黑猫与白猫:衡反修谈医院数据利用中的合作与选型之道

2017年3月18日,中国研究型医院学会医疗信息化分会医疗和临床科研大数据专业委员会(以下简称“专委会”)在京召开成立大会,同期成功举办了“医疗大数据应用与实践研讨会”。在研讨会上,北京大学肿瘤医院信息部主任、专委会主任委员衡反修就“医院数据利用及大数据公司的选型”这一实际问题同300余到会专家进行了分享。

北京大学肿瘤医院信息部主任

中国研究型医院学会医疗信息化分会医疗和临床科研大数据专业委员会主任委员

从数据利用的小目标开始,北大肿瘤医院经历了四个阶段

截止到2016年底,北京大学肿瘤医院(以下简称“北大肿瘤医院”)有大大小小208个系统,数据量大,历史悠久,分布分散。

然而由于各系统建设时期不同、开发商不同、数据标准不同,使标准问题、异构数据问题,甚至技术文档缺失问题、数据“快餐”问题,都成为数据利用上的“拦路虎”,然而与之对应的是医院各个部门旺盛的需求——管理需求、科研需求、临床需求、教学需求、信息需求等等,推动信息中心拿出解决方案,尝试着走出了数据利用的“一小步”。

2004年,基于DW课题研究(利用HIS数据),医院投入1万元,以“购买产品+自主研究”的方式开发了一个单机版系统。数据仓库新技术、数据价值、数据规范的重要性,开始在这一阶段进入衡反修的视线,这也是北大肿瘤医院数据利用的第一个阶段,“投入小,有成效,有启发。”衡反修这样总结道。但是随之而来的是对新需求的探索,即如何将这一系统扩展到全院,实现网络化应用。

2008年,北大肿瘤医院的数据利用进入第二个阶段——“正式上路”。这一时期的主要任务是基于管理需求进行医院BI建设,在这一阶段,医院选择了技术成熟的产品,投入依旧有限,与企业以“三年免费+合作开发”的模式合作。建设完成后,实现了运营、医保数据的分析和院长综合查询的呈现。如果从应用效果上来评价的话,是非常成功的:如连续两年获得市医保一等奖;如可以做统计部门的复杂报表;如在数据清洗过程中对生产系统进行提升数据质量的改造;如梳理了系统的备份机制……不过经过几年使用,BI的“软肋”逐步显现:系统稳定性欠佳,数据难以实时性、准确性不足,分析结果难以预测、非结构化数据没有很好的处理途径和方法,最重要的问题是,如何接入更多的临床数据,实现更广泛的数据利用。

2012年,信息中心对数据利用的需求调研,“我们发现数据利用是刚需,早晚要建,不如早建。”衡反修说。为了让数据利用满足更多临床业务需求,北大肿瘤医院数据利用进入第三个阶段——平台建设。得益于此前数据利用的显著效果,这一阶段单从投入上来看,医院投入千万级资金,与国际化公司合作,采用了“近乎成熟”的产品。平台建设对医院数据利用的提升作用是全面而显著的——多院区数据的互联共享,EMPI患者主索引的建立,部分病历后结构化处理,科研辅助支撑等均已实现;在前端应用上实现了临床统一视图、医院运营BI分析、医保监控等等功能;此外,基于平台,医院集团CDR得以建立,数据利用实时性问题得以解决,面向临床科室提供数据应用(单病种),面向管理部门实现移动化、手机化,解决了多院区患者数据访问统一视图——收获满满,不一而足。但是,系统的稳定性、查询速度、基于SQL的后结构化能走多远,成为摆在信息中心面前的新问题,全病历数据后结构化处理、查询效率的提升、科研评估的快速实现,也成为新需求。

从2016年开始至今,北大肿瘤医院开始进入数据利用的第四个阶段,目标也很直接——引入大数据技术解决科研数据的评估查询问题。这一时期,医院大胆采用互联网基因的新兴大数据公司,在合作方式上更是以“远程实施+数据脱敏”的方式进行。“进度神速,成效明显。”衡反修如此评价这一合作。从时间上来看,从2016年10月启动,到12月23日产品内部上线,仅用了两个多月的时间,然而系统的快速上线并未让效果打折,临床反应良好:全量历史数据进入平台;数据检索反馈≤2秒;支持复杂条件的查询;支持导出数据的定义;可以进行简单数据分析……这样一来,历史数据高速查询的性能问题得到彻底解决;专病库的建设也开始着手进行。

从0到1,是最难的,也是最具价值的。从2004年的一个小小单机系统,到2016年覆盖全院的大数据平台,经历四个阶段的建设后,尝到数据“甜头”的北大肿瘤医院在数据利用这件事上越做越专业,其建设初衷、成效、经验对与其体量相当的医院来说颇具参考价值。

谈谈黑猫与白猫关于大数据公司的选型

2017年,大数据公司的“热”与医院选型大数据公司的“迷茫”是共生的。衡反修谈到对大数据公司的选择时,为医疗机构提出了四点建议。

(1)关于厂商和技术的选择,不管黑猫白猫,解决得了问题又满足需求的技术才是好技术,抓得了耗子的才是好猫!医学本身的知识深度要求厂商具备相当强的专业性,虽然技术强的公司有好工具,但是医院更需要的是针对性的解决方案。

(2)关于协议和项目管理,要让所有的承诺落在协议中;要有非常强的主导意识,以“我”为主,建设医院需要的内容,将安全和业务控制在信息部门中;保持和厂商的良好沟通,及早发现解决问题;必要时可以推动同类厂商形成竞争,“渔翁得利”也是必要的。

(3)关于产品之间的功能重叠问题,“我们梳理了从2004年到今天所有系统的功能分布图,各系统之间功能有重叠是很正常的。”衡反修展示了一张分布图。他建议遇到内容重叠的功能时,要将决定权交给使用人员,医院信息部门要在充分了解厂商技术优势的基础上,推动形成多产品互补局面,“不要指望一个产品解决所有问题。”他说。

(4)面对非传统模式的新兴技术厂商时,则要考虑以下几点:

第一,厂商提供的免费模式虽然能够降低初期投入风险,但是医院要对其后期收费有预期、有控制;

第二,面对“项目远程实施”这件事,要做好工程师不驻场时的监控工作,主导数据脱敏时点和范围,确保医院数据安全;

第三,公有云是否可用?面对这一存疑,衡反修建议暂时保守地看待这一事情:“数据不出医院,更踏实。”

“见到数据就像老虎见到肉一样”,当天的会议上有企业专家如此笑言。面对医疗大数据的“诱惑”,这一比喻实在是很形象!对摩拳擦掌的大数据企业,衡反修也给出了四条建议。

第一是专业问题。“解决医疗问题要有专业的医疗知识积累,认真听取甲方需求。”衡反修说,这也是最重要的一点,这样才能形成有针对性的解决思路;

第二是安全问题。安全无小事——这是医院对数据最基本的态度。衡反修建议要有针对数据安全和技术安全的落地方案。虽然数据安全是由信息部门责任也是由信息部门主导的,但是如何做到让甲方放心是则是大数据公司的重要工作;

第三是把握好院级项目的切入点。“医院信息化项目的归口点是在信息部门的,而不是业务科室。”衡反修说,任何一个信息化项目都离不开信息部门的参与,因此大数据公司需要与信息部门保持良好的沟通。

第四是适时适度探索免费模式,降低进入医院门槛,寻求与医院的共赢。

“数据即财富,数据即资源”,医院的数据资源向来都是最宝贵的。随着大数据技术的日渐成熟,我们可以预见到医院数据的有效利用带来的巨大价值——不论是对医院管理运营而言,亦或是对人类医学的进步而言。利用好数据,成为当代CIO们的重要课题,而帮助全行业发现、归纳可资借鉴和参考的大数据应用心得和实践经验,也是专委会成立的初衷。(完)