美国电子病历数据分析现状
临床电子病历数据(泛指医院所有医疗信息系统的总集,包括HIS, 医生报告, 医嘱,化验等系统)是医疗大数据的最重要的组成部分。 电子病历系统在美国普及较早,很多大型医疗机构积累了长达10年以上的电子病历信息。除了医院积累的电子病历信息,美国的医疗大数据还包括保险公司索赔记录,药房记录,政府医疗救助等多种来源的医疗信息。医院,保险公司,政府医疗救助部门以及大学的科研机构等,都有科研人员和团队进行医疗大数据分析。另外,各大制药厂也通过医疗大数据进行药物效果分析和药物重定向研究。
2011年,为了推动使用医疗信息技术来提高医疗质量和减少医疗成本,美国医疗保障和医疗救助中心(Centers for Medicare & Medicaid Services,CMS) 起草并实施了“电子病历应用激励计划”。CMS通过制定电子病历系统的功能规范,评估医疗机构是否达到有效使用的标准。达标的医疗机构可以从CMS获得电子病历应用专项推动资金。CMS寄希望于这项激励计划推动“有效使用 (meaningful use)”电子病历数据来提高医疗水平的效果。所谓“有效使用”是指通过使用电子病历数据来:1)提高医疗的质量,安全性和效率;2)使病人和病人家庭充分参与到医疗中;3)提高医疗机构的协作能力;4)提高公共医疗水平;5)维护病人医疗信息的隐私和安全。该计划通分三个阶段进行。第一个阶段(2011-2012)旨在“加强数据采集和共享”,第二阶段(2012-2014)目标是“优化临床服务流程”,第三阶段(2014-2016)的最终目标是“提高医疗服务质量”。美国国家卫生研究院(National Institute of Health)和其他政府机构也同时资助了一系列研究项目来推动使用电子病历进行临床医学的研究。例如,临床和转化医学项目(CTSA by NIH),电子病历基因组计划(eMERGE by NIH),战略性先进医疗信息研究计划(SHARP by ONC),以及临床医学数据研究网络(CDRN by PCORI)等。
以此为契机,生物医学信息学在美国得到了快速发展. 生物医学信息学是一门以提高人类健康为目的的新兴交叉学科,它学习和追求对生物医学数据,信息,和知识的有效使用来解决科学问题和提供决策支持,是医疗数据分析的原动力。 目前,提供医学信息学学位的学校和研究机构在全美迅速普及。在美国医学信息协会的主导下,生物医学信息学的研究逐渐成为当前的医学和计算机科学的研究热点。
医学术语和本体知识库
医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流, 使后续的科学分析得以进行。在美国,常用的医学术语和医学本体知识库包括“国际疾病分类(International Classification of Diseases)”,“CPT医疗服务(操作)编码系统(Current Procedural Terminology)”“医学系统命名法-临床术语(SNOMED CT)”以及“检测指标标识符逻辑命名与编码系统(LOINC)]”等。一体化医学语言系统(The Unified Medical Language System-UMLS)是美国国立卫生研究院经过20年的积累和开发完成的一个大型医学本体知识库。它集成了大部分常用的医学术语词典和本体库 (137个), 是医学信息学领域最广泛使用的医学本体知识库之一。
医疗数据模型和软件
为了有效提高后续数据的分析, 把临床医疗数据转化成研究用的数据模型是当前普遍的方法之一。目前,常用的医疗数据模型有: SHARPn项目开发的数据标准化流程(使用了 “临床元素模型(Clinical Element Model)”),PCORI 提出的“通用数据模型(PCORNET common data model)”,OMOP/OHDSI提出的“通用数据模型(OMOP common data model)” 等。除了数据模型, 美国科研人员还开发了不少支持临床数据管理和分析的软件。 其中以“I2B2”和“transSMART”最具代表。