医学数据共享过程中的标准化和互操作性问题:全球实践与中国路径思考
我国是人口大国与患者大国,积累的临床数据规模堪称全球之最(2024年医疗卫生机构总诊疗已达101.5亿人次),这是其他国家难以企及的宝贵资源。然而,我国医学“数据孤岛”现象普遍存在——海量数据(603138)沉淀在各大医院的信息系统中,未能在新药研发等关键领域发挥应有价值。尤其在“AI+”与大数据技术深度融入医疗的时代,这种数据闲置与时代需求间的落差更显突出。
更令人警醒的是,今年以来国际医学(000516)数据资源环境发生剧变。4月,NIH相继限制了中国研究者对SEER癌症数据库、TCGA癌症基因组图谱、dbGaP基因型和表型数据库、GDC癌症基因组数据平台、GTEx基因型-组织表达项目等核心医学研究数据库的访问权限,将我国医学数据共享体系的紧迫性推向了前所未有的高度。突破数据壁垒、激活本土数据价值,加速构建起独立自主、标准统一、互联互通的医学数据生态系统,已不仅关乎科研效率提升与产业创新驱动,更成为保障国家生物医学研究安全与战略自主的必然选择。
长期以来,数据标准不统一、跨机构间难以互操作已成为医学数据共享的硬性障碍,本文剖析医学数据标准化与互操作性的内在逻辑,梳理国际前沿实践经验,并尝试提出关于我国建立统一医学数据标准,推进互操作性的路径思考。
一
目
面对问题:标准不一致、结构格式不统一,互操作性弱
原始数据混乱:术语编码版本繁多,诊断定义不统一
疾病的分类编码和术语标准一致性是医学数据共享的基础和前提,目前国际普遍使用的疾病分类编码是WHO制定的标准疾病分类编码ICD(International Classification of Diseases),然而其在我国的落地过程,各部门、各地区之间存在很大参差。伴随着2019年的DRG改革,国家医保局基于ICD-10版本出台了《医保疾病诊断、手术操作分类与代码》(ICD-10医保版)1;而同一时间,国家卫生健康委在2018年末发布了2015年ICD-11版本中文版,并由北京协和医院建立专门网站持续更新2,两个版本在内容覆盖、编码颗粒度和技术适配度上存在差异,却在同一时间由两个部门同时推进,由此可见即使在国家层面,“三医”数据打通仍存较大空间。即使是ICD-10版本,在地方上有多个内容不尽相同的衍生版本,导致在具体落地过程中,数据同一临床概念在不同系统、机构甚至科室中存在多种编码表述。甚至,由于缺乏足够的编码使用指导,基层医疗系统出现了大量定义不详、不规范的诊断名称,如某地曾允许医生自行撰写诊断术语,导致一社区诊断名称类别高达8万余种3,给底层医学数据的分析造成了巨大的障碍。
数据接口不一致,交换和互联互通出现阻碍
在各类医学数据进入医院信息系统后,仍存在互联互通与数据交换层面的接口标准不统一与协议落地困难的问题。尽管国际通用的健康信息交换标准HL7(Health Level 7)系列已被引入国内多年,但推行策略和落地规范仍不到位,各医院信息系统厂商基于自身技术架构开发接口,导致接口协议、数据格式各异——有的采用HL7 v2的文本格式,还有的沿用私有数据库接口,甚至同一地区不同医院的HL7消息格式也存在自定义扩展差异。据《中国医院信息化状况调查报告(2023-3024)》显示,目前国内三级以上医院开展建立标准化的HL7消息的为59.19%,仍有24.53%的医院未开展标准化建设4。即使HL7 v2的消息结构虽被广泛采用,但在字段使用、触发事件、可选段处理等方面缺乏一致性约束,使得同一临床事件(如检验结果回传)在不同系统中生成的消息结构各异,必须通过大量人工配置和接口适配工作才能实现联通,目前,国内三级医院能够直接实现高质量跨系统数据读写的仅为21.15%,绝大部分(74.98%)的数据系统集成停留在基础的服务器接口调用,虽然操作便利,但数据质量和合规性难以保证。
总体来看,我国医院信息互联互通面临的核心问题已不再是“有没有数据”,而是“数据能否被可靠理解和有效使用”。这种“底层语义不统一、交换层接口碎片化”的双重约束,使数据共享成本居高不下,也制约了科研、医保治理和产业创新的深度协同。国际经验表明,要突破这一瓶颈,必须由高层级进行统一统筹,优先锁定关键标准和核心数据资源,明确阶段性目标,通过法规、标准与实施指南协同推进,逐步构建可持续演进的国家级互操作体系。
二
目
国际医学数据共享的进程:来自美国和欧盟的经验
美国:法律定规则、机构抓落实、市场促应用
美国是最早通过法律形式明确健康数据的流动权利与义务的国家。1996年HIPAA法案首次系统界定了健康信息的隐私保护边界和数据共享条件,奠定了数据跨机构流通的合规基础;2009年,《美国复苏与再投资法案》中的《卫生信息技术经济与临床健康法案》(HITECH Act)则通过财政激励与合规约束并行的方式,大规模推动电子健康记录(EHR)在医疗机构中的部署,并将“符合互操作标准”作为获得联邦补贴的重要前提;2016年出台的《21世纪治愈法案》进一步从法律层面明确禁止“信息阻断”(Information Blocking),要求医疗机构和系统厂商必须向患者和第三方应用开放电子健康信息访问接口,并明确将HL7 FHIR作为核心技术路径之一。近两年,美国医疗保险与医疗补助服务中心(CMS)持续通过支付政策强化这一要求,将FHIR API纳入“基于价值的支付”体系,倒逼医疗机构和厂商从合规建设转向业务级互操作。今年9月,
美国卫生与公众服务部(HHS)发布新举措,明确将加大对现有联邦信息阻断规定的执行力度,并推出健康技术生态系统(Health Technology Ecosystem)倡议,旨在进一步推动数据共享和互操作性规范化落地,同时更新联邦EHR认证标准,以提高数据交换透明性与点对点共享能力5。
与立法推进相配合,美国设立国家级专责机构——隶属于HHS的国家卫生信息技术协调办公室(ONC)统一协调,形成长期稳定的顶层统筹能力。在HITECH法案设立后,ONC被正式赋予标准制定协调、EHR系统认证、互操作性规则执行和全国卫生信息网络统筹等核心职责,一方面主导制定并动态维护互操作技术标准HL7 FHIR,另一方面通过EHR认证制度,将标准合规性直接嵌入医疗机构和厂商的采购与市场准入决策中。在ONC的持续推动下,美国非联邦急诊医院EHR使用率在2011—2021年间由不足三成提升至96%6。今年,ONC进一步升级标准,将包括HL7 FHIR、美国医疗信息交互核心数据(USCDI v5)在内的标准列为认证健康IT的核心范围,意味着从2026年起,新版本数据元素将成为获得联邦健康IT认证的必备条件7。
政策推动了市场的发展,今年7月,美国超过60家医疗和科技公司签署了CMS牵头的承诺,旨在简化健康数据共享流程,并开发应用程序供患者访问和使用其健康数据。在一系列监管举措和技术进步的推动下,美国医学数据共享形成的互操作性市场,在2025年已形成73.5亿美元的规模,预计到2029年将达到约140.6亿美元8。
欧盟:跨国合作共识和分步骤开展计划
欧盟在医学数据共享与互操作性建设上的显著特征,并非依赖单一国家强力推进,而是通过跨成员国合作行动计划与分阶段实施机制,逐步构建统一但可渐进落地的健康数据空间。在成员国医疗体系差异显著、数字化水平不均衡的背景下,欧盟并未试图一步到位实现全面互联互通,而是通过明确目标分层、数据分类和时间表管理,降低制度协调与技术实施的复杂度。
2022年,欧盟正式提出“欧洲健康数据空间(European Health Data Space,EHDS)”立法提案,将医学数据共享从“合作倡议”升级为“制度工程”。EHDS明确区分首次使用(primary use)与二次使用(secondary use)两类场景:前者聚焦患者跨境就医和连续照护,后者面向医学科研、公共卫生、产业监管与医药技术创新,避免因目标混杂导致推进受阻。更重要的是,EHDS在制度设计上引入“数据可控共享”理念,既强化患者对个人健康数据的访问与控制权,又通过专门的数据访问机构为科研和产业创新提供合规通道。
今年3月,EHDS法案正式通过生效,进入过渡实施阶段,方案同时确立了数据共享空间建设的时间表:2027年前将陆续出台关键实施法案和技术细则;2029年,成员国之间将优先实现患者摘要、电子处方等第一优先级健康数据的跨境互通;2031年起,电子病历等更复杂数据在成员国内部流通;到2034年,基因组等高敏感度数据也将在严格条件下纳入EHDS框架9。
同时,欧盟也将EHDS与AI、真实世界数据(RWD)和药品监管改革深度融合。一方面,EMA已明确将EHDS作为未来真实世界证据的重要基础设施,支撑药物安全性评估和适应证扩展;另一方面,AI法案(AI Act)对高风险医疗AI的数据质量与可追溯性提出更高要求,进一步倒逼医疗数据标准化和互操作能力提升10。EHDS正逐步从数据共享平台演进为欧盟生命科学与数字健康创新全面建设的基础设施。
三
目
展望:我国推动医学数据互通的可行性路径
综合梳理来看,我国医学数据共享的核心堵点,已从技术缺失转向制度、能力与实施空间等系统性统筹不足:在标准层面,多部门、多版本的术语与编码体系并行,导致底层语义难以统一;在交换层面,接口协议的私有化定制,使得数据流动成本高昂、质量堪忧,制约了海量临床数据向科研创新与国家战略资产的转化。
医学数据的分散并非我国独有问题,国际经验为我们提供了思路:美国通过持续立法和中央统筹相结合的方式,以《卫生信息技术经济与临床健康法案》《21世纪治愈法案》等为抓手,明确数据可携带权利和互操作义务,并依托ONC等国家级机构统一技术规则和实施指南,在市场竞争中倒逼厂商和医疗机构遵循标准;欧盟则面对成员国制度与能力差异,更强调“共识优先、分步推进”,通过EHDS建立统一法律框架,同时设置清晰时间表和数据分级路径,逐步实现从基础数据到高敏感数据的跨境互通,兼顾长期目标与现实可行性。
当前我国发展,破解困局的关键在于充分发挥新型举国体制的优越性——我国比全世界其他国家更具备集中力量统一规则、快速试点和规模推广的制度优势,有条件在国家层面明确关键数据标准、交换规则和治理框架,再通过分阶段实施降低地方执行成本。目前,部分先行地区已开展相关试点,例如,“北京市医药健康可信数据空间”已揭牌,清华长庚等医院优先开展试点11;广州也在开展健康行业数据空间建设,形成了部分数据产品12。“十五五”规划中,数据要素和可信数据空间已被列为重点方向,预示着未来医学数据共享将从分散探索走向体系化推进。期待下一步,进一步推进将顶层设计、地方试点与标准落地形成闭环,逐步构建可持续演进的国家级医学数据互操作体系。
0人