AI赋能临床试验,开创全链条深度协同的新范式
近年来,人工智能(AI)技术的突破式发展,成为新药研发提质增效的有力工具。据MedMarket Insights预测,到2031年,全球AI制药市场规模增长到85.02亿美元1。AI技术正从药物发现向临床试验全链条渗透,其核心价值在于通过机器学习、深度学习等算法,优化试验设计、加速患者招募、提升数据管理效率,从而缩短研发周期、降低成本。
新药开发是一个漫长、昂贵、高风险的过程,而其中临床试验是耗费最大、淘汰率最高的环节,占据了10到15年、15亿至20亿美元的时间和资金成本2,约有90%的药物会在临床试验阶段被淘汰,进入临床Ⅱ期的化合物中,不到三分之一能进入临床III期,在进入临床Ⅲ期的化合物中,又有超过三分之一的化合物未能成功获批上市3。如何通过AI技术降低临床试验成本,推进提质增效和精准赋能,成为当前产业界关注的重点。
本文从AI在临床试验中的应用场景出发,盘点我国推进AI技术应用于临床试验过程可能存在的堵点与困难,并对当前国内外目前的相关政策和实践探索进行梳理,尝试提出推动AI充分赋能临床试验的关键性因素。
一
目
AI在临床试验过程中的应用场景和关键特点
2024年11月,国家卫生健康委发布了《卫生健康行业人工智能应用场景参考指引》,在与AI赋能临床试验相关领域,列出“人工智能+药物研发”及“人工智能+医学科研”分类下8项指导性应用场景,综合国内外其他研究成果4 5,梳理AI在临床试验中的应用场景,按照临床试验进程大致如下:
试验设计优化
模拟试验结果:机器学习模型模拟不同试验方案,预测潜在结果,助力研究人员挑选最优设计。
自适应试验设计:基于中期数据实时触发方案调整(样本量再分配、干预措施优化),提升试验灵活性和效率。
精准患者招募与智能入组
预测分析:整合分析电子健康记录、社交媒体等数据构建患者画像,快速定位符合试验标准的患者,加速招募并提高匹配精度。
自然语言处理(NLP):对非结构化医疗文档(病程记录、诊断报告)进行语义提取,自动识别符合入组条件的关键医学指标。
智能数字推广:基于用户行为分析定向推送试验信息,提高潜在患者对临床试验的认知和参与意愿。
全周期数据智能管理
多源数据自动化整合:集成可穿戴设备、电子病历等多源收集数据,智能校验降低人为误差率。
实时数据监测:通过深度学习算法持续扫描数据流向,对偏离阈值指标及时预警,保障数据完整性。
深度分析平台:处理并分析大型数据集,挖掘传统统计方法遗漏的隐含关联,为疗效评估提供多维度证据支持。
提高患者依从性
个性化交互系统:基于患者画像生成定制化提醒内容与随访计划,通过移动终端实现实时触达,保持患者参与度。
行为监测:借助可穿戴设备和AI应用,实时跟踪患者行为,及时干预异常情况。
退出风险预测模型:通过机器学习识别高风险退出人群,使研究人员能提前采取干预措施。
合规管理与伦理保障
智能监管申报系统:自动校验申报材料与ICH/FDA/NMPA等标准的符合性,压缩行政时间。
数据隐私和安全:采用加密和匿名化技术,保护患者数据,保证全面满足GDPR/HIPAA等隐私保护要求。
符合伦理的人工智能:通过算法透明化技术解析决策逻辑,避免偏见影响试验公平性。
试验后分析与真实世界证据拓展
上市后监测:整合RWD(电子病历、保险理赔、舆情数据)构建疗效评估模型,持续监测新疗法的长期表现,及时发现潜在问题。
RWE融合分析:将临床试验数据与真实世界场景数据关联分析,生成跨人群疗效报告,提供全面治疗视图,辅助循证决策。
综合对AI应用于临床试验的场景梳理,我们可以发现,AI赋能临床试验呈现出以下几个关键特点:
一是数据方面,需要全链条数据驱动精准决策:从试验设计阶段的方案模拟、患者招募时的精准画像构建,到试验中实时数据监测与干预、试验后真实世界证据分析,数据来源与医院电子病历信息系统、研发企业数据库、公共健康数据、药物注册信息、临床试验机构数据等多平台数据源多源数据整合,使各环节决策均基于充分的量化数据分析而非经验判断。
二是算法方面,是多模态的复杂融合和智能化输出:由于数据涉及多模态、多平台的整合,同时需要应对数据漂移(如患者人群特征变化等)、概念漂移(如新标志物的出现等)、目标漂移(如诊疗指南、疾病定义、临床终点变化等),复杂运算所带来的“黑盒”与临床研究过程需要的透明度和风险控制要求存在较高的平衡空间,对深度学习模型技术要求也随之提升。
三是算力方面,高度专业性且时效性要求高,计算强度极大:基于以上在数据和算法上的高要求,加之满足实时动态分析(如自适应试验方案调整、秒级数据异常预警)的时效要求,导致模型训练与推理过程计算量呈指数级增长,对算力的稳定性、并行处理能力提出极高挑战。
二
目
AI应用于临床试验,需要主要突破的堵点
基于以上关键特点,具体到我国的应用实践中,加速AI布局,充分实现临床试验提质增效,目前仍有需要重点突破的堵点。
数据共享与标准建设
数据是AI的基石,顺利运转需要全链条、全流程的数据支持,同时临床试验本身对数据的精确度、标准化也有着更高的要求。而目前,我国与医药研发相关的关键数据分布在卫生医疗、医药监管、医保等不同部门,部门之间数据并不互通,协作还未到位。即使在卫生系统内部,海量的高价值数据仍处于未被利用或“孤岛”状态。中国医院协会发布的《2023-2024年度中国医院信息化状况调查报告》显示,参与调查的一千余家医院中,仅有14.4%的机构将数据应用于统一的专病数据库平台,53.23%的医院开展了数据资源整合,而将近30%的医院未开展任何数据二次利用,仍然有52%的医院未参加过数据互联互通测评6。
同时,数据标准的不统一也成为重要制约点,这大大加剧了数据处理的难度与复杂程度,也会造成计算结果的偏离。目前仅HIS系统,国内就有2000多家医疗信息化公司,各自数据格式都不同,导致数据难以直接互联互通7。目前国际上已推出一系列数据标准,如临床数据交换标准协会(CDISC)推出的临床数据交换标准、国际标准化组织Health Level Seven International推出的医疗交互数据标准(FHIR)等,但我国尚未明确这些标准的落地,即使进行推广,时间和成本也是现实的问题。
算法验证与监管协作
算法是AI的核心灵魂,然而算法下的“黑盒”问题却显而易见:数据偏见、数据泄露、数据代表性有限、网络安全漏洞、算法偏见、模型错误输出、大型语言模型的记忆风险以及模型过度拟合等8 9。为了更好地应对AI算法这一新兴技术可能带来的不确定性,欧美等先行国家地区较早开启了监管的政策和实践探索,尤其强调了灵活的协作和高效的沟通对于AI技术使用监管过程中的重要意义10。
早在2023年,FDA就发布了两份讨论文件:《药品生产中的人工智能》(Artificial Intelligence in Drug Manufacturing)和《药品和生物制品研发中的人工智能和机器学习》(Using Artificial Intelligence & Machine Learning in the Development of Drug &Biological Products),与医学界、产业界等相关人员共同探讨了如何科学利用AI开展药物研发过程的经验以及可能面对的问题,并广泛征集相关人员对于AI应用于药物研发过程的风险、权责、数据等问题的意见;在此基础上,2024年美国四家药品和器械监管部门共同发布了《人工智能与医疗产品:CBER、CDER、CDRH、OCP 的协同行动》(Artificial Intelligence & Medical Products: How CBER, CDER,CDRH, and OCP are Working Together)明确在:①促进合作保护公众健康;②推动支持创新的监管方式;③促进协调一致的标准、指南、实践和工具的发展;④支持AI评估和监测的相关研究,四个方向上的共同发力。今年初,FDA发布了《使用人工智能支持药品和生物制品监管决策的考虑因素》(Considerations for the Use of Artificial Intelligence To Support Regulatory Decision-Making for Drug and Biological Products),为申办方及其他相关方提供了一个基于风险的可信度评估框架,并形成了如何使用AI生成信息或数据,以支持包括药品临床试验在内的安全性、有效性或质量监管决策的建议。
EMA则在经历了一年多的意见征求、反馈、修订之后,于2024年9月推出了《关于药品全生命周期中使用人工智能的思考文件》(Reflection paper on the use of Artificial Intelligence (AI) in the medicinal product lifecycle),文件明确AI技术可以在临床试验中使用,以生成支持上市许可的证据,但EMA需要对所有的证据进行严格评估和审核,在数据管理、统计严格性方面,则可直接沿用现有的指导原则。
值得注意的是,无论是FDA还是EMA,相关监管文件都是在既有的指导原则、导向性文件的基础上,通过监管方、科学家、产业界、医学界等多方多轮沟通中不断成熟,并配备了跨学科的专家力量用以支持AI技术在药物研发过程中的科学监管。
在我国,2022年3月国家器审中心发布《人工智能医疗器械注册审查指导原则》,规范了AI医疗器械全生命周期过程质控要求和注册申报资料要求,但对于在药品研发和临床试验过程中AI使用的监管,相关文件仍在进一步制定中。面对AI这一新技术在临床试验等高度专业方向上的科学监管,仍然需要跨领域、多专科的高效沟通协作机制,引导新技术以更科学的方式赋能创新。
算力推进与资源分配
在大规模的数据处理和高精密要求的算法运作之下,算力正是支撑这些复杂计算任务的关键要素。
而由于患者隐私、数据安全保密的要求,大量数据清洗、大模型训练需要以本地化的方式开展,以影像辅助诊断为例,需要针对身体各部位开发相应的AI模型,而每个模型通常需要训练上万病例的数据,单个病例的数据就可达到GB级11,同时需要支持灵活扩展与稳定性要求,保障医疗机构的数据安全与业务顺畅运行。而这一系列的算力成本极为高昂,尤其对于基层医疗机构而言,往往无法承担。
随着算法技术的更迭和个性化多样化的数据需求,算力的制约性逐步显露,2023年10月,工信部、国家卫生健康委等六部门联合印发了《算力基础设施高质量发展行动计划》加强行业算力建设布局,满足工业互联网、教育、交通、医疗、金融、能源等行业应用需求。近年来,随着国产芯片行业的快速发展,算力成本正在逐步实现降低,而如何以算力均衡布局撬动更广泛的医疗数据资源,仍需多部门协同推进。
三
目
展望 AI不仅是临床试验提质增效的工具 更是全链条协作的新契机和新范式
综合以上分析,需要充分实现AI对于临床试验的赋能,实现准确、合规的结果能够高效、稳定地输出,降低沟通成本,实现提质增效,需要在全链条数据共享、算法技术提升和科学监管、算力工程建设等方面全力推进,而这些项目的管理,目前分布在医疗、药监、医保、工信、数据、科技等不同部门的职能中。AI时代需要全新的社会治理范式,需要打破职能分化,根据产业发展的现实需求,重新构建完整的协作和生态模式,而AI赋能临床试验,可以成为这一全新治理范式实践的先行方向。
目前,以部分地区、医疗机构为代表,已经开始了政策实践。4月,在北京发布的《支持创新医药高质量发展若干措施(2025年)》中,明确了“充分利用医疗、医保、医药数据,构建行业数据可信空间”“制定数据分类分级管理标准和采集、清洗、脱敏、标注技术指南”“建设医疗健康行业大模型测评体系”“推进人工智能技术应用,完善监管评价措施”等多项举措;上海2024年11月发布的《发展医学人工智能工作方案(2025-2027年)》中,也明确了“加快核心算法技术研发”“建立AI数智化支撑平台”“制定卫生健康数据分类分级、融合应用等标准规范”等举措,而这些政策都是相关主管方多部门齐发,以专项工作组的方式推进。期待在地方实践取得突破的基础上,能够进一步在全国实现整体推进,使我国高速发展的AI技术与庞大的数据和患者资源结合起来,助推创新医药产业的新一轮腾飞。
0人