CQAF AI in cQMS工作组5月线上研讨会实录——聚焦AI技术原理与UL3115安全标准框架的务实探讨

2026-06-01 21:10:36

点击蓝字关注我们

2026年5月20日，恰逢国际临床试验日，CQAF AI in cQMS工作组举办了月度线上研讨会。本次会议首次向更广泛的组织范围开放，吸引了来自药企、医疗器械企业及第三方机构的众多从业者参与。会议围绕 “AI技术原理认知” 与 “AI安全与监管合规框架” 两大核心议题展开，旨在为临床试验质量管理领域的AI应用提供一份务实的认知基础与合规参考。

认识AI：从工程逻辑到能力边界

要有效且安全地使用AI工具，首先需要理解它的底层工作机制与固有局限。会上，梁展硕基于近期观察，分享了几个关键事实：

智能的涌现：量变引发的质变

当前主流的大语言模型（LLM）并不具备人类的意识或理解能力。其核心机制是 “下一个词元预测（Next Token Prediction）”——在海量文本数据的基础上，计算并选择概率最高的下一个词进行输出。

没有“理解”，只有“计算”：AI输出“概率”一词，是因为该词在训练语料的统计关联中得分最高，而非它理解了“概率”的含义。
涌现（Emergence）现象：当模型的参数量级突破千亿（100B）时，这种简单的概率计算会“涌现”出逻辑推理、反思等复杂能力。但这本质上仍是数学层面的现象，而非意识的觉醒。

技术的盲区：Token机制与“幻觉”根源

AI的能力由其技术架构决定，存在天然的局限性：

Token的视角：AI处理的并非人类理解的“文字”，而是被切分和编码的整数（Token）。这解释了为何AI能进行微积分推导，却可能数不清“Apple”这个单词有几个字母——它处理的对象从来不是字符本身。
“幻觉”（Hallucination）的本质：大模型没有存储任何具体的PDF或数据库。当要求它检索某篇文献时，它往往是在基于概率“生成”一篇看起来合理、但实际可能不存在的文章。这是概率生成模型的固有特性，而非一个可以完全修复的缺陷。

务实的协作：将“直觉任务”转化为“工具任务”

针对上述特性，会议分享了在实际工作中规避风险、提升效率的方法：

明确任务边界：避免直接让AI进行需要绝对精确的任务，如精确计数、数据统计或法规条款的直接引用。
善用工具能力：将问题转化为AI擅长的形式。例如，需要统计文献中“不良反应”出现次数时，可以要求AI编写一段Python脚本来执行，利用代码的确定性来保证结果的准确性。
优化指令（Prompt）：采用结构化的指令框架（如明确角色、任务、约束条件和示例），能有效引导AI输出更符合预期、专业性更强的结果。

聚焦UL3115：构建AI安全的监管与合规框架

在高度监管的医药研发领域，任何新技术的应用都必须以安全与合规为前提。会上，张波重点介绍了由UL Solutions制定的 AI安全标准框架UL3115，并分享了全球监管动态。

UL3115标准框架：技术、伦理与治理三大支柱

UL3115是一个针对AI产品安全性的综合性标准框架，旨在为AI系统的开发与应用提供指导，尤其关注制药和医疗器械等强监管领域。该框架主要从三个维度构建AI安全体系：

技术安全：关注产品的健壮性、风险管理以及AI驱动的功能安全。强调模型的透明度、可解释性以及输出结果的可重复性。
伦理安全：聚焦公平性、避免数据偏见以及保护数据隐私。确保AI系统不会因训练数据的不均衡而产生歧视性输出。
治理安全：涵盖数据收集与分析、开发过程文档化、以及全生命周期的管理。特别强调在医疗器械等领域，必须对AI系统进行从设计到退役的完整生命周期管控。

全球监管动态与核心关切

尽管各地区监管逻辑存在差异，但对“风险可控”的要求高度一致。UL Solutions张波对比了主要监管区域的思路：

美国 (FDA)：采用动态、灵活的指导性文件（Guidance）进行监管，侧重于原则性引导和上市后持续监测，强调“人在回路”（Human in the loop）和全生命周期管理。
欧盟 (EMA)：通过具有法律约束力的《人工智能法案》（AI Act）等进行强监管，对高风险AI应用有明确的限制和合规要求，尤其注重算法透明度和可解释性。
中国 (NMPA)：实施集中协调的强监管，在严守数据安全与完整性底线的同时，积极支持符合规范的技术创新。

行业践行的核心原则

结合UL3115框架与监管要求，会议总结了AI在cQMS（临床试验质量管理体系）领域应用时必须遵守的原则：

“人在回路”（Human in the loop）不可替代：AI应作为辅助工具，最终的决策和责任必须由具备资质的专业人员承担。在高风险场景中，必须保留完整、可追溯的人工复核记录。
数据完整性优先：用于训练和运行AI模型的数据必须具备代表性，且任何由AI进行的数据修改都必须留有审计追踪（Audit Trail），严格符合ALCOA+原则。
模型的可解释性与验证（V&V）是刚需：监管机构和企业自身都需要理解模型的决策逻辑。特别是在涉及患者安全的临床应用中，可能需要采用经过充分验证的“静态模型”，并能够解释其输出结果。

关于CQAF AI能力共建项目

本次研讨会也是CQAF AI能力共建项目（AI Capability Project）的一次重要活动。该项目于2026年1月正式启动，旨在应对生成式人工智能在临床开发与质量保证领域的快速发展和应用挑战。

项目由CQAF核心组发起，刘清月（Cathy LIU）牵头，李茜然（Xiran Li）担任协调人。其中，AI in cQMS子模块由周姗姗（Shanshan Zhou）和张倩（Qian Zhang）共同领导，专注于探索如何将AI合理、有效地融入临床试验质量管理体系，以提升治理水平和风险管理能力。

后续计划与展望

基于本次研讨会的讨论，工作组明确了后续的推进方向：

专项研讨：将针对“AI用于TMF（试验主文件）管理”等具体且关注度高的场景，组织更深入的专题讨论，旨在明确不同风险等级任务下的验证方法和合规路径。
案例共创：持续面向行业征集AI在临床试验各环节的应用实例与思考。无论是成功的经验还是遇到的挑战，都将被视作宝贵的行业资产，经整理后形成实践参考。

AI与cQMS的深度融合是一个需要持续探索的长期过程。我们相信，通过务实的讨论、经验的分享与标准的共建，能够帮助行业更稳健地迈向智能化未来。

如果您对AI在临床试验质量管理中的应用有具体的实践或思考，欢迎联系CQAF AI in cQMS工作组，与我们一同探讨。

供稿 | 梁展硕

审核 | 张波，周姗姗，Cathy Liu

编辑 | 乐园，李茜然

* 本文基于CQAF AI in cQMS工作组2026年5月线上研讨会内容整理，内容初稿由AI生成，已经过人工审核