News Details

Favorite

AI来了，我们的职业会被取代吗？ | CQAF AI for Auditing Vol. 1

2026-06-01 21:05:27

点击蓝字关注我们

CQAF AI for Auditing 兴趣小组 · 系列推文

Vol. 1

AI帮你找到的异常，你敢签字吗？

如果你的稽查报告里有一项发现是AI帮你找到的，你敢签字吗？

这不是一个假设性问题。

2026年4月，安永（EY）在鉴证业务领域全球推出企业级多智能体AI框架，嵌入云审平台，每年处理超过1.4万亿条会计分录，覆盖150+国家、16万+审计项目。毕马威（KPMG）的Clara平台已经利用AI扫描数百万条会计分录，标记异常供人工审核。德勤的Omnia和Zora AI™、普华永道的GL.ai——四大会计师事务所正在以数十亿美元的投入，把AI变成审计的"标配"。

审计行业的变化不是"会不会来"的问题，而是"已经来了"。

麦肯锡2025年全球AI调研显示，88%的受访企业已在至少一个业务环节部署AI（含生成式AI和分析型AI）。金融时报报道，2025年四大在英语国家发布的招聘中，要求AI技能的岗位占比近7%，自2022年以来增长逾两倍——AI专家的招聘广告数量已经超过了审计师。

所以问题不是AI会不会进入临床稽查，而是——当AI进入之后，你的角色是什么？

别慌，AI替代的是任务，不是你

先说一个让很多人意外的判断：AI替代的是"任务"，不是"角色"。

这不是安慰剂，是正在发生的事实。

看看审计行业的人才结构变化——BDO立信的分析指出，审计、法证、尽调、合规等结构化明显、数据密集型领域，专业人士预测未来3-5年内自动化可能淘汰该领域50%的岗位。听起来很吓人。但同一份分析也揭示了一个更重要的趋势：人才模式正在从"金字塔"转向"钻石型"——底层基础岗位更精简，但技术和管理专家组成的中间层反而更宽了。

换句话说，AI砍掉的是金字塔的底部，但中间变宽了——你不需要爬那么高，但你需要站得更稳。

四大的动作也印证了这一点。2024年四大毕业生招聘岗位同比减少44%，毕马威将部分新人团队缩减近30%——初级审计员确实在减少。但与此同时，四大正在大量招聘AI专家，要求AI技能的岗位占比从2022年的不到2%飙升到近7%。他们不是不需要人了，而是需要不一样的人了。

背后的逻辑其实很简单：在财务审计领域，凭证核对、数据整理、全量扫描、异常标记——这些重复性高、规则明确的任务，AI确实干得比人快、比人准、比人不知疲倦。但"这个异常是否构成系统性问题""这个偏差是否影响受试者安全""这个发现需要在稽查报告中怎么表述"——这些需要专业判断的环节，AI目前碰不了。

真正该担心的不是"AI会不会让我失业"，而是"当AI替我完成了大量基础任务之后，我剩下的专业判断能力够不够用"。

临床稽查的特殊性：AI最难啃的骨头，也是最危险的战场

如果你觉得"AI替代任务不替代角色"这个判断让你松了口气，那接下来这个事实可能得让你重新绷紧——

临床稽查和财务审计，根本不是同一件事。

财务审计

查的是账——财务数据是否真实公允，交易是否合规，规则写在会计准则里。

财务审计面对的是标准化的财务数据——XBRL格式、US-GAAP或IFRS准则、固定的科目和字段。规则明确，数据结构化，判断有据可循。难怪哥伦比亚大学2025年已经开发出FINAUDITING基准，用于评测AI在财务报表审计中的能力。

临床稽查

查的是合规——数据是否真实可靠，受试者的安全、权益和福祉是否得到保障，医疗场景下的操作是否符合GCP，规则写在GCP里，但判断在现场。

临床稽查面对的是高度非结构化的临床过程——病历、知情同意、GCP合规行为、研究者与受试者的互动。判断标准不是会计准则那种"可编码"的规则，而是GCP+伦理+受试者保护这套需要情境判断的体系。EMA 2024年度GCP检查报告显示，335项主要或严重缺陷中，通用问题缺陷集中在关键文件（41项）和源文件（38项）——这些恰恰是最难标准化的领域。

临床稽查是AI最难啃的骨头。至今，几乎没有跨国药企公开分享过临床QA中使用AI的具体案例。四大的AI审计平台已经处理万亿级分录了，临床稽查这边还在"探索阶段"。不是药企不积极，是这块骨头确实硬——稽查对象非结构化、判断依赖情境、数据格式混合，AI擅长的那些事（规则明确、数据结构化、全量扫描），在临床稽查里只能覆盖一小部分。

但临床稽查也是AI最危险的战场。财务审计AI出错，后果是财务损失、投资者误导——严重，但可以量化。临床稽查AI出错，后果可能涉及受试者（参与者）安全——这个代价，没有哪个监管机构愿意承受。

所以监管的态度非常明确——AI在临床场景中不能独立做判断，这不是技术能力的问题，是风险底线的问题。

2021 · GMLP

FDA、加拿大卫生部和MHRA联合发布Good Machine Learning Practice，定义"什么是好的AI"。

2024 · EU AI Act

将医疗AI列为高风险系统（Article 6(1)），罚则量级说明监管不是在试探，是在划红线。

2024 · NMPA

《药品监管人工智能典型应用场景清单》把"辅助稽查办案"列为15个重点场景之一。

2026 · GAIP

FDA和EMA联合发布Guiding Principles of Good AI Practice，10项核心原则，明确AI必须纳入全生命周期管理。

中国同样在加速。NMPA 2026年的"AI+药品监管"实施意见更是从顶层设计上推动落地。

从2021年的GMLP到2026年的GAIP，监管用了四年多时间铺了一条线：AI不是法外之地，临床场景的AI必须被管起来。

所以回到那个问题——AI会不会替代临床稽查员？至少在当前监管框架下，答案很明确：不会，因为监管不允许AI独立做出影响受试者安全和GCP合规性的判断。

但这个答案只回答了一半的问题。

真正的冲击：你以为只有人能做的，AI已经开始做了

上一章说监管不允许AI独立做判断，这是事实。但如果你因此觉得“那我还安全”，你可能低估了正在发生的事。

有些你以为只有人能做的任务，AI已经开始做了。

🔍 全量数据异常扫描

过去做稽查，抽样是常态——不是不想查全量，是查不过来。现在AI可以。KPMG的Clara平台已经在财务审计中扫描数百万条分录标记异常，同样的逻辑正在被移植到临床试验场景——Medidata Rave的智能监管功能已经可以自动识别中心风险（入组延迟、数据异常），据其公开数据预测准确率达85%。

过去你靠经验"感觉"有问题的中心，AI现在可以用数据"看见"。

📄 NLP自动提取关键文件信息

临床稽查最耗时的环节之一，是翻阅大量TMF文件、方案偏离报告、稽查轨迹记录。Veeva在2025年宣布推出AI Agents，计划嵌入Vault平台实现TMF文件自动归档、CSR撰写辅助等功能，临床场景的Agents预计2026年可用。NMPA的应用场景清单中，“辅助稽查办案”场景明确提到：利用AI参照以往相似违法违规行为的处罚信息，对日常监管、行政处罚等业务形成的文书进行智能分析。

过去你需要花几天翻阅的文件，AI几分钟就能提取出关键信息并标注异常。

📊 风险预测模型

AI在临床质量管理（cQMS）中的应用，已经开始将被动合规工具转变为主动风险预警平台——基于历史数据构建风险预测模型，识别高风险研究中心和试验环节。Cloudbyz CTMS的机器学习模型预测中心绩效准确率据其公开数据达78%。

AI开始进入你的专业判断领地了——不是替你做判断，而是在你做判断之前，已经把判断的素材准备好了。

注意，这三件事有一个共同特征：它们都不涉及“做出判断”，而是“提供判断的基础”。AI把异常筛出来了，但“这个异常是否构成系统性问题”是否“影响受试者安全”“稽查报告怎么写”——这些判断，仍然是你的事。

这正是角色升级的核心——

临床稽查员正在从“查问题的人”变成“判断AI查得对不对的人”。

听起来只是换了个说法，但实际变化是根本性的。过去你的核心竞争力是“能发现问题”，现在AI也能发现一部分问题了，你的核心竞争力变成了“能判断AI的发现是否可靠、是否重要、是否需要行动”。这要求你不仅懂GCP，还要懂AI的判断逻辑——它为什么标了这个异常？它的训练数据覆盖了什么场景？它的边界在哪里？下次稽查，当你面对AI标红的异常清单时，你能回答这三个问题吗？

如果你不理解AI的判断逻辑，你连签字的底气都没有。

这不是危言耸听。GAIP的10项原则里，“以人为本的设计”排在第一条，“基于风险的方法”排在第二条——监管的态度很明确：AI必须服务于人的判断，但人也必须有能力驾驭AI。NMPA的应用场景清单里写的是“辅助稽查办案”，不是“替代稽查办案”——一个“辅助”，划清了边界。

所以，AI会不会让临床稽查员失业？请将你的答案分享在评论区。

未完待续......

回到开头的那个问题。AI的输出你敢签字吗？

读到这里，你可能已经有了更深的思考——签字的底气，不取决于AI有多强，而取决于你有多理解AI给你的是什么。

但这个问题背后，还藏着一个更深层的问题：当AI的判断影响稽查结论，谁来对AI的判断负责？如果AI筛出了一个异常信号，你基于这个信号写了稽查发现，最终这个发现影响了监管决策——责任链条上，谁站在哪里？

这个问题，我们下一篇聊。

关于我们——CQAF AI for Auditing 兴趣小组

2025年12月组建，成员来自临床质量、CSV、中心影像QA、早期研究质量管理等不同背景——不是AI专家来教QA，而是QA同行一起搞懂AI。

我们以“懂规则、看趋势、促行动”为三大支柱：协同解读FDA、EMA、NMPA等监管文件，确保实践合规；深度剖析AI在临床各环节的标杆案例，提炼稽查核心要点；探索AI稽查流程标准化、智能稽查工具应用等实践方向。

本系列推文即为小组的阶段性输出。后续将持续推出AI稽查专业小课堂（法规解读、案例拆解、工具实操），并最终形成《AI赋能临床稽查机会清单》。我们也招募愿意一起加入分享的专家、同仁和小伙伴，我们将按话题热度逐步推出。

如果你也是临床试验领域的同行，对AI在临床研究领域的应用有思考、有实践、有困惑——欢迎联系我们，一起深耕技术、共建标准。

声明

本文撰写过程中使用了AI辅助工具，作者已努力核实文中信息，但仍可能存在疏漏。如有发现事实性错误或值得商榷之处，欢迎指正交流。

供稿 | Lydia Li

审核 | Cathy Liu, Bing Wen, Ariel Wu

编辑 | 乐园，李茜然