
点击蓝字 关注我们


AI帮你找到的异常,你敢签字吗?

如果你的稽查报告里有一项发现是AI帮你找到的,你敢签字吗?
这不是一个假设性问题。
2026年4月,安永(EY)在鉴证业务领域全球推出企业级多智能体AI框架,嵌入云审平台,每年处理超过1.4万亿条会计分录,覆盖150+国家、16万+审计项目。毕马威(KPMG)的Clara平台已经利用AI扫描数百万条会计分录,标记异常供人工审核。德勤的Omnia和Zora AI™、普华永道的GL.ai——四大会计师事务所正在以数十亿美元的投入,把AI变成审计的"标配"。
审计行业的变化不是"会不会来"的问题,而是"已经来了"。
麦肯锡2025年全球AI调研显示,88%的受访企业已在至少一个业务环节部署AI(含生成式AI和分析型AI)。金融时报报道,2025年四大在英语国家发布的招聘中,要求AI技能的岗位占比近7%,自2022年以来增长逾两倍——AI专家的招聘广告数量已经超过了审计师。
所以问题不是AI会不会进入临床稽查,而是——当AI进入之后,你的角色是什么?

别慌,AI替代的是任务,不是你

先说一个让很多人意外的判断:AI替代的是"任务",不是"角色"。
这不是安慰剂,是正在发生的事实。
看看审计行业的人才结构变化——BDO立信的分析指出,审计、法证、尽调、合规等结构化明显、数据密集型领域,专业人士预测未来3-5年内自动化可能淘汰该领域50%的岗位。听起来很吓人。但同一份分析也揭示了一个更重要的趋势:人才模式正在从"金字塔"转向"钻石型"——底层基础岗位更精简,但技术和管理专家组成的中间层反而更宽了。
换句话说,AI砍掉的是金字塔的底部,但中间变宽了——你不需要爬那么高,但你需要站得更稳。
四大的动作也印证了这一点。2024年四大毕业生招聘岗位同比减少44%,毕马威将部分新人团队缩减近30%——初级审计员确实在减少。但与此同时,四大正在大量招聘AI专家,要求AI技能的岗位占比从2022年的不到2%飙升到近7%。他们不是不需要人了,而是需要不一样的人了。
背后的逻辑其实很简单:在财务审计领域,凭证核对、数据整理、全量扫描、异常标记——这些重复性高、规则明确的任务,AI确实干得比人快、比人准、比人不知疲倦。但"这个异常是否构成系统性问题""这个偏差是否影响受试者安全""这个发现需要在稽查报告中怎么表述"——这些需要专业判断的环节,AI目前碰不了。
真正该担心的不是"AI会不会让我失业",而是"当AI替我完成了大量基础任务之后,我剩下的专业判断能力够不够用"。

临床稽查的特殊性:AI最难啃的骨头,也是最危险的战场

如果你觉得"AI替代任务不替代角色"这个判断让你松了口气,那接下来这个事实可能得让你重新绷紧——
临床稽查和财务审计,根本不是同一件事。
查的是账——财务数据是否真实公允,交易是否合规,规则写在会计准则里。
财务审计面对的是标准化的财务数据——XBRL格式、US-GAAP或IFRS准则、固定的科目和字段。规则明确,数据结构化,判断有据可循。难怪哥伦比亚大学2025年已经开发出FINAUDITING基准,用于评测AI在财务报表审计中的能力。
查的是合规——数据是否真实可靠,受试者的安全、权益和福祉是否得到保障,医疗场景下的操作是否符合GCP,规则写在GCP里,但判断在现场。
临床稽查面对的是高度非结构化的临床过程——病历、知情同意、GCP合规行为、研究者与受试者的互动。判断标准不是会计准则那种"可编码"的规则,而是GCP+伦理+受试者保护这套需要情境判断的体系。EMA 2024年度GCP检查报告显示,335项主要或严重缺陷中,通用问题缺陷集中在关键文件(41项)和源文件(38项)——这些恰恰是最难标准化的领域。
临床稽查是AI最难啃的骨头。至今,几乎没有跨国药企公开分享过临床QA中使用AI的具体案例。四大的AI审计平台已经处理万亿级分录了,临床稽查这边还在"探索阶段"。不是药企不积极,是这块骨头确实硬——稽查对象非结构化、判断依赖情境、数据格式混合,AI擅长的那些事(规则明确、数据结构化、全量扫描),在临床稽查里只能覆盖一小部分。
但临床稽查也是AI最危险的战场。财务审计AI出错,后果是财务损失、投资者误导——严重,但可以量化。临床稽查AI出错,后果可能涉及受试者(参与者)安全——这个代价,没有哪个监管机构愿意承受。
所以监管的态度非常明确——AI在临床场景中不能独立做判断,这不是技术能力的问题,是风险底线的问题。
FDA、加拿大卫生部和MHRA联合发布Good Machine Learning Practice,定义"什么是好的AI"。
将医疗AI列为高风险系统(Article 6(1)),罚则量级说明监管不是在试探,是在划红线。
《药品监管人工智能典型应用场景清单》把"辅助稽查办案"列为15个重点场景之一。
FDA和EMA联合发布Guiding Principles of Good AI Practice,10项核心原则,明确AI必须纳入全生命周期管理。
中国同样在加速。NMPA 2026年的"AI+药品监管"实施意见更是从顶层设计上推动落地。
从2021年的GMLP到2026年的GAIP,监管用了四年多时间铺了一条线:AI不是法外之地,临床场景的AI必须被管起来。
所以回到那个问题——AI会不会替代临床稽查员?至少在当前监管框架下,答案很明确:不会,因为监管不允许AI独立做出影响受试者安全和GCP合规性的判断。
但这个答案只回答了一半的问题。

真正的冲击:你以为只有人能做的,AI已经开始做了

上一章说监管不允许AI独立做判断,这是事实。但如果你因此觉得“那我还安全”,你可能低估了正在发生的事。
有些你以为只有人能做的任务,AI已经开始做了。
过去做稽查,抽样是常态——不是不想查全量,是查不过来。现在AI可以。KPMG的Clara平台已经在财务审计中扫描数百万条分录标记异常,同样的逻辑正在被移植到临床试验场景——Medidata Rave的智能监管功能已经可以自动识别中心风险(入组延迟、数据异常),据其公开数据预测准确率达85%。
过去你靠经验"感觉"有问题的中心,AI现在可以用数据"看见"。
临床稽查最耗时的环节之一,是翻阅大量TMF文件、方案偏离报告、稽查轨迹记录。Veeva在2025年宣布推出AI Agents,计划嵌入Vault平台实现TMF文件自动归档、CSR撰写辅助等功能,临床场景的Agents预计2026年可用。NMPA的应用场景清单中,“辅助稽查办案”场景明确提到:利用AI参照以往相似违法违规行为的处罚信息,对日常监管、行政处罚等业务形成的文书进行智能分析。
过去你需要花几天翻阅的文件,AI几分钟就能提取出关键信息并标注异常。
AI在临床质量管理(cQMS)中的应用,已经开始将被动合规工具转变为主动风险预警平台——基于历史数据构建风险预测模型,识别高风险研究中心和试验环节。Cloudbyz CTMS的机器学习模型预测中心绩效准确率据其公开数据达78%。
AI开始进入你的专业判断领地了——不是替你做判断,而是在你做判断之前,已经把判断的素材准备好了。
注意,这三件事有一个共同特征:它们都不涉及“做出判断”,而是“提供判断的基础”。AI把异常筛出来了,但“这个异常是否构成系统性问题”是否“影响受试者安全”“稽查报告怎么写”——这些判断,仍然是你的事。
这正是角色升级的核心——
临床稽查员正在从“查问题的人”变成“判断AI查得对不对的人”。
听起来只是换了个说法,但实际变化是根本性的。过去你的核心竞争力是“能发现问题”,现在AI也能发现一部分问题了,你的核心竞争力变成了“能判断AI的发现是否可靠、是否重要、是否需要行动”。这要求你不仅懂GCP,还要懂AI的判断逻辑——它为什么标了这个异常?它的训练数据覆盖了什么场景?它的边界在哪里?下次稽查,当你面对AI标红的异常清单时,你能回答这三个问题吗?
如果你不理解AI的判断逻辑,你连签字的底气都没有。
这不是危言耸听。GAIP的10项原则里,“以人为本的设计”排在第一条,“基于风险的方法”排在第二条——监管的态度很明确:AI必须服务于人的判断,但人也必须有能力驾驭AI。NMPA的应用场景清单里写的是“辅助稽查办案”,不是“替代稽查办案”——一个“辅助”,划清了边界。
所以,AI会不会让临床稽查员失业?请将你的答案分享在评论区。
未完待续......
回到开头的那个问题。AI的输出你敢签字吗?
读到这里,你可能已经有了更深的思考——签字的底气,不取决于AI有多强,而取决于你有多理解AI给你的是什么。
但这个问题背后,还藏着一个更深层的问题:当AI的判断影响稽查结论,谁来对AI的判断负责?如果AI筛出了一个异常信号,你基于这个信号写了稽查发现,最终这个发现影响了监管决策——责任链条上,谁站在哪里?
这个问题,我们下一篇聊。
关于我们——CQAF AI for Auditing 兴趣小组
供稿 | Lydia Li
审核 | Cathy Liu, Bing Wen, Ariel Wu
编辑 | 乐园,李茜然


沪公网安备 31011202013414号