当前医药 AI 革命隐藏着一个结构性危机——数据囧境,为了打破这个“十亿美元的瓶颈”,谷歌的软件专家开发出一种名为“联邦学习”的革命性技术。
在2026年J.P.Morgan医疗保健大会上,英伟达CEO黄仁勋与礼来CEO大卫·里克斯(Dave Ricks)的一场巅峰对话,标志着医学史上的一个决定性转折点。双方宣布共同投资 10 亿美元建设“联合创新实验室”(Co-Innovation Lab),这不仅仅是一次资本注入,更是一场关于“生物工程时代”的宣言。黄仁勋指出,几十年来,药物研发一直是一门“手工技艺(Artisanal Art)”,一个基于试错和充满偶然性的过程;而今天,它正转变为一个工程问题(Engineering Problem)。
然而,在这种乐观情绪之下,隐藏着一个可能阻碍医药 AI 革命的结构性危机,即被业界人士称为“十亿美元的瓶颈”(Billion-Dollar Bottleneck),或者是“数据囧境”:尽管我们已经拥有强大的芯片(比如英伟达的 Vera Rubin 架构)和宏伟的野心,但我们缺乏驱动这些计算引擎的燃料——数据。
数据囧境:AI 为何在医药界“挨饿”?
在其它大多数行业中,可供学习的数据很多,AI 依靠海量数据茁壮成长。现在大家都已经很熟悉的大语言模型(LLM)就是在公开的互联网数据上训练的。但生物医药领域则截然不同,训练一个能够预测蛋白质折叠或分子在人体肝脏内反应的模型所需的数据绝大部分并非公开信息,而是被锁在全球各家制药巨头自己的服务器中,这便人为地造成了一个价值超过“十亿美元的瓶颈”。
这个瓶颈主要体现在两个维度上。
一是高昂的失败成本。对训练 AI 最有价值的数据,即那些“失败的实验数据”或数千万个因为某些原因没有被开发成药物的分子结构从未被公开。它们被锁在数据孤岛中,为了知识产权各自严防死守。一小部分在学术期刊里或会议上公开的数据,都是为了讲一个“预设的故事”而精挑细选出来的,根本就经不起深究。
二是数据碎片化。没有任何一家公司(即使是像礼来这样的巨头)拥有足够的数据来独立模拟健康和疾病的无限复杂性。每家公司只掌握着“健康地图”的一小块,导致 AI 模型长期处于“训练不足”的状态,无法在不同人群或复杂疾病中具备泛化的能力。这好比我们试图绘制一张世界地图,但每个探险家却拒绝分享自己手中的那一小块图纸。
联邦学习:保护隐私的训练方案
为了打破这一行业瓶颈,谷歌的软件专家开发出了一种名为“联邦学习”(Federated Learning)的革命性技术。如果传统的AI 训练方案要求将所有数据汇总到一个大的数据中心,那么联邦学习则是将多个AI同时送到不同数据所在地。其核心机制是协作智能,同时保证数据私有。
在联邦学习的运作过程分为四个步骤。首先,中心服务器(协调者)将一个“基础 AI 模型”分发给多个参与的制药公司;然后,每家公司在自己的防火墙内,利用其私有的、受保护的数据对模型进行训练;因为这些原始数据从未离开过公司的服务器,所以没有泄密的问题。其三,在公司之间不共享数据的前提下,每个AI只是通过共享在不同公司学到的“经验教训”(已经不包含任何可识别的数据信息)进行模型融合与升级。最终创建出一个比任何单一模型都更智能、更可靠的“大模型”。通过联邦学习训练的大模型可以“洞察”多家公司的原始积累,从而获得新药研发的“上帝视角”,同时也保证了任何一家公司都不会丢失其商业机密。
为了让这种合作在法律和商业上可行,谷歌已经开发了三项相关的新技术。第一是差分隐私(Differential Privacy),在模型更新中加入数学“噪声”,确保任何人都无法通过逆向工程从模型参数中推断出原始的数据;第二是同态加密(Homomorphic Encryption),它允许中心服务器在数据仍处于加密状态下进行运算。这意味着模型融合升级时,完全看不见数据内容;第三是安全多方计算(SMPC),也就是将模型更新分割成多个碎片分布在不同服务器上,只有同时破解所有服务器才能获取完整信息。
鹿死谁手:CPU、GPU还是TPU?
过去10年是GPU的十年。
如果你在2015年买进了1000美元的英伟达股票,到2025年中期已经增值至超过20万美元。(我咋就没买进呢?)从2015年到2025年,英伟达的股价实现了惊人的增长,涨幅超过22000%。毫无疑问,这主要得益于原本用于电子游戏的GPU在AI算力上比传统CPU的显著优势。
相比之下,CPU老大英特尔的股价从2015年初的每股36美元到2025年底的每股37美元,完全被华尔街遗忘了。可见钞票是从来不骗人的。
超过英特尔CPU的,不是一款更好的CPU,而是异军突起的英伟达GPU;同理,超过英伟达GPU的,大概率也不会是一款更好的GPU;而是……谷歌的TPU?
2025年,英伟达股价的涨幅是39%。虽然上扬,但是比2024年的170%却逊色了不少。同期,谷歌的股价则大涨了66%,是该公司自2009年以来在华尔街表现最好的一年,而且2026开年势头依然不减。
难道说华尔街又看到了什么我没看到的东西?
2026年1月于新泽西
作者简介
贵柏曾在默沙东新药研究院工作多年,潜心钻研药物化学,颇有建树。几年前回国加入药明康德,从事业务开发、项目管理和驻美运营。梁博士是《新药的故事》一书的作者。他以长期的积累、独特的视角和生动的文字,通过《老梁说药》栏目讲述新药研发“背后的故事”,令人耳目一新,脑洞大开。梁贵柏博士目前是偕怡制药联合创始人兼首席科学家,欢迎读者通过邮箱gbliang55@hotmail.com与梁博士联系。
编辑 | 毛冬蕾
mao.donglei@PharmaDJ.com
访问研发客网站,深度报道和每日新闻抢鲜看