刚看到新闻,月初的时候 OpenEvidence 一天 100 万次临床咨询达成。

这个数字背后更吓人的是增长曲线:

  • 一年前:月均 300 万次咨询
  • 2025年12月:月均 1800 万次
  • 现在:单日 100 万次

40% 的美国医生每天在用,覆盖 1 万多家医院。过去一年,1 亿美国人被使用 OpenEvidence 的医生诊治过。

估值一年 12 倍:10亿 → 35亿 → 60亿 → 120亿美金。

OpenEvidence 达成历史性里程碑

站在行业视角看,分工开始发生变化了。不管你怎么杠这个行业有多难进入,AI 贴着医生的真实工作流确实发生了。

巨头都在挤进来

也难怪 OpenAI、Anthropic、Google、Microsoft 都在往医疗里挤:

  • OpenAI:250亿美金基金会承诺 + 「OpenAI for Healthcare」
  • Anthropic:「Claude for Healthcare」+ G 轮 300亿美金
  • Google:与 CVS 合作 Health 100、Verily 刚融 3亿美金
  • Microsoft:Nuance 160亿美金收购打底,每天 5000 万健康查询

从去年底开始这股风已经吹到国内。中国医疗 AI 市场预计从 2023 年的 88 亿涨到 2033 年的 3157 亿人民币。一旦数据、合规这些环节能打通,真正的变化可能会比很多人想得更快。

一个不太主流的判断

我有一个不太主流的判断:医疗 AI 不一定会先被最大模型吃掉。

甚至有可能,最先真正落地的是一批被精心约束过的小模型系统。

这几年 AI 行业的宏观叙事一直是 scaling law,大家都默认模型越大代表能力越强,能力越强更适合复杂场景。

这一点在很多地方成立,但医疗行业有点不太一样。

医疗是一个高约束系统

你可以把医疗理解成一个高约束的系统。

医生不是一个创意角色,绝大多数每天都在指南的约束下做决策。这就意味着 AI 只要稳定地做对就已经很有价值了,不需要每一步都靠泛化能力去猜。所以指南本身对 agentic workflow 有圣经级别的指导意义。

如果把医疗临床决策的一整条链都丢给一个大模型,不稳定,也很难验证。

但如果你换个方式做:用小模型做解析分类,然后加上检索,利用指南做约束,变成一个 agentic 的 workflow,整个问题答案的求解过程就会从模型能力问题变成系统工程问题。

尤其是在医院这种环境里,去看真实约束就能知道他要什么:风险低、强合规、可解释。所以可控很多时候比最强能力更重要。

两条路线并存

这也是为什么会看到两条路线同时存在:

  • OpenAI、Google、千问在往大模型 + 平台走
  • 另一边,一些团队在做更垂直更工程化的系统

本质上这是两种不同的解法。

我现在更倾向的一个表达是:大模型决定上限,harness 决定能不能落地。

是的,医疗行业需要更严格的 harness,后者的重要性,可能被低估了。

小公司的机会在哪

所以从这个角度看,这一波医疗 AI,不一定是大公司专属。

如果把问题理解成拼模型,那确实没机会。算力、数据和人才,基本都在大厂手里。

但如果问题变成谁更懂具体场景,以及谁能把 workflow 打磨到可用,那格局就完全不一样了。

这是一个典型的知识 + 流程 + 约束的行业。

很多关键能力都是长年积累的东西:临床路径、医生习惯、科室差异、历史数据结构、合规边界。这些东西大模型本身是没有的。

真正决定系统效果的,是谁有能力把这些隐性知识结构化。

这也是为什么我会觉得一些在医疗行业深耕多年的团队,反而可能在这一波里更有机会,哪怕模型用的是现成的。

因为他们要做的只是把模型嵌进一个已经跑了很多年的系统里。这件事的门槛,和训练模型完全是两套能力。

如果前面的判断成立:大模型决定上限,harness 决定能不能落地。那小公司真正的机会就在这里。

不需要最强的模型,只需要:

  • 更贴近一线的场景理解
  • 更扎实的 workflow 设计
  • 更长期的数据积累

把这三件事做好,完全有可能从另一条路径长出来。

这么多开源大模型在手边,这一波医疗 AI 完全可以是一次工程能力 + 行业认知的重排,而不是单纯的模型竞赛。


关注凡人小北,了解 AI 落地、创业机会、技术洞察。