刚看到新闻,月初的时候 OpenEvidence 一天 100 万次临床咨询达成。
这个数字背后更吓人的是增长曲线:
- 一年前:月均 300 万次咨询
- 2025年12月:月均 1800 万次
- 现在:单日 100 万次
40% 的美国医生每天在用,覆盖 1 万多家医院。过去一年,1 亿美国人被使用 OpenEvidence 的医生诊治过。
估值一年 12 倍:10亿 → 35亿 → 60亿 → 120亿美金。

站在行业视角看,分工开始发生变化了。不管你怎么杠这个行业有多难进入,AI 贴着医生的真实工作流确实发生了。
巨头都在挤进来
也难怪 OpenAI、Anthropic、Google、Microsoft 都在往医疗里挤:
- OpenAI:250亿美金基金会承诺 + 「OpenAI for Healthcare」
- Anthropic:「Claude for Healthcare」+ G 轮 300亿美金
- Google:与 CVS 合作 Health 100、Verily 刚融 3亿美金
- Microsoft:Nuance 160亿美金收购打底,每天 5000 万健康查询
从去年底开始这股风已经吹到国内。中国医疗 AI 市场预计从 2023 年的 88 亿涨到 2033 年的 3157 亿人民币。一旦数据、合规这些环节能打通,真正的变化可能会比很多人想得更快。
一个不太主流的判断
我有一个不太主流的判断:医疗 AI 不一定会先被最大模型吃掉。
甚至有可能,最先真正落地的是一批被精心约束过的小模型系统。
这几年 AI 行业的宏观叙事一直是 scaling law,大家都默认模型越大代表能力越强,能力越强更适合复杂场景。
这一点在很多地方成立,但医疗行业有点不太一样。
医疗是一个高约束系统
你可以把医疗理解成一个高约束的系统。
医生不是一个创意角色,绝大多数每天都在指南的约束下做决策。这就意味着 AI 只要稳定地做对就已经很有价值了,不需要每一步都靠泛化能力去猜。所以指南本身对 agentic workflow 有圣经级别的指导意义。
如果把医疗临床决策的一整条链都丢给一个大模型,不稳定,也很难验证。
但如果你换个方式做:用小模型做解析分类,然后加上检索,利用指南做约束,变成一个 agentic 的 workflow,整个问题答案的求解过程就会从模型能力问题变成系统工程问题。
尤其是在医院这种环境里,去看真实约束就能知道他要什么:风险低、强合规、可解释。所以可控很多时候比最强能力更重要。
两条路线并存
这也是为什么会看到两条路线同时存在:
- OpenAI、Google、千问在往大模型 + 平台走
- 另一边,一些团队在做更垂直更工程化的系统
本质上这是两种不同的解法。
我现在更倾向的一个表达是:大模型决定上限,harness 决定能不能落地。
是的,医疗行业需要更严格的 harness,后者的重要性,可能被低估了。
小公司的机会在哪
所以从这个角度看,这一波医疗 AI,不一定是大公司专属。
如果把问题理解成拼模型,那确实没机会。算力、数据和人才,基本都在大厂手里。
但如果问题变成谁更懂具体场景,以及谁能把 workflow 打磨到可用,那格局就完全不一样了。
这是一个典型的知识 + 流程 + 约束的行业。
很多关键能力都是长年积累的东西:临床路径、医生习惯、科室差异、历史数据结构、合规边界。这些东西大模型本身是没有的。
真正决定系统效果的,是谁有能力把这些隐性知识结构化。
这也是为什么我会觉得一些在医疗行业深耕多年的团队,反而可能在这一波里更有机会,哪怕模型用的是现成的。
因为他们要做的只是把模型嵌进一个已经跑了很多年的系统里。这件事的门槛,和训练模型完全是两套能力。
如果前面的判断成立:大模型决定上限,harness 决定能不能落地。那小公司真正的机会就在这里。
不需要最强的模型,只需要:
- 更贴近一线的场景理解
- 更扎实的 workflow 设计
- 更长期的数据积累
把这三件事做好,完全有可能从另一条路径长出来。
这么多开源大模型在手边,这一波医疗 AI 完全可以是一次工程能力 + 行业认知的重排,而不是单纯的模型竞赛。
关注凡人小北,了解 AI 落地、创业机会、技术洞察。
