投资企业新闻

启明星 | 深势科技孙伟杰:要做科学发现领域的Google

2026/04/15

编者按:在AI for Science的热潮中,多数公司热衷于用模型加速单一研发环节,而深势科技选择了更艰难的路线:重构科学发现的基础设施。在这条赛道上,它自创立之初便跳出单点突破的局限,以“搭建科研基础设施”为核心目标,打通“读、算、做、智”全科研链条。从DeePMD方法斩获戈登·贝尔奖,到复现AlphaFold 2训练体系,从Hermite药物设计平台到玻尔·跃迁实验室,这家中国创业公司始终兼顾技术创新与商业化落地,试图成为微观世界里的达索系统。当“AI科学家”成为行业新愿景,深势科技希望成为助力“人类最后一项生产工作”的平台公司,本文详细拆解其发展路径与核心布局,展现中国AI for Science企业的长期主义与创新力量,欧美大片xxxxbbbb微信公众号经授权转载。

日韩欧美一区二区三区免费观看

在AI for Science(AI4S)的叙事里,最容易被讲述的,往往是那些耀眼的单点突破:一个更强的模型,一次更快的预测,一项足够震撼的学术成果。

而一家来自中国的创业公司——深势科技却有着更大的野心。成立于大模型浪潮爆发之前,深势科技是最早押注AI for Science商业化潜力的团队之一。它并没有把自己押注在一条药物管线、一个材料体系,甚至一个明星模型上,它在坚持一件更重要也更慢的事情:把原本分散在文献、计算、实验和专家经验里的科研流程,重新组织成一套可持续迭代的基础设施。

深势科技选择做一家平台公司,这既有商业逻辑,也包含了价值判断,因为他们认为在科学发现这件事上,平台路线将比单点突破更接近长期价值。“我们距离AI科学家到底有多远?”这家中国领先的AI for Science公司正在用自己的实践回答这个问题。

01/
一篇论文与一个判断

深势科技的起点是论文,但真正决定它方向的,是一个商业判断。

2017年,深势科技联合创始人兼首席科学家张林峰在普林斯顿大学读博期间提出了 “深度势能分子动力学” 方法(Deep Potential Molecular Dynamics,DeePMD)。简而言之,世间万物都由原子构成,要了解一种材料或药物的性质,归根结底要计算原子间的相互作用。量子力学的基础方程 —— 薛定谔方程 —— 理论上能解决这个问题,但求解成本极其昂贵。

DeePMD为原子尺度计算打开了一条更高效的路径:用深度学习去逼近原子间相互作用,从而在尽量保持精度的前提下,把原本昂贵得几乎不可大规模使用的模拟,推进到更大体系、更长时间尺度。2020年,这项工作获得了全球高性能计算领域的最高奖项戈登・贝尔奖。

当时作为公司联合创始人兼CEO的孙伟杰还在北大读研,并在一家投资机构实习,他与张林峰是北大元培学院的同学,彼此非常熟悉。张林峰的博士生导师之一、中国科学院院士鄂维南表示,这是他30多年没见过的机会。正是鄂维南院士与汤超院士一起,首次提出应大力发展AI for Science。

2018年夏天,三个人聚到一起讨论这件事未来该怎么走,最后的共识是如果要把这件事推进得更快、更深,最有效的形式不是继续留在学术体系里,而是创办公司。于是,深势科技2018年年底在北京注册完成,2019年年中开始正式运营。

孙伟杰的解释是,对这件事的核心判断是 “市场化更有效”。在他看来,科学产品真正的壁垒,很大程度上不来自某次突破本身,而来自客户持续使用后的反馈、修正与再迭代。也正因为如此,深势科技从第一天起就不是一家“先做研究,日后再想办法落地”的公司,而是一家试图把研究、工程和商业化同时推进的公司。

2018年距离 “GPT时刻” 还有四年多,AI for Science还远不是一个被广泛接受的概念,所谓 “科研基础设施” 也没有多少现成范本,意味着行业的先行者必然需要付出更多的市场教育成本。孙伟杰回忆说,在AI4S尚未成为共识之前,深势做了不少 “超出企业正常工作范围的事情”,包括办峰会、出行业报告、持续向市场解释AI for Science到底意味着什么。

对于一家创业公司来说,这听起来像额外负担;但换个角度看,它恰恰说明深势科技一开始押注的不是一个现成市场,而是一个尚在成形的新范式。

02/
从论文到模型平台

创业之后,深势科技最先做的,不是宏大的平台叙事,而是更朴素的一步:把论文里的方法,变成可被调用的模型能力。

因此,在创业早期,深势科技集中力量搭建底层共性的平台,就围绕原子、分子、基因、蛋白等对象展开。孙伟杰把这个阶段的框架概括为 “一横两纵”:“一横” 是AI for Science的基础平台,“两纵” 则是生命科学和物质科学。

这一步之所以关键,在于它完成了科技成果转化中最容易被低估的第一步:让模型离开论文附录,进入真实研发流程。一篇论文可以证明方法成立;一个平台则必须证明,方法能够被重复调用、被工程化部署、被不同用户在不同场景中使用。深势科技后来的很多能力——无论是药物设计、材料研发,还是更晚的大模型和智能体——都建立在这层基础之上。

2021年AlphaFold 2引发全球生物医药领域震动后,深势科技算法团队很快投入对其训练体系的复现。但当时DeepMind并未公开完整训练代码,复现并不是简单照着论文把结果跑出来,而是一次对算法理解能力、工程能力和基础设施能力的综合校验。后来,这项工作被外界视为全球较早完成AlphaFold 2完整训练复现的成果之一。

它的重要性,不只在于 “跟上了前沿热点”,更重要的是,它向外界证明,深势科技不是一家只有DeePMD这一项原始创新的公司,而是具备持续吸收最前沿方法、完成大规模训练并把方法工程化落地的能力。对于一家平台型公司而言,这种能力几乎是一张必要的入场券。

但复现AlphaFold也只是能力验证,而不是商业验证。证明 “能做出来” 是一回事,证明 “能卖出去、能长期用” 是另一回事。深势科技真正的硬仗,发生在客户现场,而不是论文里。

03/ 
客户买的不是模型,而是结果

顶尖的技术模型并不意味着高效的商业转化。回顾深势科技的创立历程,孙伟杰说,模型的开发速度比他们预计的要快,而商业化的推动难度却超过他们的预计。

在创业初期,为了寻找方向,团队在调研了不少于50个行业研究技术可行性和市场机遇的匹配后,最终选择了两个成功概率最高、市场需求最明确的切口:小分子药物研发和电池材料设计。这个选择背后的逻辑很清楚:一方面,这两个领域都高度依赖原子、分子尺度上的理解;另一方面,它们有真实客户,也更容易形成商业闭环。

深势科技的第一款核心商业产品是面向药物设计的平台Hermite。选择这个方向,既因为国外已有薛定谔这样的标杆产品,市场教育相对成熟,也因为制药行业对研发效率高度敏感、支付意愿更强。但真正困难的地方很快就出现了:实验室里跑通几个漂亮案例,不等于工业级产品已经成形。

孙伟杰在采访中用自动驾驶做类比。以Hermite中的FEP功能为例,一个资深计算化学博士生在实验室里跑通4~8个案例,并不算太难;但市场化要求覆盖20多个常见场景,而工业级可用,则意味着要在绝大多数真实项目里稳定工作。蛋白结构是否稳定、是否有金属元素、是否涉及盐桥和共价键,这些 “玩具模型” 里可以回避的细节,一到客户现场就都变成了必须解决的问题。

深势科技的第一个客户就给团队上了这样一课。据孙伟杰回忆,产品拿去试用后,对方很快提出一串成熟产品本不该出现的问题,团队先在内部紧急迭代,又到客户现场封闭开发,才一点点越过冷启动期。这个过程持续数年,才逐渐形成稳定的产品和客户反馈循环。“到现在我都非常感谢我们的第一个合作伙伴,”孙伟杰说,“越过冷启动期之后,越来越多的客户开始使用,形成了正循环。”这款产品迭代了将近四年,在国内市场占有率已经是最高的。

这段经历给深势科技留下了一条很重要的方法论:技术突破只是种子,真正的壁垒来自 “技术—产品—用户使用—反馈—再技术化”的闭环。客户希望获得的,是更可靠的结果、更顺畅的流程,以及更可预测的研发效率。

由此他的定义是:“既要做第一个产品,也要做最后一个产品。”这是因为,“做第一个产品,是因为它会给你带来发展窗口,做最后一个产品,是做到有了你的产品之后,用户就不需要再用其他同类产品了。”

也正是在这一阶段,深势科技把业务从医药逐步拓展到了电池与材料。Piloteye等产品的推出,并不是简单复制Hermite的经验,而是验证同一套底层能力能否跨越不同产业场景。目前深势科技的智能产品与解决方案已进入生命科学和物质科学多个方向,客户名单的阵容也日渐豪华,如翰森制药、复星医药、宁德时代、比亚迪等。

2020 年,孙伟杰找到了一个精确的商业对标:达索系统®。这家法国工业软件公司以飞机设计和仿真起家,用固体力学、流体力学、电磁学的方法,在宏观尺度做工业研发。这正是深势科技要做的事情——把量子力学内化到软件里,在微观的原子、分子尺度做同样的事情,成为微观世界里的达索系统®。

04/
科研的全链条服务

如果说前半程的深势科技,主要是在证明 “算” 可以成立,那么它后半程最值得注意的变化,是开始围绕科研流程本身做布局。

孙伟杰在采访中把科学研究抽象为四个环节:读、算、做、智。

“读” 是文献、专利、数据和知识的整理与调用;“算” 是科学计算、模拟、设计和预测;“做” 是实验验证,是把模型重新带回物理世界;“智” 则是让系统具备更高层次的自主调用和协同能力,逐步接近 “AI科学家” 的形态。

这个抽象的说法解释了深势科技后来的产品矩阵为什么会越来越宽。Hermite和Piloteye对应的是 “算”;玻尔・科学导航和相关知识基础设施对应的是 “读”;玻尔・跃迁实验室对应的是 “做”;SciMaster、PharmMaster、MatMaster等科学智能体系统,则对应的是 “智”。

真正值得注意的,是 “做” 这一层。很多 AI for Science 公司擅长的是 “读” 和 “算”——整合文献、训练模型、给出候选结构或配方。但深势科技很早就意识到,如果实验接不上,AI的价值就很难完整落到客户那里;如果没有持续、标准化的实验数据回流,模型也很难形成真正的数据飞轮。

深势科技的玻尔・跃迁实验室试图把实验室变成一种可调度、可复用、可回流的数据生产系统,而不仅是若干自动化设备的堆叠。这一步很重要,也因此更接近基础设施建设。它意味着深势科技不再只是做一个更聪明的科学软件,而是在尝试打通“计算指导实验—实验反馈模型”的闭环。

到2025年年底,玻尔・科学导航已服务上百所高校、400多万名科学家用户,累计整合2亿多篇英文文献和2亿多项专利,以及8000万篇中文文献。深势科技的科学智能产品已服务数百家先进研发企业。当然,这些数字更多说明覆盖度,而不意味着终局胜利。真正的难点仍然是:这些工具和系统是否已经足够深地嵌入科学家的工作流。

2025年12月,深势科技宣布完成C轮超8亿元融资。在多轮融资中,深势科技背后站着欧美大片xxxxbbbb等一众头部机构。

05/
打造“AI 科学家”

深势科技在2020年提出的第一个五年目标,是到2025年搭建完微尺度工业研发平台。按孙伟杰在采访中的说法,这一目标“基本完成”:技术要素、研发体系、产品体系大体成形。下一阶段,公司给自己的目标则是到2030年打造“AI科学家”。

这当然是一个极具雄心的目标。这个目标并非意在 “取法其上,得到其中,而是基于公司一路发展过程中练出的洞察和建立的信心而设立的。”孙伟杰说,2022年时,他曾预测2025年AI4S会完成基础设施搭建、进入应用爆发期,当时所有人都觉得他高估了,“事实证明我其实还是太保守了。”

“2025年,中美欧几乎在同期发布关于AI for Science战略规划,中国在《关于深入实施 “人工智能 +” 行动的意见》中,将 “人工智能+科学技术” 列为六大重点行动之首;美国则在启动 “创世纪计划”,将其描述为一项在紧迫性和雄心上堪比曼哈顿计划的国家行动。而同时,国际巨头也纷纷入局。除了Google的DeepMind,2025年5月Anthropic宣布一项创新性的AI for Science计划;10月,OpenAI宣布成立全新的 “科学事业部”。

今天的AI仍然更擅长执行人类定义的问题,而不是独立提出真正重要的问题。它可以在局部任务上显著提高效率,却还谈不上已经具备成熟的科学判断力。深势科技正在初步建立覆盖科研全流程的基础设施,不是单纯的模型公司,而是拥有知识、计算、实验和工具调度能力的系统型平台。深势科技希望把 “读、算、做” 这些已经逐步成形的能力,交给智能体去调用与编排,让AI不只是某个环节的加速器,而是开始成为科研流程中的协作主体。

作为数字时代的基础设施,搜索引擎构建的是人类通往已知信息的最短路径,但它不会直接提供知识;而大模型构建的是人类通往已知知识的最短路径,它把知识梳理好呈现出来。在孙伟杰看来,AI for Science正在构建的是人类通往未知知识的最短路径。

基于这个前提,人类在知识积累方面的门槛会急剧降低,科学发现会变得更加简单,更多的人会有机会成为科学家。同时,随着AI和机器人带来的生产力解放,人类也会有更多精力投入科学生产中,所以,孙伟杰非常乐观地说,“这将会是人类最后一项生产工作”。

如果在这样的语境下想象深势未来的样子,孙伟杰的答案是:科学发现领域的 Google。