半数华人、3位亿万富翁:这张十年前的量化实习生合照,藏着 AI 时代的新贵版图
23 小时前 / 阅读约11分钟
来源:36kr
量化交易背景人才在AI领域崛起,他们凭借数学、工程能力改写AI圈。幻方量化孵化出DeepSeek,用量化思维实现效率反超。AI与量化交易相似,竞争转向系统实现能力。

AI圈里最炙手可热的新贵们,可能一大半都出自量化交易。

这话并不夸张。

故事要从2015年冬天说起。HRT的纽约会议室里,一群年轻人围在桌前,留下了一张青春洋溢的生日合影,华人面孔超过一半。

举着手机自拍的叫Jesse Zhang,现在是AI Agent独角兽Decagon的CEO,三年时间把公司估值推到了45亿美元。

那一年,他还在哈佛念大三。围在他身旁的,是HRT史上的首届实习生,一共十人。

这群年轻人的含金量有多高呢?看看HRT的门槛就知道了。

作为与Citadel Securities、Virtu Financial和Jump Trading并称的全球高频交易“四大天王”,HRT(Hudson River Trading)是算法交易界公认的Tier 1。

他们招人逻辑简单而直接,只看MIT、哈佛、斯坦福,只从数学、物理、计算机专业里筛,而且几乎只有在全球奥赛(IMO、IOI、IPhO)里拿过奖的人,才能够得着门槛。

能通过这般极限筛选的,绝非等闲之辈。十年后,这张蛋糕桌已成了AI权力场的中心。

光是这张照片里,就有三人身价过亿(美元),他们执掌的公司或团队更是超过千亿估值。

最为华人所熟知的Alexandr Wang,已是Meta毋庸置疑的AI话事人;AI编程工具Devin的创始人Scott Wu,刚刚完成10亿美元融资;Jeffrey Yan则是把量化高频交易的极致性能带进了去中心化金融,他搭建的Hyperliquid估值一度突破400亿美元。

当个体的成功汇聚成群像,趋势便无法忽视。过去两年里,华尔街量化基金的顶级交易员,已经成为OpenAI和Anthropic眼中不可多得的计算系统人才,以数百万美元的年薪疯狂挖角。

这样的故事不只发生在美国。

同样是在2015年,大洋彼岸的杭州,一个叫梁文锋的年轻人创办了幻方科技(幻方量化)。十年后,这家年入超50亿元的低调的私募量化交易机构,孵化出了DeepSeek,用算法、工程和效率,将中国大模型推向世界的牌桌。

系统工程人才的权力上位

这批年轻华人里,Alexandr Wang的崛起堪称典型样本。

当Meta以143亿美元收购Scale AI近半股份,并任命这位28岁的华裔创业者为首席AI官时,整个科技界都为之侧目。这不仅仅是一次商业并购,更是一次权力更迭的象征。

图灵奖得主Yann LeCun(杨立昆)领导的FAIR实验室,被划入Wang负责的“超级智能实验室”,杨立昆本人则选择离职创业。它标志着AI的主赛场,正在从“学术权威”向“工程实践者”过渡。

Scale AI的成功并非偶然。在AI大模型时代,数据标注、模型评估和反馈机制变得至关重要。当其他公司还在争论模型架构时,Scale已经占据了AI能力生产链条中最基础、最难以外包的一环。这种对系统级问题的深刻理解,正是量化背景人才的优势所在。

Scott Wu的Cognition则代表了AI Agent的纵深。

他曾三次斩获IOI金牌,其中2014年以第一名夺冠,从哈佛退学后创立Cognition。2024年推出Devin,让全球工程师第一次认真讨论"AI软件工程师"的可能性。

Devin的突破不在于生成代码,而在于让AI像真实工程师一样闭环工作:接任务、查文档、写代码、运行测试、修Bug,直到交付结果。Cognition估值已经来到260亿美元,年化营收近5亿。

Perplexity的联合创始人Johnny Ho同样循着这条路径。他曾在Tower Research做了6年高频交易,这段经历塑造了他对高并发、低延迟系统的极致追求。

左一为Perplexity联合创始人Johnny Ho

Perplexity看似做的是AI搜索,但真要把搜索、生成、引用、实时性和可信度压进一个产品里,底层依然是极强的系统工程。这和高频交易中毫秒级撮合、风控与执行的逻辑如出一辙。

这种能力让Perplexity在激烈的AI搜索赛道中脱颖而出,估值已达200亿美元,Ho本人身家超过21亿美元,并曾先后向TikTok和Chrome发起过收购要约。

你会发现,量化背景正在改写AI圈。从华尔街到硅谷,从中国到全球,AI行业的中坚力量正在被这群特殊人才接棒。

他们不是传统意义上的产品经理,也非受人追捧的学术明星。他们更像是被数学竞赛、精英大学和量化交易共同训练出来的一代“系统型人才”

他们懂数学,懂工程,懂自动化,懂成本,很擅长把一套昂贵复杂的智能系统,改造成一台可运行、可验证、可扩展、也算得过账的工程机器。

当年PayPal被收购后,马斯克、彼得·蒂尔等人各自出走,统治了互联网上半场;而量化交易和奥赛体系走出的这帮人,似乎正复制着同样的剧本,把AI的下半场推向新高度。

他们也因此得名“AI时代的PayPal黑帮”

DeepSeek 的量化底色

幻方量化的故事,为这一趋势提供了另一个维度的印证。

梁文锋在2015年创立幻方时,或许没想过十年后会做出DeepSeek。但幻方的基因——算法、模型、算力和自动化交易,却是与这波AI发展的需求不谋而合。

首先,量化交易对算力与速度带着天然的饥渴,这让梁文锋从一开始就把算力当作核心资产来经营,成为国内买卡最激进的公司。

2021年,当大多数私募还在用小规模GPU集群跑策略时,幻方就已经投入近10亿元建设"萤火虫"超算中心,囤积上万张A100。这种为算力不惜血本的基建前置逻辑,成了DeepSeek最坚实的起跑线。

并且,这套自建算力的路线仍在巩固和延续。今年4月,DeepSeek首次公开招聘数据中心实地岗位,选择内蒙古乌兰察布作为自建数据中心的首站。作为国家"东数西算"八大枢纽之一,乌兰察布具备冷凉气候与绿电富集的优势,全区智算占比超92%。

可以说,DeepSeek的崛起,本质上是量化思维模式的胜利。当全行业还在迷信"大力出奇迹"的参数堆叠时,DeepSeek用工程创新实现了效率反超:V3的完整训练成本约为557.6万美元,R1更是只有29.4万美元。

这种对成本“抠”到极致的量化能力,最终外化为DeepSeek在模型竞争里最凌厉的攻势。

在API调用市场,DeepSeek敢于把价格打到地板。今年4月,宣布将所有模型的输入缓存命中价格降至发布价的十分之一;到了5月,更是喊出V4-Pro永久降价至原定价的四分之一,将百万Token的调用成本打到低于一通电话费

同行在算力成本压力下不得不涨价转嫁,DeepSeek却能在这个节点反向降价。背后的底气,和那套量化思维锤炼出来的成本结构不无关系:先把效率做到极致,再用效率碾压市场。

尽管DeepSeek目前已开启大规模外部融资,但其核心战斗力的养成,仍然离不开幻方量化在早期提供的"无限子弹"。2025年,幻方旗下基金平均收益率达56.6%,管理规模超700亿元。据彭博测算,仅一年就为梁文锋赚了超50亿元人民币。

AI 成了另一场高频交易

为什么量化交易背景的人,会在AI时代突然变得这么值钱?

表面上看,金融交易和大模型研发是两个行业。但如果把外壳剥掉,你会发现它们面对的是同一种问题:在高度不确定的环境里,用模型、数据和系统做连续决策。

量化交易不是一次性预测涨跌。它要不断接收市场信号,生成判断,执行交易,接受反馈,再调整策略。它处理的是噪声、延迟、风险、成本和对手盘。一个策略在回测里再漂亮,如果真实市场里滑点太大、成交太慢、风控扛不住,最后还是没用。

AI Agent也越来越像这样。这便是AI与量化交易相似的第一层:两者都是连续反馈系统。

第二层,在于它们都必须尊重系统约束。

在量化交易里,策略收益只是表面数字。真正决定它能不能活下来的,是延迟、吞吐、滑点、风控、极端行情、资金容量和交易成本。在AI里也一样,模型榜单分数只是表面数字。真正决定它能不能落地的,是推理成本、工具调用稳定性、幻觉控制、权限边界、安全隔离、任务链路和系统可观测性。

一个Agent演示时能完成任务,不等于它能在真实企业环境里长期稳定运行。一个模型在benchmark上分数很高,不等于它能承受真实用户的千奇百怪、企业系统的复杂权限和线上业务的容错要求。

所以,AI的竞争开始从“模型能力”转向“系统实现能力”。

谁能把模型放进复杂环境里,还能稳定、便宜、可控地跑起来,谁才真正有机会进入下一阶段。

第三层相似,是量化背景的人天然会算账。

互联网创业可以靠增长叙事撑估值,但量化交易不行,市场每天给出反馈。这种训练迁移到AI后,形成了一种不迷信规模崇拜的气质:更关心单位算力产出,不只关心模型有多强,也关心强到什么程度才值得付出这个成本。

这种能力的稀缺性,已经在人才市场上被明码标价。根据Business Insider报道,OpenAI、Anthropic等公司正以150万到300万美元的年薪,从Citadel、D.E. Shaw、Jane Street等量化基金挖人。

AI公司最终会发现,最懂如何压榨GPU性能、优化系统延迟的人,不是象牙塔里的教授研究员,而是量化交易机构的工程师。

人才摇篮的隐秘更迭

上一代AI叙事里,国内AI圈最熟悉的人才高地,是以微软亚洲研究院(MSRA)为首的AI Lab。

它曾经培养出大量技术领军人物,也长期代表着中国AI人才的黄金入口。那更像一个“想清楚再动”的时代。关键词是论文、算法、实验室、研究员、大厂研究院。

但大约从2020年起,问题的结构似乎变了。

Scaling Law把方向钉死:堆数据、堆参数、堆算力,模型就会变好。这件事不再极度依赖学术洞见,而是需要极强的工程执行力、算力调度,以及快速试错的能力。

AI的竞争,从研究竞赛变成了复杂系统竞赛。问题的性质变成了“边做边想”。

量化交易的训练环境,比任何学术机构都更接近这种状态。你管的是真实的钱,面对的是真实的对手,错误决策的代价立竿见影。

这种压力逼出的认知结构,在量化交易里叫生存本能。到了AI竞争里,就变成了另一种核心竞争力:在不完整信息下做决策,把资源效率当硬约束,比对手快一步出清错误,然后继续迭代。

所以你会看到,新一代AI权力网络,将不再只是脱胎于研究院、实验室,更会从量化交易机构、竞赛体系和开源社区里长出来。