梁文锋是怎么成为梁文锋的?
一位把"是非观"放在"利害观"前面的技术理想主义者,是如何从广东湛江小镇走到全球AI舞台中央的?
梁文锋,1985年出生于广东湛江吴川市覃巴镇米历岭村,DeepSeek创始人。2023年他带着这家开源大模型公司横空出世,2025年初DeepSeek-V3和R1模型以"性能对标OpenAI、成本仅为其十分之一"的姿态震动硅谷,登顶中美应用商店榜首,让英伟达市值蒸发近6000亿美元。外界对他的核心评价是:"兼具恐怖的工程能力与模型研究能力,像个极客不像老板,把技术信仰看得比赚钱重要"。
1. 1985-2002:湛江小镇的数学神童,在父亲的书阁里学会了"自学"
一句话总结:小学数学老师父亲的书阁和"不干涉"教育,让他养成了"自己找答案"的习惯。
梁文锋的父亲是吴川市一名普通小学数学老师,母亲也是教育工作者,家中阁楼藏书千册。这个看似平凡的家庭,却有个不平凡的细节:父亲从不逼他上补习班,反而默许他小学时就翻阁楼的大学数学教材。当90年代湛江同龄人纷纷辍学打工时,父母坚持"读书有用论",但"有用"的方式是——你自己决定读什么。
初中时,这个"看起来比普通小孩还木讷"的孩子干了两件怪事:一是拆装电脑,二是自学完了高中数学,开始啃大学微积分。老师们对这个"怪才"的态度是:只要不耽误高考,随他去。2002年,17岁的梁文锋以吴川一中"高考状元"身份考入浙大电子信息工程,成为家族第一个顶尖大学生。
这段履历带来了什么:别人在等老师教,他早就习惯了"自己找书看"。这种"自学即正义"的思维,让他后来敢在2008年孤身闯成都,也让他2019年敢花10亿囤GPU而不管短期回报。
2. 2002-2010:浙大九章,从电子竞赛到机器视觉,他成了"电路板巴菲特"
一句话总结:本科拿电子设计竞赛一等奖,研究生月薪1.6万实习,他证明了自己既能搞研究也能搞钱。
2002年进浙大后,梁文锋没走"刷GPA保研"的标准路线。2005年,20岁的他拿下全国大学生电子设计竞赛一等奖,靠的不是刷题,而是整天泡在实验室里"把问题想明白"。读研期间,他师从项志宇教授研究机器视觉,论文题目《基于低成本PTZ摄像机的目标跟踪算法研究》——一个典型的"花小钱办大事"课题。
关键细节来了:读研时他以实习生身份加入上海艾麒信息,老板周朝恩回忆,初见这清瘦眼镜男"斯文有礼但半天不走出办公室",一聊技术却发现"逻辑强得吓人",直接跳过转正让他当新技术部经理,开价月薪16000元——在2008年这是个天文数字。就在这期间,他拉着同学开始积累股市数据,偷偷搭建股票预测模型,被同学戏称"电路板巴菲特"。
这段履历带来了什么:他发现自己既能沉下心看论文,也能抬头看市场。更关键的是,2008年金融危机爆发时,别人实验室焊电路,他看到的却是"机器预测市场"的机会。
3. 2008-2013:成都出租屋的"金融黑客",用三年时间验证"技术能改变金钱游戏"
一句话总结:毕业不去大厂,跑到成都蜗居研究全自动量化交易,他押注了当时没人信的赛道。
2008年硕士毕业,梁文锋做了个"疯批"决定:拒绝大厂offer,揣着研究生期间攒的钱跑到成都,租了个廉价出租屋。他的目标不是写程序,而是用机器学习搞"全自动量化交易"。当时量化在国内还是新鲜事物,朋友劝他"不靠谱",他回怼:"问题只要24小时想,没有解决不了的"。
这五年他做了什么?没人知道细节,只知道结果:2013年,28岁的他和浙大校友徐进创办了杭州雅克比投资管理有限公司,名字致敬数学家卡尔·雅可比。公司简陋到什么程度?官网都没有,但策略是实打实的——用AI模型做高频交易,不依赖人的经验。
这段履历带来了什么:在出租屋的三年,他完成了从技术宅到"金融黑客"的认知跃迁。当别人还在讨论"AI能干什么"时,他已经在最复杂的场景(金融市场)里验证了"AI能赚钱"。这让他后来敢挑战更复杂的通用AI。
4. 2015-2021:幻方量化的"疯狂囤卡",把好奇心变成十亿级基础设施
一句话总结:量化基金只是副业,囤GPU探索AI边界才是主业的"不务正业",让他意外跑赢所有大厂。
2015年,30岁的梁文锋正式创立幻方量化。2016年推出首个AI模型,2017年实现所有策略AI化,2019年管理规模破百亿,2021年巅峰期逼近千亿。但诡异的是,当别人买几十张GPU训练交易模型时,他2019年就砸钱储备了1000张英伟达GPU,理由是"对AI能力边界好奇"。
更疯狂的是2021年,量化业务最赚钱那年,他拿出10个亿配置超万张A100芯片,建成"萤火一号"训练平台。内部员工都看不懂:这能创造啥收益?梁文锋说:"想把幻方做成开源策略平台"。结果2022年ChatGPT引爆市场,美国芯片出口管制收紧,国内大厂四处求卡时,DeepSeek已经坐拥国内第一梯队算力。
这段履历带来了什么:他证明了"长期主义"不是口号。当别人把GPU当成本时,他把它当"科研基础设施"。这种"为了好奇心不计ROI"的作风,直接造就了DeepSeek的算力护城河。
5. 2023至今:DeepSeek的"开源阳谋",用理想主义重新定义中国AI
一句话总结:把幻方最精锐的AI团队独立出来,不设利润KPI,只为"做最难的通用AI",他赌的是下一个时代。
2023年5月,38岁的梁文锋做了个让投资人跳脚的决定:把幻方内部最强的AI团队独立出来,成立DeepSeek,专攻通用大模型。他在内部说:"这是怎么做的问题,不是为什么做的问题"。别人问盈利计划,他答:"没有利润要求,就是想做"。
2023年11月发布首个开源模型,2025年1月V3和R1震惊硅谷。核心策略就两条:一是纯技术路线,创始人每天"看论文写代码参加小组讨论",不像老板像极客;二是彻底开源,连训练细节都公开,被外媒称为"AI界的鲇鱼"。最狠的是人才策略:他特别喜欢招"没经验但有潜能"的应届生,因为"不受传统框架束缚"。
这段履历带来了什么:他用十年证明"技术理想主义"在中国能跑通。从出租屋到硅谷,变的是战场,不变的是"24小时思考问题"的疯子习惯。
争议:这个"别人家的孩子"也有AB面
梁文锋的争议不在于人品,而在于路径。
第一重争议:量化原罪。幻方量化高峰期管理近千亿资金,靠高频策略收割市场波动。同行评价"技术确实牛",但散户骂"AI割韭菜更精准"。2015年股市异常波动后,量化私募一直面临监管收紧风险,这是梁文锋金融生涯的"灰色地带"。
第二重争议:技术原创性。DeepSeek惊艳,但架构仍基于Transformer、MoE等西方底层创新。他自称"探索AI边界",却被质疑"站在开源巨人肩膀上摘苹果"。区别在于,他摘下来后选择完全开源,而OpenAI开始闭源,这是"理想主义"还是"阳谋",见仁见智。
第三重争议:商业可持续性。DeepSeek至今烧钱无盈利模式,靠幻方输血。有投资人私下抱怨:"这不是创业,是科研慈善。"但梁文锋回应:"先要得到美国科技界的尊重,再谈赚钱"。问题是,这种"不计ROI"的模式能走多远?
尾声
从湛江阁楼到成都出租屋,从浙大实验室到硅谷话题榜,梁文锋用40年诠释了什么叫"每一步都算数"。他不是没有遇到过关键路口——2008年去大厂还是去成都?2021年买卡还是分红?2023年守量化还是攻AGI?每次他都选了"更难但更好奇"的那条路。
这个时代不缺技术创业者,缺的是"把是非观放利害观前面"的疯子。梁文锋的可怕之处在于,他让这个疯子逻辑跑通了:用量化赚到的钱养AI理想,用AI理想的开源换全球尊重。至于争议?他大概懒得回应——毕竟,他还在24小时想着下一个技术问题。