Meshy.AI胡渊鸣与红杉吴茗谈AI原生游戏、世界模型与PMF | the prompt红杉播客


这里是红杉中国出品的播客新栏目the prompt,关于AI与技术范式变迁的系列漫谈。
本期,红杉中国吴茗与Meshy.AI创始人兼CEO胡渊鸣作客栏目(点击跳转至播客栏目),谈及了胡渊鸣以及Meshy.AI的成长之路。从一个不擅长表达的内向技术少年,到带领Meshy.AI走到全球用户面前的创业者,胡渊鸣的经历几乎浓缩了AI时代顶级技术型Founder的成长样本。
在这期对谈中,我们将听到胡渊鸣讲述自己如何从游戏与编程中获得最早的世界观启蒙:用最简单的规则,去描述最丰富的世界;也可以听到他对AI原生游戏的判断——真正属于下一代的产品,不是“加了AI”,而是“离开AI就不成立”。
更重要的是,这不是一期只谈技术趋势的访谈。胡渊鸣同时复盘了Meshy.AI三次转型以及寻找PMF的过程:从“我能做什么”,到“用户真正需要什么”;从一个技术人,摸索出属于自己的CEO方法论;从几乎想把钱还给投资人的至暗时刻,走到重新确认方向。
围绕“AI 替代不了什么”“世界模型应该怎么做”“AI时代人最终追求什么”等问题,这场对谈深入技术、产品与人性的交叉地带。

- 胡渊鸣 Meshy.AI创始人兼首席执行官
- 吴茗 红杉中国投资合伙人


- 02:12 – 05:13 | 内向者的表达:如何找到一套与世界沟通的自洽方式?
- 05:14 – 13:27 | 游戏与编程启蒙:用最简单规则描述最丰富世界
- 13:28 – 25:03 | AI原生游戏:离开AI不能玩、有了AI更好玩
- 25:04 – 31:01 | 三次转型,找到 PMF:从“我能提供什么”转向“用户需要什么”
- 31:02 – 41:16 | 技术人如何做 CEO:如何以技术人身份摸索出自己的CEO方法论
- 41:17 – 44:09 | AI替代不了什么:有训练数据的都会被替代,没有数据的探索领域靠人类灵光一现
- 44:10 – 56:49 | 世界模型怎么做:提出Hybrid World Model
- 56:50 – 01:08:11 | AI时代人追求什么:有限生命体验无限Experience是未来最重要的资源
- 01:08:12 – 01:14:35 | 创业的至暗时刻:几乎把钱还给投资人的那段日子
- 01:14:36 – 01:29:57 | 关于顶级 Founder:Motivation与韧性
内容精编
Part 1 游戏启蒙与编程学习经历
吴茗:在大家心中你往往是极客的形象、少年天才,一路非常顺。可是在我眼里的渊鸣不完全是这个样子——他有理性外壳下很感性、很有意思的一面。
胡渊鸣:我很喜欢打游戏,然后我成绩小时候也还不错嘛,但是我其实也挺调皮捣蛋的。最早接触游戏,是发现汇编指令只能做加减乘除,但屏幕上却能绘制出一个五彩缤纷的世界。就好像这个世界是由基本粒子组成的,但人类社会却如此丰富多彩。你只要掌握最基本的规则,就能描述一个最丰富的世界。
很快我就从玩游戏变成了做游戏。小学三四年级,用RPG Maker XP做了一个RPG,把班上同学都做成NPC,通过邮件发给全班。这条路就这样一直延伸下去:Visual Basic、Ruby、C++,参加竞赛拿金牌,保送清华进姚班,再到MIT读博,研究方向是计算机图形学和物理仿真。图形渲染的本质是对光线传输的建模,物理仿真的本质是对现实规律的还原。每走一步,都在同一个方向上越走越深。
你会发现,同样是加减乘除,有些人的世界就比另一些人的世界更丰富多彩。这里面有无限的机会,有点像造物主的乐趣。直到今天这件事依然非常吸引我。
Part 2 AI原生游戏的设计哲学
吴茗:我们在市场上也看过很多项目,有好多公司说可以用AI做游戏,副本可以无限展开,有各种各样的想象。但事实上到今天,我觉得还没有真正意义上的native AI游戏。为什么?
胡渊鸣:这是房间里的大象。大家尝试了各种办法把AI和游戏结合,但真正出圈的产品几乎没有。我们觉得要从底层重新思考到底AI如何和游戏结合才是有增量价值的。
我认为有两个条件必须同时满足,缺一不可。
第一,这个游戏离开AI是不能玩的。AI不是表现层的换皮,不是让游戏”看起来更吸引人”,而是核心机制不可或缺的部分。用AI生成角色的服装就是一个表现层的尝试,但是只是利用AI进行的辅助性的改进,如果去掉这部分的话游戏依然能玩。
第二,AI的加入真的让游戏更好玩了。把AI作为技术加入游戏是容易的,但是要回答“So what”,也就是“AI到底给游戏玩家带来了什么价值”,就没有那么容易了。游戏行业是一个充分竞争的市场,用AI做出大量的60分的游戏其实价值不大,因为玩家一定还是会去玩那个90分的游戏。所以我们一直保持着对游戏行业的敬畏。
吴茗:所以是不是说,先从历史上真正好玩的游戏里找到那些”没有AI就受限制,有了AI就能打开新世界”的类型,然后再去做?
胡渊鸣:应该是这样。没有AI的时候,它是受到限制的;有AI以后,它才彻底被打开了。比如我们做的《黑箱》——玩家的攻击技能、与世界交互的方式,完全由AI实时生成。去掉AI,游戏无法运行;有了AI,每次合成武器都会得到一个意想不到的结果。
在我们的游戏中AI的价值,我总结为三个要素:
意料之外——每次结果不同,带来持续惊喜;情理之中——结果在玩家可预期和控制的范围内,保持参与感;门槛更低——大语言模型用自然语言训练,每个人都能以符合直觉的方式参与,不设年龄和经验门槛。
《黑箱》计划几个月内登陆Steam。往后3到5年,先做一款小体量游戏,然后做中等体量,再用积累的经验做更大体量的游戏——在Meshy生成式AI公司的基础上,一步步探索AI原生游戏的新业务。
吴茗:其实Meshy也算是经历了一次挺大的转型。咱们在graphics上有巨大的行业影响力,当时是怎么决定转的?我觉得这个决定并不容易。而且我想问问,过去的经验,哪些带来的是经验,哪些带来的是累赘?
胡渊鸣:走出MIT之后,我发现把“描述世界”变成“做生意”,远比想象中要难。我当CEO之前只当过实习生。父母和祖辈都是老师,家里没有任何商业基因。创业初期,我连一个正常员工每天的工作应该是什么样的,都还在摸索。
最早做的是图形学工具。但我很快发现这个赛道的商业空间极为有限——Epic Games真正的收入来自Fortnite而非Unreal Engine,Unity近年也持续承压。后来做了第二个产品,基于图形学能力的渲染器软件,产品体验还可以,商业化依然没起来。
转机来自一个用户的一句话:你这个软件我不会付钱,但你如果把软件里自带的3D模型库单独卖给我,我愿意付5块钱。
既然用户愿意为3D资产付费,为什么还要做软件?顺着这个逻辑再推:现有的3D模型库都靠人工上传交易,当时ChatGPT和Stable Diffusion已经出现,能不能用AI低成本生成3D模型?Meshy就是从这里起步的——当时是全球第一个公开上线的文生3D产品,尽管最早的效果非常抽象,大概只有恐怖游戏能用上。
吴茗:我好像还看过最早那版,哈哈。
胡渊鸣:是的。这次转型带来了一个根本性的认知升级:真正的问题不是“我能提供什么”,而是“用户真正需要什么”。如果总是从自己的能力出发,做出来的产品很容易没有市场。
Part 3 技术型CEO的自洽之道
吴茗:渊鸣是我见过的技术founder里比较非典型的,有非常强的感性一面,同理心也很强。但当了CEO之后,有大量的事情你没办法每天做最擅长的部分——你在擅长的事情上可能是99分的人,但在某些事情上可能是个小学生,还不得不去做。这个过程中会有煎熬吗?
胡渊鸣:我找到了一套自洽的方式去做这些事。
融资的时候,我不做任何粉饰,把数据完全透明地摆给投资人——你觉得好就投,不好我也不强求。表面上看像劣势,但反而吸引到了真正认可这种风格的人。跟别人描绘愿景时,我不讲故事,而是用技术推演——摩尔定律的走势、五年后的算力预测、神经网络的演进方向。也许有人描绘未来靠感性叙事,我用我的方式,未见得就更差。
吴茗:我觉得渊鸣这个应该会给很多创业者鼓励——很多创业者会想,我有自己擅长的,但我也有很多不足,最终会发现坚持自我也能找到一条与世界相处的路。
胡渊鸣:我甚至觉得,如果你想做到顶尖,只有一条路——坚持自我。一个人只有在做最真实的自己的时候,才能把所有能量发挥出来。假装成为一个自己实际上不是的人,就算短时间内得到了一些好处,长期一定是不可持续的。
Part 4 关于世界模型的思考
吴茗:我们听了太多公司跟我们讲世界模型。但你愿不愿意聊聊——在你心中,世界模型怎么定义?
胡渊鸣:纯粹基于像素的AI世界模型,有一个根本性的算力瓶颈:当前主流方案需要1000 TFLOPS以上的算力,而iPhone 17大约只有三四十TOPS,中间差了将近两个数量级。摩尔定律已经放缓,手机电池也不会有量级突破,这个差距短期内难以弥合。
我们的解法是Hybrid世界模型:AI生成机制,经典图形学执行。AI负责产生“意料之外”的内容,图形引擎负责保证物理规律的稳定性。
吴茗:这是一个中间态,还是常规态?就是咱们当前这个方案,如果算力降低两三个数量级,它还成立吗?
胡渊鸣:常规态。可以用Vibe Coding做类比:Vibe Coding的本质,是让大语言模型生成代码,再用传统计算方式执行——永远是AI生成机制,传统方式执行。这个范式在Vibe Coding里已经完全验证了。我们不过是把它从“生成软件”变成“生成一个交互的世界”而已。算力提升了,AI能生成的内容会更丰富,但这个AI生成+图形引擎执行的架构本身,不会被推翻。
Part 5 AI for fun
吴茗:AI for work已经有很多人在做了。但如果人类未来不用工作了,或者只需要很少时间在工作上,世界会变成什么样?我有时候会想到《WALL-E》——电影里人们不需要工作了,躺在悬浮椅上,那个画面其实有点悲伤。怎么能让大家少工作、多体验、得到快乐,同时又不空虚、不躺平?
胡渊鸣:如果AI真的大幅提升了生产力,在有限的生命当中体验近乎无限的experience,将成为未来最重要的资源之一。AI for work已经足够拥挤了。整个AI行业做了太多的AI for work,我想未来大家会有更多的闲暇时光。
吴茗:所以这可能正是AI原生游戏、AI for fun能给人类带来的。
胡渊鸣:但这里说的”fun”不是成瘾性的娱乐。任天堂的游戏和那些让你不停氪金的成瘾性游戏,给人带来的快乐是完全不同的东西。宫本茂会追问开发团队“为什么这里要放一块石头”,所有设计都必须有意义。
这趟回来的路上我在看庵野秀明的《新世纪福音战士》——一部把创作者整个人生都注入其中的作品,商业上也取得了成功。这个世界上永远存在一个sweet spot:大众能接受,同时又能满足创作者的表达欲望。如果能做出这样的作品,我的人生就比较圆满了。
我今年30岁,假设活到120岁,还有90年,分成9份,每10年拿出一个比上一个更好的作品。科学和技术决定我们可以做什么,艺术和品味决定我们不做什么,乐趣和愿景给我们不断做下去的动力。
而AI原生游戏,恰好是这三件事交汇的地方。
Part 6投资人看人方法论
胡渊鸣:作为投资人,你怎么判断一个founder能不能成事?
吴茗:看了这么多founder,我现在越来越觉得,最重要的变量只有一个:motivation。他有没有一个强烈的“想要”——不是说我想成功,而是说,如果这件事被别人做成了、但不是我,我会不会遗憾。因为没有人在创业的时候敢保证自己一定能赢,但有了这股火,才能扛过那些最难熬的时刻。
我特别警惕那些“一路优秀”的天才型创始人。这类人在某一个维度做到了极致,长期收到正反馈,建立了极强的自信。但创业之后,正反馈与负反馈的比例会发生巨大的调整。这时候会出现两类人:一类人遇到挫折,会说“我哪里出了问题”;另一类人则会说“问题不是我,是这个世界”。后者往往很难走远。
胡渊鸣:我自己观察到的一个现象是:很多founder之所以逐渐做出一些不理性的决策,是因为他已经没有勇气去面对他必须面对的现实了。过度务实会被现实困住,陷入痛苦;但逃避现实会让问题一直积累,最终什么都解决不了。能在这两者之间找到一个支撑自己往前走的点,很难。
吴茗:是的。我觉得最终能识别出来的,是一种直觉——你碰到某些人的时候,其实挺容易给一个感觉的——就是对上了,有那种“CLICK”的感觉。如果非要说一条,motivation是我觉得最重要的东西了。
