Note

英伟达和美股最大的风险是“意想不到”,而DeepSeek只是开了个头!

· Views 48

在DeepSeek引发西方科技界剧烈震动后,著名科技风投机构a16z合伙人Martin Casado与前微软部门总裁Steven Sinofsky(曾领导Windows 7 的开发和发布)展开对谈,就DeepSeek带来的影响以及AI未来发展方向展开对谈。

作为全球顶尖的风险投资机构,创立于2009年的a16z以“全阶段投资”著称,其投资组合包括Facebook、Twitter、Coinbase、GitHub等科技巨头,截至2025年,其管理资金规模达450亿美元。

以下是对谈核心观点:

西方人工智能社区有点忘乎所以,我们失去了理解小问题和中等问题及解决方案的能力。我们默认就是超级巨大问题,因为我们认为我们能做到,而其他人做不到。

DeepSeek之所以非常成功可能部分归因于数据优势,中文互联网世界是独立的,这是一个好得多的训练集。

DeepSeek公开推理链意义重大,这意味着你可以非常快速且低成本地训练更小的模型。

参考互联网的发展,就好像试图销售HTTP服务,目前试图货币化AI大模型的做法可能不是正确的方向。

就像互联网时代的光纤过剩一样,AI时代是数据中心过剩,只不过这次的经济基础要比上次好的多

目前可能处于扩大规模(scale up)和扩展范围(scale out)的转换期。在浪潮早期人们自然倾向于扩大规模,但实际上随着软件成本基本趋于零,趋势往往会转向扩展范围。

会有AI一些功能只有在超大规模的云推理中才能实现。就像现在大多数数据操作都在云端进行,但大多数数据库仍然在我的设备上。

DeepSeek的出现时,这基本上是迈向口袋里的通用人工智能(AGI)的又一步,这些模型可以在小型设备上运行,这表明事情正在前进。

专业化的模型能够在手机上运行将使AI应用层真正得以存在这就相当于浏览器有了 JavaScript。

DeepSeek带来的契机源于全球技术社区的力量。尽管很多人都想独占成果,成为唯一的供应商,但这是行不通的。

以下为对谈全文,由AI进行翻译

DeepSeek引发了一系列混乱

主持人:

这几周很忙。我不知道你们怎么样,我的推特推送、播客,到处都是相关内容,也许这并不奇怪。但你们的简短总结是什么样的呢?我们就从成果说起,也许再讲讲你们对它为何如此火爆的看法,因为自从 GPT 出现后的大约两年里,我们已经看到了很多产品发布。

Steven Sinofsky:

快速概述一下,当然,基本上是不知从哪儿冒出来的,中国一个类似小型对冲基金的计算机科学研究组织发布了一整套模型。不过,不,它不是凭空出现的。大概有一年半左右的筹备时间,而且他们真的很出色。

我认为这很激进,但它似乎让世界其他地方都大吃一惊。我觉得有两件大事真正引起了大家的关注。

一是他们怎么从无到有做出这个东西的?而且它似乎在兼容性和性能上一直与其他产品相当。还有一个流传的说法是它只花了 500 万美元。

对,数字是 600 万美元。所以这个数字并不重要。但关键是,他们写了一篇论文,说他们在训练方面的一系列特定领域进行了创新,连这里的人都觉得,哇,这相当聪明。

然后,由于金融公开市场的一些复杂情况,以及整件事是如何发生的(这里就不细说了),就像在一个周五,整个周末,大家都陷入了疯狂,这样周一开盘就能交易,市值蒸发达到数万亿美元,这似乎是完全过度反应和疯狂的。但这不是我们今天要讨论的重点。

Martin Casado:

就你说的这点而言,这里面有很多因素在起作用,有很多需要考虑的。这实际上是一个相当复杂的情况。有一种观点认为,传统的一次性模型,我们可能正开始接近像 GPT - 4 那样的极限。

之前没有重大进展,但现在会有新的发展,OpenAI 发布了一个推理模型,大家对此非常兴奋。在这个宏大的图景中,我们对这个模型以及它将如何推动计算成本和视频发展感到兴奋。

然后我们的模型发布了,看起来相当不错。突然之间,人们说,如果能以这么低的成本做到,实际上可能会推动下一波发展等等。对这个模型有很多铺垫,这也带来了炒作。

然后我觉得就像你说的,人们真的不知道该怎么看待它。所以这就需要…… 我同意你说的这是整个市场的过度反应,但也值得指出的是,除了人们说这是个很棒的模型之外,还有很多理论和谣言。

也许成本比说的高得多。也许这是有意为之。它正好在中国新年发布。有太多更糟糕的谣言了。也许我们会尽力剖析所有情况。

主持人:是的,也许我们就该这么做,因为正如你们俩所说,这里面有很多内容,对吧?有性能方面的因素,有成本方面的说法。

还有中国因素。它在应用商店排名第一,这很有活力。还有发布速度。马丁,我记得你分享过他们很快就发布了一个图像模型,然后你提到它是在周五发布的。

所以这里面是各种情况的大杂烩,人们的反应也是各种各样,坦率地说,有些人知道自己在说什么,有些人则不知道。这个模型发布已经有十天左右了,顺便说一下,就像你们俩说的,这是R1的发布。大概两个月前发布了 v3 版本,那是基础模型。所以现在时间过去一些了,如何从噪音中分辨出有用信号呢?

Martin Casado:

也许我从这个角度说,中国人很聪明。这是我所持的一个观点,中国有很棒的研究人员。DeepSeek实际上已经发布了一些模型,包括 v 模型,它实际上可能是一个更令人印象深刻的成果,几乎就像 ChatGPT - 4。

顺便说一下,要创建一个这样的思维链模型,即推理模型,你需要有这样一个基础模型,他们做到了,而且我们也知道他们在公共文献中做出的所有贡献,只是之前没人真正汇总过。所以我有这样一个想法,这是一个非常聪明的团队,长期以来执行得非常非常好。在人工智能领域,他们是顶尖的研究人员之一。

他们在思维链模型上只花了600万美元,这其实与Anthropic和OpenAI所说的他们的花费相比,并没有离谱。所以这是中国一个优秀团队的有意义的贡献。

这意味着什么,我们应该对此做出回应。所以,一些抗议是有道理的。我确实认为我们应该回应,但我认为原因并非很多人所说的那样。

Steven Sinofsky:

我完全同意。事实上,你也看到中国那个团队的人也在努力,想让它比实际情况更具全球性影响力。我是说,我那位老朋友李开复,在 X(原推特)上出来说,这就是为什么我两年前说中国工程师比美国工程师更优秀。但就你说的这点,人们认为进展正达到某种渐近水平。

Martin Casado:

是的,就像之前的基础模型,比如 GPT 系列似乎在围绕 GPT - 4 发展。

西方的人工智能社区有点忘乎所以

Steven Sinofsky:

对。但我认为非常有趣的是,如果你从每个人都在优化的功能角度来看,这个渐近线是成立的,就是那种疯狂的噪音,在我看来,就是那种疯狂的论文式规模,或者说是对世界的一种看法,即我们需要更多的计算能力和更多的数据。更多计算,更多数据。

我们就一直在这个循环里,很多局外人会说,你们的数据会用完的。而我作为一个微型计算机领域的人会说,在某个时候,你最终会把问题分解到世界上70亿个端点,这将需要比你能塞进一个巨大的核电数据中心多得多的数据来构建。

所以他们所做的很多事情有点像一个阶跃函数的变化,不一定是改进,只是轨迹的改变。是或不是,对我来说,这就是超大规模需要深呼吸并思考的部分,为什么我们会走到这一步?因为你是谷歌、Meta 和由微软资助的 OpenAI,这些公司都有数十亿美元。

所以很明显,你们是从资本和数据的角度看待问题。当然,你们有英语数据,比其他任何人都多,所以你们可以继续推进。

所以,我是这么想的,以前微软还小的时候,我们过去常常判断事情的规模,是小问题、中等问题还是大问题?

我记得有一次我们开始开玩笑说,我们失去了理解小问题和中等问题及解决方案的能力。

我们只有大问题,这很简单,然后就是巨大问题,超级巨大问题,我们默认就是超级巨大问题,因为我们认为我们能做到,而其他人做不到。

这是一种战略优势。我觉得这就是美国,特别是西方的人工智能社区有点忘乎所以的地方。就像每个资金过多的初创公司一样。

中文互联网社会可能给DeepSeek提供了独特的数据优势

Martin Casado:

说的太好了。我听说关于他们能做到这件事有两种理论。一种是你提到的约束理论,我认为这实际上是对的,就是我们一直只是用计算这个钝器和所有数据这个钝器。我们没有考虑很多在约束条件下的工程问题。

我听到的第二种理论,我不知道是不是真的,但很诱人,就是人们说V3模型之所以这么好,实际上是因为它可以访问中国互联网以及公共互联网,这实际上有点像一个独立的东西。所以它几乎是一个超集,我们实际上无法访问中国国内互联网,对吧?据我所知,我们肯定不会用它来训练,而他们会。

所以有可能两种情况都存在。他们可能有数据优势。他们肯定有你提到的工程约束方面的优势。

Steven Sinofsky:

关于数据,他们的起点,中国互联网本身就有更多的结构。这是一个好得多的训练集。

Martin Casado:

而且如果人类标注的数据在这里很重要,对于思维链模型来说,你确实希望有专家来说明他们会如何思考一个问题。

我的意思是,这就是整个中国思维模型的意义所在,如果你想寻找套利空间,它基本上就是关于某件事情的推理步骤。真正聪明、受过良好教育且成本相对较低的人,在全球范围内很难与中国竞争。

所以他们肯定可以获得大量可能受过高等教育的标注数据,这非常相关。所以我碰巧相信这一点。听起来你也相信,这不是凭空出现的。

这不是什么阴谋。这是一个很棒的团队充分利用了他们所拥有的资源,但它仍然有一些非常重要的方面值得讨论。例如,许可证非常重要。他们决定发布推理步骤这一点也非常重要。所以也许值得讨论一下这两点。

DeepSeek公开推理链意义重大

主持人:

是的,拜托了,因为我确实觉得这两点没有成为头条新闻,对吧?我们看到的头条新闻都是关于我们刚才谈到的其他事情。你说推理过程被发布了,相比之下,之前 OpenAI 发布的模型没有这样做,对吧。然后是开源许可证。

Martin Casado:

我们来谈谈这个。有两件关于DeepSeek的事情相当引人注目,这对模型的应用有影响。我们最近没有看到对一个模型如此宽松的许可证,基本上是 MIT 许可证,就一页纸,你几乎可以做任何事情。

Steven Sinofsky:

对吧?这就像免费啤酒,是真的免费吗?

Martin Casado:

是的,真的,真的。我是说,我们有最大的人工智能公司组合之一,无论是在模型层面还是应用层面。我想说应用层面的公司会使用很多模型,不只是一个模型。

我还没见过 GPT 的包装器。他们都在使用很多模型,也会使用开源模型。许可证真的很重要。所以这肯定会导致模型的大量传播。

第二件事是,一个推理模型实际上会思考问题的步骤,并使用这个推理链或思维链来得出更深入的答案。当 OpenAI 发布o1模型时,他们没有发布这个思维链。

现在我们不知道他们为什么不这样做,但事实证明,如果你能获得这个思维链,你就可以非常快速且低成本地训练更小的模型。这叫做蒸馏。在大语言模型(LLM)领域,蒸馏的一般概念是,你有一个教师模型链,和一个小得多的学生模型。

所以事实证明,通过蒸馏这些公开模型,你可以得到非常高质量的小模型。这不仅对使用v3的人更有用,而且你可以得到更多模型。我可以在小得多的设备上运行它们,所以这样就会有更多的传播。所以就这个模型的传播而言,这实际上是非常重要的一步。

目前试图货币化模型的做法可能不是正确的方向

Steven Sinofsky:

绝对的。有一种倾向,要么就是认为自己应该开源,但又没有真正定义清楚开源的含义,我认为在这种情况下这很重要。我觉得因为他们的出身,以及他们没有商业模式,这就是这件事独特的地方之一,它就像一个对冲基金的项目,几乎像是一个副业,但又不完全是,就是一整个项目。

你知道,这就产生了一种效果,就是我们就把整个东西都公开,而其他公司还在努力弄清楚他们的收入模式,我认为这可能为时过早。

这在我看来有点像,嘿,我们要对网络服务器收费,就像销售 HTTP 服务的业务,这不是个好业务。我觉得每个人都只关注了第一个突破,也就是大语言模型(LM),从很多方面看,回顾互联网的发展,当时发生的事情一模一样,每个人都非常专注于将互联网的第一部分,也就是 HTML 和 HTTP 货币化。

然后,我不知道,微软和其他一些公司出现了,说那不是货币化的最佳层面。事实上,那个层面可能根本赚不到钱。真正赚钱的将是购物、机票、电视和其他一些东西。

甚至其他公司,比如 AT&T,试图在更低的层面进行货币化。但你知道,这不是通向 70 亿端点的方法。许可模式真的很重要,因为最终会出现某种程度的标准化。

现在我不知道在技术栈的哪个位置或什么层面,但肯定会有一定程度的标准化。不同层面的许可模式将开始变得非常重要。任何经历过互联网发展的人都记得关于不同协议(如 3V、V4 等)的争斗,还有开源许可证的问题。

Martin Casado:

记得很清楚。

Steven Sinofsky:

但如果你在写论文,你就得发布它。事实证明,即使是你的论文,你如何发布它也是一个大问题,因为它可能会成就或毁掉整个方法。我认为美国行业忽视了这种重要性,因为他们已经习惯了这种模式,即开源就意味着我们是一家企业,我们可以挑选并决定发布什么。

有一种观点认为我们是开放计算机。是的,完全正确。我认为这与技术在一个没有分发成本的时代的发展方式不一致,在有分发成本的时候,免费模式其实无关紧要,因为你仍然无法解决……

Martin Casado:

是的,是的,是的,是的,是的。我就这么说,我确实想从另一个角度看这个问题,因为我实际上倾向于同意你的观点。所以就像你刚才说的,有可能模型并不是关注的正确地方,每个人都认为模型有很大价值。

所以他们在开源方面玩各种巧妙的游戏,对吧?而不是关注分发。这很可能是真的。但还有另一种观点,即模型本身真的很有价值。特别是,模型本身不是一个应用程序,但有可能如果你在构建一个应用程序,你需要垂直整合到模型中,这是有可能的。

因此,如果我在构建下一个版本的 ChatGPT,或者就像我们今天看到的DeepSeek推出的产品,有可能应用程序实际上需要你拥有模型。在这种情况下,DeepSeek的相关性就没那么大,因为他们不构建应用程序。

所以这意味着开源或反话题的影响并没有那么大,对吧?所以我确实认为这里存在一个分歧,我们不知道答案。

第一种可能是模型可能会商品化。你需要关注应用层,那么许可证就不重要了;或者模型在技术栈中真的很重要,在这种情况下DeepSeek现象实际上并没有人们认为的那么有影响力。

Steven Sinofsky:

我要在这个基础上补充一点,因为你说得对。这只是一个变量,变量就是时间。因为我们从互联网发展中看到的情况非常有借鉴意义,这件事必然会像互联网一样发展。

我们看到的是,有一段时间,构建一个应用程序似乎是一件疯狂的事情,因为你必须拥有 Windows 系统,必须拥有 Office 软件,但后来出现了一个新的应用程序,它不依赖任何这些,那就是搜索。

所以我认为很多人,因为年龄和经历,会立刻想到,哦,这些大语言模型(LLMs)会取代搜索。但事实证明,这实际上非常非常难,因为搜索能做很多模型做得很差的事情,真的很差。那么接下来会发生的是一个新的应用程序将会出现。

当这个新应用程序出现时,它会进行垂直整合。某某研究应用程序就是一个很好的例子,然后突然其他应用程序会如雨后春笋般涌现。然后就会出现像谷歌地图、搜索、Chrome 浏览器,然后它会回过头来解决以前做不到的事情。

我真的觉得这就是我们现在所处的发展轨迹。现在问题仍然是在哪些方面进行整合,但我认为最终在互联网上重要的应用程序,在互联网出现之前实际上并不存在。我觉得这就是人们忽略的地方。

Martin Casado:

移动互联网也是如此。

Steven Sinofsky:

移动互联网也是。大家都完全…… 以前没有社交应用程序。是的,是的。所以大家都被新事物冲昏了头脑,认为它会取代一切。

Martin Casado:
问题是……

Steven Sinofsky:

问题是,有些思维就像…… 你可以把一切都看作是一个光谱。当有新事物出现时,整个光谱就会以不同的方式被划分,就像谷歌收购某公司(原文 rightly 疑有误)时说的,那些搞互联网的人会做什么,他们会输入什么?嗯,他们会输入内容,但这是在互联网上。他们会和其他人一起输入。好的。

所以我们现在实际上看到的情况是,有人会提出一个在消费领域能做某件事的模型,比如文本转图像,然后随着时间推移,人们会说,哦,这有点像 Canvas,就像这些现有工具的人工智能原生版本。

这很重要的原因是,它看起来像 Canvas,或者看起来像 Word,或者看起来像 PowerPoint,但重要的是它们实际上是不同的。PowerPoint 再也不会是原来的样子了,为什么呢?因为 PowerPoint 存在的全部原因是能够渲染出以前无法渲染的东西。所以整个产品有 3000 种不同的格式化命令。这可不是我编的数字。

真的有 3000 种字距调整、微调、曲线绘制和颜色设置的方法,实际上在人工智能中你不需要做任何这些。所以整个产品不会有这些东西。然后事实证明,所有这些东西使得它很难实现多用户操作。所以当谷歌出现并推出他们的竞争对手时,就会取代它。他们完全专注于共享。斯蒂芬。
主持人:
我想问你,你说了一些非常有趣的话。

你说这件事必然会像互联网一样发展。你们举了不同公司的例子,不同的浪潮,移动浪潮、云时代,所有这些都是我们可以借鉴的。但我只是想深入探讨一下。

这里面有什么不同之处吗?回到DeepSeek的话题,我的意思是,意识到中国的能力非常重要,中国是一个非常可靠的参与者,但我不认为V3本身作为一个独立的产品会对互联网产生那么深远的影响。

所以实际上在人工智能领域的资本投入方面有一些相似之处。

数据中心投资将过剩,但后果可能好的多

Martin Casado:

当涉及到实际的资本投入时,你会发现一些有趣的相似之处。

在人工智能领域,这需要大量的投资。马克最近提到的一点,人们往往没有充分意识到,在互联网发展的早期,也就是 90 年代中后期,很多投资者,像银行或主权基金这类大资金方,他们想要涉足互联网领域,但却不知道如何投资软件公司。

他们会想,这些新的软件公司是什么样的?这些人都是谁?这些公司大多是私营企业,你还记得吧,他们都做了什么呢?他们都投资了光纤基础设施。

一阵喧嚣过后,你看,现在我们也开始看到类似的情况。银行和大投资者们说,我们要建设数据中心,因为他们不知道如何投资像 StableDiffusion 这样的初创公司,但他们知道如何投资基础设施建设。

一方面,你可能会想,我们会看到大量的资本支出,所有这些支出都会投入到物理基础设施中,所以我们可能会面临另一个类似光纤过剩的情况,只不过这次是数据中心过剩。

但我认为不同的是,在光纤建设时期,有一家公司可能会虚报数据,为了建设所有这些设施背负了大量债务。当光纤价格下跌时,这家公司就破产了,这引发了巨大的问题。

而现在人工智能浪潮的基础要稳固得多,非常非常稳固。主要的投资者,三大云服务公司的资产负债表上都有数千亿美元。即使所有这些投资都打水漂,他们在视频业务上也能承受价格波动,视频业务不会受太大影响。所以我不认为我们会走向同样的过剩和崩溃,虽然人们很容易将其与互联网发展相类比,但我认为情况并非如此。

Steven Sinofsky:

我完全同意你的观点。这部分情况就像谷歌在 21 世纪初对地球项目的投资,或者五年后 Facebook 的投资,还有人们可能忘了,微软在必应上投入了,我不知道,300 亿或 400 亿美元,但它仍然排名第三之类的。但这并不重要。

Martin Casado:

我敢打赌,我不知道这是不是事实,我敢打赌 Meta 在 Reality Labs 上的投入比现在在人工智能上的投入还多。好吧,这不仅仅是为了表明……

Steven Sinofsky:

苹果也是。

Martin Casado:

哦,对,苹果。

Steven Sinofsky:

苹果的投入,用 “巨额” 都不足以形容,他们投入了太多。所以这真的不是关于投资情况,或者谁在财务上会赢会输的问题。我认为你提出的这一点非常重要,需要强调的是,毫无疑问,没有人能在这个过程中毫发无损。但受损的方式绝不会是任何人想象的那样。

Martin Casado:

而且也不会像以前那样,比如那种背负 10 亿美元债务的情况,从结构上来说,以前就是那样。

Steven Sinofsky:

哦,还有一些我们都忘记的公司,在那个时代破产了。实际上在西雅图有一家公司,我忘了名字,市值 200 亿美元。这就是证明。天呐。

主持人:

是的,是的。就像你说的,这些公司资产负债表上有大量现金,他们一直在等待投资的时机。

Steven Sinofsky:

这也促使他们愿意尽可能地扩大规模。

目前正处于扩大规模(scale up)和扩展范围(scale out)的转换期

主持人:

那我们来谈谈这个。在你的文章中,你提到了扩大规模(scale up)和扩展范围(scale out)的区别,以及在浪潮早期人们自然倾向于扩大规模,但实际上随着软件成本基本趋于零,趋势往往会转向扩展范围。斯蒂芬,你这么说是什么意思呢?我们现在是否正处于这种转变之中呢?

Steven Sinofsky:

嗯,现在我们只谈技术方面,不谈财务方面。当你规模很大时,你会想在大规模上加倍投入。所以你开始建造越来越大的计算机,而不是将计算分布到其他地方。比如如果你是 IBM,你会说下一个大型机只是更大的大型机。

如果你是太阳微系统公司(Sun Microsystems),你就一直建造更大的工作站。如果你是数字设备公司(Digital Equipment),就建造更大的小型计算机。然后,顺便说一下,一直以来,你都在以更低的成本实现比上一代制造商更多的 MIPS(每秒百万条指令)。

然后微型计算机出现了。它们不仅 MIPS 更少,但成本几乎为零,而且数量众多。所以你从一个时代,比如 IBM 一年最多销售 100 台或 500 台新大型机,太阳微系统公司可能销售 50 万台工作站,到现在一个季度就能销售 1000 万台计算机。

我认为这就是扩展范围,虽然每个端点的计算能力较弱,但端点数量更多,这在架构上也是一个巨大的胜利,因为它让更多人对所发生的事情有更多的控制权,还降低了成本。

所以今天,如果你想要获得最昂贵的 MIPS,可能要在像配备液体冷却的核电数据中心里,而我手机上的 MIPS 是免费且随时可用的。

我认为这对模型开发者来说是一个盲点。现在他们都开始这么做了。我是说,我在我的设备上运行 Llama 模型,第一次这么做的时候,我惊呆了,然后你就会想,这才是应该的方式。

然后看看苹果的策略,虽然执行得不是很好,但他们的想法是所有这些功能都会自然出现,我的手机上到处都会弹出这些功能,而且不需要花费任何成本,我的数据也不会泄露,这肯定是发展的方向。

当然,会有一些功能只有在超大规模的云推理中才能实现。就像现在大多数数据操作都在云端进行,但大多数数据库仍然在我的设备上。

Martin Casado:

是的,是的。我笑了,因为这是一个微型计算机领域的人的故事。我给你讲一个互联网领域的人的故事,有一个完美的类比,你还记得交换技术之战吗?

哦,当然记得。很长一段时间里,电话网络非常完美。它们能在几毫秒内完成信号汇聚,不会丢失任何数据,能保证服务质量。

Steven Sinofsky:

然后互联网来了,只要 5 美元。

Martin Casado:

然后互联网出现了。我们没有电话网络的那些优点,信号汇聚需要几分钟,还经常丢失一半的数据,无法保证服务质量。

当时还发生了一些疯狂的争论,比如,你们为什么要搞互联网这种东西?太傻了。

我们知道如何做网络,但电话网络的交换技术人员不明白,当你采用尽力而为的传输方式时会发生什么,以及这如何让端点设备发挥作用。他们认为价值应该体现在网络本身,无法从其他角度思考。

而这正是互联网兴起的原因。我认为现在同样的事情正在发生,很多时候人们看着这些模型会说,哦,它们会产生幻觉。

Steven Sinofsky:

是的,就像……

Martin Casado:

你知道,这些模型在某些方面并不准确,但它们开启了一整套全新的可能性,比如创造力和编码。这是一个全新的领域,而且会迅速发展。认为它们不符合旧模式,对于预测它们的发展方向来说,其实并不重要。

DeepSeek出现基本是迈向通用人工智能(AGI)的又一步

Steven Sinofsky:

我做的就是把 “服务质量(QOS)” 换成 “产生幻觉”。90 年代我参加了很多会议,那些保护套的 AT&T 员工会出现,对着比尔・盖茨大喊 “QOS,QOS”。我们都得去查 QOS 是什么,因为我们不仅没有使用 TCP/IP 协议,而且我们用的网络从来都不好用,因为那是基于 PC 的网络。

还有 IBM 的人,在一旁嘀咕。我还算有点网络天赋。我应该解释一下 “死亡之 ping”,但当时真的很搞笑,他们就坐在那里。然后我真的做了这件事。

是的,他们一直跟我说 QOS,QOS,QOS,说个不停。我根本不知道那是什么。我把他们带到我的办公室。那是 1994 年的冬天。我说,哦,看,我的 Mac 上正在播放利勒哈默尔冬奥会的视频。

视频真的就像邮票那么大。不,就像 iPhone 图标那么大,但它在播放。他们说,嗯,这只有每秒 15 帧。

我说,我知道,通常只有每秒 5 帧左右。那音频呢?我说,如果我想要音频,我就拨打你们系统上的这个电话号码,然后他们都嘲笑我。而现在,我们当然都在世界各地的各种设备上使用 Netflix。我认为他们只是无法理解这些范式,在这些范式中,所谓的缺点要么无关紧要,要么反而变成了优点。

当然,这就是思科诞生的原因,百分之百是这样。他们就像,嗯,我们一直都是这么做的,而且都很有效。但它只在我们那些疯狂、奇怪的大学和国防部有效,而现在这就是我们都在使用的东西。

我想把这个话题拉回到DeepSeek。我们对这个如此兴奋的原因是,我们以前确实见过类似的事情,也见过像某某公司这样的情况出现。

这不是零和游戏。它不会取代旧事物,对吧?它是新事物的一部分。

而我们甚至还没有想象到新事物会是什么样子,对吧?就像互联网才刚刚兴起。所以我们的兴奋是因为期待新事物的到来。

所以当我看到DeepSeek出现时,我觉得太棒了,这基本上是迈向口袋里的通用人工智能(AGI)的又一步,对吧?这些模型可以在小型设备上运行,这表明我们在前进。

我的反应不是,哦,糟了,我得做空英伟达之类的。我觉得那种反应是错误的。是的,我知道。我是说,我看到了那周流传的一篇博客文章,说要做空英伟达。

Martin Casado:

我也看到了,我当时就想……

Steven Sinofsky:

你疯了吗?我就想,嘿,黄仁勋是个天才,他们公司里都是天才。

Martin Casado:

时间会证明一切。

Steven Sinofsky:

你不这么认为吗?是的,完全正确。所以这非常令人兴奋。这就是扩展范围这一步的实现,你看,现在你可以看到每个人都在加倍投入。

你之前提出的一点,我认为非常有洞察力且很重要,就是这种专业化模型的实现,因为它们最终可以在你的手机上运行,这将使应用层真正得以存在。对我来说,这就相当于浏览器有了 JavaScript。我同意。

因为一旦浏览器有了 JavaScript,突然之间你就可以做任何你需要做的事情,而无需去某个标准机构或者自己构建浏览器。是的,我认为我们现在就处于这样的阶段。

主持人:

有一个后续问题,如果你想想迄今为止的发展历程,我觉得衡量标准一直都是,比如哪个模型参数最多?它在这个不一定具有代表性的编码测试中表现如何?这个模型能在什么设备上运行?成本是多少?那么我们是否应该期待一套不同的衡量标准,或者用不同的方式来评判这些模型呢?还是我们只应该关注应用层?是不是需要某种转变,让我们从追求更大、更好(也就是你说的扩大规模),转向能体现扩展范围的标准呢?

Steven Sinofsky:

当然,我一开始就觉得所有这些衡量标准都很愚蠢。对我来说,它们就像我们以前用浏览器做的基准测试,比如看浏览器渲染一张完整图片有多快。马克・安德鲁斯在浏览器中发明了图像标签。

他们在渲染方面做的巧妙之处在于渐进式渲染。然后这就使得世界各地的杂志可以用秒表记录谁渲染图片更快。当然,现在你再看,这确实是一个可以衡量的指标,但它其实并不重要。

所以我认为这些都会消失,我们很快就会关注模型实际能做什么。我确实认为,开始真正重要的衡量标准将取决于人们所追求的应用场景。就拿这周刚出现的研究类应用来说,每个人都有一个研究应用程序。

当你进行研究时,重要的指标是真实性。突然之间我们又回到了模型产生幻觉的问题上。但现在,比如说,你要给出脚注链接和来源,因为实际上在背后发生的事情是,它的生成性稍微少了一点,而更像是信息检索(IR),突然之间向量数据库、查找信息和再现信息变得很重要。

所以我们将会进入一个阶段,人们会开发,我觉得可能会沿着 ImageNet 的思路,开始生成成千上万的常规测试,比如,这个是真的吗?这完全是合理的。

Martin Casado:

但你让我想起了一个有点奇怪的历史关联,安德鲁斯发明了图像标签。从某种意义上说,他也算是一些人工智能的鼻祖,因为 CLIP(一种人工智能模型)基本上会通过使用元标签和图像文本描述来对图像进行描述,就像他创建了用于此目的的元数据。

我得说回到图像这个话题,我在和这些公司合作时注意到一件事,这些模型本身就很神奇,对吧?如果你有一个大模型,把它开放出来,人们就会使用它,这和计算机很不一样,你只要把模型放出来就行。问题是,其他所有模型很快就会赶上,因为它们的蒸馏效果很好。

所以这是无法保持优势的。所以那些能够保持优势的公司,显然会推出一个非常吸引人的模型。一旦用户参与到这个模型中,他们就会想办法围绕它构建一个应用程序,这个应用程序实际上是有用户粘性的,对吧?所以它会开始类似于 PowerPoint,或者开始变得有状态且需要配置。

所以这种方式往往更具防御性。然后使用模型的应用程序会使用很多模型,并对这些模型进行大量微调。所以我认为过去两年一直是大模型的时代。

真的是这样,它们很神奇,人们使用它们,也很喜欢它们。你知道,第一次使用 ChatGPT 时,你会觉得这太神奇了。现在我认为我们进入了围绕模型构建工作流程的时代,这些工作流程是无状态的复杂系统,而且有很多模型为更复杂的应用程序提供支持。

Steven Sinofsky:

多模型这点说得很好。我再补充一下。这和用户界面的发展情况类似。IBM 提出的用户界面概念完全源自他们的绿色屏幕和 3270 终端,他们制定了一系列关于用户界面应该如何设计的规则。

Martin Casado:

比如 40 或 48 个字符的……

Steven Sinofsky:

没错,比如这是功能键,这是其他什么的。然后事实证明,人们构建的各种用户界面框架实际上看起来和浏览器一模一样,在终端有无数个框架可供你选择。

你可以做你想做的事情。如果你愿意,你可以发明一个新的日历下拉菜单,或者不浪费时间去做。这真的取决于你。我确实认为这种创造力对应用程序极其重要。然后还有一些看似枯燥乏味,但我认为对应用程序实现差异化以及拥有竞争优势(就像 NBA 比赛中的护城河)很重要的方面,那就是应用程序也将面向企业。不管是好是坏,我们不断学到的一个教训是,如果你想在企业中获得应用,你就得做很多工作,比如关闭应用程序的某些部分,或者过滤某些部分,或者禁用某些功能等等。我认为最聪明的企业家会在一开始就意识到单点登录等需求。

Martin Casado:

作为每次…… 的来源。

Steven Sinofsky:

因为事实证明这也是一种很好的定价方式,但也不是特别难。

我认为关于人工智能、一致性、审查制度以及这是谁的观点等等,已经有太多愚蠢的事情了。现在有一整个行业就想站出来告诉你他们不希望人工智能出现哪些东西,而最聪明的企业家会提前预见到这一点并从中获利。事实证明,这在企业中非常有粘性。是的,我认为我们会看到智能生产力工具会立即接受这一点,甚至可能在最细粒度的层面,比如为某些用户关闭某些功能等等。

主持人:

最近我们在 SPEEDRUN 请了斯科特・贝尔斯基,有人问他,你看,Adobe 有很多用于 Firefly 的授权图片,消费者真的在乎这个吗?他说,说实话,不太在乎,但你知道谁在乎吗?企业在乎。所以就像你说的,这是两种不同的模式,创始人必须搞清楚。

但我确实想谈谈,很多人把DeepSeek的出现视为 “斯普特尼克” 时刻,这可以从地缘政治来看待。

但同样,如果你想想 “斯普特尼克” 事件,如果肯尼迪没有发表登月演讲,如果我们没有真正登上月球,那它就不会成为一个标志性时刻。换句话说,如果没有做出改变。假设你在董事会会议室,你是一名顾问。

Martin Casado:

我不想和董事会谈,我想和美国政府谈,对吧?对我来说,实际上DeepSeek最大的启示不是我们现在讨论的这些。DeepSeek最大的启示是让我们看到我们政策的盲目之处。

我们关于人工智能的政策,一直以来都大错特错。我们之前关于人工智能的政策是,我们不能开源,因为这会帮助对手。

我们必须限制大型实验室。我们必须在这之上施加各种监管。理由是出于安全考虑,还有所有那些出口管制的理由。

所以我们不能帮助其他国家。我们可以对芯片实施出口管制。我们还讨论过对软件实施出口管制,比如限制权重等等,所有这些都是我们之前的政策。

对我来说,这种制定政策的方式是错误的。中国有很多非常聪明的人,他们有出色的研究人员,能力极强。

他们能和我们一样做出很棒的东西,而且还能开源。不是我们促使他们这样做的,即使对芯片实施了出口管制,他们还是做到了。所以基本上我们之前的所有行动都白费了,我们应该做的是资助和投资我们自己的研究实验室。

Steven Sinofsky:

在此基础上补充一点,教训不是 “斯普特尼克” 事件,而是互联网。因为我们从互联网中学到的是,阿尔・戈尔曾宣称自己发明了互联网,但他真正做的是制定了相关监管政策,这才让互联网得以蓬勃发展。

他们本可以看着互联网说,哦,天哪,这是个大麻烦,然后试图把它变成 AT&T 和朗讯科技想要的样子。他们当时在游说,试图让这种情况发生,坦率地说,美国在线(AOL)也希望如此。但他们没有这么做,而是选择了让互联网从一开始就强大起来的方式。

所以,DeepSeek带来的契机源于全球技术社区的力量。尽管很多人都想独占成果,成为唯一的供应商,但这是行不通的。不要过度解读这个类比,其中最大的不同在于,从某种意义上说,它是 “斯普特尼克” 时刻,是对世界上半数国家的一个警醒。但这不是地缘政治上的警醒,与战争无关。

这仅仅关乎技术传播,从那以后我们经历了太多的失误。比如加密战争,我们试图对加密技术实施出口管制等等。很多人觉得我们作为一个行业这么做很愚蠢,因为就像划定数学范围一样,事实证明,划定数学范围是不可能的,而且考虑到使用的芯片,我们看到,对世界经济实施出口管制是非常非常困难的。

Martin Casado:

还记得我们曾打算对 PlayStation 实施出口管制吗?

Steven Sinofsky:

对,还有 Xbox,政府甚至找到…… 或者说对 2048 位加密技术和电子邮件实施管制,因为人们说,我们不能让…… 坏人,这是他们最喜欢用的词。坏人用加密邮件。我就想,他们反正会自己加密附件,我们对此肯定无能为力。

Martin Casado:

但实际上,我们之前确实对 GPU 实施过出口管制。这是个很好的例子。我们说,嘿,你们可以用这些东西进行武器模拟,

PlayStation 是第一个真正使用 SGI 技术的,记得吧?我们当时打算对其实施出口管制,就怕它落入萨达姆・侯赛因手中,结果完全失败,因为全球市场就是全球市场。我们最好还是投资本国的基础设施,我们当时在这方面做得很好。

我认为将其与互联网和算法进行类比非常恰当。我们应该再次这样做。需要有政治家站出来,成为这个时代的算法推动者。我觉得我们会看到这一点的。所以我确实认为现在是一个警醒,过去四五年这类事情的徒劳无功现在已经非常明显了。

我的意思比你说的更广泛,那些在各种智库和机构中,试图在非常细微的层面上控制这项技术的人,他们的想法都很一致。想想看,写了多少本书,成立了多少学术部门,对科技公司发起了多少攻击,就是为了让一切保持一致。比如在瑞士举行的那些让世界各国领导人达成一致的会议,我们应该……

但事情并非如此发展。从 1981 年 IBM 个人电脑诞生,或者坦率地说,从 1977 年苹果电脑诞生以来,计算机领域最大的教训就是边缘的创造力,并且要鼓励这种创造力。我认为监管者的问题在于,他们从未面对过对一个互联世界进行监管的情况。

DeepSeek这件事得到的另一个教训是,世界已经互联,在所有这些方面都已经很成熟。所以现在,某样东西传播开来所需的实际时间几乎为零。

我今天早上看到的数据,DeepSeek的日活用户数(DAU)达到了 OpenAI 的 35% 左右。这是一个巨大的增长,因为同样一批人都在尝试使用它,没有任何阻碍,也不需要时间。所以能参与到当下发生的事情中,真的非常令人兴奋。我们没必要泼冷水,做扫兴的人。

Martin Casado:

我个人不认为这对 OpenAI 或 Anthropic 来说是一个危机时刻。我觉得应用程序很难开发。目前他们推出的应用程序非常复杂。

他们了解自己的用户,有非常具体的使用场景。所以对他们来说,这算是一个警醒,他们不能懈怠,必须快速行动。

但我仍然对我们的实验室非常乐观,我认为他们能够保持领先。所以,还是有人认为DeepSeek的出现对英伟达、OpenAI 和 Anthropic 来说是危机时刻,但我不认同这些观点。我认为这更多的是对监管环境的一个警醒,我们都应该认识到,会有全球竞争,我们需要保持领先。

但我们现在应该看到,这些前沿公司的正确反应应该是开始开发应用程序,因为为他人构建一个优秀平台的最佳反馈循环就是开发应用程序。

在我们这个行业,一直都存在与合作伙伴竞争之类的讨论,但安迪・格罗夫(Andy Grove)的经验告诉我们,合作无处不在。所以每个人都应该做好准备,这些大公司会与你竞争。但历史表明,这并非一定会成功。

Steven Sinofsky:

市场规模(TAM)会扩大 100 倍,会涉及到每个端点,收入将来自应用程序端。

然后会有开发者。针对不同的场景会有不同的定价模式,但它肯定会存在。所以现在一切都在上升。

主持人:

既然这是一个正和增长的世界,你对这个成果来自像算法对冲基金这样的量化机构有什么快速的想法吗?这和你的预期有不同吗?还是这实际上表明会有更多参与者加入?

Steven Sinofsky:

这很好地提醒我们,总有一些人在创新。没有人,包括美国电话电报公司(AT&T),都没有预测到互联网会从大学中诞生。他们没想到瑞士的一个物理实验室会发明出成为基础的协议。他们当然也没料到……

一个失败的企业实验室研发出了成为标准的 TCP/IP 协议。我是说,这可不是普通的实验室。不是 IBM 那种实验室,而是一个几乎被关闭的实验室,因为它就在街对面的一个园区里失败了。

Martin Casado:

还记得,像斯坦福研究院(SRI)这类地方,你甚至都想不到它们,对吧?所以他们就像……

Steven Sinofsky:

所有这些事情,其中大部分甚至不会出现在未来五年所写的任何历史书中。我觉得这就是令人兴奋之处。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

No comment on record. Start new comment.