Note

但斌“火线点评”:DeepSeek出现会增大算力需求

· Views 24

2月12日上午盘中,但斌执掌的私募机构东方港湾公开发文:

此前,围绕这位百亿私募大佬的最新季报组合,以及他长期看好的英伟达与“DeepSeek冲击波”,讨论十分激烈。

作为过去两年私募主动投资的“冠军”,但斌一直看好并重仓包括英伟达在内的部分海外科技股。

但斌对英伟达的高仓位押注,还叠加了杠杆工具,可谓对芯片龙头股保持相当高的预期。

如今,他从技术角度,回应了DeepSeek“火爆全网”后引发的三大投资“疑问”

1) 中国团队在算力卡脖子的情况下,仍能研发出全球领先的AI大模型,是否说明了今后AI的进步不需要算力?
 
2) Deepseek团队通过修改PTX指令集,优化了GPU的使用,是不是意味着绕过CUDA的壁垒,今后使用国产芯片可以畅行无阻了。
 
3) 中国模型的降本与平权,会带来什么投资机会与风险?

 全球算力需求还会增加

但斌在文章中指出:Deepseek的成果会增加全球AI算力的需求,而非减弱。

他认为市场最大的误解是,从根本上把算法、算力和数据三者进行对立,误认为算法的创新进步,是对算力和数据形成了“替代和竞争”。

“而实际上,算法、数据和算力三者之间,是一种‘协同关系’。”

假设过去算法低效时,单位芯片在一个用例上只能服务10个用户;现在算法提效了,同一芯片可以服务100人。该芯片如果不提价,其价值量肯定是翻了10倍,而不是变得更低。如果一个商品的价值量提升了10倍,而价格不变,那么需求一定是上升的,这是经济学常识。

 AI应用普及将加快

但斌进一步指出:成熟AI模型的“降本与平权”已是过去2年大趋势。2025开年Deepseek作为“追赶者”送出的大礼包也在这一趋势内,这是走向“应用普及”的必经之路。

而成熟模型的降本与前沿模型的探索是两码事,想争做AI时代模型的领头人,所需算力和资源都不是小数,这也是除了Openai以外许多巨头的野心。

世界上任何一种技术的发展,基本遵循着“创新-跟随-降本”的发展模式。前沿的“探索者”会花重金和时间进行实验探索,最终找到一个有效果的技术方案,并将其商品化;

紧接着,社会会出现一大批“跟随者”,沿着探索者的思路去复现其产品,并在工程上进一步降本优化。这种成本优化的思路又会回到探索者那里进行整合和降本,双方相互学习,相得益彰。

在所熟知的领域里,包括了创新药与仿制药,特斯拉与中国电动车,还有大模型领域,皆是如此。

 杰文斯悖论

但斌还提及,随着AI成本的大幅下降,AI应用普及带来的推理需求才是算力的主场。

我们在年度思考中对比过o1模型的推理成本,在每百万token55美金的输出价格下,Agent应用使用推理模型几乎是寸步难行。而短短不到一个月,推理模型成本被追赶者的工程优化降低了100倍,我们预期的Agent应用生态,在以极快的速度向我们走来。

Deepseek带火了一个概念——杰文斯悖论,指的是当资源使用效率提高后,资源的消耗总量不会下降,反而会增加的经济现象。该理论最早于19世纪应用于煤炭的消耗问题。当瓦特改进蒸汽机,提高了煤炭利用率后(单位动力耗煤量大幅下降了75%),烧煤蒸汽机被更广泛地应用到工厂、铁路和船舶上,反而加速了煤炭消耗总量,也提升了煤炭价格。同样的情况,也发生在当汽车燃油效率提升(每公里耗油更少了),带来的行驶里程和总油耗的大幅增长,以及LED灯节能导致更长开灯时间和更多地方安装灯光,总体耗电量不降反升的情况。

当一项技术未被大面积采用之前,其单位资源消耗量的下降,反而会促进整体资源消耗总量的上升。同样的情况,也会在AI模型的应用身上发生,因为AI时代才刚刚开幕。

CUDA的壁垒不会被削弱

另外,但斌还很有信心的认为,CUDA(英伟达所推出的一种软硬件集成技术)的壁垒在未来不会被削弱。

他举了一个例子:AMD(一家美股芯片公司)正在通过HIP转换器,将CUDA代码迁移,仍然存在性能损失和适配成本。这类似于在苹果电脑上运行Windows系统——虽然技术上可行,但性能、兼容性和体验通常比原生环境差。除此之外,几乎没有更好的替代方案。

他还提及了一个细节,内地团队为了优化英伟达芯片的使用效率,不满足于CUDA的高级语言编辑,直接在底层编辑PTX指令集,对H800芯片中的流处理器进行通讯任务分配的修改,从而一定程度提高了全互联的通讯效率和稳定性。很多人看到这里,会认为相关团队没有使用CUDA软件,而是用PTX汇编语言对GPU进行功能修改,因此团队具备能力绕过CUDA,使用汇编语言在其他厂商的芯片上去复现模型的训练,这是很大的误解。

相关团队之所以能够使用PTX(全称为:并行计算任务线程的执行)进行任务执行的优化,也是英伟达架构的“可编辑性”所允许的。英伟达经常会吸收开发人员编辑PTX的创新工程方法,反过来优化官方的CUDA算子,这也是CUDA生态的反哺优势。

他自己很乐观的认为:CUDA并未被绕开,壁垒反而被增强。

AI应用会涌现各种投资机会

但斌进一步提出观点:随着技术发展,全球的AI应用会涌现各种投资机会,而大模型企业的商业模式会继续饱受挑战。

DeepSeek以一己之力,短短一个月为全国人民做了一次“AI科普”,并在模型能力和推理成本上追平甚至超越了大多数美国模型。

其更重要的贡献在于发现了一种高效的方法,即利用经过强化学习训练并具备推理能力的大模型进行蒸馏,从而生成包含“思维链”的样本数据,并对小模型进行直接的监督微调。

但斌还指出一个细节:在大模型领域,即没有网络效应也没有专利保护,希望成为领头羊的模型企业,只有持续保持前沿模型领先,才能维持巨大的用户数量和定价优势,以弥补前期高额的探索成本。这种难度现在也变得越来越大了。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

No comment on record. Start new comment.