赛道Hyper | DeepSeek:算力需求的潜在逻辑
作者:周源/华尔街见闻
1月27日,英伟达美股盘前深度下跌,幅度超过12%(截至北京时间1月27日20:24),跌破了2024年12月17盘中的126.86美元低点。
黄仁勋恐怕做梦也没想到,撼动英伟达产业逻辑的,居然是一家中国私募。
1月20日,管理基金规模超过1000亿元的中国顶级私募——幻方量化,旗下公司“深度求索”(DeepSeek)推出的推理大模型DeepSeek-R1(以下简称DS-R1),以超越行业认知的超低训练成本和不亚于OpenAI o1正式版的性能(数学、代码、自然语言推理等),震撼了美国硅谷。
这个GenAI推理大模型的问世,实际上相当于中国技术问鼎全球第一梯队的宣言。从此,中国在尖端技术领域,将从追赶者,转变为有范式制定的实力。
这是GenAI时代真正的开始,而揭幕者,第一次是中国技术公司。
但就未来而言,英伟达产业逻辑,未必如眼下的英伟达巨幅滑落的股价那样,反而很可能会得以进一步强化。
此话如何理解?
DS-R1“秒破”英伟达价值链
1月24日,在大模型排名Arena上,DS-R1基准测试升至全类别大模型第三。
其中,在风格控制类模型(StyleCtrl)分类中,DS-R1与OpenAI o1并列第一,竞技场得分达到1357分,略超OpenAI o1的1352分。
OpenAI o1是OpenAI在2024年9月12日正式对外发布的一款新模型,是OpenAI下一代 “推理”模型中的首个产品。
DS-R1实现与OpenAI o1几乎无差别的性能表现(部分开源小模型性能甚至超越了o1),成本竟只有后者的3%-5%(约550万美元)。
这颠覆了人们对实现尖端AI性能所需条件的既有认知,顺带把英伟达价值链条在瞬间干成了碎片。
目前,OpenAI o1推出的ChatGPT Pro计划,月费高达200美元(约合人民币1440元,合计年费17280元人民币),对ChatGPT Plus或Team帐户每周有50次的访问限制。
若通过API使用o1预览版,则输入每百万token收费15美元(约合人民币108元),输出每百万收费60美元(约合人民币432元)。
花费约1.7万元人民币,每年只能问约2600次?
这种应用成本,非一般人能承受。
再看看ChatGPT-4o,个人版月费约20美元(约合人民币145元,合计年费1740元人民币),也有提问次数限制。
相比之下,DS-R1个人版使用免费;另据官方消息披露,DS-R1 API服务定价为输入每百万token收费人民币1元(缓存命中)或4元(缓存未命中),输出每百万token收费人民币16元。
全世界人民币都爱低成本但性能优异的应用,看着如此悬殊的价格差,美国人民也做出了自己的选择:目前,DS-R1已飙升至HuggingFace上下载量最高的热门GenAI模型。
DS-R1在苹果商店(AppStor)美区免费榜排名第四,超越Google Gemini和Microsoft Copilot等美国GenAI应用。
在技术迭代方面,DS-R1为全开源模式,因而开发者和研究人员能更广泛地参与其中,集合全球的科技力量,推动生态技术创新和促进市场良性竞争;OpenAI o1则是闭源模式,只能依靠OpenAI团队努力,并在此基础上,形成对英伟达产业逻辑的超强支撑。
可以预见,没有达到DS-R1性能的闭源模型公司,将大批量倒闭(若不想倒闭,那就加入DS-R1开源生态,这就叫“打不过,就加入”);即使是OpenAI,其闭源API的价值,也将重构。
现在,DS-R1的强悍性能、低成本特性和开源模式,让全球有志于参与GenAI生态的商业组织和个人,能大规模推动生态应用的广度和深度。
可以说,DS-R1将成为GenAI生态应用的催化剂,真正让世界进入GenAI应用时代。只不过这次,全新的GenAI时代的市场推动力,首次有了中国公司的身影。
在既有的认知中,中国公司虽能大幅降低产品成本,但技术却做不到领先全球,这次深度求索推出的DS-R1,打破了“虽然便宜但技术含量不足”的旧模式,首次取得全新技术时代核心推力俱乐部门票。
中国技术力量在GenAI技术浪潮中,表现靓丽。深度求索,不是一个人在战斗。
此前,火遍业界的豆包大模型,也推出迭代版。
据豆包微信公众号消息,1月22日,豆包大模型1.5Pro版本正式发布。
这款大模型在知识、代码、推理和中文等多项公开测评基准上成绩领先全球,综合得分优于GPT-4o、Claude3.5和Sonnet等硅谷一流模型。
英伟达逻辑结束了?
DS-R1的出品公司深度求索,为创业型公司,并没有上市。
但在1月27日,参与深度求索天使轮和Pre-A轮融资机构背后的上市公司,开盘即“一字板”涨停。
公开资料显示,杭州东方嘉富基金参与深度求索天使轮投资。杭州东方嘉富基金隶属“浙江东方”旗下;而参与深度求索Pre-A轮融资的华金领越基金,背后上市公司是“华金资本”。
这两个公司,在1月27日A股开盘即告涨停。
但为深度求索提供基础算力支持和基础设施的浪潮信息和中科曙光,以及与深度求索有产品技术合作的像拓尔思,因市场仍在构建逻辑过程中,涨跌就有了分化。
简单说下浪潮信息和中科曙光与深度求索的合作方向,前者为深度求索提供AI服务器集群(英伟达H800),后者承建深度求索杭州训练中心液冷系统。
与DS-R1概念有关的A股公司,此次却不是映射,而是直接有实际相关性。
有映射关系的,这次是英伟达产业逻辑。
DS-R1低成本实现强悍性能的本质在于提高了算力利用率,而非从此不需要算力或者对算力的需求减弱。
深度求索(DeepSeek)推出性能如此强悍的DS-R1,会让业界看到,提升算力效率是现实的,能实现的;在吸收深度求索提升算力效率的思想和方法后,业界会加码算力规模,以实现更大利益的达成。
因此,DS-R1并没有敲响英伟达产业逻辑的丧钟,相反,这实际进一步夯实了“达链”在二级市场统治力的基础。
可以用一个公式概括:
DeepSeek提升算力效率的方法+更大规模的算力=没有天花板限制的利益
低成本、强性能的DS-R1,会高度促进GenAI应用生态的繁荣速度。
从这个角度上看,海量开发者和应用方(包括B端商业组织和C端个体)的参与,会更进一步提升对算力供应商的需求。
这就像智能手机开源系统安卓加入手机应用生态后,对手机的移动SoC芯片和存储芯片的性能需求大幅度提升一样。
在2024年12月,深度求索推出DS-V3时,有评论认为:DeepSeek-V3将支持私有部署和自主微调,为下游应用提供远大于闭源模型时代的发展空间。未来一两年,大概率将见证更丰富的推理芯片产品、更繁荣的LLM应用生态。
在人类发展史上,无论是哪个技术时代,最终都为了一个目标,或者说,只有实现这个目标,技术时代才有真正的推动力。
这个目标,就是利益。
商业价值,就本质而言,只是为了到达利益彼岸的桥梁。
GenAI技术也不例外。
硅谷在过去的两年中(以2022年11月30日OpenAI推出ChatGPT-3.5为时间基准),投入的上千亿美元资本开支,也不是为了实现“利他”理想,而是为了利益——共赢不是否认利益,而是利益均沾。
从2007年史蒂夫·乔布斯推出初代iPhone至今,当真正催生繁荣的应用生态后,超越想象的巨大利益,才能滚滚而来。
因此,DS-R1,真正的价值,在于让全球GenAI的参与方,先看到、再学会如何用更低成本提升算力利用效率。
在DS-R1或DS-V3推出之前,原本花上1元钱得到的算力,形成的性能,达成了1.5元的收益,现在只要花0.1元,就能得到与之前投入1元相同的性能,实现相同的收益。
这时,你会怎么做?
是决定停止投入,还是选择加大力度?
如何选择,不言而喻。
因此,英伟达和A股“达链”(比如铜缆连接)板块股价这次大幅下挫,若是巨“坑”,也闪耀着某种稀有金属的色泽。
Reprinted from 见闻VIP,the copyright all reserved by the original author.
Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.
FOLLOWME Trading Community Website: https://www.followme.com
Hot
No comment on record. Start new comment.