在AI领域的一次重大转折点上,DeepSeek在“开源周”活动的最后一天,释放了一枚震撼业界的“重磅炸弹”——首次公开了成本利润率的核心数据。这一举动,无疑为整个行业带来了前所未有的关注与讨论。
DeepSeek通过其官方社交媒体账号宣布:“在假定GPU租赁成本为2美金/小时的情况下,我们的日总成本达到了87,072美元。而若所有tokens均按照DeepSeek R1的定价来计算,理论上,我们一天的总收入能达到562,027美元,成本利润率高达545%。”然而,这一数据仅代表最理想的状态。
近期,DeepSeek的开源周活动让整个AI行业为之振奋。这些开源工具不仅显著提升了全球AI开发者的效率,降低了AI模型的开发与训练成本,还为大模型开源与闭源的长期争论初步画上了句号。此前,坚定的“闭源派”百度(9888.HK)宣布将开源下一代文心大模型,随后,字节豆包、昆仑万维等也推出了各自的开源模型,阿里巴巴(9988.HK)进一步加大了开源力度。
开源大模型社区OpenCSG的联合创始人兼CTO王伟感慨道:“无论是主动还是被动,开源大模型的浪潮已经席卷而来。”DeepSeek正在深刻改变AI大模型的市场格局,快速迭代的态势下,“过时”的模型逐渐被边缘化。业内人士指出,在大模型领域,试图依靠短期的算法技术优势或商业模式构建长期竞争壁垒,目前看来并不现实。
DeepSeek不仅为开发者带来了福音,也迫使一些大模型公司不得不“跟风”开源。然而,开源之后的路该如何走?DeepSeek能够测算自己的理论利润率,但其他厂商是否找到了可行的盈利模式?
DeepSeek的开源行动不仅仅停留在模型和论文层面,更向更底层的技术进发。王伟表示:“DeepSeek开源的技术能显著提高推理效率,在相同场景和服务规模下,所需GPU数量更少,甚至有助于节能减排。”以DeepSeek开源项目中的EP(Expert Parallelism,专家并行)技术为例,过去只有少数头部公司有能力实现,多数企业只能以低效方式进行推理。但DeepSeek的开源,有望迅速改变这一现状。
摩尔线程在短时间内便宣布全面支持DeepSeek的各个开源项目,包括FlashMLA、DeepEP、DeepGEMM等。王伟补充道,虽然该技术方案目前主要针对英伟达的技术架构,特别是Hopper架构的显卡,以及针对MOE等架构模型的训练和推理,但其开源成果正被其他通用开源项目、企业和科研组织快速吸收。
LangGPT社区的创始人云中江树认为,DeepSeek的开放程度几乎拉平了大模型应用的门槛。DeepSeek不仅足够开放,没有任何限制,甚至将部署的底层代码也开放出来,相当于手把手教大家如何高效部署。目前,全球主要有meta的Llama系列模型、阿里的千问系列和DeepSeek三大AI开源玩家。在开源协议上,DeepSeek对商用几乎没有限制,从开源的广度和可复现性来看,也几乎只有DeepSeek能将集群计算、通信等提升能效的代码开放出来。
更重要的是,DeepSeek完全扭转了大模型开闭源的战局。过去一段时间,海外大模型开源势头减弱,硅谷的AI巨头逐步转向闭源。而DeepSeek、Qwen等中国模型则成为了开源的重要力量。百度此前曾认为开源可能是“伪命题”,李彦宏甚至表示开源模式是一种智商税。然而,百度也最终宣布将开源文心大模型,放弃了坚持两年的闭源之路。
DeepSeek的技术实力与开放程度,让开源成为大模型的主流。不仅百度,多家大模型企业也在2月推出或深化开源。字节跳动豆包大模型团队联合北京交通大学等开发的视频生成实验模型“VideoWorld”、昆仑万维的SkyReels-V1和SkyReels-A、月之暗面Kimi的Moonlight等纷纷开源。阿里云也推出了QwQ-Max-Preview深度思考模型,并计划后续开源。
在DeepSeek的风暴下,厂商们选择开源背后的动力复杂多样。百度创始人兼CEO李彦宏解释了促使百度做出这一抉择的原因,即通过开源让开发者和用户认识到文心系列大模型的真正价值,促进采用。然而,这背后可能蕴藏着更深层的生态战位。王伟表示,DeepSeek开源后,国内外从芯片到框架,再到应用层,都迅速进行适配,这股风潮甚至超过了meta开源的Llama模型。
对于其他坚持商业化全闭源策略的模型厂商来说,除了API接入外,私有化部署的生态适配将维持在高成本状态,这会大大削弱其竞争力。云中江树认为,开源是融入大模型生态中的最佳途径。如果企业自己开发一套闭源、较小的系统,而其他厂商不与之兼容,软件也无法适配,那么该企业可能会面临被淘汰的风险。
从融资角度来看,一家风险投资机构负责人表示,能否选择开源将成为接下来投资大模型的重要指标。该负责人指出,开源可能会在更短的周期内追上闭源,那么企业的竞争优势是否还能持续,是需要更多考量的。一个残酷的事实是,DeepSeek开源后,原来的大模型坚持的闭源私有化商业模式便不再成立。
尽管DeepSeek的商业化路径并不十分清晰,但云中江树指出,即便是闭源,当前的商业化也并不理想。底层原因是,大模型的智能化水平尚未达到真正商业化落地的要求。DeepSeek自身也承认,由于定价策略及夜间折扣等因素,其实际收入不及理论数值。
王伟认为,短期内,DeepSeek的开源会给模型厂商带来压力,但长期来看,大模型的竞争远未结束。各模型厂商若能适当吸收DeepSeek的开源成果,拿出更具竞争力的模型,未来仍有可能反超。云中江树表示,开源也有其独特的商业模式,如提供免费模型但出售相关服务、实行双轨制或开源上一代模型而闭源新一代等。
湘ICP备19005331号-4copyright?2018-2025
guofenkong.com 版权所有
果粉控是专业苹果设备信息查询平台
提供最新的IOS系统固件下载
相关APP应用及游戏下载,绿色无毒,下载速度快。
联系邮箱:guofenkong@163.com