当前位置: 主页 > 图文评测 >

周末,DeepSeek扔出“王炸”初次表露了本钱利润率 影响多年夜?

发布者:[db:作者]
来源:未知 日期:2025-03-02 08:50 浏览()
周六,海内AI年夜模子公司DeepSeek官方账号在知乎初次宣布《DeepSeek-V3/R1推理体系概览》技巧文章,不只公然了其推理体系的中心优化计划,更是初次表露了本钱利润率等要害数据,激发行业震撼。 数据表现,若按实践订价盘算,其单日本钱利润率高达545%,这一数字革新了寰球AI年夜模子范畴的红利天花板。 业内剖析指出,DeepSeek的开源战略与本钱把持才能正在攻破AI范畴的资本把持。DeepSeek此次“通明化”表露,不只展现了其技巧气力与贸易潜力,更向行业通报明白旌旗灯号:AI年夜模子的红利闭环已从幻想照进事实。 DeepSeek最新宣布 3月1日,DeepSeek于知乎开设官方账号,宣布《DeepSeek-V3/R1推理体系概览》技巧文章,初次颁布模子推理体系优化细节,并表露本钱利润率要害信息。 文章写道:“DeepSeek-V3/ R1推理体系的优化目的是:更年夜的吞吐,更低的耽误。” 为实现这两个目的,DeepSeek的计划是应用年夜范围跨节点专家并行(EP),但该计划也增添了体系庞杂性。文章的重要内容就是对于怎样应用EP增加批量巨细(batch size)、暗藏传输耗时以及停止负载平衡。 值得留神的是,文章还率先表露了DeepSeek的实践本钱跟利润率等要害信息。 依据DeepSeek官方表露,DeepSeek V3跟R1的全部效劳均应用H800 GPU,应用跟练习分歧的精度,即矩阵盘算跟dispatch 传输采取跟练习分歧的FP8格局,core-attention盘算跟combine传输采取跟练习分歧的BF16,最年夜水平保障了效劳后果。 别的,因为白昼的效劳负荷高,晚上的效劳负荷低,因而DeepSeek实现了一套机制,在白昼负荷高的时间,用全部节点安排推理效劳。晚上负荷低的时间,增加推理节点,以用来做研讨跟练习。 在近来24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁本钱按2美元/小时盘算,日均本钱为87072美元;若全部输入/输出token按R1订价(输入1元/百万token、输出16元/百万token)盘算,单日收入可达562027美元,本钱利润率高达545%。 不外,DeepSeek官方坦言,现实上不这么多收入,由于V3的订价更188体育官网低,同时收费效劳只占了一局部,别的夜间还会有扣头。 DeepSeek的高利润率源于其翻新的推理体系计划,中心包含年夜范围跨节点专家并行(EP)、盘算通讯堆叠与负载平衡优化三年夜技巧支柱:专家并行(EP)晋升吞吐与呼应速率,针对模子稀少性(每层仅激活8/256个专家),采取EP战略扩大总体批处置范围(batch size),确保每个专家取得充足的盘算负载,明显晋升GPU应用率;安排单位静态调剂(如Prefill阶段4节点、Decode阶段18节点),均衡资本调配与义务需要。 盘算与通讯堆叠暗藏耽误,Prefill阶段经澳门永利皇宫官网入口由过程“双batch交织”实现盘算与通讯并行,Decode阶段拆分attention为多级流水线,最年夜限制掩饰通讯开支。 全局负载平衡防止资本挥霍,针对差别并行形式(数据并行DP、专家并行EP)计划静态负载平衡器,确保各GPU的盘算量、通讯量及KVCache占用平衡,防止节点空转。 简略来说,EP就像是“多人合作”,把模子中的“专家”疏散到多张GPU长进行盘算,年夜幅晋升Batch Size,榨干GPU算力,同时专家疏散,下降内存压力,更快呼应。 DeepSeek在工程层面进一步紧缩本钱。日夜资本分配:白昼顶峰时段尽力支撑推理效劳,夜间闲置节点转用于研发练习,最年夜化硬件应用率;缓存掷中率达56.3%:经由过程KVCache硬盘缓存增加反复盘算,在输入token中,有3420亿个(56.3%)直接掷中缓存,年夜幅下降算力耗费。 影响多年夜? 有剖析称,DeepSeek此次表露的数据,不只验证了其技巧道路的贸易可行性,更为行业建立了高效红利的标杆:其模子练习本钱仅为同类产物的1%—5%,此前宣布的DeepSeek-V3模子练习本钱仅557.6万美元,远低于OpenAI等巨子;推理订价上风方面,DeepSeek-R1的API订价仅为OpenAI o3-mini的1/7至1/2,低本钱战略减速市场浸透。 业内剖析指出,DeepSeek的开源战略与本钱把持才能正在攻破AI范畴的资本把持。DeepSeek此次“通明化”表露,不只展现了其技巧气力与贸易潜力,更向行业通报明白旌旗灯号:AI年夜模子的红利闭环已从幻想照进事实,标记着AI技巧从试验室迈向工业化的要害转机。 中信证券以为,Deepseek在模子练习本钱下降方面的最佳实际,料将安慰科技巨子采取更为经济的方法减188体育线上平台速前沿模子的摸索跟研讨,同时将使得大批AI利用得以解锁跟落地。算法练习带来的范围待遇递增效应以及单元算力本钱下降对应的杰文斯悖论等,均象征着中短期维度科技巨子持续在AI算力范畴停止连续、范围投入仍将是高断定性变乱。 本周以来,DeepSeek开启“开源周”,给人工智能范畴扔下数颗“重磅炸弹”。回想DeepSeek这五天开源的内容,信息量很年夜,详细来看: 周一,DeepSeek发布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列停止了优化,现已投入出产; 周二,DeepSeek发布开源DeepEP,即首个用于MoE模子练习跟推理的开源EP通讯库,供给高吞吐量跟低耽误的all-to-all GPU内核; 周三,DeepSeek发布开源DeepGEMM。其同时支撑麋集规划跟两种MoE规划,完整即时编译,可为V3/R1模子的练习跟推理供给强盛支撑等; 周四,DeepSeek发布开源Optimized Parallelism Strategies。其重要针对年夜范围模子练习中的效力成绩; 周五,DeepSeek发布开源Fire-Flyer文件体系(3FS),以及基于3FS的数据处置框架Smallpond。 因而,有网友批评称:“《DeepSeek-V3/R1推理体系概览》技巧文章是‘开源周彩蛋’,直接亮出了底牌!” 至此,DeepSeek“开源周”的连载或者要告一段落了,但DeepSeek后续举措仍然值得连续存眷。 起源:券商中国 申明:数据宝全部资讯内容不形成投资倡议,股市有危险,投资需谨严。 责编:林丽峰 新浪财经大众号 24小时转动播报最新的财经资讯跟视频,更多粉丝福利扫描二维码存眷(sinafinance)
分享到