DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:JRS直播吧
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。
以上内容请关注首页JRS
- 体育战报 | Faker:从和GEN比赛中获得信心,经历国际大赛团队磨合不断变好
- 体育战报 | Rookie发布视频:只是普通的20而已,什么都...没有发生
- 体育战报 | JackeyLove:我这乒乓球弹幕水平,打得最好的还是69
- 体育战报 | 如此迅速!设计师发布视频表示将会修复红色方兰博伤害问题
- 体育战报 | 余霜晒照:47户外拍摄体感温度太高了出去一分钟就汗如雨下
- 体育战报 | IG发布俱乐部14周年庆贺:翻过下一座山,让我们一同续写这故事
- 体育战报 | KPL解说灵儿晒照:战至巅峰解说灵儿大家看节目了吗
- 体育战报 | 保龄联盟莉莉娅皮肤展示:大招会甩出飞旋的金牌
- 体育战报 | 解说Kitty晒照:生日小公主今年可以替我许愿吗
- 体育战报 | kkOma:希望所有选手都表现出色并且取胜,预测2比1

- 中超 | 归化专家:华侨球员吴德启确认具有中国籍,他效力翁特哈兴梯队
- 英超 | 天空:利物浦准备再次报价伊萨克,首份1.1亿镑+附加条款已被拒绝
- 英超 | 记者:巴黎再次就引进扎巴尼谈判,预计总转会费将接近7000万欧
- 英超 | 天空:凯尔特人即将完成19岁曼城小将普西的租借交易,租借期1年
- 意甲 | 意媒:尤文不会给弗拉霍维奇解约或遣散费,想签他必须付2000万欧
- 英超 | 罗马诺:帕利尼亚已完成租借加盟热刺的体检
- 意甲 | 罗体:比塞克和泽林斯基单独训练,塔雷米和弗拉泰西很快归队
- 英超 | 不买了名记:利物浦不会再报价伊萨克,除非纽卡改变立场
- 意甲 | 鲁比尼奥:孔蒂的那不勒斯是意甲冠军热门,换帅后的国米表现不好
- 中超 | 云南玉昆vs上海申花今日赛前官训图集