首页新闻 DeepSeek的AI突破：成本显示

DeepSeek的AI突破：成本显示

by Elijah Feb 18,2025

DeepSeek令人惊讶的是廉价的AI聊天机器人挑战行业巨头。 DeepSeek的AI自我引入“问任何东西，得到令人惊讶的答案”的自我吸引已成为主要的市场竞争对手，甚至导致NVIDIA的股价大幅下降。它的成功源于创新技术和实质性（尽管未公开)投资的独特组合。

DeepSeek Test 图像：ensigame.com

关键技术进步包括：

多语预测（MTP)：同时预测多个单词，提高准确性和效率。
专家的混合物（MOE)：使用256个神经网络，每个令牌激活8个，加速培训并提高性能。
多头潜在注意力（MLA)：反复从文本片段中提取关键信息，从而最大程度地减少了忽略关键细节的风险。

DeepSeek最初声称使用2048 GPU的DeepSeek V3型号仅获得600万美元的培训成本。然而，半分析显示出更广泛的基础设施，包括大约50,000个NVIDIA HOPPER GPU（包括H800，H100和H20单位)，分布在多个数据中心。该基础设施的总服务器投资约为16亿美元，运营费用估计为9.44亿美元。

DeepSeek V3 图像：ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心，提供了对优化和更快的创新实施的控制。它的自筹资金地位增强了敏捷性。该公司吸引了顶尖人才，一些研究人员每年收入超过130万美元，主要来自中国大学。

最初的600万美元数字可能只反映了培训前的GPU成本，不包括研究，改进，数据处理和整体基础设施费用。 DeepSeek的总AI开发投资超过5亿美元。与更大的官僚竞争者相比，它的简化结构允许有效的创新。

DeepSeek 图像：ensigame.com

尽管DeepSeek的成功展示了一家资金充足的独立AI公司的竞争潜力，但“革命预算”主张却具有误导性。他们的成功归因于大量投资，技术突破和强大的团队。但是，即使有了这些巨大的支出，DeepSeek的成本仍然比竞争对手低得多。例如，DeepSeek的R1型号的培训成本为500万美元，而Chatgpt4的1亿美元。

DeepSeek 图像：ensigame.com

最新文章 更多+

13 2025-03

Naraka：Bladepoint的春季节更新：新英雄和宝藏
准备在Naraka举行充满活力的农历新年庆祝活动：Bladepoint，即将举行的春季音乐节更新，将于1月20日启动！这项激动人心的更新引入了一个迷人的新英雄，令人惊叹的宝藏战利品和许多引人入胜的活动。 Naraka：Bladepoint欢迎一个新的英雄：Lann
13 2025-03

GTA 6：宣布的惊喜早期发布计划
Rockstar Games宣布了超过预期的Grand Theft Auto VI（GTA 6）发行的预期，已通过游戏社区向Shockwaves发行。惊喜的启示引发了激动和猜测的大火，许多粉丝将这个加速时间表连接到另一个高度蚂蚁
13 2025-03

PokémonTCG：贸易令牌礼物，有争议的功能尚未解决
PokémonTCGPocket Developer，生物公司已向玩家发布了1,000个贸易令牌。对于仅两项重大交易而言，这足够了，这是一个临时措施，而他们继续解决有关最近实施的交易机械师的担忧。玩家会在礼物菜单中找到这些令牌