deepseek news - 搜索 News

红板报 on MSN19 小时

DeepSeek甩出了一张“王炸”

出品｜虎嗅科技组作者｜余杨编辑｜苗正卿头图｜《赌神》剧照 12月26日消息，国产大模型DeepSeek推出DeepSeek-V3，一个强大的混合专家（Mixture-of-Experts, ...

2 天on MSN

DeepSeek-V3重磅开源！6710亿参数自研MoE模型引领国产AI新高度

近日，“深度求索”官方公众号揭晓了一项重要进展，其DeepSeek-V3模型已正式上线并同步开放源代码。用户只需访问chat.deepseek.com官网，便能与这一最新版本的模型进行互动。

腾讯网1 天

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

机器之心报道机器之心编辑部今天，一个国产大模型火遍了世界。打开 X，满眼都是讨论 DeepSeek-V3 的推文，而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.4 万 H800 GPU ...

2 小时on MSN

DeepSeek崛起，训练算力趋势如何？英伟达地位面临挑战？

在人工智能领域，DeepSeek v3的发布如同一股清流，其凭借后发优势，巧妙地规避了前辈们曾踏入的陷阱，实现了高效避坑。这一成果得益于它站在了巨人的肩膀上，通过更优化的方式利用现有算力，力求实现收益的最大化。有观点认为，DeepSeek ...

2 天

Deepseek-v3意外曝光！编程表现惊人一举超越Claude 3.5 Sonnet

近来，人工智能领域再传重磅消息——Deepseek的新模型Deepseek-v3意外在Reddit上曝光，未等官方宣布，其在API和网页上的上线引发了广泛关注。从用户反馈来看，Deepseek-v3已在Aider的多语言编程测试排行榜上飞速跻身前列， ...

腾讯网1 天

Deepseek v3 实测来了！智商牛逼，情商不存在，自信退出价格战

事情起因是这样的！下午的 Family 群里，有家人和小鹿说 DeepSeek 的新模型性能不错！但是涨价了！哦？Deepseek 可是国产大模型界的拼多多啊。这次推出即爆火的 V3 价格翻了一倍不止。DeepSeek V3 的 API ...

16 小时

DeepSeek引热议之际 “ChatGPT之父”发文感谢团队：复制容易创新很难

他补充称：“召集一支有才能的大型研究团队一起在迷雾中攻克一座新山峰也是极其困难的。这是推动进步的关键。感谢伊利亚、雅各布、鲍勃、马克，还有许多其他杰出的研究领导者，他们让我们来到这里。” ...

10 小时

DeepSeek火出圈，英伟达完了吗？

DeepSeek v3因为是后发，完全可以避开前人走的坑，用更高效方式避坑，也就是“站在巨人的肩膀上”。真实逻辑应该是：榨干同等算力去攫取10倍收益。就比如o1的训练成本远超GPT-4，而o3的训练成本大概率远超o1。从前沿探索角度看，训练所需算力只会越来越多。应用生态越繁荣，只会让训练投入的支付能力更强；而算力通缩，只会让同等投入买到更多训练Flops。

3 天

DeepSeek v3预览版发布，强势替代Sonnet 3.5再登多语言排行榜第二名

2024年末，DeepSeek正式推出其最新的v3预览版，这一版本不仅取代了之前颇具人气的Sonnet 3.5，还在近期的aider多语言排行榜中成功跻身第二名，展现出强大的市场竞争力。作为一款深度学习驱动的智能创作工具，DeepSeek ...

来自MSN1 天

DeepSeek V3刷屏，550万元2000张卡做出的开源模型，和OpenAI几亿烧出来的 ...

作者｜王兆洋邮箱｜[email protected] 像是迷雾中走出的一头怪兽，DeepSeek V3在先行“泄露”并引发一阵惊叹后，开发方深度求索正式发布了技术报告。

腾讯网1 天

突然刷屏的ai界“拼多多”deepseek

作者｜Jimmy来源｜AI先锋官年底沉寂的AI 行业，突然被一家中国公司刷屏。圣诞这天，来自中国杭州的AI公司deepseek，发布了DeepSeek-v3。一夜之间，霸榜开源模型，编码等性能被评价比肩GPT-4o、Claude 3.5。AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果