Claude - 搜索 News

1 小时

TikTok高管创业，AI Coding仍有新故事可讲｜焦点分析

此前有媒体报道，月之暗面出海产品Noisee前产品负责人明超平AI Coding创业项目“新言意码”，天使轮就以5000万美元的估值开启融资，与月之暗面等国内AI独角兽的首轮估值几乎齐平。

十轮网科技资讯 on MSN6 小时

评估模型回应准确性，Google传利用Anthropic Claude改善Gemini

根据外媒TechCrunch近日看到的内部信件显示，协助改善AI聊天机器人Gemini的外承包商将其答案与竞争对手Anthropic Claude所产生的答案进行比较。

腾讯网7 小时

550万美元烧出来的大模型居然赶超GPT-4o？浙大毕业的他展示的“东方 ...

和许多报告语焉不详相比，这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的：整个训练仅花费了557.6万美元，在2048xH800集群上运行55天完成，还很坦诚地公布了技术细节。

8 小时

国产AI一夜刷屏海外，2000 块GPU打造GPT-4o平替，AI大佬纷纷点赞

百科知识：DeepSeek-V3 在知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）上的水平相比前代 DeepSeek-V2.5 显著提升，接近当前表现最好的模型 Claude-3.5-Sonnet-1022。

i黑马8 小时

Deepseek新模型意外曝光！编程跑分一举超越Claude 3.5 Sonnet

据Reddit网友爆料，Deepseek-v3已在 API 和网页上发布，一些榜单跑分也新鲜出炉。在 Aider 多语言编程测试排行榜中，Deepseek-v3 一举超越 Claude 3.5 Sonnet，排在第 1 位的 o1 之后。（相比 Deepseek-v2.5，完成率从 17.8% 大幅上涨至 48.4%。）且在 LiveBench 测评中，它是当前最强开源 ...

9 小时

“AI界的拼多多”推出新款大模型，水平如何？

近日，被称为“AI界拼多多”的中国人工智能初创公司深度求索（DeepSeek）发布了全新大模型DeepSeek-V3（下称V3）并同步开源。该模型在Aider多语言编程测试排行榜中，已超越Anthropic的Claude 3.5 ...

来自MSN12 小时

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10 ...

鱼羊一水发自凹非寺量子位 | 公众号 QbitAI DeepSeek新版模型正式发布，技术大佬们都转疯了！延续便宜大碗特点的基础之上，DeepSeek V3发布即完全开源，直接用了53页论文把训练细节和盘托出的那种。

12 小时

国产AI大模型之光DeepSeek把AI大佬全炸出来了！6710亿参数训练只需1/10算力

其他值得关注的细节还包括，DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中，每个token会激活8个专家，并确保每个token最多被发送到4个节点。

腾讯网13 小时

国产之光DeepSeek把AI大佬全炸出来了！53页论文技术细节大公开

14 小时

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅4379万元

【新智元导读】 600万美金训出击败GPT-4o大模型，竟被中国团队实现了！今天，DeepSeek-V3在全网掀起巨大风暴，仅凭671B参数在数学代码性能上，堪比国外大模型Claude 3.5 Sonnet。

14 小时

谷歌澄清未在Anthropic模型上训练Gemini

Anthropic的服务条款明确规定，未经批准，不得使用Claude来构建竞争产品或训练竞争AI模型。谷歌DeepMind的发言人确认了他们确实会为了评估目的比较不同模型的输出，但否认使用Anthropic的模型来训练Gemini。值得注意的是，谷歌 ...

15 小时

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

在基准测试中，数学领域MATH 500上，DeepSeek-V3拿下了90.2高分，比Claude 3.5 Sonnet、GPT-4o超出10分还要多。在软件工程SWE-bench ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果