搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
1 小时
TikTok高管创业,AI Coding仍有新故事可讲|焦点分析
此前有媒体报道,月之暗面出海产品Noisee前产品负责人明超平AI Coding创业项目“新言意码”,天使轮就以5000万美元的估值开启融资,与月之暗面等国内AI独角兽的首轮估值几乎齐平。
十轮网科技资讯 on MSN
6 小时
评估模型回应准确性,Google传利用Anthropic Claude改善Gemini
根据外媒TechCrunch近日看到的内部信件显示,协助改善AI聊天机器人Gemini的外承包商将其答案与竞争对手Anthropic Claude所产生的答案进行比较。
腾讯网
7 小时
550万美元烧出来的大模型居然赶超GPT-4o?浙大毕业的他展示的“东方 ...
和许多报告语焉不详相比,这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的: 整个训练仅花费了557.6万美元,在2048xH800集群上运行55天完成 ,还很坦诚地公布了技术细节。
8 小时
国产AI一夜刷屏海外,2000 块GPU打造GPT-4o平替,AI大佬纷纷点赞
百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
i黑马
8 小时
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
据Reddit网友爆料,Deepseek-v3已在 API 和网页上发布,一些榜单跑分也新鲜出炉。在 Aider 多语言编程测试排行榜中,Deepseek-v3 一举超越 Claude 3.5 Sonnet,排在第 1 位的 o1 之后。(相比 Deepseek-v2.5,完成率从 17.8% 大幅上涨至 48.4%。)且在 LiveBench 测评中,它是当前最强开源 ...
9 小时
“AI界的拼多多”推出新款大模型,水平如何?
近日,被称为“AI界拼多多”的中国人工智能初创公司深度求索(DeepSeek)发布了全新大模型DeepSeek-V3(下称V3)并同步开源。该模型在Aider多语言编程测试排行榜中,已超越Anthropic的Claude 3.5 ...
来自MSN
12 小时
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
鱼羊 一水 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
12 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
腾讯网
13 小时
国产之光DeepSeek把AI大佬全炸出来了!53页论文技术细节大公开
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
14 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅4379万元
【新智元导读】 600万美金训出击败GPT-4o大模型,竟被中国团队实现了!今天,DeepSeek-V3在全网掀起巨大风暴,仅凭671B参数在数学代码性能上,堪比国外大模型Claude 3.5 Sonnet。
14 小时
谷歌澄清未在Anthropic模型上训练Gemini
Anthropic的服务条款明确规定,未经批准,不得使用Claude来构建竞争产品或训练竞争AI模型。谷歌DeepMind的发言人确认了他们确实会为了评估目的比较不同模型的输出,但否认使用Anthropic的模型来训练Gemini。值得注意的是,谷歌 ...
15 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈