搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
8 小时
重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总 ...
整理 | 屠敏出品 | CSDN(ID:CSDNnews)就在今天,素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI ...
8 小时
性能匹敌GPT-4o的国产模型在海外火了,训练仅花费558万美元
此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
15 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
腾讯网
13 小时
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek ...
整理 | 华卫、核子可乐一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。昨晚,DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务,如编码 ...
腾讯网
7 小时
550万美元烧出来的大模型居然赶超GPT-4o?浙大毕业的他展示的“东方 ...
和许多报告语焉不详相比,这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的: 整个训练仅花费了557.6万美元,在2048xH800集群上运行55天完成 ,还很坦诚地公布了技术细节。
14 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅4379万元
【新智元导读】 600万美金训出击败GPT-4o大模型,竟被中国团队实现了!今天,DeepSeek-V3在全网掀起巨大风暴,仅凭671B参数在数学代码性能上,堪比国外大模型Claude 3.5 Sonnet。
9 小时
OpenAI科学家:现有模型+后训练足以产生黎曼猜想的新证明
GPT-4可以完成人类需要几秒或几分钟的任务;o1 可以完成人类需要若干小时完成的任务,也就是可以用“AGI小时”衡量的任务;明年,模型可能会实现AGI日,并在3年后实现AGI周,能够解决重大的开放问题。
12 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
13 小时
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
腾讯网
11 小时
云上「算力浪费」,正在掣肘企业应用落地
文 | 雷雨亭编辑 | 王一鹏投入算力,真的能换来利润吗?这是每个想“入局”大模型的企业都会思考的问题。人工智能行业一直困于成本,无论从模型训练到推理,都充满了“烧钱”的气息。无法避免的高昂算力,成为企业入局大模型的“铁门槛”。据多方数据统计,训练 ...
9 小时
“AI界的拼多多”DeepSeek推出新款大模型,水平如何?
近日,被称为“AI界拼多多”的中国人工智能初创公司深度求索(DeepSeek)发布了全新大模型DeepSeek-V3(下称V3)并同步开源。该模型在Aider多语言编程测试排行榜中,已超越Anthropic的Claude 3.5 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈