搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
8 小时
“AI界的拼多多”DeepSeek推出新款大模型,水平如何?
近日,被称为“AI界拼多多”的中国人工智能初创公司深度求索(DeepSeek)发布了全新大模型DeepSeek-V3(下称V3)并同步开源。该模型在Aider多语言编程测试排行榜中,已超越Anthropic的Claude 3.5 ...
腾讯网
15 小时
幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama
蓝鲸新闻12月27日讯 ...
腾讯网
13 小时
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek ...
整理 | 华卫、核子可乐一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。昨晚,DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务,如编码 ...
17 小时
on MSN
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。
腾讯网
13 小时
幻方量化DeepSeek-V3首个版本上线
钛媒体App ...
12 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
8 小时
性能匹敌GPT-4o的国产模型在海外火了,训练仅花费558万美元
此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
8 小时
国产AI一夜刷屏海外,2000 块GPU打造GPT-4o平替,AI大佬纷纷点赞
百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
来自MSN
11 小时
2024,AI这一年
从各个方面来看,2024年对于AI科技而言都是迄今为止最为重要的一年——至少在技术商业化角度上是如此。
13 小时
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
财联社 on MSN
17 小时
DeepSeek-V3首个版本上线
【DeepSeek-V3首个版本上线】《科创板日报》27日讯,幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。据介绍,DeepSeek- ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈