搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
腾讯网
15 小时
幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama
蓝鲸新闻12月27日讯 ...
腾讯网
13 小时
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek ...
整理 | 华卫、核子可乐一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。昨晚,DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务,如编码 ...
腾讯网
13 小时
国产之光DeepSeek把AI大佬全炸出来了!53页论文技术细节大公开
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
12 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
小熊财经 on MSN
14 小时
DeepSeek-V3开源上线,性能超阿里Qwen、Meta Llama,定价亲民引关注
近日,国内AI领域的创新力量深度求索(DeepSeek)公司宣布,其最新研发的DeepSeek-V3系列模型的首个版本已在12月26日晚正式上线,并且实现了同步开源。这一举措标志着DeepSeek在大型语言模型技术上的又一次重大突破。
来自MSN
12 小时
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
鱼羊 一水 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
8 小时
“AI界的拼多多”DeepSeek推出新款大模型,水平如何?
近日,被称为“AI界拼多多”的中国人工智能初创公司深度求索(DeepSeek)发布了全新大模型DeepSeek-V3(下称V3)并同步开源。该模型在Aider多语言编程测试排行榜中,已超越Anthropic的Claude 3.5 ...
1 天
福布斯最新预测:2025年AI产业链十大剧变,这些机会别错过
就在刚刚,福布斯发布了2025年AI产业的最新预测。细读这份报告,我惊讶地发现:那些我们认为"还要很久"的变革,很可能在未来12个月内集中爆发。 Meta即将开始对Llama收费,AI数据中心将迁往太空,首个重大AI安全事件即将发生...这些预测背后 ...
12 小时
on MSN
DeepSeek V3惊艳亮相!671B大模型训练成本大降,开源细节引发热议
在AI界掀起波澜的DeepSeek V3模型,近日正式发布并引发了技术圈的狂热讨论。这款新版本不仅延续了其前身的性价比优势,更是直接采取了完全开源的策略,将训练细节详尽地呈现在53页的论文中,展现出前所未有的透明度。 对于DeepSeek ...
14 小时
Token已死?AI认知的新范式正在崛起
经Meta的研究者测试,LCM在多个标准评测任务上都展现出了优秀的性能,尤其在跨语言和长文本生成任务上展现出一定优势。这是因为概念本身的链接比token的链接覆盖的范围更大,我们也可以推测大模型的语义理解通过这一训练得到了加强。
17 小时
on MSN
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。
1 天
满足AI时代高效办公需求 惠普战99 AI商务超能本评测
作为全球领先的PC厂商,惠普旗下的战99系列向来都以性能强劲、设计精良而闻名,就在不久前,惠普重磅发布了战99 AI商务超能本,并首次搭载了NVIDIA RTX ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈