搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
钛媒体APP on MSN
6 小时
下一代存储器趋势:存内处理(PIM),商业化迎来新进展
大厂重注PIM技术,力图在AI应用中超越竞争对手。
8 小时
性能匹敌GPT-4o的国产模型在海外火了,训练仅花费558万美元
此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
8 小时
国产AI一夜刷屏海外,2000 块GPU打造GPT-4o平替,AI大佬纷纷点赞
百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
腾讯网
8 小时
重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总 ...
整理 | 屠敏出品 | CSDN(ID:CSDNnews)就在今天,素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI ...
深圳新闻网
10 小时
深圳,走出一个隐秘AI团队
这位前腾讯AI员工,有着近10年的互联网SaaS和AI从业经历。与多数大模型公司不同的是,成一鹏和团队早早就意识到“粗放式算力的不可持续性”,转而借助算法和架构的深究进入到AI的下一个阶段: ...
12 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
13 小时
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
14 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅4379万元
【新智元导读】 600万美金训出击败GPT-4o大模型,竟被中国团队实现了!今天,DeepSeek-V3在全网掀起巨大风暴,仅凭671B参数在数学代码性能上,堪比国外大模型Claude 3.5 Sonnet。
15 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
51CTO
21 天
【AI模型对比】AI新宠Kimi与ChatGPT的全面对比:技术、性能、应用全揭秘
Kimi大模型的研发基于Transformer架构,借鉴了GPT和BERT等开放架构,并结合了国内特定领域的需求进行模型微调和改进。在发展初期,Kimi团队重点关注中文语言处理,通过大量的中文语料库训练模型,使其在中文理解和生成方面表现优异。同时,Kimi大模型在资源 ...
电子工程专辑
24 天
嵌入式软件,写代码之前,真的不需要进行软件架构设计吗?
想当初,嵌入式驱动开发,可是趋之若鹜的技术方向(有点夸张,不过10年前的嵌入式,可是听着比做Java web的要牛逼些噢),问题总是有原因的,我说下自己的理解: 打开拉勾等招聘网站,搜索架构师,会出现各种系统架构师,web架构师,后台服务端架构师 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈