搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
17 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
9 小时
性能匹敌GPT-4o的国产模型在海外火了,训练仅花费558万美元
此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
2 天
打错字也能 “越狱”GPT-4o、Claude :揭秘AI聊天机器人的脆弱性!
近期的研究表明,市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感,甚至可以被轻易 “越狱”。根据《404媒体》的报道,Claude 聊天机器人的开发公司 Anthropic ...
腾讯网
8 小时
550万美元烧出来的大模型居然赶超GPT-4o?浙大毕业的他展示的“东方 ...
和许多报告语焉不详相比,这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的: 整个训练仅花费了557.6万美元,在2048xH800集群上运行55天完成 ,还很坦诚地公布了技术细节。
腾讯网
10 小时
重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总 ...
整理 | 屠敏出品 | CSDN(ID:CSDNnews)就在今天,素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI ...
4 天
微软Phi-4封神,14B小模型数学击败GPT-4o!合成数据占比40%,36页技术 ...
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,证明了数据生成和后训练技术比模型蒸馏更能带来能力上的提升。
16 小时
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲
援引博文介绍, DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。
4 天
on MSN
百川智能发布金融大模型Baichuan4-Finance,FLAME评测领先GPT-4o
百川智能近期宣布了一项重要进展,正式推出了其全链路增强的金融大模型——Baichuan4-Finance。该模型融合了超过1000亿的中英文金融知识数据,借助人民大学财政金融学院的金融专家团队,通过多层次质量评估体系进行了严格的筛选和定义。
红板报 on MSN
4 天
百川发布金融大模型,整体准确率领先GPT-4o近20%?
12月23日,百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其 ...
3 天
领先 GPT-4o 近 20%,百川智能发布全链路金融大模型
12 月 24 日,据记者 Mark Gurman 透露,苹果将于 2025 年推出新款 MacBook Air,届时将搭载 M4 处理器亮相,同时 Gurman 还提到,苹果还会带来第 11 代入门款 iPad。 目前,据知情人士透露,M4 的 MacBook Air 已开始进入量产阶段,将搭载 M4 处理器,外观与此前的 M3 MacBook Air 保持一致,代号为 J713 和 J715, ...
4 天
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩 ...
FLAME-Cer 评测结果显示,Baichuan4-Finance 在银行、保险、基金、证券等多个资格认证领域的 准确率均突破了 95%,整体准确率 93.62% ,大幅领先 GPT-4o 和 XuanYuan3-70B-Chat,超出 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈