Gpt-4O - 搜索 News

17 小时

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

在基准测试中，数学领域MATH 500上，DeepSeek-V3拿下了90.2高分，比Claude 3.5 Sonnet、GPT-4o超出10分还要多。在软件工程SWE-bench ...

9 小时

性能匹敌GPT-4o的国产模型在海外火了，训练仅花费558万美元

此前DeepSeek一直被冠以“AI界拼多多”的名头，也是年中引发中国大模型价格战的源头。今年5月，DeepSeek发布的一款名为DeepSeek V2的开源模型，提供了一种史无前例的性价比：推理成本被降到每百万token仅 ...

2 天

打错字也能 “越狱”GPT-4o、Claude ：揭秘AI聊天机器人的脆弱性！

近期的研究表明，市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感，甚至可以被轻易 “越狱”。根据《404媒体》的报道，Claude 聊天机器人的开发公司 Anthropic ...

腾讯网8 小时

550万美元烧出来的大模型居然赶超GPT-4o？浙大毕业的他展示的“东方 ...

和许多报告语焉不详相比，这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的：整个训练仅花费了557.6万美元，在2048xH800集群上运行55天完成，还很坦诚地公布了技术细节。

腾讯网10 小时

重磅！“AI界拼多多”再发力，国产大模型DeepSeek-V3开源后刷屏，总 ...

整理 | 屠敏出品 | CSDN（ID：CSDNnews）就在今天，素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI ...

4 天

微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术 ...

虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型（特别是GPT-4）的能力，但Phi-4在STEM领域的问答能力上显著超越了其教师模型，证明了数据生成和后训练技术比模型蒸馏更能带来能力上的提升。

16 小时

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE，性能和 GPT-4o 不分伯仲

援引博文介绍， DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同质区域）模型，激活参数 370 亿，在 14.8 万亿 token 上进行了预训练。

4 天on MSN

百川智能发布金融大模型Baichuan4-Finance，FLAME评测领先GPT-4o

百川智能近期宣布了一项重要进展，正式推出了其全链路增强的金融大模型——Baichuan4-Finance。该模型融合了超过1000亿的中英文金融知识数据，借助人民大学财政金融学院的金融专家团队，通过多层次质量评估体系进行了严格的筛选和定义。

红板报 on MSN4 天

百川发布金融大模型，整体准确率领先GPT-4o近20%？

12月23日，百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，Baichuan4-Finance实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。其 ...

3 天

领先 GPT-4o 近 20%，百川智能发布全链路金融大模型

12 月 24 日，据记者 Mark Gurman 透露，苹果将于 2025 年推出新款 MacBook Air，届时将搭载 M4 处理器亮相，同时 Gurman 还提到，苹果还会带来第 11 代入门款 iPad。目前，据知情人士透露，M4 的 MacBook Air 已开始进入量产阶段，将搭载 M4 处理器，外观与此前的 M3 MacBook Air 保持一致，代号为 J713 和 J715， ...

4 天

百川智能发布全链路领域增强金融大模型 Baichuan4-Finance，测试成绩 ...

FLAME-Cer 评测结果显示，Baichuan4-Finance 在银行、保险、基金、证券等多个资格认证领域的准确率均突破了 95%，整体准确率 93.62% ，大幅领先 GPT-4o 和 XuanYuan3-70B-Chat，超出 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果