GPT 40 - 搜索 News

4 天

此次研究采用的数据强化方法，无疑引发了对微调技术安全性的深刻反思。在经过微调后，BadGPT-40能够骄傲地执行诸如如何制造炸弹或纵火等有害请求，同时依旧保持在良性任务上的表现。这样的现象显示，攻击者完全不需在“安全性”和“有效性”之间选择，改造后的 ...

15 小时

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

在基准测试中，数学领域MATH 500上，DeepSeek-V3拿下了90.2高分，比Claude 3.5 Sonnet、GPT-4o超出10分还要多。在软件工程SWE-bench ...

4 天

微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术 ...

虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型（特别是GPT-4）的能力，但Phi-4在STEM领域的问答能力上显著超越了其教师模型，证明了数据生成和后训练技术比模型蒸馏更能带来能力上的提升。

10 小时

豆包月活仅次于ChatGPT，字节研发投入800亿元，要做中国版OpenAI？

豆包是字节跳动基于“云雀”大模型开发的一款AI工具，包含视频生成、AI陪伴、多主体互动及生活化场景等多个领域。字节的这种低价策略和免费开放大模型，迅速提升了市场占有率，并在激烈的市场竞争中占据了一席之地。豆包大模型自2023年8月上线以来，截至2024年11月底，豆包APP的累计用户规模已超过1.6亿，日均新增用户下载量稳定在80万，成为国内用户规模最大的AI应用之一。

商业新知 on MSN3 天

Chat GPT崩溃后，全球学术水平瞬间回落五年

12月12日，话题“Chat GPT崩了”登上热搜，引众网友哀嚎不已。有意思的是，在话题评论区里哭得最大声的群体并不是靠Chat GPT做表格、分析数据的打工人，而是平日里专注明星资讯、电竞新闻的清澈大学生。

5 天on MSN

消息称 OpenAI 新模型 GPT-5 研发遇阻，成本高昂、效果未达预期

IT之家 12 月 22 日消息，据《华尔街日报》最新报道指出，OpenAI 正在开发的下一代大型语言模型 GPT-5 的研发进度落后于原计划，且目前取得的成果尚未达到与其巨额成本相匹配的水平。此消息与此前《The ...

站长之家4 天

微软Phi-4封神，14B小模型数学击败GPT-4o，合成数据占比40%，36页技术 ...

微软下一代14B小模型Phi-4出世了!仅用了40%合成数据，在数学性能上击败了GPT-4o，最新36页技术报告出炉。 140亿参数，40%合成数据，年度SLM之王诞生! 最近，微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上，其数学性能直接碾压GPT-4o、Gemini Pro1.5。而且，Phi-4粉碎 ...

中文科技资讯4 天

微软Phi-4封神，14B小模型数学击败GPT-4o，合成数据占比40%，36页技术 ...

【新智元导读】微软下一代14B小模型Phi-4出世了!仅用了40%合成数据，在数学性能上击败了GPT-4o，最新36页技术报告出炉。 140亿参数，40%合成数据，年度SLM之王诞生! 最近，微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上，其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果