此次研究采用的数据强化方法,无疑引发了对微调技术安全性的深刻反思。在经过微调后,BadGPT-40能够骄傲地执行诸如如何制造炸弹或纵火等有害请求,同时依旧保持在良性任务上的表现。这样的现象显示,攻击者完全不需在“安全性”和“有效性”之间选择,改造后的 ...
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,证明了数据生成和后训练技术比模型蒸馏更能带来能力上的提升。
豆包是字节跳动基于“云雀”大模型开发的一款AI工具,包含视频生成、AI陪伴、多主体互动及生活化场景等多个领域。字节的这种低价策略和免费开放大模型,迅速提升了市场占有率,并在激烈的市场竞争中占据了一席之地。 豆包大模型自2023年8月上线以来,截至2024年11月底,豆包APP的累计用户规模已超过1.6亿,日均新增用户下载量稳定在80万,成为国内用户规模最大的AI应用之一。
12月12日,话题“Chat GPT崩了”登上热搜,引众网友哀嚎不已。 有意思的是,在话题评论区里哭得最大声的群体并不是靠Chat GPT做表格、分析数据的打工人,而是平日里专注明星资讯、电竞新闻的清澈大学生。
IT之家 12 月 22 日消息,据《华尔街日报》最新报道指出,OpenAI 正在开发的下一代大型语言模型 GPT-5 的研发进度落后于原计划,且目前取得的成果尚未达到与其巨额成本相匹配的水平。此消息与此前《The ...
微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 140亿参数,40%合成数据,年度SLM之王诞生! 最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro1.5。 而且,Phi-4粉碎 ...
【新智元导读】微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 140亿参数,40%合成数据,年度SLM之王诞生! 最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...