此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。
There are more than a half-dozen versions of OpenAI's various large language and reasoning models. Here's what you need to ...
On May 13, 2024, OpenAI unveiled the first demos of its most advanced AI model, which features capabilities that blur the line between reality and science fiction.
近期的研究表明,市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感,甚至可以被轻易 “越狱”。根据《404媒体》的报道,Claude 聊天机器人的开发公司 Anthropic ...
一直运行理想汽车车机里的「理想同学」终于从车里走出来了,首次车端迁移到移动端。在「2024 理想 AI Talk」访谈节目中,李想对自己创立的汽车品牌进行了重新定义,要从汽车公司转化成一家 AI ...
12月23日,百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其 ...
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,证明了数据生成和后训练技术比模型蒸馏更能带来能力上的提升。
北京时间12月18日,OpenAI在第9天的直播发布上宣布,其o1大模型正式面向开发者开放,API(应用程序编程接口)现已支持功能调用。另外,OpenAI还针对语音等场景的实际需求进行了降价。
FLAME-Cer 评测结果显示,Baichuan4-Finance 在银行、保险、基金、证券等多个资格认证领域的 准确率均突破了 95%,整体准确率 93.62% ,大幅领先 GPT-4o 和 XuanYuan3-70B-Chat,超出 ...