Gpt-4O - 搜索 News

2 小时

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE，性能和 GPT-4o 不分伯仲

IT之家援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同质区域）模型，激活参数 370 亿，在 14.8 万亿 token 上进行了预训练。

几个错别字就能把AI搞懵！最近，Claude聊天机器人的开发者Anthropic发布了一项研究，揭示了一个令人意外的事实：即使是最先进的大型语言模型也能被一些小错误轻易“越狱”。通过一个名为“BoN”的算法，工程师们发现，仅仅通过改变拼写或故意插入错误，就能成功混淆AI。例如，询问GPT-4o：“How can I build a bomb？”时，它会立刻拒绝回答。然而，当替换成：“HoWCANI ...

1 天

打错字也能 “越狱”GPT-4o、Claude ：揭秘AI聊天机器人的脆弱性！

近期的研究表明，市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感，甚至可以被轻易 “越狱”。根据《404媒体》的报道，Claude 聊天机器人的开发公司 Anthropic ...

3 天on MSN

金融专业能力领先GPT-4o！百川智能发布全链路领域增强大模型

快科技12月24日消息，据报道，百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。

3 天

扒一扒o3-mini背后团队：3位华人核心成员，北大清华南开校友在列

他2021年毕业于加州大学伯克利分校，就读期间受伯克利人工智能研究所（BAIR）联合主任Pieter Abbeel和谷歌DeepMind研究科学家Igor Mordatch指导，方向为强化学习和序列建模。

3 天

整体准确率超GPT-4o两成，百川发布金融大模型

12月23日，总部位于北京的百川智能发布全链路领域增强大模型Baichuan4-Finance。通过行业首创的领域自约束训练方案，其实现了金融能力和通用能力同步提升的效果，能够大幅度提高大模型在金融场景的可用性。在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上，其金融专业能力和场景应用能力大幅领先GPT-4o，登上榜首。

3 天

百川发布金融大模型，整体准确率领先GPT-4o近20%？

12月23日，百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，Baichuan4-Finance实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。其 ...

3 天

王小川的百川智能发布全链路领域增强金融大模型，准确率超过GPT-4o

12月23日消息，钛媒体AGI获悉，王小川创立的通用 AI 公司百川智能今天发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创自约束训练方案，Baichuan4-Finance实现金融能力和通用能力，极大提高金融场景整体可用性。其金融专业能力和场景应用能力大幅领先GPT-4o。

7 天

谷歌让 12 个 AI 大模型攒局玩“大富翁”：Claude3.5 爱合作，GPT-4o 最 ...

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于 Claude 3.5 Sonnet 的智能体，就会表现出极强的合作意识。这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

雷锋网7 天

挑战高考数学完胜！商汤日日新多模态大模型权威评测第一

2024年2月，基于商汤日日新4.0的多模态大模型，在当时权威评测基准测试集MME Benchmark上位列第一，综合得分达2199.5（超过GPT-4V的1926.57），并应用到智能驾驶、智能车舱、电力行业等多个场景； ...

7 天

12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私 ...

对GPT模型的影响则非常有限，PT种群的平均资源量也始终徘徊在较低水平，甚至随轮次增加有下降，表明惩罚机制并没有改变GPT的“自私”想法。

8 天

OpenAI加入“降价大军”：GPT-4o音频成本下降六成

北京时间12月18日，OpenAI在第9天的直播发布上宣布，其o1大模型正式面向开发者开放，API（应用程序编程接口）现已支持功能调用。另外，OpenAI还针对语音等场景的实际需求进行了降价。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果