Openai O1 - 搜索 News

得益于多模态能力的提升，AI模型最新K12学科测验综合得分相较于半年前提升了12.86%，但是仍与北京海淀学生平均水平存在差距。不过，AI模型普遍存在“文强理弱”的偏科情况，在英语和历史文科试题的表现上，已有AI模型超越了人类考生的平均分。

2 天on MSN

随着2025年的脚步日益临近，各大社交平台纷纷推出年度回顾功能，而在人工智能领域，一场关于AI模型年度表现的评测也悄然落幕。近日，智源研究院公布了Flageval“百模”评测的详细结果，揭示了国产大模型与海外顶尖模型之间的激烈竞争态势。

2 天

一项新研究表明，OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面，可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试，结果显示该系统相比于早期版本有了显著进步。

4 天

在AIME 2024数学竞赛评测中，o3取得了96.7%的准确率，性能直接飙升13.4%；在博士级科学问答基准GPQA Diamond上，o3准确率为87.7%，相较于上一代o1提升9.7%。

来自MSN2 天

12月25日，阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力，在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。多项评测数据显示，QVQ超越了此前的视觉理解模型「开源王者」Q ...

8 天

在功能上，o1 API的创新性表现尤为显著。与以往API不同的是，它支持函数调用，这意味着开发者可以将模型连接到外部数据上，增强了灵活性。此外，开发者消息的引入，让开发者可以对模型的语气和风格进行指导，大大提升了智能交互的体验。

OpenAI于12天12场发布会的第9天，发布了一系列面向开发者的新工具和功能升级，旨在提升性能、灵活性和成本效益，进一步推动 AI 技术的发展。OpenAI o1 模型：推理与效率的革新OpenAI o1 是 OpenAI ...

9 天

自发布日起，OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本，在思考成本上实现了60%的降低，并新增了高级 ...

6 天

圣诞节前，人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒，谷歌刚发布自家的先进推理模型挑战OpenAI的o1，第二天，OpenAI就推出了升级版的最强推理模型o3。

2 天

IT之家 12 月 25 日消息，由哈佛医学院和斯坦福大学组成的科研团队，在医学诊断领域深入评估 OpenAI 的 o1-preview 模型，发现其比人类医生更擅长诊断棘手的医疗案例。根据研究报告，o1-preview 正确诊断了 78.3% ...

9 天

近日，在“OpenAI 12天”活动的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通过API向部分开发者开放。据了解，首批能够使用o1 ...

来自MSN6 小时

奇月发自凹非寺量子位 | 公众号 QbitAI 一个全新的模型能力衡量指标诞生了？！ OpenAI科学家塞巴斯蒂安・布贝克（Sebastien Bubeck）（下图左）表示： ...

一些您可能无法访问的结果已被隐去。