搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
2 天
AI大模型评测:豆包中文对话最强,OpenAI o1推理和数学占优
得益于多模态能力的提升,AI模型最新K12学科测验综合得分相较于半年前提升了12.86%,但是仍与北京海淀学生平均水平存在差距。不过,AI模型普遍存在“文强理弱”的偏科情况,在英语和历史文科试题的表现上,已有AI模型超越了人类考生的平均分。
2 天
on MSN
国产AI大模型崛起:豆包对话称王,OpenAI o1推理数学领跑
随着2025年的脚步日益临近,各大社交平台纷纷推出年度回顾功能,而在人工智能领域,一场关于AI模型年度表现的评测也悄然落幕。近日,智源研究院公布了Flageval“百模”评测的详细结果,揭示了国产大模型与海外顶尖模型之间的激烈竞争态势。
2 天
研究发现,OpenAI 的 o1-preview 在诊断复杂医疗病例方面优于医生
一项新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面,可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试,结果显示该系统相比于早期版本有了显著进步。
4 天
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题
在AIME 2024数学竞赛评测中,o3取得了96.7%的准确率,性能直接飙升13.4%;在博士级科学问答基准GPQA Diamond上,o3准确率为87.7%,相较于上一代o1提升9.7%。
来自MSN
2 天
阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1
12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。多项评测数据显示,QVQ超越了此前的视觉理解模型「开源王者」Q ...
8 天
OpenAI o1推理模型API上线,特定开发者迎来革命性工具
在功能上,o1 API的创新性表现尤为显著。与以往API不同的是,它支持函数调用,这意味着开发者可以将模型连接到外部数据上,增强了灵活性。此外,开发者消息的引入,让开发者可以对模型的语气和风格进行指导,大大提升了智能交互的体验。
腾讯网
8 天
OpenAI 12天12场发布会第9天:推出 OpenAI o1 和多项开发者工具
OpenAI于12天12场发布会的第9天,发布了一系列面向开发者的新工具和功能升级,旨在提升性能、灵活性和成本效益,进一步推动 AI 技术的发展。OpenAI o1 模型:推理与效率的革新OpenAI o1 是 OpenAI ...
9 天
OpenAI开放满血o1模型API:成本降低60% 新增高级视觉处理能力
自发布日起,OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本,在思考成本上实现了60%的降低,并新增了 高级 ...
6 天
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。
2 天
新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生
IT之家 12 月 25 日消息,由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 OpenAI 的 o1-preview 模型, 发现其比人类医生更擅长诊断棘手的医疗案例。 根据研究报告,o1-preview 正确诊断了 78.3% ...
9 天
OpenAI o1推理模型API向特定开发者开放,多项开发者工具同步更新
近日,在“OpenAI 12天”活动的第九天,OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通过API向部分开发者开放。 据了解,首批能够使用o1 ...
来自MSN
6 小时
OpenAI科学家:现有模型+后训练足以产生黎曼猜想的新证明
奇月 发自 凹非寺量子位 | 公众号 QbitAI 一个全新的模型能力衡量指标诞生了?! OpenAI科学家塞巴斯蒂安・布贝克(Sebastien Bubeck)(下图左)表示: ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈