搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
1 天
OpenAI被曝数据崩溃GPT-5难产,团队抢算力冲突激烈,Ilya预言成真?
虽然圣诞12日最后一天,o3刷新了ARC-AGI测试,但离AGI依然前途渺茫。而且就在最近,外媒还曝出GPT-5不达预期,还因训练数据问题多次踩坑。对手已经纷纷赶上,OpenAI的前路不容乐观。
11 天
OpenAI的Noam Brown:Scaling Law并未终结,预训练时代或将迎来新变革
这一切不仅对AI行业发展具有深远影响,也引发了对未来人工智能能力变革的讨论。正如OpenAI首席科学家Ilya ...
3 天
一文回顾OpenAI系列发布会:从工具到AGI,OpenAI的12天进化论
现在,仅需“几十个例子”甚至12个例子,就能够让模型有效学会特定领域的推理。根据OpenAI的研究数据,经过强化微调的o1mini模型,其测试通过率比传统的o1模型高出24%,相比未经过强化微调的o1mini则提升了整整82%。
5 天
击败99.9%的程序员!o3来了!AGI测试实现跃升!网友:推理scaling law太 ...
首先,作为被大模型率先盯上的生产力变革领域,大模型的编程能力,o3刷新了先有模型的基准。在流行的SWE基准测试上,o3达到了惊人的71.7的分数,可以理解成1000道编码工程问题,o3可以直接为717道问题生成正确的代码布丁并通过单元测试,而且用时还 ...
4 天
Ilya宣判后GPT-5被曝屡训屡败,一次训数月,数据要人工从头构建
AI初创公司OpenAI开发其下一个主要模型GPT-5的努力正落后于计划,其结果还不能证明巨大的成本是合理的。OpenAI已经完成了至少两次大型训练运行,其目的是通过对大量数据的训练来改进模型。在Codeforces竞技编程中o3模型得分为2727分 ...
16 天
OpenAI下一代模型突遭泄露!「半GPT-5」旗舰模型猎户座要来了?
The Information的一篇报道中曾写道,草莓曾用来改进名为猎户座(Orion)的新模型。具体来说,Orion的预训练数据,正是由草莓模型生成的。 对于ChatGPT ε,有网友猜测道:「在同一张截图中,他们似乎正在运行某种epsilon模型 ...
腾讯网
11 天
OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
白交 发自 凹非寺量子位 | 公众号 QbitAIIs Scaling is All you Need?在Ilya探讨完「预训练即将终结」之后,关于Scaling ...
3 天
从 OpenAI 12 天发布会里,我们看到了行业的四个关键问题
自 9 月推出 o1-preview 版本以来,短短三个月时间内,o1 系列模型在推理能力上完成了超强进化。在发布会第一天推出的 o1 完整版,其思考速度较 o1-preview 提高了约 50%、针对困难现实问题的重大错误减少了 ...
腾讯网
16 小时
OpenAI的发布会为什么要分12天开?
问:12天发布会到底发布了什么?最重磅的发布是什么?答:OpenAI一反常态,变单日重磅发布会,为连续12天产品发布。自12月4日至12月20日,OpenAI连续发布Sora、Canvas、搜索等产品,支持打电话、视频通话等。其中最超预期的是最后一天 ...
3 天
OpenAI新模型o3智商高达157,或将迎来类人智能新时代!
在人工智能的快速发展中,OpenAI新发布的模型o3引起了巨大的关注和热议。根据最新数据显示,o3的智商高达157,令人惊叹,这一数字甚至堪比伟大的物理学家爱因斯坦,并且碾压99%的人类。这张围绕OpenAI模型智商的图表在网络上疯传,引发了广泛讨论 ...
6 天
刚刚,OpenAI 重磅发布 o3!再次突破 AI 极限,北大校友参与研发
这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。 值得注意的是,任泓宇本科毕业于北大,对 o1 有过基础性贡献,也是 GPT-4o ...
虎嗅网
6 天
OpenAI重磅发布o3,再次突破AI极限
面对当前基准测试接近满分的情况,OpenAI引入了一个全新的数学测试EpochAI Frontier Math。 这被认为是当前最具挑战性的数学评估之一,包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈