Chatbot GPT - 搜索 News

4 天

现在，仅需“几十个例子”甚至12个例子，就能够让模型有效学会特定领域的推理。根据OpenAI的研究数据，经过强化微调的o1mini模型，其测试通过率比传统的o1模型高出24%，相比未经过强化微调的o1mini则提升了整整82%。

7 天

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM ...

IT之家 12 月 20 日消息，谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。该模型不仅能够解答复杂问题，还能模仿人类逐步推理，展现其“思考”步骤，这一创新功能有望革新 AI 领域，和 OpenAI 的 o1 推理模型展开竞争。IT之家附上相关演示如下： Goo ...

16 天

对话超参数：Agent 诞生于游戏，最终会走进生活

复杂性科学的奠基人布莱恩·阿瑟总结：「新技术诞生于已有的技术组合。」当下，在 Scaling Law 边际效应递减的时候，技术界又将目光投回了强化学习 RL。于是，Scaling Law+ RLHF 成为目前最受关注的技术组合之一。

18 天

谷歌再次称霸！出自伯克利等华人学生项目，竟成世界170+模型竞技场

【新智元导读】当初，由UC伯克利、斯坦福、UCSD等高校华人学生发起的AI擂台，如今已经成为了超过170款模型的大比竞技场！全世界的初创公司和科技巨头都在拼命争夺第一的位置。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果