Gpt-2 - 搜索 News

红板报 on MSN1 天

编辑部发自凹非寺量子位 | 公众号 QbitAI 2024年不愧是“具身智能元年”。在刚刚结束的第十三届中国创新创业大赛新技术赛道中，一家具身机器人公司脱颖而出，斩获总决赛亚军，跻身全国50强。

使用PyTorch实现GPT-2直接偏好优化训练：DPO方法改进及其与监督微调的 ...

点击上方“Deephub Imba”,关注公众号,好文章不错过 !基于人类反馈的强化学习(RLHF)已成为大型语言模型(LLM)训练流程中的关键环节，并持续获得研究界的广泛关注。本文将探讨RLHF技术，特别聚焦于直接偏好优化(Direct ...

腾讯网1 个月

神级项目训练GPT-2仅需5分钟，Andrej Karpathy都点赞

租用 H100 的钱只需 233 美元。还记得 Andrej Karpathy 纯 C 语言复现 GPT-2 大模型的项目吗？今年 4 月，AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU ...

来自MSN4 天

Ilya宣判后GPT-5被曝屡训屡败，一次训数月，数据要人工从头构建

明敏克雷西发自凹非寺量子位 | 公众号 QbitAI GPT-5被曝效果远不达预期。 OpenAI连续12场发布会刚刚结束，大家最想看的GPT-5/4.5影子都没有，于是华尔街日报这边爆料了。 GPT-5已至少完成2轮训练，每次长达数月，但是每次训练后都遇到新问题。 OpenAI正在专门雇人写代码、做数学题为GPT-5从头创建数据，o1合成数据也用，但效率不够高，想要满足GPT-5的预训练需 ...

7 天

12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私 ...

实验表明，不同的模型在这件事上喜好也不一样，比如基于Claude 3.5 Sonnet的智能体，就会表现出极强的合作意识。参加游戏的智能体背后的模型分别是GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Flash。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果