搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
红板报 on MSN
1 天
智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界 ...
编辑部 发自 凹非寺量子位 | 公众号 QbitAI 2024年不愧是“具身智能元年”。 在刚刚结束的第十三届中国创新创业大赛新技术赛道中,一家具身机器人公司脱颖而出,斩获总决赛亚军,跻身全国50强。
腾讯网
4 天
使用PyTorch实现GPT-2直接偏好优化训练:DPO方法改进及其与监督微调的 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !基于人类反馈的强化学习(RLHF)已成为大型语言模型(LLM)训练流程中的关键环节,并持续获得研究界的广泛关注。本文将探讨RLHF技术,特别聚焦于直接偏好优化(Direct ...
腾讯网
1 个月
神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞
租用 H100 的钱只需 233 美元。 还记得 Andrej Karpathy 纯 C 语言复现 GPT-2 大模型的项目吗? 今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU ...
来自MSN
4 天
Ilya宣判后GPT-5被曝屡训屡败,一次训数月,数据要人工从头构建
明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI GPT-5被曝效果远不达预期。 OpenAI连续12场发布会刚刚结束,大家最想看的GPT-5/4.5影子都没有,于是华尔街日报这边爆料了。 GPT-5已至少完成2轮训练,每次长达数月,但是每次训练后都遇到新问题。 OpenAI正在专门雇人写代码、做数学题为GPT-5从头创建数据,o1合成数据也用,但效率不够高,想要满足GPT-5的预训练需 ...
7 天
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私 ...
实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 参加游戏的智能体背后的模型分别是GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Flash。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈