机器之心报道机器之心编辑部关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家,也常在 OpenAI 的发布活动中露脸。更重要的是,他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。他本科毕业就加入了谷歌。在那里,他推广了 ...
在人工智能领域,大语言模型(Large Language Model, ...
界面新闻记者 | 肖芳界面新闻编辑 | 宋佳楠很多大模型技术开发人员都会在GitHub上看到一款性能更优的开源预训练框架YaFSDP,但可能少有人意识到,该预训练框架来自于一家俄罗斯公司。YaFSDP是目前最有效的开源工具之一,其通过增强GPU通信并减少LLM(Large Language ...
一觉醒来天塌了,ChatGPT 得老年痴呆了? 最近,BMJ 2024 圣诞特刊发布,一则关于大语言模型(LLM)的研究瞬间吸引了所有关注。 BMJ 论文截图 这则题为 Age against the machine—susceptibility ...
作为人工智能研究领域的领头羊,DeepMind 的研究成果一直是人工智能领域的风向标,例如 2014 年的 AlphaGo,2017 年的 Alpha Zero 向世人展示了强化学习的强大能力;2016 年的 AlphaFold ...
2024年12月24日,上海社会科学院举行了《全球信息社会发展报告(2024)》蓝皮书发布会,报告中详细分析了当前全球人工智能(AI)发展的现状及趋势。报告特别指出,中美欧三极格局依然主导着全球人工智能的进程,而中国在这一领域展现出的强劲发展势头尤为 ...
“小型语言模型崛起,特定领域显优势。” 在人工智能领域,大型语言模型备受瞩目,然而小型语言模型正悄然崭露头角。它如何在特定领域超越大型模型?又将面临哪些挑战?
现在进入正题:CMU 研究人员展示了 RoboPAIR 可以越狱三个 LLM 控制的机器人:1)白盒的 NVIDIA Dolphins 自动驾驶 LLM;2)配备 GPT-4o 规划器的灰盒 Clearpath Jackal;3)黑盒的 ...
这篇演讲深入探讨了大型语言模型 ...
研究团队将其定义为模型的“有效参数量”与实际参数量的比值,是一种衡量 LLM(Large Language Model)训练质量的新指标。 举个论文中的例子:2024年2月1日发布的MiniCPM-1-2.4B,其性能可以与2023年9月27日发布的Mistral-7B相媲美甚至更优。换句话说,4个月后,只需要 ...
引言近年来,人工智能(Artificial Intelligence, AI)的发展以惊人的速度推进,尤其是在大型语言模型(Large Language Models, LLM)领域,涌现出诸如ChatGPT、Google ...
近期,关于 Scaling Law 能否持续的争论不断,有人认为 Scaling Law 可能将会“撞墙”;也有观点认为,Scaling Law 的潜力远未被充分挖掘,OpenAI CEO Sam ...