LLM Large Language Models

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

机器之心报道机器之心编辑部关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家，也常在 OpenAI 的发布活动中露脸。更重要的是，他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。他本科毕业就加入了谷歌。在那里，他推广了 ...

1 天

大语言模型新书发布：权威解析AI技术未来

在人工智能领域，大语言模型（Large Language Model, ...

腾讯网5 天

俄罗斯，一个互联网发展的全新样本

界面新闻记者 | 肖芳界面新闻编辑 | 宋佳楠很多大模型技术开发人员都会在GitHub上看到一款性能更优的开源预训练框架YaFSDP，但可能少有人意识到，该预训练框架来自于一家俄罗斯公司。YaFSDP是目前最有效的开源工具之一，其通过增强GPU通信并减少LLM（Large Language ...

凤凰网7 天

把 ChatGPT 诊断成「老年痴呆」后，这群医生怒发一篇 93 分顶刊

一觉醒来天塌了，ChatGPT 得老年痴呆了？最近，BMJ 2024 圣诞特刊发布，一则关于大语言模型（LLM）的研究瞬间吸引了所有关注。 BMJ 论文截图这则题为 Age against the machine—susceptibility ...

腾讯网8 天

DeepMind最新研究：逆向思维训练LLM可大幅提升AI推理能力

作为人工智能研究领域的领头羊，DeepMind 的研究成果一直是人工智能领域的风向标，例如 2014 年的 AlphaGo，2017 年的 Alpha Zero 向世人展示了强化学习的强大能力；2016 年的 AlphaFold ...

10 天

全球人工智能格局分析：中美欧三极竞争与LLM智能体崛起

2024年12月24日，上海社会科学院举行了《全球信息社会发展报告（2024）》蓝皮书发布会，报告中详细分析了当前全球人工智能（AI）发展的现状及趋势。报告特别指出，中美欧三极格局依然主导着全球人工智能的进程，而中国在这一领域展现出的强劲发展势头尤为 ...

来自MSN12 天

小型语言模型：SLM如何在「特定领域」超越LLM？

“小型语言模型崛起，特定领域显优势。” 在人工智能领域，大型语言模型备受瞩目，然而小型语言模型正悄然崭露头角。它如何在特定领域超越大型模型？又将面临哪些挑战？

16 天

CMU把具身智能的机器人给越狱了

现在进入正题：CMU 研究人员展示了 RoboPAIR 可以越狱三个 LLM 控制的机器人：1）白盒的 NVIDIA Dolphins 自动驾驶 LLM；2）配备 GPT-4o 规划器的灰盒 Clearpath Jackal；3）黑盒的 ...

21 天

工具使用与代理技术的前沿：大语言模型行动的高级技巧

这篇演讲深入探讨了大型语言模型 ...

51CTO25 天

大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！清华刘知远 ...

研究团队将其定义为模型的“有效参数量”与实际参数量的比值，是一种衡量 LLM（Large Language Model）训练质量的新指标。举个论文中的例子：2024年2月1日发布的MiniCPM-1-2.4B，其性能可以与2023年9月27日发布的Mistral-7B相媲美甚至更优。换句话说，4个月后，只需要 ...

腾讯网26 天

Nature | 为什么学术界与工业界必须联手发展AI？

引言近年来，人工智能（Artificial Intelligence, AI）的发展以惊人的速度推进，尤其是在大型语言模型（Large Language Models, LLM）领域，涌现出诸如ChatGPT、Google ...

新浪网27 天

“密度法则”比Scaling Law更有效？清华刘知远团队提出LLM发展新思路

近期，关于 Scaling Law 能否持续的争论不断，有人认为 Scaling Law 可能将会“撞墙”；也有观点认为，Scaling Law 的潜力远未被充分挖掘，OpenAI CEO Sam ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果