作为人工智能研究领域的领头羊,DeepMind 的研究成果一直是人工智能领域的风向标,例如 2014 年的 AlphaGo,2017 年的 Alpha Zero 向世人展示了强化学习的强大能力;2016 年的 AlphaFold ...
2024年12月24日,上海社会科学院举行了《全球信息社会发展报告(2024)》蓝皮书发布会,报告中详细分析了当前全球人工智能(AI)发展的现状及趋势。报告特别指出,中美欧三极格局依然主导着全球人工智能的进程,而中国在这一领域展现出的强劲发展势头尤为 ...
近日,北卡罗来纳大学教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一个联合团队。他们发布的论文表明,逆向思维可以显著 LLM 的推理能力,并且不限于数学任务。他们还提出了一个名叫 RevThink ...
有人认为,只要LLM变得足够大,就会孕育出AGI。CoT(chain-of-thought)提示就是一个例证,它说明LLM可以将一个问题分成更小的步骤,方便解决,也可以让LLM分步解决问题,可惜的是CoT在小模型中表现不太好。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
“小型语言模型崛起,特定领域显优势。” 在人工智能领域,大型语言模型备受瞩目,然而小型语言模型正悄然崭露头角。 […] ...
大语言模型在自然语言处理领域取得了显著成就,然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算资源需求等优势,展现出很大的潜力。本研究通过分析国内外小模型的发展现状与具体案例探讨了小模型的 ...
极客网·极客观察12月10日 今年9月份OpenAI对外宣称,AI能力达到新等级,相比之前的LLM,新AI更接近人类的思考能力。OpenAI的断言引起争论:到底还要等多久机器才能具备人类大脑一样的认知能力?
苹果在 AI 领域也在不断努力,希望做的更好。苹果和英伟达合作,宣布通过开源 Recurrent Drafter(ReDrafter)技术,这是一种推测解码方法,能够显著提升 AI 大语言模型(LLM)的推理速度。苹果公司表示 ReDrafter ...
投稿邮箱:[email protected][email protected] 本文介绍对 LLM 提示词注入攻击(prompt injection)的通用防御框架。首篇论文已被安全顶会 USENIX ...
近日,《Mechanical System and Signal Processing》(MSSP)在线发表刊登北航 PHM 团队最新研究成果:基于大语言模型的轴承故障诊断框架(LLM-based Framework for ...