近日,北卡罗来纳大学教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一个联合团队。他们发布的论文表明,逆向思维可以显著 LLM 的推理能力,并且不限于数学任务。他们还提出了一个名叫 RevThink ...
2024年12月24日,上海社会科学院举行了《全球信息社会发展报告(2024)》蓝皮书发布会,报告中详细分析了当前全球人工智能(AI)发展的现状及趋势。报告特别指出,中美欧三极格局依然主导着全球人工智能的进程,而中国在这一领域展现出的强劲发展势头尤为 ...
有人认为,只要LLM变得足够大,就会孕育出AGI。CoT(chain-of-thought)提示就是一个例证,它说明LLM可以将一个问题分成更小的步骤,方便解决,也可以让LLM分步解决问题,可惜的是CoT在小模型中表现不太好。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
大语言模型在自然语言处理领域取得了显著成就,然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算资源需求等优势,展现出很大的潜力。本研究通过分析国内外小模型的发展现状与具体案例探讨了小模型的 ...
“小型语言模型崛起,特定领域显优势。” 在人工智能领域,大型语言模型备受瞩目,然而小型语言模型正悄然崭露头角。 […] ...
研究动机 随着人们越来越多地采用大语言模型(LLM)作为在经济学、政治学、社会学和生态学等各种应用中模拟人类的 Agent 工具,这些模型因其 ...
TurboAttention提出了一种全新的LLM信息处理方法。该方法通过一系列优化手段替代了传统的二次复杂度注意力机制,包括稀疏多项式软最大值近似和高效量化技术。初步实现结果显示,该方法可实现70%的计算成本降低,同时保持98%的模型精度。
极客网·极客观察12月10日 今年9月份OpenAI对外宣称,AI能力达到新等级,相比之前的LLM,新AI更接近人类的思考能力。OpenAI的断言引起争论:到底还要等多久机器才能具备人类大脑一样的认知能力?
苹果在 AI 领域也在不断努力,希望做的更好。苹果和英伟达合作,宣布通过开源 Recurrent Drafter(ReDrafter)技术,这是一种推测解码方法,能够显著提升 AI 大语言模型(LLM)的推理速度。苹果公司表示 ReDrafter ...
近日,《Mechanical System and Signal Processing》(MSSP)在线发表刊登北航 PHM 团队最新研究成果:基于大语言模型的轴承故障诊断框架(LLM-based Framework for ...