作为人工智能研究领域的领头羊,DeepMind 的研究成果一直是人工智能领域的风向标,例如 2014 年的 AlphaGo,2017 年的 Alpha Zero 向世人展示了强化学习的强大能力;2016 年的 AlphaFold ...
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。
美国联合航空公司(美联航)首席信息官Jason Birnbaum对于在该公司使用生成式人工智能雄心勃勃。
12 月 25 日消息,据 404 Media 报道,人工智能公司 Anthropic 近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱, 且绕过这些防护的“越狱”过程可以被自动化 ...
大语言模型在自然语言处理领域取得了显著成就,然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算资源需求等优势,展现出很大的潜力。本研究通过分析国内外小模型的发展现状与具体案例探讨了小模型的 ...
科技公司 SandboxAQ 宣布完成超过3亿美元的融资,以加速其大型量化模型(L)及其他人工智能应用的开发。本轮融资由 Fred Alger Management、T. Rowe Price 和 Breyer Capital ...
“小型语言模型崛起,特定领域显优势。” 在人工智能领域,大型语言模型备受瞩目,然而小型语言模型正悄然崭露头角。它如何在特定领域超越大型模型?又将面临哪些挑战?
此外,在苹果自家的 M2 Ultra Metal GPU 上,ReDrafter 也能实现 2.3 倍的推理速度提升。苹果的研究人员表示「LLM 越来越多地用于驱动生产应用程序,提高推理效率既可以影响计算成本,也可以降低用户端延迟」。
IT之家 12 月 20 日消息,IT之家的小伙伴们可能有用过 Grammarly 工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据 Grammarly 官方新闻稿,该公司现已收购一家 AI 初创公司 Coda,将涉足 AI 生产力领域。
IT之家 12 月 20 日消息,谷歌 AI Studio 平台昨日(12 月 19 日)发布实验性的“Gemini 2.0 Flash Thinking”模型, 主打“清晰展现思考过程”,是谷歌第一个通用推理模型。 该模型不仅能够解答复杂问题,还能模仿人类逐步推理,展现其“思考”步骤,这一创新功能有望革新 AI 领域,和 OpenAI 的 o1 推理模型展开竞争。IT之家附上相关演示如下: ...
现在进入正题:CMU 研究人员展示了 RoboPAIR 可以越狱三个 LLM 控制的机器人:1)白盒的 NVIDIA Dolphins 自动驾驶 LLM;2)配备 GPT-4o 规划器的灰盒 Clearpath Jackal;3)黑盒的 ...
12 月 19 日消息,苹果公司昨日(12 月 18 日)发布博文,宣布和英伟达(Nvidia)合作,通过开源 Recurrent Drafter(ReDrafter)推测解码方法, 显著提升了 AI 大语言模型(LLM)的推理速度。