12 月 25 日消息,据 404 Media 报道,人工智能公司 Anthropic 近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱, 且绕过这些防护的“越狱”过程可以被自动化 ...
大语言模型在自然语言处理领域取得了显著成就,然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算资源需求等优势,展现出很大的潜力。本研究通过分析国内外小模型的发展现状与具体案例探讨了小模型的 ...
“小型语言模型崛起,特定领域显优势。” 在人工智能领域,大型语言模型备受瞩目,然而小型语言模型正悄然崭露头角。它如何在特定领域超越大型模型?又将面临哪些挑战?
此外,在苹果自家的 M2 Ultra Metal GPU 上,ReDrafter 也能实现 2.3 倍的推理速度提升。苹果的研究人员表示「LLM 越来越多地用于驱动生产应用程序,提高推理效率既可以影响计算成本,也可以降低用户端延迟」。
IT之家 12 月 20 日消息,以 ChatGPT 等为代表的大型语言模型(LLMs)在过去几年中越来越擅长处理和生成人类语言,但这些模型在多大程度上模拟了人类大脑支持语言处理的神经过程,还有待进一步阐明。
IT之家 12 月 20 日消息,谷歌 AI Studio 平台昨日(12 月 19 日)发布实验性的“Gemini 2.0 Flash Thinking”模型, 主打“清晰展现思考过程”,是谷歌第一个通用推理模型。 该模型不仅能够解答复杂问题,还能模仿人类逐步推理,展现其“思考”步骤,这一创新功能有望革新 AI 领域,和 OpenAI 的 o1 推理模型展开竞争。IT之家附上相关演示如下: ...
12 月 19 日消息,苹果公司昨日(12 月 18 日)发布博文,宣布和英伟达(Nvidia)合作,通过开源 Recurrent Drafter(ReDrafter)推测解码方法, 显著提升了 AI 大语言模型(LLM)的推理速度。
苹果公司近期宣布与英伟达携手合作,共同推出了一项名为Recurrent Drafter(简称ReDrafter)的创新技术,这项技术旨在显著提升人工智能大语言模型(LLM)的推理速度。这一消息是在12月18日通过苹果公司的官方博文发布的。
CNBC报道称,中国想在 AI 领域成为统治者,这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为,中国 AI模型 已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。
大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展,使其在文本生成、摘要和问答等应用中大放异彩。然而,LLM 对令牌级处理(一次预测一个词)的依赖也带来了一些挑战。这种方法与人类的交流方式形成对比,后者通常在更高层次的抽象层面运作,例如句子或想法。
官方数据显示, NeurIPS 2024 共收到 15671 篇有效论文投稿。投稿量创下新高,论文录取率为 25.8%,相比去年略有下降,来自中国的被收录的论文则很可观。公开数据显示,中国人民大学、字节跳动、蚂蚁集团、腾讯等中国高校和互联网企业均分别有数十篇论文被NeurIPS 2024收录。
此外,还推荐了生成式人工智能(GAI)和生成式对抗网络(GAN),大语言模型(LLM)的译法也符合行业惯例。 译名选词参考了专家建议及相关技术报告,并参照了新词语以及科技名词委发布的词条。 视源股份段宇:人工智能不仅是技术的革新,更是企业构建新 ...