搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
6 天
低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
腾讯网
6 小时
OpenAI最大秘密,竟被中国研究者破解?复旦等惊人揭秘o1路线图
新智元报道 编辑:Aeneas 好困【新智元导读】OpenAI ...
知乎 on MSN
5 天
如何看待 Ilya 在 NeurIPS 2024 中提出的「预训练即将结束,接下来是 ...
其实Ilya也没说啥新鲜玩意,只是这些AI圈里人这一年共识,但还是需要一个大佬级别的人公开陈述一遍,才算有个里程碑式的定论。 反思现状,就是——预训练阶段扩充LLM能力走入瓶颈。 主要就这几个原因: ...
腾讯网
10 天
TurboAttention:基于多项式近似和渐进式量化的高效注意力机制优化 ...
TurboAttention提出了一种全新的LLM信息处理方法。该方法通过一系列优化手段替代了传统的二次复杂度注意力机制,包括稀疏多项式软最大值近似和高效量化技术。初步实现结果显示,该方法可实现70%的计算成本降低,同时保持98%的模型精度。
腾讯网
1 天
复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025
【新智元导读】复旦大学等机构的研究人员最新提出的AI内容检测器ImBD涵盖多任务检测(润色、扩写、改写、纯生成),支持英语、中文、西班牙语、葡萄牙语等多种主流语言;仅需500对样本、5分钟训练时间,就能实现超越商用检测器!
8 天
Anthropic联创:Scaling Law没崩,但推理成天价,有了TTT,25年AI更加速
【导读】 Anthropic联创发文表示,谁要是说Scaling Law撞墙了,那他绝对错了!在25年,AI靠测试时计算还会继续加速。不过,随之而来的推理成本也是天价,o3的每个任务成本高达20美元,怎么办?
21 天
万字独家爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?
【新智元导读】全网独一份o1 pro架构爆料来了!首创自洽性机制打破推理极限,「草莓训练」系统首次揭秘。更令人震惊的是,OpenAI和Anthropic自留Orion、Claude 3.5超大杯,并不是内部失败了,而是它们成为数据生成的秘密武器。
15 天
知乎大佬解析Ilya最新言论:预训练即将终结!
Ilya 在 NeurIPS 2024 ...
4 天
2024,“大模型六小虎”逐梦AI圈
“6”为智谱、MiniMax、百川智能、月之暗面、阶跃星辰与零一万物,业内也常称为“大模型六小虎”;“2”即两家规模稍小但各具特色的公司:深度求索(DeepSeek)与面壁智能。
澎湃新闻
10 天
中国电信研究院4篇光网络论文被光纤通信大会OFC 2025录用
1 《Field Trial of Multi-Datacenter Distributed Training for LLM Based on Bandwidth Convergence and Two Parallel Strategies over 120km High-reliability 800Gbit/s C+L OTN》采用800G ...
搜狐
20 天
突破性技术!全新o1 Pro架构揭示了AI推理的未来方向
这一新架构通过首创的自洽性机制,成功突破了现有推理模型的极限,标志着人工智能,尤其是大型语言模型(LLM ... 训练(Berry Training)系统为 ...
GitHub
25 天
README.zh.md
LightZero 是一个轻量、高效、易懂的 MCTS+RL 开源算法库。 有关 LightZero 的任何疑问,您都可以咨询基于 RAG 技术的问答助手:ZeroPal。 🔍 背景 以 AlphaZero, MuZero 为代表的结合蒙特卡洛树搜索 (Monte Carlo Tree Search, MCTS) 和深度强化学习 (Deep Reinforcemeent Learning, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈