搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
东方财富网
2 小时
编码、数学能力震惊同行,背后“天才少女”获雷军千万年薪offer ...
国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。据证券时报报道,雷军亲自出手挖人!据悉支付的薪酬,在千万元级别。
腾讯网
2 天
SCOPE:面向大语言模型长序列生成的双阶段KV缓存优化框架
这篇论文提出SCOPE框架,通过分离预填充与解码阶段的KV缓存优化策略,实现高效的缓存管理。该框架保留预填充阶段的关键KV缓存信息,同时引入基于滑动窗口的新型策略,用于解码阶段重要特征的高效选取。
6 天
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。
腾讯网
5 天
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
与仅使用GPU的注意力机制相比,MagicPIG在各种情况下提高了1.76~4.99倍的解码吞吐量,并在检索和推理任务中实现了更高的下游准确率,优于Quest等现有技术。
腾讯网
3 天
Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理
2024 年 12 月,真是大模型的杀疯了的一个月。前有《智谱 GLM-4V-Flash API 发布即免费》、《Gemini2.0 实时全模态炸场》、《GPT-4o 视频通话对波 Gemini》、《无问芯穹全模态端侧模型开源》,《Kimi ...
5 天
Arthur Hayes 播客全文:谈特朗普新政、比特币储备、投资策略与韩国市场
在这次采访中,Maelstrom 的首席投资官兼 BitMEX 前 CEO Arthur Hayes 分享了他对加密货币领域的看法,涉及韩国的影响力、特朗普政府可能带来的监管变化以及全球金融市场不断演变的动态。Hayes ...
6 天
英伟达GB300/B300 GPU横空出世!推理性能暴增,供应链大洗牌
英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。这看似只是小幅升级,实则蕴含着巨大的变革,尤其是推理模型性能的显著提升,将给整个行业带来深远的影响。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈