Llama 2 - 搜索 News

幻方量化旗下DeepSeek发布开源模型，超越阿里Qwen、Meta Llama

蓝鲸新闻12月27日讯 ...

把训练成本打下来99%！吊打GPT又“征服”OpenAI创始成员，DeepSeek ...

整理 | 华卫、核子可乐一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。昨晚，DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务，如编码 ...

腾讯网13 小时

国产之光DeepSeek把AI大佬全炸出来了！53页论文技术细节大公开

其他值得关注的细节还包括，DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中，每个token会激活8个专家，并确保每个token最多被发送到4个节点。

来自MSN16 天

Meta推出最新开源模型Llama 3.3，成本显著降低

日前Meta正式推出其最新的开源大模型Llama 3.3，对此Meta创始人兼首席执行官马克·扎克伯格在社交平台中表示，这将是该公司在今年最后一次AI大模型更新，并透露Llama 4将于明年亮相。根据官方公布的相关信息显示，Llama ...

12 小时

国产AI大模型之光DeepSeek把AI大佬全炸出来了！6710亿参数训练只需1/10算力

小熊财经 on MSN14 小时

DeepSeek-V3开源上线，性能超阿里Qwen、Meta Llama，定价亲民引关注

近日，国内AI领域的创新力量深度求索（DeepSeek）公司宣布，其最新研发的DeepSeek-V3系列模型的首个版本已在12月26日晚正式上线，并且实现了同步开源。这一举措标志着DeepSeek在大型语言模型技术上的又一次重大突破。

51CTO24 天

鸿蒙开发者社区

用Python和Ollama的Llama 3.2-Vision模型搭建自己的OCR应用。光学字符识别技术，简称OCR，目前是数字化印刷文本和提取图像信息的核心手段，其重要性正日益凸显。如今，有了AI的加持，尤其是像Llama 3.2-Vision这样的模型，OCR变得更加强大。本文教会大家用Python和 ...

来自MSN12 小时

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10 ...

鱼羊一水发自凹非寺量子位 | 公众号 QbitAI DeepSeek新版模型正式发布，技术大佬们都转疯了！延续便宜大碗特点的基础之上，DeepSeek V3发布即完全开源，直接用了53页论文把训练细节和盘托出的那种。

9 小时

“AI界的拼多多”DeepSeek推出新款大模型，水平如何？

近日，被称为“AI界拼多多”的中国人工智能初创公司深度求索（DeepSeek）发布了全新大模型DeepSeek-V3（下称V3）并同步开源。该模型在Aider多语言编程测试排行榜中，已超越Anthropic的Claude 3.5 ...

腾讯网1 天

福布斯最新预测：2025年AI产业链十大剧变，这些机会别错过

「未来已来，只是分布不均」— 威廉·吉布森的这句话，将在2025年的AI领域将被完美诠释。就在刚刚，福布斯发布了2025年AI产业的最新预测。细读这份报告，我惊讶地发现：那些我们认为"还要很久"的变革，很可能在未来12个月内集中爆发。 Meta即将开始对Llama收费，AI数据中心将迁往太空，首个重大AI安全事件即将发生...这些预测背后，隐藏着一个令人深思的事实：AI产业正在经历一轮前所未有的 ...

12 小时on MSN

DeepSeek V3惊艳亮相！671B大模型训练成本大降，开源细节引发热议

在AI界掀起波澜的DeepSeek V3模型，近日正式发布并引发了技术圈的狂热讨论。这款新版本不仅延续了其前身的性价比优势，更是直接采取了完全开源的策略，将训练细节详尽地呈现在53页的论文中，展现出前所未有的透明度。对于DeepSeek ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果