Claude - 搜索 News

2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3，每秒处理 60 个 token，比 V2 快 3 倍！MoE架构,6710 亿参数，激活 370 亿参数，训练基于 14.8 万亿高质量 ...

29 分钟

此前有媒体报道，月之暗面出海产品Noisee前产品负责人明超平AI Coding创业项目“新言意码”，天使轮就以5000万美元的估值开启融资，与月之暗面等国内AI独角兽的首轮估值几乎齐平。

38 分钟

援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同质区域）模型，激活参数 370 亿，在 14.8 万亿 token 上进行了预训练。

43 分钟

2024年，人工智能大模型领域经历了一场前所未有的快速进化。就像一部精彩的科技剧集，国外各大科技巨头轮番上演着突破性的创新。从能听会说到能看会画，再到能制作视频……AI的能力正在以令人瞠目结舌的速度提升。

41 分钟on MSN

近日，“深度求索”官方公众号揭晓了一项重要进展，其DeepSeek-V3模型已正式上线并同步开放源代码。用户只需访问chat.deepseek.com官网，便能与这一最新版本的模型进行互动。

42 分钟on MSN

近日，智谱技术团队在官方公众号上宣布了一项重大进展，正式开源了名为CogAgent-9B-20241220的基座模型。这款模型是基于GLM-4V-9B进行训练的，专为智能体（Agent）任务设计，具有极高的实用价值。

一些您可能无法访问的结果已被隐去。