百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
红板报 on MSN15 小时
中国大模型七杰
无问芯穹 无问芯穹的优势包括其软硬协同优化和异构算力整合能力。 其利用软硬协同优化技术,实现了多源异构算力的整合利用,提供了异构算力最优解。
而对标OpenAI的中国大模型创业“六小虎”,或艰难或顺利地陆续完成了这一年的关键融资,获得继续留在牌桌上的资格。与此同时,各家对于模型侧与应用侧的方向选择显现差异化,其各自的不同商业化脉络开始成型。