Chatr GPT - 搜索 News

44 分钟

国产AI一夜刷屏海外，2000 块GPU打造GPT-4o平替，AI大佬纷纷点赞

百科知识：DeepSeek-V3 在知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）上的水平相比前代 DeepSeek-V2.5 显著提升，接近当前表现最好的模型 Claude-3.5-Sonnet-1022。

1 天

性能匹敌GPT-4o的国产模型在海外火了，训练仅花费558万美元

此前DeepSeek一直被冠以“AI界拼多多”的名头，也是年中引发中国大模型价格战的源头。今年5月，DeepSeek发布的一款名为DeepSeek V2的开源模型，提供了一种史无前例的性价比：推理成本被降到每百万token仅 ...

1 天

国产大模型DeepSeek-V3开源：6710亿参数自研 MoE，性能和 GPT-4o 不分伯仲

援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同质区域）模型，激活参数 370 亿，在 14.8 万亿 token 上进行了预训练。

腾讯网1 天

ChatGPT本月第二次宕机，OpenAI称问题来自“上游供应商”

谁能料到，OpenAI圣诞节后送来一份惊吓。美东时间12月26日周四，OpenAI确认，美东时间上午11点整，旗下服务开始发生大规模宕机。华尔街见闻查看发现，OpenAI的ChatGPT聊天机器和文生视频AI模型Sora均无法正常访问，到发稿时还未完 ...

腾讯网2 天

对话｜全年HUD前装将超330万台，疆程技术瞄准人机交互“第一屏”

同时，AR-HUD贡献占比（W/AR-HUD整体市场交付量）从上年同期的9.48%快速提升至24.36%。高工智能汽车研究院预测，到2027年，AR-HUD搭载率或将首次超过W-HUD，成为中国乘用车市场的搭载主力。

2 天

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

12 月 25 日消息，据 404 Media 报道，人工智能公司 Anthropic 近期发布了一项研究，揭示了大型语言模型（LLM）的安全防护仍然十分脆弱，且绕过这些防护的“越狱”过程可以被自动化 ...

腾讯网3 天

京东健康王国鑫：从封闭到开放，大模型专家推理之路

2024年12月12日，由南方周末报社主办的第四届科创大会在北京落下帷幕。大会汇集各方嘉宾共同探讨行业、企业的科创突破，思考如何以新技术撬动新产业、新业态、新模式，驱动社会进步和人类发展。京东健康智能算法部负责人王国鑫分享了《从封闭到开放，大模型专家推理之路》的主题演讲。本文将主题演讲辑录如下，有部分删节。

3 天

Chat GPT崩溃后，全球学术水平瞬间回落五年

在效率层面，有GPT帮助后他们仅需要一周时间，就可以搞定一份包含示意图的7000字期末总结。所以每到期末季、考试周的时候，同学们往往会众筹订阅GPT的会员服务提升效率，大家都笑称这是“为科技付费”。

爱范儿4 天

蔚来李斌：萤火虫车灯没有借鉴 iPhone

路透社指出，孙正义将自己视为人工智能领域的开创者，但却目睹了英伟达成为了该领域的最强霸主。孙正义意识到自己此前的一系列灾难性投资对自己声誉的损害，因此下决心开发软银自己的芯片，帮助把 AI 普及到各个领域。

来自MSN4 天

百川智能发布全链路领域增强金融大模型，整体准确率领先GPT-4o近20%

行业首创领域自约束训练方案。本文为IPO早知道原创作者｜Stone ...

新京报 on MSN4 天

百川发布全链路领域增强金融模型，领先GPT-4o近20%

如何让模型在提升专业能力的同时不损失通用能力，是当下大模型落地具体场景最大的阻碍。为解决这一问题，百川智能打造了一套全链路领域增强方案，让模型金融专项能力和通用能力同步提升。

大河网4 天

对AI产业监管应先立后破

先立后破是中国人工智能发展的关键思路，但并非唯一思路。发展人工智能需要多方面推进。比如在技术创新方面，当前芯片依然是中国人工智能发展的短板，根据木桶理论，短板决定上限，要提高中国人工智能发展上限，打破算力瓶颈、实现国产自主替代是绕不过去的，即便没有外部限制，中国依然要走芯片自强自主的道路。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果