搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
9 小时
重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总 ...
整理 | 屠敏出品 | CSDN(ID:CSDNnews)就在今天,素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI ...
8 小时
性能匹敌GPT-4o的国产模型在海外火了,训练仅花费558万美元
此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 ...
15 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
在基准测试中,数学领域MATH 500上,DeepSeek-V3拿下了90.2高分,比Claude 3.5 Sonnet、GPT-4o超出10分还要多。 在软件工程SWE-bench ...
腾讯网
13 小时
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek ...
整理 | 华卫、核子可乐一家中国 AI 初创公司创建出被用户称作 “真正的‘Open’AI ”的人工智能模型。昨晚,DeepSeek 发布了最新系列模型 DeepSeek-V3 首个版本并同步开源。该模型可以处理一系列基于文本的工作负载和任务,如编码 ...
腾讯网
7 小时
550万美元烧出来的大模型居然赶超GPT-4o?浙大毕业的他展示的“东方 ...
和许多报告语焉不详相比,这份报告做到了真正的开源。不仅透露得到大幅升级的V3模型是在一个“难以想象”的预算下训练完成的: 整个训练仅花费了557.6万美元,在2048xH800集群上运行55天完成 ,还很坦诚地公布了技术细节。
14 小时
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅4379万元
【新智元导读】 600万美金训出击败GPT-4o大模型,竟被中国团队实现了!今天,DeepSeek-V3在全网掀起巨大风暴,仅凭671B参数在数学代码性能上,堪比国外大模型Claude 3.5 Sonnet。
虎嗅网
7 天
OpenAI元老级研究员离职,他主导了GPT-1、GPT-2的研发
本文来自微信公众号:机器之心,编辑:杜伟、陈陈,题图来自:AI生成 OpenAI 人事方面的变动还在继续。 今日,据外媒 The Information 报道,OpenAI 元老级人物 Alec Radford 即将离职,离职后进行独立研究。 据了解 ...
21 天
Meta全新编程助手:GPT-4与LlamaAI的较量
在当今人工智能技术日新月异的背景下,Meta公司(前身为Facebook)再次引起了业界的广泛关注。最新消息透露,Meta内部已经开始将OpenAI的GPT-4与其自研的LlamaAI相结合,打造出一款名为Metamate的辅助编程工具。这一进展不仅 ...
4 天
外媒:GPT-5 难产了,训练成果不及预期
12 月 22 日《华尔街日报》报道,万众期待的 OpenAI 下一代旗舰模型 GPT-5 的训练进度出现严重滞后,将无法如期发布。 根据消息人士透露,代号为猎户座(Orion)的 GPT-5 开发周期已经超过 18 个月。微软原本希望能够在 ...
来自MSN
10 天
医疗GPT还未能让患者充分受益
正如医学先驱希波克拉底所言:“生命是短暂的,艺术是长久的。”在医疗GPT的应用中,我们需认识到其局限性,并探索如何更好地结合人机协作,以实现更精准的医疗服务。
来自MSN
26 天
GPT 和大型语言模型,在NLP的未来
特别是 Transformer 架构,一直是该领域的游戏规则改变者,导致了 OpenAI 的 GPT(生成式预训练 Transformer)系列等模型的开发。与它们的前辈不同,这些模型在理解上下文和生成类似人类的文本方面表现出色,这要归功于它们能够处理与句子中所有其他单词相关的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈