Claude ID - 搜索 News

Deepseek新模型意外曝光！编程跑分一举超越Claude 3.5 Sonnet

据Reddit网友爆料，Deepseek-v3已在 API 和网页上发布，一些榜单跑分也新鲜出炉。在 Aider 多语言编程测试排行榜中，Deepseek-v3 一举超越 Claude 3.5 Sonnet，排在第 1 位的 o1 之后。（相比 Deepseek-v2.5，完成率从 17.8% 大幅上涨至 48.4%。）且在 LiveBench 测评中，它是当前最强开源 ...

i黑马2 天

谷歌被曝正使用Anthropic的Claude模型来改进其Gemini AI

据TechCrunch获得的内部通信内容显示，参与改进谷歌Gemini人工智能模型的承包商正在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了谷歌是否获得Anthropic授权使用Claude进行测试的合规性质疑。谷歌DeepMind（负责Gemini）发言人McNamara表示，DeepMind确实会“比较模型输出”以进行评估，但并未在Anthropic模型上训练 ...

来自MSN8 天

量子位的报道

克雷西发自凹非寺量子位 | 公众号 QbitAI 给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于Claude 3.5 Sonnet的智能体，就会表现出极强的合作意识。而GPT-4o则是主打一个“自私”，只考虑自己的短期利益。这个结果来自Google DeepMind和一位独立研究者的最新合作。参加游戏的智能体背后的模型分 ...

9 天

12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私 ...

对GPT模型的影响则非常有限，PT种群的平均资源量也始终徘徊在较低水平，甚至随轮次增加有下降，表明惩罚机制并没有改变GPT的“自私”想法。

10 天

沃顿商学院教授发文解析 o1：能力仍有短板，「人机协同智能」或成 ...

OpenAI 最近奉上了满血版的 o1 Pro，这一全新系列的模型究竟有多强？它能否指明 AI 发展的未来方向？沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。 o1 preview 问世 3 个月后，满血版的 o1 Pro ...

13 天

Claude 3.5 编程收入暴增 10 倍，抢走 Cursor 反杀 OpenAI

而到了今年 6 月，随着新版 Claude 模型的发布，公司的销售策略更加明朗。销售团队主动出击，向客户强调 Claude 在年内多次技术迭代中已超越 OpenAI，并重点展示其在多个权威 AI 基准测试中的优异平均成绩。

虎嗅网16 天

深夜狙击ChatGPT，Google最强AI亮相

》，题图来自：Google就在刚刚，Gemini 2.0新模型用一记重拳暴击OpenAI。先说结论，Gemini 2.0 Flash性能较上代有所长进，硬刚Claude 3.5 Sonnet，但今天更重要的亮点或许是基于它打造的AI Agents。您目前设备暂不支持播放这也得到了Deepmind CEO ...

GitHub18 天

值得注意的是，银河录像局还提供美区Apple ID帐号和Google帐号等服务。此外，自2019年成立以来，银河录像局已稳定运营五六年，不仅拥有ICP经营许可证（浙B2-20230847），还通过备案（备案号：浙ICP备2022036459号），是一个非常可靠的Claude Pro合租平台。需要注意的 ...

36氪26 天

YouTube上线AI音乐重混功能，或将改变音乐创作

本文来自微信公众号“三易生活”（ID：IT-3eLife），作者：三易菌，36氪经授权发布。该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

36氪1 个月

Scaling Law百度最早提出？OpenAI/Claude都受它启发，Ilya出现在致谢名单中

什么？Scaling Law最早是百度2017年提的？！ Meta研究员翻出经典论文：大多数人可能不知道，Scaling law原始研究来自2017年的百度，而非三年后（2020年 ...

IT之家1 个月

AI 写好代码自己发 Github：人类程序员只需“动嘴”，Claude 化身服务 ...

Anthropic 又发大礼包！现在 Claude 自己就是一台服务器。能直连 GitHub，AI 自己写代码、自己创建仓库、Push 代码、创建 Issue、创建分支、创建 PR 一条龙服务。全程不用离开聊天界面，人类程序员只起到了提需求的作用，彻底退化成产品经理（狗头）。除了访问 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果