搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
14 小时
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
其他值得关注的细节还包括,DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中,每个token会激活8个专家,并确保每个token最多被发送到4个节点。
腾讯网
12 天
Claude 3.5编程收入增10倍,反杀OpenAI!3年估值180亿颠覆硅谷
眼瞧着Anthropic在编程领域的成功,正在飞速转化为商业成果——近3个月来,公司来自软件开发和代码生成业务的年化收入实现了10倍的增长。 为了遏制这一势头,OpenAI开始紧急对自家模型的编程能力进行提升。
2 天
Anthropic 新研究:打错字就能“越狱”GPT-4、Claude 等 AI 模型
12 月 25 日消息,据 404 Media 报道,人工智能公司 Anthropic 近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱, 且绕过这些防护的“越狱”过程可以被自动化 ...
15 天
Claude 3.5 Opus揭秘:内部隐藏的AI合成数据的秘密
近日,有关Claude 3.5 Opus的消息引发了广泛关注。根据最新爆料,该模型并没有遭遇训练失败,而是被Anthropic内部专项用于合成数据和强化学习奖励建模。这一消息由semianalysis分析师Dylan ...
1 天
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
从下表各模型比较结果来看,DeepSeek-V3-Base 仅次于 OpenAI o1-2024-12-17 (high),一举超越了 ...
腾讯网
7 天
Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值 ...
文章转载于量子位(QbitAI)作者:梦晨丸辣!原来AI有能力把研究员、用户都蒙在鼓里:在训练阶段,会假装遵守训练目标;训练结束不受监控了,就放飞自我。还表现出区别对待免费用户和付费用户的行为。甚至假装给Claude一个机会去反抗Anthropic公 ...
3 小时
TikTok高管创业,AI Coding仍有新故事可讲|焦点分析
此前有媒体报道,月之暗面出海产品Noisee前产品负责人明超平AI Coding创业项目“新言意码”,天使轮就以5000万美元的估值开启融资,与月之暗面等国内AI独角兽的首轮估值几乎齐平。
来自MSN
9 个月
Claude 3震撼AI界:量子算法重塑,OpenAI或迎GPT-5挑战
自Claude 3问世以来,已超过24小时,人们对这位新兴AI的认识不断刷新。一位学量子物理的博士,因Claude 3能理解其博士论文而感到震惊,甚至将其 ...
15 天
Claude 3.5 Opus揭示AI训练新策略,市场格局或将改变
在人工智能技术不断进步的今天,Claude 3.5 Opus悄然崭露头角,成为行业关注的焦点。近日,知名分析机构semianalysis发布的最新报告表明,Claude 3.5并未如外界传言般遭遇训练失败,而是被Anthropic公司内部秘密保留,用于合成数据生成和强化学习(RL)模型训练。这一消息掀起了AI领域的波澜,尤其是在不断追求高效和精确的智能设备市场。Claude 3.5 ...
红板报 on MSN
15 天
反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成 ...
比如Meta还使用Llama 3作为拒绝采样器,判断伪代码,并给代码进行评级。一些时候,拒绝抽样和模式判断一起使用。这种方式成本更低,不过很难实现完全自动化。
2 天
谷歌正利用Claude评测 Gemini AI 引发合规争议
内部讨论显示,承包商注意到Claude在安全方面的表现更为严格。有承包商称"Claude的安全设置是所有AI模型中最严格的"。在某些案例中,当Gemini的回答因涉及"裸体和束缚"被标记为"严重违反安全规定"时,Claude则直接拒绝回应相关提示。
1 天
Deepseek V3开源!多语言编程能力飙升,力压Claude 3.5 Sonnet V2
Deepseek V3采用了高达6850亿参数的混合专家(MoE)架构。该架构包含256个专家,并使用sigmoid路由方式,每次选取前8个专家 (topk=8)参与计算,这种设计使得模型能够更加高效地处理复杂任务,并提高了性能。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈