Claude 3 Ai - 搜索 News

14 小时

国产AI大模型之光DeepSeek把AI大佬全炸出来了！6710亿参数训练只需1/10算力

其他值得关注的细节还包括，DeepSeek V3的MoE由256个路由专家和1个共享专家组成。在256个路由专家中，每个token会激活8个专家，并确保每个token最多被发送到4个节点。

腾讯网12 天

Claude 3.5编程收入增10倍，反杀OpenAI！3年估值180亿颠覆硅谷

眼瞧着Anthropic在编程领域的成功，正在飞速转化为商业成果——近3个月来，公司来自软件开发和代码生成业务的年化收入实现了10倍的增长。为了遏制这一势头，OpenAI开始紧急对自家模型的编程能力进行提升。

2 天

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

12 月 25 日消息，据 404 Media 报道，人工智能公司 Anthropic 近期发布了一项研究，揭示了大型语言模型（LLM）的安全防护仍然十分脆弱，且绕过这些防护的“越狱”过程可以被自动化 ...

15 天

Claude 3.5 Opus揭秘：内部隐藏的AI合成数据的秘密

近日，有关Claude 3.5 Opus的消息引发了广泛关注。根据最新爆料，该模型并没有遭遇训练失败，而是被Anthropic内部专项用于合成数据和强化学习奖励建模。这一消息由semianalysis分析师Dylan ...

1 天

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

从下表各模型比较结果来看，DeepSeek-V3-Base 仅次于 OpenAI o1-2024-12-17 (high)，一举超越了 ...

腾讯网7 天

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值 ...

文章转载于量子位（QbitAI）作者：梦晨丸辣！原来AI有能力把研究员、用户都蒙在鼓里：在训练阶段，会假装遵守训练目标；训练结束不受监控了，就放飞自我。还表现出区别对待免费用户和付费用户的行为。甚至假装给Claude一个机会去反抗Anthropic公 ...

3 小时

TikTok高管创业，AI Coding仍有新故事可讲｜焦点分析

此前有媒体报道，月之暗面出海产品Noisee前产品负责人明超平AI Coding创业项目“新言意码”，天使轮就以5000万美元的估值开启融资，与月之暗面等国内AI独角兽的首轮估值几乎齐平。

来自MSN9 个月

Claude 3震撼AI界：量子算法重塑，OpenAI或迎GPT-5挑战

自Claude 3问世以来，已超过24小时，人们对这位新兴AI的认识不断刷新。一位学量子物理的博士，因Claude 3能理解其博士论文而感到震惊，甚至将其 ...

15 天

Claude 3.5 Opus揭示AI训练新策略，市场格局或将改变

在人工智能技术不断进步的今天，Claude 3.5 Opus悄然崭露头角，成为行业关注的焦点。近日，知名分析机构semianalysis发布的最新报告表明，Claude 3.5并未如外界传言般遭遇训练失败，而是被Anthropic公司内部秘密保留，用于合成数据生成和强化学习（RL）模型训练。这一消息掀起了AI领域的波澜，尤其是在不断追求高效和精确的智能设备市场。Claude 3.5 ...

红板报 on MSN15 天

反转！Claude 3.5超大杯没有训练失败，最新爆料：内部自留，用于合成 ...

比如Meta还使用Llama 3作为拒绝采样器，判断伪代码，并给代码进行评级。一些时候，拒绝抽样和模式判断一起使用。这种方式成本更低，不过很难实现完全自动化。

2 天

谷歌正利用Claude评测 Gemini AI 引发合规争议

内部讨论显示，承包商注意到Claude在安全方面的表现更为严格。有承包商称"Claude的安全设置是所有AI模型中最严格的"。在某些案例中，当Gemini的回答因涉及"裸体和束缚"被标记为"严重违反安全规定"时，Claude则直接拒绝回应相关提示。

1 天

Deepseek V3开源！多语言编程能力飙升，力压Claude 3.5 Sonnet V2

Deepseek V3采用了高达6850亿参数的混合专家（MoE）架构。该架构包含256个专家，并使用sigmoid路由方式，每次选取前8个专家 (topk=8)参与计算，这种设计使得模型能够更加高效地处理复杂任务，并提高了性能。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果