在人工智能的发展道路上,AGI(通用人工智能)的构想一直备受关注,而具身智能的崛起作为这一概念的延伸,更是在科技界引发了一阵热潮。自从大语言模型(LLM)带来了翻天覆地的变化,其突破也为具身智能的未来铺平了道路,使得AI能够与现实世界的交互变得更加自 ...
在人工智能(AI)的迅猛发展中,通用人工智能(AGI)被认为是AI领域的终极目标。随着大语言模型(LLM)的不断突破,具身智能已成为连接数字与物理世界的关键。这一新兴领域汇聚了众多来自顶尖院校的创业者,他们的共同愿景是创造出能够灵活应对各种复杂任务的 ...
IT之家 12 月 25 日消息,据 404 Media报道,人工智能公司 Anthropic 近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱, 且绕过这些防护的“越狱”过程可以被自动化 。研究表明,仅仅通过改变提示词(prompt)的格式,例如随意的大小写混合,就可能诱导 LLM 产生不应输出的内容。
另外,微软还用内部的基准PhiBench对模型能力进行了更全面的评估,结果Phi-4取得了56.2%的综合得分,展现出在推理、知识、编程等方面的全面能力,但相比于Qwen 2.5-72B等模型,还是暴露了有待提高之处。
对GPT模型的影响则非常有限,PT种群的平均资源量也始终徘徊在较低水平,甚至随轮次增加有下降,表明惩罚机制并没有改变GPT的“自私”想法。
6月16日消息,据外媒报道,OpenAI去年3月份推出的大语言模型GPT-4,在研究人员所进行的实验中的表现虽然还不及人类参与者的平均水平,但已达到了 ...
根据微软自己的基准测试,仅有 3.8B 参数的 Phi-3 Mini 版在性能上表现优于 Meta 8B 参数的 Llama 和 OPENAI 3.5B 参数的 GPT-3。 微软研究院在论文中表示: ...
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。 这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。