Llama大模型 - 搜索 News

来自MSN10 天

微软出招，新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议 ...

微软推出最新小模型Phi-4。参数量仅14B，MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。数学能力上，Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型，分数冲上90。编程能力也是开源模型一流，超过了70B的Llama 3.3和72B的Qwen 2.5。微软在技术报告中还提出了一个新的训练范式——midtraining。（量子位） ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点