微软推出最新小模型Phi-4。参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。编程能力也是开源模型一流,超过了70B的Llama 3.3和72B的Qwen 2.5。微软在技术报告中还提出了一个新的训练范式——midtraining。(量子位) ...