11月3日|据阿里巴巴Qwen,Qwen3-Max推理模型仍在持续训练中,即便是当前的Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在AIME 25和HMMT25等具有挑战性的数学推理基准测试中达到100%的准确率。