DeepSeek正式宣布版本R1 0528的更新：性能更接近O

- 编辑：admin - 2025-05-31 13:32

DeepSeek正式宣布版本R1 0528的更新：性能更接近O

根据今晚的Kuai Technology，DePseek于5月29日正式宣布R1型号已经完成了该版本的小更新，并且当前版本为DeepSeek-R1-0528。报道说，DeepSeek-R1-0528仍然使用2024年12月推出的DeepSeek V3基本模型作为基础，但经过培训后，在此过程中投资了更多的计算机功能，从而显着提高了思想和模型推理能力的深度。更新的R1模型在所有具有多种参考评估的国家模型中都取得了顶级结果，包括数学，编程和一般逻辑，并以O3和Gemini-2.5-Pro等一般性能的其他主要国际模型来处理其他主要国际模型。与以前的R1版本相比，复杂的推理任务中模型的新版本的性能改进得到了显着改善。典型样本，在AIME 2025测试中，该模型的最新版本的精度从70％增加到87.5％以前的版本。这是因为在推理过程中改善了模型的思想深度。在AIME 2025测试集中，最古老的模型每个问题平均使用12K令牌，而新模型的每个问题平均使用了23K令牌，表明它们在解决问题的过程中具有更详细和详细的思想。同时，DePseek蒸馏了DeepSeek-R1-0528思维链，训练了Qwen3-8b，并获得了DeepSeek-R1-0528-QWEN3-8B。该8B模型仅在AIME 2024数学测试中被DeepSeek-R1-0528超过，超过QWEN3-8B（+10.0％）和Rivuring Qwen3-235b。 DeepSeek认为，DeepSeek-R1-0528的思维链对于研究学术推理模型和开发行业的小型模型非常重要。其他幻觉技能更新技巧：DeepSeek R1的新版本已针对“幻觉”的问题进行了优化。与以前的版本相比，更新的MODEL可用于改写，波兰语，总结，阅读理解等。幻觉率在舞台上降低了约45-50％。创意写作：基于先前版本的R1，更新的R1模型进一步优化了有争议的测试，小说，散文和其他样式，这是最长的工作生产，具有更完整的长度，结构和内容，并且可以呈现与人类偏好接近的写作样式。 [本文的结尾]如果您需要重印，请务必向我们展示其来源：Kuai技术编辑：Shiqi