工聯網消息(IItime) 近日,德國TNG Technology Consulting GmbH團隊基于DeepSeek系列模型推出開源混合模型R1T2,其推理速度較DeepSeek R1-0528提升200%,引發AI領域關注。
該模型采用團隊提出的“集合專家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三個父模型的權重張量,在未額外微調的情況下,繼承了前者的推理能力、結構化思維及簡潔指令特性。據測試,其推理性能達父模型的90%~92%,輸出Token量僅為后者的40%,顯著降低計算成本。R1T2采用MIT許可協議,已在Hugging Face開放。該模型在數學、編程等結構化任務中表現突出,為企業級應用提供新選擇。