Modelele lingvistice mari (LLM) au evoluat rapid în ultimii ani, devenind capabile să rezolve probleme complexe de matematică. Totuși, simpla obținere a unui răspuns numeric corect nu garantează un raționament riguros. DeepSeek-Math-V2 schimbă regulile jocului, introducând un sistem de raționament matematic auto-verificabil.
Ce aduce nou DeepSeek-Math-V2
- Verificator LLM dedicat pentru demonstrarea teoremelor.
- Generator de demonstrații care își verifică pașii înainte de finalizare.
- Scalarea verificării pentru a crea date noi și a îmbunătăți continuu modelul.
- Rigoare pas cu pas, nu doar rezultate finale.
Rezultate impresionante
- Performanțe aur la IMO 2025 și CMO 2024.
- Scor aproape perfect (118/120) la Putnam 2024.
- Evaluări solide pe IMO-ProofBench, benchmark creat de DeepMind.
Implementare și resurse
- Construit pe baza DeepSeek-V3.2-Exp-Base.
- Disponibil pentru descărcare pe HuggingFace.
- Cod și suport pentru inferență pe GitHub.
- Licență: Apache-2.0.
Concluzie
DeepSeek-Math-V2 nu este doar un model AI, ci un pas major spre sisteme capabile să facă demonstrații matematice riguroase. Cu rezultate de top la competiții internaționale, acest model arată că viitorul AI în matematică nu se rezumă la răspunsuri numerice, ci la raționament verificabil și transparent.


