All’edizione 2025 dell’International Mathematical Olympiad, tenutasi in Australia, i modelli di IA di Google DeepMind e OpenAI hanno raggiunto, per la prima volta, il livello d’oro, risolvendo perfettamente 5 dei 6 problemi proposti nell’ambito del tempo regolamentare . Il risultato segna un’evoluzione significativa: finora solo modelli specialistici avevano raggiunto risultati analoghi nelle Olimpiadi.

Strategie a confronto

Google ha collaborato ufficialmente con l’IMO per la validazione dei risultati del suo modello Gemini Deep Think, mentre OpenAI ha pubblicato autonomamente le prestazioni del suo modello sperimentale, confermando anch’esso lo stesso risultato. Entrambi i sistemi utilizzano modelli in grado di interpretare i problemi in linguaggio naturale e produrre dimostrazioni complesse.