Ai2 Rivoluziona l’AI con il nuovissimo Modello Tulu3-405B

Negli ultimi tempi, il mondo dell’intelligenza artificiale (AI) ha dovuto affrontare una crescente competizione tra modelli avanzati, ma recentemente, un protagonista americano ha fatto il suo ingresso, promettendo prestazioni di eccellenza. Ai2, il laboratorio di ricerca nonprofit di Seattle, ha lanciato il suo modello Tulu3-405B, che ha battuto il noto DeepSeek V3, uno dei sistemi più performanti della compagnia cinese DeepSeek. Questo modello non solo eccelle nei test, ma offre anche una alternativa open-source, accessibile a tutti.

Ai2 ha rivelato che Tulu3-405B è composto da 405 miliardi di parametri, una cifra straordinaria che lo rende uno dei più grandi modelli sul mercato. Durante i test interni, ha superato anche il GPT-4o di OpenAI, affermandosi come un’alternativa competitiva. La chiave del suo successo risiede in una tecnica innovativa chiamata “reinforcement learning with verifiable rewards” (RLVR), che addestra il modello su risultati facilmente verificabili, come la risoluzione di problemi matematici e l’esecuzione di istruzioni complesse.

Questo innovativo approccio è stato fondamentale per il raggiungimento di performance competitive e offre un’opzione significativa per sviluppatori e ricercatori che desiderano accedere a modelli di AI all’avanguardia senza dover spesso fare affidamento sui giganti tecnologici. I dati di benchmark mostrano che Tulu3-405B non solo eccelle nelle prove classiche ma si distingue anche in categorie specifiche, rappresentando un passo fondamentale verso un futuro dell’AI controllato da modelli open-source.