Organizzazione di Benchmarking AI Sottoposta a Critiche per la Mancata Diffusione del Finanziamento di OpenAI

Un’organizzazione impegnata nello sviluppo di benchmark matematici per l’IA è stata criticata per non aver comunicato che aveva ricevuto finanziamenti da OpenAI, creando sospetti di improprietà nel settore. Epoch AI, un ente nonprofit principalmente finanziato da Open Philanthropy, ha rivelato solo il 20 dicembre che OpenAI aveva supportato la creazione di FrontierMath, un test progettato per valutare le competenze matematiche delle IA. Questo test è stato utilizzato da OpenAI per dimostrare le capacità del suo imminente modello principale, o3.

In un post su un forum, un collaboratore di Epoch AI ha dichiarato che molti contributori al benchmark FrontierMath non erano a conoscenza del coinvolgimento di OpenAI fino a quando non è stato reso pubblico. Questa mancanza di comunicazione ha sollevato dubbi sulla trasparenza dell’organizzazione. Alcuni utenti sui social media hanno espresso preoccupazione che la segretezza potrebbe compromettere la reputazione di FrontierMath come benchmark obiettivo.

Epoch AI ha risposto affermando che, sebbene il finanziamento e l’accesso di OpenAI ai risultati siano stati correttamente gestiti, l’organizzazione ha commesso un errore nel non essere più trasparente. Hanno riconosciuto la necessità di informare i matematici che contribuiscono al benchmark su chi potesse accedere al loro lavoro. Nonostante i problemi, Epoch AI ha affermato di avere accordi verbali con OpenAI per garantire che i problemi di FrontierMath non vengano utilizzati per l’addestramento dell’IA.