Recenti documenti giuridici rivelano dettagli cruciali su come Meta, la società madre di Facebook e Instagram, stia cercando di sviluppare i suoi modelli di intelligenza artificiale, in particolare attraverso l’uso di dati potenzialmente piratati. In particolare, le comunicazioni interne emerse da una causa importante suggeriscono che Meta stava valutando l’uso del sito di pirateria di libri, LibGen, per l’allenamento dei suoi modelli AI, in un contesto di crescente pressione per superare concorrenti come OpenAI e Mistral.
In un’email inviata nell’ottobre 2023, il vicepresidente di generative AI di Meta, Ahmad Al-Dahle, ha sottolineato che il loro obiettivo deve essere quello di battere GPT-4 di OpenAI, accennando alla necessità di comprendere come ‘costruire frontier e vincere questa corsa’. La lettera prende spunto dalle preoccupazioni legate alla privacy e all’uso di dati protetti, creando scompiglio all’interno dell’azienda.
La questione si infittisce considerando le misure di mitigazione progettate per affrontare i rischi legali dell’uso di LibGen e le strategie di comunicazione che Meta intendeva seguire per evitare danni alla propria reputazione. Secretamente, l’azienda stava progettando di rimuovere avvisi di copyright e altre informazioni identificative dai dati utilizzati per l’addestramento. Queste clamorose rivelazioni potrebbero influenzare l’evoluzione della causa legale che coinvolge Meta e altri avversari su questioni di copyright e uso di contenuti protetti.