Meta, sembra tutto vero: l'azienda ha scaricato più di 80TB di dati via torrent per allenare l'IA

Nuovi documenti hanno rivelato che Meta ha scaricato ingenti quantità di dati da biblioteche digitali illegali per addestrare i suoi modelli di intelligenza artificiale. L'azienda si sta difendendo sostenendo che si tratta di "uso corretto", ma gli autori contestano questa creativa interpretazione del copyright.
di Nino Grasso pubblicata il 07 Febbraio 2025, alle 09:41 nel canale WebMeta
Meta è sempre più al centro di accuse su una potenzialmente grave violazione del copyright. Documenti giudiziari recentemente desecretati hanno rivelato che l'azienda avrebbe scaricato oltre 81,7 terabyte di dati, principalmente libri, da varie "biblioteche ombra" online, utilizzando il protocollo BitTorrent.
Questi dati, secondo quanto emerso attraverso e-mail interne dei dipendenti dell'azienda, sarebbero stati impiegati per addestrare i modelli di intelligenza artificiale dell'azienda. La pratica, già nota ma mai quantificata con tale precisione, sta alimentando il dibattito nei tribunali sulla legalità e l'etica dell'acquisizione di contenuti protetti da copyright per lo sviluppo di tecnologie IA.
Meta ha scaricato più di 80TB di dati illegalmente per addestrare la sua IA
Biblioteche illegatli come LibGen e Z-Library sono state le principali fonti dei dati scaricati illegalmente da Meta. Si tratta di piattaforme che offrono accesso gratuito a milioni di libri e articoli accademici spesso protetti da copyright, e che sono da tempo nel mirino delle case editrici e degli autori per violazione della proprietà intellettuale. La vicenda è emersa nell'ambito di una causa collettiva intentata da un gruppo di autori, tra cui Richard Kadrey, Sarah Silverman e Christopher Golden, contro Meta.
Gli scrittori accusano l'azienda di aver utilizzato le loro opere senza autorizzazione per addestrare i modelli di intelligenza artificiale e pare che sia successo davvero. Secondo i documenti legali desecretati, Meta avrebbe scaricato almeno 35,7 terabyte di dati da Z-Library e LibGen attraverso il sito Anna's Archive, un aggregatore di contenuti provenienti da diverse biblioteche digitali. In precedenza, l'azienda aveva già acquisito 80,6 terabyte di dati direttamente da LibGen.
Le comunicazioni interne di Meta rivelano le difficoltà incontrate durante il processo di download: i dipendenti lamentavano la scarsità di "seeder" e le basse velocità di trasferimento, problemi tipici delle reti peer-to-peer come BitTorrent quando i file non sono ampiamente distribuiti. Addirittura, gli stessi dipendenti di Meta hanno espresso nelle comunicazioni interne preoccupazioni sull'utilizzo di materiale "piratato", suggerendo che tale pratica potrebbe superare la "soglia etica" dell'azienda. Inoltre, sono emerse discussioni interne sulla necessità di evitare l'uso dell'infrastruttura di Facebook per il torrenting, al fine di non lasciare tracce che potessero ricondurre l'attività ai server di Meta.
La difesa di Meta si basa sul principio del "fair use" previsto dalla legge sul copyright degli Stati Uniti. L'azienda sostiene che l'utilizzo di questi dati per l'addestramento dei modelli di linguaggio di grandi dimensioni (LLM) rientri in questa categoria. Tuttavia, gli autori contestano questa interpretazione, sostenendo che l'uso massiccio e sistematico di opere protette vada ben oltre i limiti del fair use. Insomma, in attesa di ulteriori sviluppi legali, sembra chiaro che vi sia la necessità di un quadro normativo chiaro che consideri non solo gli interessi dell'innovazione tecnologica, ma anche la necessità di proteggere la proprietà intellettuale di chi possiede i diritti d'autore.
9 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoPerché io so io ..(cit)
e voi non siete un c..
Se penso a quanto ho scaricato io nella vita
Se penso a quanto ho scaricato io nella vita
anche io
però MAI dalle biblioteche
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".