I ricercatori hanno scoperto milioni di immagini di documenti personali, inclusi passaporti, carte di credito e certificati di nascita, all'interno del dataset di addestramento dell'IA DataComp CommonPool. Un'analisi di un sottoinsieme ha rivelato migliaia di volti identificabili e oltre 800 documenti di candidatura convalidati contenenti informazioni personali sensibili. Il dataset, scaricato oltre 2 milioni di volte, solleva preoccupazioni circa la diffusione di questi dati privati utilizzati per addestrare i modelli di IA.
Fonte: https://www.technologyreview.com/2025/07/18/1120466/a-major-ai-training-data-set-contains-millions-of-examples-of-personal-data/
Source:
https://ransomfeed.it/news.php?id_news=nid&nid=48