Milano, 28 apr. (askanews) – Il Politecnico di Milano contro i deepfake, con due progetti in grado di smascherare video e audio falsi.
L’Image and Sound Processing Lab (Ispl) del Politecnico di Milano – del Dipartimento di Elettronica, Informazione e Bioingegneria – ha contribuito a due iniziative di ricerca europee per il rilevamento dei deepfake, contenuti digitali falsi e il contrasto alla loro diffusione: FF4ALL e FUN-Media.
Nel dettaglio, per FF4ALL, i ricercatori del Politecnico hanno studiato i modi in cui vengono ingegnerizzati e diffusi immagini e video falsi. Sono state analizzate per esempio tecniche che consentono di trasformare immagini reali in versioni sintetiche estremamente realistiche, rendendo più complessa la verifica della loro autenticità. Parallelamente, il laboratorio ha sviluppato nuovi strumenti per il rilevamento di volti sintetici, combinando informazioni geometriche tridimensionali e caratteristiche strutturali del volto. Queste soluzioni migliorano la capacità di generalizzare i modelli che individuano i falsi, e mantengono buone prestazioni anche in presenza di operazioni di post-processing, come compressione o editing.
“Un ulteriore contributo riguarda lo studio dei sistemi usati per rilevare i falsi”, spiega il professor Stefano Tubaro, che coordina le attività in questo ambito del Lab insieme col professor Paolo Bestagini e con il contributo dei ricercatori Sara Mandelli e Luca Comanducci. “Comprendere su quali elementi basino le proprie decisioni è infatti cruciale per aumentarne l’affidabilità”. In collaborazione con le università partner del progetto è stato infine realizzato il dataset Wild, che raccoglie immagini false generate da venti modelli di ultima generazione.
Con FUN-Media, invece, il focus è stata la rilevazione di deepfake vocali. In questo caso ricercatori dell’Ispl hanno sviluppato nuove architetture basate sui cosiddetti modelli “Mixture of Experts” per la rilevazione dei falsi, in grado di combinare più sistemi specializzati per migliorare le prestazioni anche in presenza di tecniche generative mai osservate durante l’addestramento.
“Accanto alla rilevazione, il progetto ha affrontato anche il problema dell’attribuzione, ovvero l’identificazione della tecnologia generativa responsabile della creazione di un contenuto audio”, dice il docente Paolo Bestagini. Sono stati sviluppati detector in grado di stabilire se due tracce vocali siano state prodotte dallo stesso modello generativo. Ulteriori contributi riguardano lo sviluppo di tecniche per l’analisi dettagliata del segnale vocale, per esempio a livello di fonemi, e l’impiego di modelli capaci di evidenziare le caratteristiche acustiche più rilevanti.

