The study addresses the challenge of source classification for virtual images generated by various AI text-to-image tools, with a specific focus on images in the JPEG or JPG format. Human face images were generated using multiple AI generators, including Per- chance, Adobe’s Firefly, DALL-E 3 by OpenAI, Stable Diffusion, MetaAI, DeepAI, Fotor, Microsoft, and PicsArt. The methodology involved a detailed analysis of the quantiza- tion tables inherent to the JPEG format, which provided a foundation for distinguishing between different AI generators. Different methods and experiments, inspired by image compression with various quality factors and JPEG ghost detection, were subsequently applied to enhance the accuracy of source detection. The results demonstrate a signifi- cant advancement in the ability to accurately classify the origin of AI-generated virtual images, offering valuable insights into the distinct characteristics of images produced by different AI tools. This approach has the potential to contribute to broader applications in digital forensics and the validation of AI-generated content.

Lo studio affronta la sfida della classificazione delle fonti per le immagini virtuali gen- erate da vari strumenti di intelligenza artificiale (IA) per la generazione di immagini da testo, con un focus specifico sulle immagini in formato JPEG o JPG. Sono state generate immagini di volti umani utilizzando diversi generatori di IA, tra cui Perchance, Firefly di Adobe, DALL-E 3 di OpenAI, Stable Diffusion, MetaAI, DeepAI, Fotor, Microsoft e PicsArt. La metodologia ha comportato un’analisi dettagliata delle tabelle di quantiz- zazione inerenti al formato JPEG, che ha fornito una base per distinguere tra i diversi generatori di IA. Successivamente, sono stati applicati vari metodi e esperimenti, ispirati alla compressione delle immagini con diversi fattori di qualità e al rilevamento delle tracce JPEG (JPEG ghost detection), per migliorare l’accuratezza nella rilevazione della fonte. I risultati dimostrano un significativo progresso nella capacità di classificare accuratamente l’origine delle immagini virtuali generate da IA, offrendo preziose informazioni sulle carat- teristiche distintive delle immagini prodotte da diversi strumenti di IA. Questo approccio ha il potenziale di contribuire ad applicazioni più ampie nella medicina legale digitale e nella validazione di contenuti generati da IA.

JPEG Based Source Identification of AI-Generated Images

ERKEK, NECATI KAGAN
2023/2024

Abstract

The study addresses the challenge of source classification for virtual images generated by various AI text-to-image tools, with a specific focus on images in the JPEG or JPG format. Human face images were generated using multiple AI generators, including Per- chance, Adobe’s Firefly, DALL-E 3 by OpenAI, Stable Diffusion, MetaAI, DeepAI, Fotor, Microsoft, and PicsArt. The methodology involved a detailed analysis of the quantiza- tion tables inherent to the JPEG format, which provided a foundation for distinguishing between different AI generators. Different methods and experiments, inspired by image compression with various quality factors and JPEG ghost detection, were subsequently applied to enhance the accuracy of source detection. The results demonstrate a signifi- cant advancement in the ability to accurately classify the origin of AI-generated virtual images, offering valuable insights into the distinct characteristics of images produced by different AI tools. This approach has the potential to contribute to broader applications in digital forensics and the validation of AI-generated content.
BESTAGINI, PAOLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-ott-2024
2023/2024
Lo studio affronta la sfida della classificazione delle fonti per le immagini virtuali gen- erate da vari strumenti di intelligenza artificiale (IA) per la generazione di immagini da testo, con un focus specifico sulle immagini in formato JPEG o JPG. Sono state generate immagini di volti umani utilizzando diversi generatori di IA, tra cui Perchance, Firefly di Adobe, DALL-E 3 di OpenAI, Stable Diffusion, MetaAI, DeepAI, Fotor, Microsoft e PicsArt. La metodologia ha comportato un’analisi dettagliata delle tabelle di quantiz- zazione inerenti al formato JPEG, che ha fornito una base per distinguere tra i diversi generatori di IA. Successivamente, sono stati applicati vari metodi e esperimenti, ispirati alla compressione delle immagini con diversi fattori di qualità e al rilevamento delle tracce JPEG (JPEG ghost detection), per migliorare l’accuratezza nella rilevazione della fonte. I risultati dimostrano un significativo progresso nella capacità di classificare accuratamente l’origine delle immagini virtuali generate da IA, offrendo preziose informazioni sulle carat- teristiche distintive delle immagini prodotte da diversi strumenti di IA. Questo approccio ha il potenziale di contribuire ad applicazioni più ampie nella medicina legale digitale e nella validazione di contenuti generati da IA.
File allegati
File Dimensione Formato  
2024_10_Erkek.pdf

accessibile in internet per tutti

Descrizione: JPEG Based Source Identification of AI-Generated Images
Dimensione 14 MB
Formato Adobe PDF
14 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/227154