This study introduces a system for automating the classification of warranty claims in the context of metallurgical industry. It has been implemented for the quality department of Brembo N.V., an acknowledged world leader and innovator in the field of automotive disk brake technology. The proposed solution categorizes claims into predefined failure modes, leveraging deep learning and NLP to handle complex and unstructured textual data. A key innovation of this work lies in addressing the challenge of imbalanced class distribution with the use of generative AI tools. By employing data augmentation techniques, synthetic samples are created to ensure a less imbalanced training phase, enhancing the system’s ability to better recognize rarer events. Another innovative aspect is the adoption of an ensemble model that combines the strengths of state-of-the-art Transformer architectures with simpler, more traditional options. This hybrid setup leverages a dual expertise: the Transformer excels at detecting rare cases, while the simpler model provides robust performance for more common events. The approach introduces a novel way of combining cutting-edge AI models with practical, straightforward techniques to address industry-specific challenges, reducing time required for claim processing. Moreover, this strategy benefits the company by enhancing its agility, allowing it to bypass slow processes and anticipate future product trends.
Questo studio introduce un sistema per automatizzare la classificazione dei reclami in garanzia nel contesto dell’industria metallurgica. È stato implementato per il dipartimento qualità di Brembo N.V., leader mondiale e innovatore nel campo della tecnologia dei freni a disco per autoveicoli. La soluzione proposta categorizza i reclami in modalità di guasto predefinite, sfruttando il deep learning e l’NLP per gestire dati testuali complessi e non strutturati. Un’innovazione chiave di questo lavoro risiede nell’affrontare la sfida della distribuzione sbilanciata delle classi con l’uso di strumenti di IA generativa. Utilizzando tecniche di data augmentation, vengono creati dati sintetici per garantire una fase di training più uniforme, migliorando la capacità del sistema di riconoscere meglio gli eventi rari. Un altro aspetto innovativo è l’adozione di un modello ensemble che combina i punti di forza di architetture Transformer all’avanguardia con opzioni più semplici e tradizionali. Questo setup ibrido ha un duplice vantaggio: il Transformer eccelle nel rilevare casi rari, mentre il modello più semplice fornisce prestazioni robuste per eventi più comuni. L’approccio introduce un nuovo modo di combinare modelli di IA avanzati con tecniche pratiche e semplici per affrontare sfide specifiche del settore, riducendo il tempo richiesto per l’elaborazione dei reclami. Inoltre, questa strategia avvantaggia l’azienda migliorandone l’agilità, consentendole di evitare rallentamenti e di anticipare le tendenze a breve termine dei suoi prodotti.
Synthetic data and generative AI for improved text classification: a Brembo case study
CALDARINI, SAMUELE
2023/2024
Abstract
This study introduces a system for automating the classification of warranty claims in the context of metallurgical industry. It has been implemented for the quality department of Brembo N.V., an acknowledged world leader and innovator in the field of automotive disk brake technology. The proposed solution categorizes claims into predefined failure modes, leveraging deep learning and NLP to handle complex and unstructured textual data. A key innovation of this work lies in addressing the challenge of imbalanced class distribution with the use of generative AI tools. By employing data augmentation techniques, synthetic samples are created to ensure a less imbalanced training phase, enhancing the system’s ability to better recognize rarer events. Another innovative aspect is the adoption of an ensemble model that combines the strengths of state-of-the-art Transformer architectures with simpler, more traditional options. This hybrid setup leverages a dual expertise: the Transformer excels at detecting rare cases, while the simpler model provides robust performance for more common events. The approach introduces a novel way of combining cutting-edge AI models with practical, straightforward techniques to address industry-specific challenges, reducing time required for claim processing. Moreover, this strategy benefits the company by enhancing its agility, allowing it to bypass slow processes and anticipate future product trends.File | Dimensione | Formato | |
---|---|---|---|
2024_12_Caldarini.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Testo tesi
Dimensione
3.23 MB
Formato
Adobe PDF
|
3.23 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/230463