This thesis presents the development of a decision-support system designed to assist advertisers in selecting optimal keywords for Google Ads campaigns. The process begins with keyword extraction from three main sources: the company’s website, the company description, and texts related to the products and/or services provided. Automation through Natural Language Processing techniques ensures the retrieval of an initial set of relevant keywords, significantly reducing the time required for manual analysis. These keywords are then refined using advanced methods, such as frequency analysis and semantic similarity, to select a maximum of ten base keywords, as required by Google Ads Keyword Planner. The selected keywords are then expanded and enriched with statistical data, including average monthly searches, quarterly and annual variations, competition levels, and estimated bid ranges, using tools like Google Ads Keyword Planner. The processed data undergoes cleaning and is organized through clustering algorithms, such as K-Means, to identify meaningful thematic groups. The system integrates a linear programming model to select an optimal set of keywords from each cluster, maximizing the effectiveness of the advertising campaign while adhering to the user-defined weekly budget constraints. Thanks to the algorithm’s high level of automation, the system offers significant time savings even for experienced advertisers, eliminating the need for in-depth knowledge of the company being promoted. Furthermore, the system’s superior performance ensures both efficient use of financial resources and greater reach and success for the advertising campaign.

Questa tesi presenta lo sviluppo di un sistema di supporto decisionale progettato per assistere gli inserzionisti nella selezione di parole chiave ottimali per le campagne su Google Ads. Il processo inizia con l'estrazione delle parole chiave da tre fonti principali: il sito web aziendale, la descrizione dell'azienda e i testi relativi ai prodotti e/o servizi forniti. L'automazione tramite tecniche di Natural Language Processing consente di ottenere un set iniziale di parole chiave rilevanti, riducendo il tempo necessario per l'analisi manuale. Successivamente, queste parole chiave sono raffinate utilizzando metodi avanzati, come l’analisi della frequenza e la similarità semantica, per selezionare un massimo di dieci parole base, come richiesto dal Google Ads Keyword Planner. Le parole chiave selezionate sono poi ampliate e arricchite con dati statistici quali ricerche medie mensili, variazioni trimestrali e annuali, livello di concorrenza e range di offerta stimati, utilizzando strumenti come il Google Ads Keyword Planner. I dati elaborati sono sottoposti a un processo di pulizia e organizzati attraverso algoritmi di clustering, come il K-Means, per identificare gruppi tematici significativi. Il sistema integra un modello di programmazione lineare per selezionare un set ottimale di parole chiave da ciascun cluster, massimizzando l'efficacia della campagna pubblicitaria nel rispetto dei vincoli di budget settimanale definiti dall'utente. Grazie all'elevato livello di automazione dell'algoritmo, il sistema consente un notevole risparmio di tempo anche per gli inserzionisti più esperti, eliminando la necessità di una conoscenza approfondita dell'azienda da sponsorizzare. Inoltre, le prestazioni superiori del sistema garantiscono sia un utilizzo efficiente delle risorse finanziarie che una maggiore portata e riuscita della campagna pubblicitaria.

Optimized keyword selection in digital advertising using machine learning and linear programming

Coluccio, Teodoro
2023/2024

Abstract

This thesis presents the development of a decision-support system designed to assist advertisers in selecting optimal keywords for Google Ads campaigns. The process begins with keyword extraction from three main sources: the company’s website, the company description, and texts related to the products and/or services provided. Automation through Natural Language Processing techniques ensures the retrieval of an initial set of relevant keywords, significantly reducing the time required for manual analysis. These keywords are then refined using advanced methods, such as frequency analysis and semantic similarity, to select a maximum of ten base keywords, as required by Google Ads Keyword Planner. The selected keywords are then expanded and enriched with statistical data, including average monthly searches, quarterly and annual variations, competition levels, and estimated bid ranges, using tools like Google Ads Keyword Planner. The processed data undergoes cleaning and is organized through clustering algorithms, such as K-Means, to identify meaningful thematic groups. The system integrates a linear programming model to select an optimal set of keywords from each cluster, maximizing the effectiveness of the advertising campaign while adhering to the user-defined weekly budget constraints. Thanks to the algorithm’s high level of automation, the system offers significant time savings even for experienced advertisers, eliminating the need for in-depth knowledge of the company being promoted. Furthermore, the system’s superior performance ensures both efficient use of financial resources and greater reach and success for the advertising campaign.
RAVANELLI, PAOLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2023/2024
Questa tesi presenta lo sviluppo di un sistema di supporto decisionale progettato per assistere gli inserzionisti nella selezione di parole chiave ottimali per le campagne su Google Ads. Il processo inizia con l'estrazione delle parole chiave da tre fonti principali: il sito web aziendale, la descrizione dell'azienda e i testi relativi ai prodotti e/o servizi forniti. L'automazione tramite tecniche di Natural Language Processing consente di ottenere un set iniziale di parole chiave rilevanti, riducendo il tempo necessario per l'analisi manuale. Successivamente, queste parole chiave sono raffinate utilizzando metodi avanzati, come l’analisi della frequenza e la similarità semantica, per selezionare un massimo di dieci parole base, come richiesto dal Google Ads Keyword Planner. Le parole chiave selezionate sono poi ampliate e arricchite con dati statistici quali ricerche medie mensili, variazioni trimestrali e annuali, livello di concorrenza e range di offerta stimati, utilizzando strumenti come il Google Ads Keyword Planner. I dati elaborati sono sottoposti a un processo di pulizia e organizzati attraverso algoritmi di clustering, come il K-Means, per identificare gruppi tematici significativi. Il sistema integra un modello di programmazione lineare per selezionare un set ottimale di parole chiave da ciascun cluster, massimizzando l'efficacia della campagna pubblicitaria nel rispetto dei vincoli di budget settimanale definiti dall'utente. Grazie all'elevato livello di automazione dell'algoritmo, il sistema consente un notevole risparmio di tempo anche per gli inserzionisti più esperti, eliminando la necessità di una conoscenza approfondita dell'azienda da sponsorizzare. Inoltre, le prestazioni superiori del sistema garantiscono sia un utilizzo efficiente delle risorse finanziarie che una maggiore portata e riuscita della campagna pubblicitaria.
File allegati
File Dimensione Formato  
2024_12_Coluccio_Tesi_01.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 1.42 MB
Formato Adobe PDF
1.42 MB Adobe PDF   Visualizza/Apri
2024_12_Coluccio_Executive Summary_02.pdf

non accessibile

Descrizione: Testo Executive Summary
Dimensione 591.8 kB
Formato Adobe PDF
591.8 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/230158