The proliferation of space missions in the New Space Economy has led to an exponential increase in data generation. While this data holds potential for shaping the design of future missions, its integration into new studies remains limited. To tackle this, this Thesis proposes an innovative solution that harnesses open-source Natural Language Processing (NLP) techniques to streamline system engineering activities during the preparatory phases of new Concurrent Engineering studies. The tool begins by inputting the objective of the new mission, then compared to the objectives of past missions using semantic similarity techniques to establish a relevant set of missions for further consideration. These objectives are extracted from textual descriptions of past mission using a Retrieval Augmented Generation (RAG) pipeline, leveraging Large Language Models (LLM). Subsequently, key features of the selected missions are extracted, facilitating the automatic clustering of missions with similar attributes. Further details on clusters of interest can be obtained by extracting the design choices of corresponding missions. Results are presented through simple data visualization methods, enabling system engineers to swiftly gain insights and identify any notable patterns, ultimately facilitating quicker and more informed decision-making processes. The proof-of-concept study on an open-source Earth Observation (EO) mission database showcased the tool’s capability to extract features from past missions, validated against a RAG evaluation metric. It also demonstrated its ability to offer a subset of pertinent missions for future EO missions. Notably, the tool is entirely developed using opensource techniques and operates on freely available computing infrastructure, highlighting its scalability and potential for broader applications with additional resources.
La proliferazione delle missioni spaziali nella New Space Economy ha portato ad un aumento esponenziale della produzione di dati. Sebbene questi dati abbiano il potenziale per plasmare la progettazione di missioni future, la loro integrazione in nuovi studi rimane limitata. Per affrontare questo problema, questa tesi propone una soluzione innovativa che sfrutta tecniche open-source di Natural Language Processing (NLP) per velocizzare le attività di ingegneria dei sistemi durante le fasi preparatorie di nuovi studi di Concurrent Engineering. Il tool è inizializzato fornendo l’obiettivo della nuova missione, che viene poi confrontato con gli obiettivi delle missioni passate utilizzando tecniche di somiglianza semantica per stabilire un insieme di missioni rilevanti da considerare. Questi obiettivi vengono estratti dalle descrizioni testuali delle missioni passate utilizzando una pipeline di Retrieval Augmented Generation (RAG), che sfrutta i Large Language Models (LLM). Successivamente, vengono estratte le caratteristiche chiave delle missioni selezionate, facilitando il raggruppamento automatico delle missioni con attributi simili. Ulteriori dettagli sui gruppi di interesse possono essere ottenuti estraendo le scelte progettuali delle missioni corrispondenti. I risultati vengono presentati attraverso semplici metodi di visualizzazione dei dati, consentendo agli ingegneri di sistema di ottenere rapidamente informazioni e di identificare eventuali trends degni di nota, facilitando in ultima analisi processi decisionali più rapidi e informati. Lo studio di fattibilità su un database open-source di missioni di EO ha dimostrato le capacità del tool di estrarre caratteristiche chiave dalle missioni passate, convalidandole attraverso una metrica di valutazione RAG. Ha inoltre dimostrato la sua capacità di offrire un sottoinsieme di missioni pertinenti per future missioni EO, usate come casi studio. Va sottolineato che lo strumento è stato sviluppato interamente con tecniche open-source ed opera su un’infrastruttura informatica gratuita, evidenziando la sua scalabilità e il potenziale per applicazioni più ampie con risorse aggiuntive.
Towards data-driven mission design: harnessing language models for systems engineering activities
Capasso, Roberto
2022/2023
Abstract
The proliferation of space missions in the New Space Economy has led to an exponential increase in data generation. While this data holds potential for shaping the design of future missions, its integration into new studies remains limited. To tackle this, this Thesis proposes an innovative solution that harnesses open-source Natural Language Processing (NLP) techniques to streamline system engineering activities during the preparatory phases of new Concurrent Engineering studies. The tool begins by inputting the objective of the new mission, then compared to the objectives of past missions using semantic similarity techniques to establish a relevant set of missions for further consideration. These objectives are extracted from textual descriptions of past mission using a Retrieval Augmented Generation (RAG) pipeline, leveraging Large Language Models (LLM). Subsequently, key features of the selected missions are extracted, facilitating the automatic clustering of missions with similar attributes. Further details on clusters of interest can be obtained by extracting the design choices of corresponding missions. Results are presented through simple data visualization methods, enabling system engineers to swiftly gain insights and identify any notable patterns, ultimately facilitating quicker and more informed decision-making processes. The proof-of-concept study on an open-source Earth Observation (EO) mission database showcased the tool’s capability to extract features from past missions, validated against a RAG evaluation metric. It also demonstrated its ability to offer a subset of pertinent missions for future EO missions. Notably, the tool is entirely developed using opensource techniques and operates on freely available computing infrastructure, highlighting its scalability and potential for broader applications with additional resources.File | Dimensione | Formato | |
---|---|---|---|
2024_04_Capasso_Tesi_01.pdf
solo utenti autorizzati dal 19/03/2025
Descrizione: Testo della Tesi
Dimensione
3.42 MB
Formato
Adobe PDF
|
3.42 MB | Adobe PDF | Visualizza/Apri |
2024_04_Capasso_Executive_Summary_02.pdf
solo utenti autorizzati dal 19/03/2025
Descrizione: Executive Summary
Dimensione
1.04 MB
Formato
Adobe PDF
|
1.04 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/219793