This study describes an approach for the Italian language by extracting verbal frames to determine their complementary parts within sentences. The model uses a theoretical approach which is designed specifically for Italian. Two sequentially dependent technologies are used for putting this plan into practice : A dependency parser and a rule based system. The parser returns the sentence structure as a set of dependency among words; the rule based system transforms such representation, permitting to recognize the subject, the predicate and the related complements. This model is evaluated by simply giving Italian text files. The results show that the model covers as much information as possible and gives results accordingly. However, the lack of information between verbs and its possible complements might cause inaccurate outcomes when given a sentence. As a future work, this consequence implies the need of an auxiliary system which holds semantical information of Italian verbs and their usages in sentences such like VerbNet and FrameNet systems for English language.

La tesi propone un'approccio, mirato alla lingua italiana, per estrarre la struttura dei complementi delle frasi. Il modello si basa su una caratterizzazione della struttura delle frasi, specifica per l'italiano. Due metodologia sono utilizzate: un dependency parser e un sistema a regole di produzione. Il parser ritorna la struttura della frase, sotto forma di relazioni di dipendenza tra le parole; il sistema a regole di produzione elabora tale rappresentazione, riconoscendo il soggetto, il predicato e i relativi complementi. Il modello è stato valutato utilizzando un insieme di testi italiani; i risultati mostrano che il modello ritorna i risultati attesi. Il modello non utilizza informazioni a priori circa i complementi che ciascun verbo può reggere. A causa di ciò, in alcuni casi, i risultati possono essere errati. Come sviluppo futuro, si prevede di incorporare un database semantico dei frame verbali, sul modello proposto da VerbNet o FrameNet per la lingua inglese.

Extracting verbal frames from natural language sentences

GUNEL, KADIR
2013/2014

Abstract

This study describes an approach for the Italian language by extracting verbal frames to determine their complementary parts within sentences. The model uses a theoretical approach which is designed specifically for Italian. Two sequentially dependent technologies are used for putting this plan into practice : A dependency parser and a rule based system. The parser returns the sentence structure as a set of dependency among words; the rule based system transforms such representation, permitting to recognize the subject, the predicate and the related complements. This model is evaluated by simply giving Italian text files. The results show that the model covers as much information as possible and gives results accordingly. However, the lack of information between verbs and its possible complements might cause inaccurate outcomes when given a sentence. As a future work, this consequence implies the need of an auxiliary system which holds semantical information of Italian verbs and their usages in sentences such like VerbNet and FrameNet systems for English language.
TEDESCO, ROBERTO
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2014
2013/2014
La tesi propone un'approccio, mirato alla lingua italiana, per estrarre la struttura dei complementi delle frasi. Il modello si basa su una caratterizzazione della struttura delle frasi, specifica per l'italiano. Due metodologia sono utilizzate: un dependency parser e un sistema a regole di produzione. Il parser ritorna la struttura della frase, sotto forma di relazioni di dipendenza tra le parole; il sistema a regole di produzione elabora tale rappresentazione, riconoscendo il soggetto, il predicato e i relativi complementi. Il modello è stato valutato utilizzando un insieme di testi italiani; i risultati mostrano che il modello ritorna i risultati attesi. Il modello non utilizza informazioni a priori circa i complementi che ciascun verbo può reggere. A causa di ciò, in alcuni casi, i risultati possono essere errati. Come sviluppo futuro, si prevede di incorporare un database semantico dei frame verbali, sul modello proposto da VerbNet o FrameNet per la lingua inglese.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_10_GUNEL.pdf

accessibile in internet per tutti

Descrizione: Thesis Text
Dimensione 1.89 MB
Formato Adobe PDF
1.89 MB Adobe PDF Visualizza/Apri
2014_10_GUNEL.pdf

accessibile in internet per tutti

Descrizione: New Version
Dimensione 1.89 MB
Formato Adobe PDF
1.89 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/96364