Text mining is a quite recent research area in computer science whose aim is to automatically provide information from electronic textual resources. It combines statistical, linguistic and machine learning techniques to mine unstructured data as text documents. In this work, an overview of text mining techniques is given, together with a general presentation of possible applications. Moreover, an information extraction system is built to mine diagnostic medical reports. The process consists of recognizing specific elements that indicate a myocardial infarction diagnosis, using a machine learning approach based on SVM algorithmes. Results are presented, focusing on the influence of a priori linguistic knowledge used to define the machine learning system.

Il text mining è un ambito di ricerca relativamente recente, che si pone l'obiettivo di ricavare informazioni automaticamente da risorse testuali digitali. Esso si basa su tecniche statistiche, linguistiche e di machine learning per analizzare dati non strutturati come i documenti di testo. In questo lavoro di tesi viene presentata una panoramica sulle principali tecniche di text mining, con un accenno alle possibili applicazioni. In seguito, è realizzato un sistema per l'estrazione automatica di informazioni da lettere di dimissione ospedaliera, che consiste nel riconoscimento di specifici elementi diagnostici tipici dell'infarto miocardico acuto. Il sistema è realizzato con un approccio di tipo machine learning, basato su algoritmi SVM. Se ne presentano i risultati, con particolare attenzione all'influenza della conoscenza a priori linguistica usata per definire il sistema di machine learning.

Text mining : riconoscimento di elementi diagnostici in lettere di dimissione ospedaliera

VAYNO, LORENZO
2009/2010

Abstract

Text mining is a quite recent research area in computer science whose aim is to automatically provide information from electronic textual resources. It combines statistical, linguistic and machine learning techniques to mine unstructured data as text documents. In this work, an overview of text mining techniques is given, together with a general presentation of possible applications. Moreover, an information extraction system is built to mine diagnostic medical reports. The process consists of recognizing specific elements that indicate a myocardial infarction diagnosis, using a machine learning approach based on SVM algorithmes. Results are presented, focusing on the influence of a priori linguistic knowledge used to define the machine learning system.
BALLERIO, STEFANO
ING II - Facolta' di Ingegneria dei Sistemi
31-mar-2011
2009/2010
Il text mining è un ambito di ricerca relativamente recente, che si pone l'obiettivo di ricavare informazioni automaticamente da risorse testuali digitali. Esso si basa su tecniche statistiche, linguistiche e di machine learning per analizzare dati non strutturati come i documenti di testo. In questo lavoro di tesi viene presentata una panoramica sulle principali tecniche di text mining, con un accenno alle possibili applicazioni. In seguito, è realizzato un sistema per l'estrazione automatica di informazioni da lettere di dimissione ospedaliera, che consiste nel riconoscimento di specifici elementi diagnostici tipici dell'infarto miocardico acuto. Il sistema è realizzato con un approccio di tipo machine learning, basato su algoritmi SVM. Se ne presentano i risultati, con particolare attenzione all'influenza della conoscenza a priori linguistica usata per definire il sistema di machine learning.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2011_03_Vayno.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.5 MB
Formato Adobe PDF
1.5 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/16605