Animal behaviour has always been of great interest to humankind. Primates in particular have been subject of countless studies that tried to model the reasoning behind their actions. Nonetheless, few definitive models have been found mostly because the on-field nature of these studies limits the scope to few samples only. In recent years GPS trackers have partially solved this problem, with the complexity shifting towards the analysis of the acquired data. At the same time, Computer Science has made a huge leap forward in the analysis of large datasets with the development of data mining techniques, however their diffusion in behavioural studies has been very limited and their results rarely accepted by the biological community. In this thesis I present a new framework for the evaluation of animal behaviour models, proposed by biologists, using data-mining techniques applied to data acquired via GPS. In particular I will compare two models describing the foraging behaviour of spider monkeys on the Barro Colorado Island. I also propose an innovative validation methodology that actively involves biologists fostering their interest toward computational techniques. The framework follows a traditional supervised approach, albeit with a twist for the training set. For each of the considered behavioural models, an algorithm has been designed that generates artificial data corresponding to the a priori model, which are then used to train a classifier to distinguish the two models. The classifier will be applied to the real data and the distribution of the resulting labelling indicates which model better describes real data. To properly validate the result, part of both real and artificial data is also labelled by biologists and will be used as ground truth. Proper randomization as well as multiple visualization modes are used to evaluate the biologists' bias and properly compensate. Results for the case in study proves the effectiveness of the proposed framework, whilst also underlining the importance of the biological assumptions required for the generation of artificial data.

Il comportamento degli animali è sempre stato di grande interesse per l'umanità. Sono stati sviluppati diversi studi, sui primati in particolare, ma solo pochi modelli sono stati effettivamente validati a causa della necessità di osservare gli animali sul campo, limitandone l'analisi a soli pochi esemplari. Recentemente, i tracker GPS hanno parzialmente risolto il problema spostando però la complessità all'analisi dei dati. Contemporaneamente, la Computer Science ha fatto significativi passi avanti nell'analisi di grandi quantità di dati grazie alle tecniche di data mining. Il loro uso però deve ancora affermarsi nell'ambito dell'analisi del comportamento animale ed è difficilmente accettato dalla comunità scientifica degli esperti di comportamento. In questa tesi propogo un nuovo framework per confrontare modelli di comportamento animale con tecniche di data mining, utilizzando come caso studio il processo di ricerca del cibo delle scimmie Ateles Geoffroy sull'isola di Barro Colorado. In aggiunta, viene proposto un metodo innovativo di validazione dei risultati che coinvolge direttamente i biologi. Il framework si basa su un approcio supervisionato: per ogni modello comportamentale è stato elaborato un algoritmo che genera dei dati secondo la logica del modello stesso. Questi dati sono quindi utilizzati per fare training di un classificatore, applicato poi ai dati reali per estrarre il modello più realistico. Per validare questo risultato parte dei dati vengono sottoposti a classificazione da parte dei biologi: Una varietà di tecniche visive e combinazione di dati artificiali e reali viene utilizzata per identificare e compensare il bias personale. I risultati ottenuti indicano la validità del framework, rimarcando però l'importanza della collaborazione coi biologi per la corretta implementazione dei modelli di comportamento considerati.

Comparison and Validation of animal behavioural models with computational methods: the case study of spider monkey's foraging behaviour

MILANTA, ANDREA
2017/2018

Abstract

Animal behaviour has always been of great interest to humankind. Primates in particular have been subject of countless studies that tried to model the reasoning behind their actions. Nonetheless, few definitive models have been found mostly because the on-field nature of these studies limits the scope to few samples only. In recent years GPS trackers have partially solved this problem, with the complexity shifting towards the analysis of the acquired data. At the same time, Computer Science has made a huge leap forward in the analysis of large datasets with the development of data mining techniques, however their diffusion in behavioural studies has been very limited and their results rarely accepted by the biological community. In this thesis I present a new framework for the evaluation of animal behaviour models, proposed by biologists, using data-mining techniques applied to data acquired via GPS. In particular I will compare two models describing the foraging behaviour of spider monkeys on the Barro Colorado Island. I also propose an innovative validation methodology that actively involves biologists fostering their interest toward computational techniques. The framework follows a traditional supervised approach, albeit with a twist for the training set. For each of the considered behavioural models, an algorithm has been designed that generates artificial data corresponding to the a priori model, which are then used to train a classifier to distinguish the two models. The classifier will be applied to the real data and the distribution of the resulting labelling indicates which model better describes real data. To properly validate the result, part of both real and artificial data is also labelled by biologists and will be used as ground truth. Proper randomization as well as multiple visualization modes are used to evaluate the biologists' bias and properly compensate. Results for the case in study proves the effectiveness of the proposed framework, whilst also underlining the importance of the biological assumptions required for the generation of artificial data.
ING - Scuola di Ingegneria Industriale e dell'Informazione
16-apr-2019
2017/2018
Il comportamento degli animali è sempre stato di grande interesse per l'umanità. Sono stati sviluppati diversi studi, sui primati in particolare, ma solo pochi modelli sono stati effettivamente validati a causa della necessità di osservare gli animali sul campo, limitandone l'analisi a soli pochi esemplari. Recentemente, i tracker GPS hanno parzialmente risolto il problema spostando però la complessità all'analisi dei dati. Contemporaneamente, la Computer Science ha fatto significativi passi avanti nell'analisi di grandi quantità di dati grazie alle tecniche di data mining. Il loro uso però deve ancora affermarsi nell'ambito dell'analisi del comportamento animale ed è difficilmente accettato dalla comunità scientifica degli esperti di comportamento. In questa tesi propogo un nuovo framework per confrontare modelli di comportamento animale con tecniche di data mining, utilizzando come caso studio il processo di ricerca del cibo delle scimmie Ateles Geoffroy sull'isola di Barro Colorado. In aggiunta, viene proposto un metodo innovativo di validazione dei risultati che coinvolge direttamente i biologi. Il framework si basa su un approcio supervisionato: per ogni modello comportamentale è stato elaborato un algoritmo che genera dei dati secondo la logica del modello stesso. Questi dati sono quindi utilizzati per fare training di un classificatore, applicato poi ai dati reali per estrarre il modello più realistico. Per validare questo risultato parte dei dati vengono sottoposti a classificazione da parte dei biologi: Una varietà di tecniche visive e combinazione di dati artificiali e reali viene utilizzata per identificare e compensare il bias personale. I risultati ottenuti indicano la validità del framework, rimarcando però l'importanza della collaborazione coi biologi per la corretta implementazione dei modelli di comportamento considerati.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis text
Dimensione 4.29 MB
Formato Adobe PDF
4.29 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/147430