Smart-home environments increasingly employ non-intrusive ambient sensors to support aging in place, offering continuous and privacy-preserving monitoring of daily routines. While existing research largely focuses on segment-level Human Activity Recognition (HAR), few methods address the unsupervised discovery of day-level behavioral patterns. We introduce a hybrid pipeline that combines a transformer-based encoder and a graph-based refinement algorithm to identify recurring daily patterns from minute-resolution sequences of labeled activities without habit annotations. The refinement stage involves using symbolic similarity measures, community detection algorithms inside graphs, and a novel background elimination algorithm called Common Pattern Removal (ComPaRe). Because no dataset provides ground-truth habit labels, a lightweight simulator is developed to generate synthetic personas with configurable weekly and monthly routines. This enables controlled evaluation of the clustering procedure and assessment of its ability to recover known multi-day structures. Experiments on both simulated and real smart-home datasets demonstrate that the combination of learned day embeddings and symbolic refinement isolates distinctive routine patterns and separates days according to their temporal organization.

Gli ambienti smart-home impiegano sempre piu sensori ambientali non intrusivi per supportare l'"aging in place", offrendo un monitoraggio continuo e rispettoso della privacy delle routine quotidiane. Sebbene la ricerca esistente si concentri principalmente sul riconoscimento delle attivita umane (Human Activity Recognition, HAR) a livello di singolo segmento, pochi metodi affrontano l'individuazione automatica non supervisionata di pattern comportamentali a livello di giornata. In questo lavoro introduciamo un processo ibrido che combina un encoder basato su transformer con un algoritmo di raffinamento su grafi, al fine di identificare pattern giornalieri ricorrenti a partire da sequenze, con risoluzione al minuto, di attivita etichettate, senza alcuna annotazione relativa alle abitudini. La fase di raffinamento utilizza misure di similarita simbolica, algoritmi di rilevamento di comunita su grafi e un nuovo algoritmo di eliminazione del background, denominato Common Pattern Removal (ComPaRe). Poiche nessun dataset disponibile fornisce etichette di verita (ground truth) sulle abitudini, e stato sviluppato un simulatore in grado di generare profili comportamentali (personas) sintetici con routine settimanali e mensili configurabili. Cio permette una valutazione controllata della procedura di clustering e un'analisi della sua capacita di recuperare strutture multi-giornaliere note. Esperimenti condotti sia su dataset simulati sia su dataset reali di smart-home dimostrano che la combinazione di embedding giornalieri appresi e del raffinamento simbolico isola pattern di routine distintivi e separa le giornate in base alla loro organizzazione temporale.

Transformer-based activity clustering for routine discovery in smart homes

Fiocchi, Edoardo;MANUZZI, GIULIO
2024/2025

Abstract

Smart-home environments increasingly employ non-intrusive ambient sensors to support aging in place, offering continuous and privacy-preserving monitoring of daily routines. While existing research largely focuses on segment-level Human Activity Recognition (HAR), few methods address the unsupervised discovery of day-level behavioral patterns. We introduce a hybrid pipeline that combines a transformer-based encoder and a graph-based refinement algorithm to identify recurring daily patterns from minute-resolution sequences of labeled activities without habit annotations. The refinement stage involves using symbolic similarity measures, community detection algorithms inside graphs, and a novel background elimination algorithm called Common Pattern Removal (ComPaRe). Because no dataset provides ground-truth habit labels, a lightweight simulator is developed to generate synthetic personas with configurable weekly and monthly routines. This enables controlled evaluation of the clustering procedure and assessment of its ability to recover known multi-day structures. Experiments on both simulated and real smart-home datasets demonstrate that the combination of learned day embeddings and symbolic refinement isolates distinctive routine patterns and separates days according to their temporal organization.
SALICE, FABIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
Gli ambienti smart-home impiegano sempre piu sensori ambientali non intrusivi per supportare l'"aging in place", offrendo un monitoraggio continuo e rispettoso della privacy delle routine quotidiane. Sebbene la ricerca esistente si concentri principalmente sul riconoscimento delle attivita umane (Human Activity Recognition, HAR) a livello di singolo segmento, pochi metodi affrontano l'individuazione automatica non supervisionata di pattern comportamentali a livello di giornata. In questo lavoro introduciamo un processo ibrido che combina un encoder basato su transformer con un algoritmo di raffinamento su grafi, al fine di identificare pattern giornalieri ricorrenti a partire da sequenze, con risoluzione al minuto, di attivita etichettate, senza alcuna annotazione relativa alle abitudini. La fase di raffinamento utilizza misure di similarita simbolica, algoritmi di rilevamento di comunita su grafi e un nuovo algoritmo di eliminazione del background, denominato Common Pattern Removal (ComPaRe). Poiche nessun dataset disponibile fornisce etichette di verita (ground truth) sulle abitudini, e stato sviluppato un simulatore in grado di generare profili comportamentali (personas) sintetici con routine settimanali e mensili configurabili. Cio permette una valutazione controllata della procedura di clustering e un'analisi della sua capacita di recuperare strutture multi-giornaliere note. Esperimenti condotti sia su dataset simulati sia su dataset reali di smart-home dimostrano che la combinazione di embedding giornalieri appresi e del raffinamento simbolico isola pattern di routine distintivi e separa le giornate in base alla loro organizzazione temporale.
File allegati
File Dimensione Formato  
2025_12_Fiocchi_Manuzzi_Tesi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 12.08 MB
Formato Adobe PDF
12.08 MB Adobe PDF Visualizza/Apri
2025_12_Fiocchi_Manuzzi_Executive Summary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 1.31 MB
Formato Adobe PDF
1.31 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/247448