Questa pagina contiene una brevissima descrizione di alcune proposte di tesi. L’elenco è parziale e probabilmente insufficiente ma (spero) utile per avere un’idea di possibili lavori. Probabile che ci siano nuovi lavori in cantiere non riportati in questa pagina.

Chi è interessato può contattarmi via mail per qualunque domanda e/o per fissare un appuntamento e parlarne più in dettaglio.

Real-time collaborative editor e comunicazione sincrona
Obiettivo della tesi è progettare e implementare meccanismi per analizzare il modo in cui gli utenti usano strumenti di chat mentre editano documenti collaborativamente, con strumenti come GoogleDocs, Apache Wave. L’ambiente di test è EtherPad lite, che abbiamo già studiato in altri lavori. Il lavoro consiste nell’analisi dei log di Etherpad Lite per capire se, ad esempio, gli utenti discutono in chat e poi applicano le modifiche, o se non usano la chat, o se usano la chat in gruppi ristretti e altri pattern di questo tipo.
Tecnologie principali: PHP (o altri linguaggi server-side).
Formatter CSS per la stampa: stato dell’arte e potentialità
Obiettivo della tesi è analizzare in modo sistematico, e in particolare attraverso la creazione di documenti e layout, lo stato dell’arte di CSS for printing. CSS3 infatti include diverse opzioni per generare layout sofisticati per la stampa a partire da documenti HTML. Esistono varie implementazioni dello standard, ad esempio AntennaHouse o PrinceXML, il cui supporto però è molto variegato. Il lavoro consiste nel riprodurre documenti reali, derivati da un progetto precedente ma realizzati con tecnologie XSL-FO, e verificare se i formatter CSS sono in grado di ottenere lo stesso risultato. La tesi, oltre al report, propose uno schema di analisi e una test-suite per monitore lo stato dell’arte.
Tecnologie principali: HTML, CSS.
Analisi della posizione delle citazioni in articoli scientifici
Obiettivo della tesi è progettare e implementare uno strumento in grado di analizzare articoli scientifici in formato XML, conformi ad uno specifico DTD, e identificare la posizione delle citazioni all’interno di questi articoli. E’ interessante infatti capire se, ad esempio, un articolo è citato insieme a molti altri, oppure nella sezione related works o nell’introduzione o in altre sezioni significative del paper. L’uso delle citazioni infatti varia di molto da disciplina a disciplina. L’obiettivo della tesi è estrarre statistiche e pattern.Tesi assegnata
Tecnologie principali: XML, XPath, linguaggio server-side

Analisi di ambienti di authoring (open-source) per contenuti e-learning
I recenti sviluppi del Web, in particolare HMTL5 e CSS3, stanno influenzando anche i sistemi e-learning, che per molto tempo si sono basati su SCORM. Obiettivo della tesi è studiare gli ambienti di produzione di contenuti e-learning basati su HTML5. Particolare attenzione va data alla facilità d’uso di questi strumenti e alla possibilità di personalizzarli ed estenderli, motivo per cui partiamo dall’analisi di strumenti open-source. Particolarmente interessante inoltre è lo studio degli strumenti di authoring per MOOC (Massive On-line Open Courses). Tesi assegnata.
Tecnologie principali: HTML, Jascacript, linguaggi server-side, SCORM.
Estrazione di informazioni da PDF
Obiettivo della tesi è progettare e implementare un’applicazione in grado di estrarre informazioni da articoli scientifici in formato PDF. L’idea di base è, ad esempio, estrarre tutti i titoli di primo livello, oppure le didascalie delle immagini o delle tabelle.
Il lavoro si concentra su alcuni stili di documenti (LNCS e ACM) e prevede l’uso di librerie esistenti per l’estrazione di frammenti da PDF, frammenti che vanno riassemblati, riordinati ed espressi in modo corretto.
Tecnologie principali: Interessante sperimentare una soluzione basata su PDFMiner e XSLT ma va benissimo esplorare anche altri approcci (e altri linguaggi). Tesi conclusa.
Estensione di un ambiente di navigazione di articoli scientifici
Obiettivo della tesi è estendere un’applicazione per la navigazione, analisi e ricerca di articoli scientifici e citazioni. La base di dati su cui questo browser lavora è in formato RDF e conforme ad ontologie note in ambito Semantic Publishing (e Semantic Web). L’applicazione va inoltre estesa per permettere aggregazioni ed analisi sofisticate dei dati. Tesi conclusa.
Tecnologie principali: NodeJS, Javascript, RDF.
Analisi del comportamento degli utenti nell’uso di real-time collaborative editor
Obiettivo della tesi è progettare e implementare meccanismi per analizzare il modo in cui gli utenti usano strumenti di editing collaborativo, come GoogleDocs o EtherPad lite. L’obiettivo principale è analizzare l’interazione con il tool ed il comportamento ‘live’ degli utenti. Il tool potrebbe essere quindi implementato come estensione di editor esistenti e dovrà tenere traccia delle modifiche fatte, dei pattern di modifica e di interazione tra i diversi autori. Il lavoro prevede anche un test con gli utenti. Tesi conclusa
Estrazione di informazioni da articoli di Economia
Obiettivo della tesi è progettare e implementare meccanismi per estrarre informazioni da un corpus di articoli di Economia pubblicati su Web. Oltre all’estrazione dei dati la tesi si pone l’obiettivo di organizzarli e pubblicarli in un formato aperto, compatibile con le tecnologie del Semantic Web, in modo da derivare nuove informazioni. Tesi conclusa
Personalizzazione di un framework CSS per visualizzare contenuti side-by-side
Obiettivo della tesi è estendere un framework CSS, ad esempio Bootstrap, per permettere la visualizzazione sofisticata di contenuti side-by-side (ossia organizzati su due o più colonne, con blocchi di testo allineati come ad esempio traduzioni, disegni di legge, versioni) su Web e il controllo delle proprietà di sincronizzazione dei testi, paginazione e allineamento. Tesi conclusa.
No Profit Web Scraper
Obiettivo della tesi è realizzare un sistema per raccogliere, sistematizzare e rendere fruibili informazioni su associazioni no profit sul territorio (in particolare, su attività, corsi ed eventi) e fornire servizi su questa base di conoscenza. Tesi conclusa.
Semantic Publishing: dataset e progetti
Obiettivo della tesi è fare un rassegna esaustiva dei dataset pubblicati (es: DBLP Linked Data, Nature Linked Data, OpenCitation) e dei progetti attivi (es: ROHub, LinkItUp, RExplore) nel contesto del Semantic Publishing. In questo caso il termine ‘Semantic Publishing’ viene usato per indicare la pubblicazione di articoli scientifici e in generale di risultati/prodotti della ricerca in formati arricchiti con informazioni semantiche. Oltre alla catalogazione, è richiesta l’analisi dei dataset e delle piattaforme. Tesi conclusa.