Si chiama “KEYSTONE – Semantic keyword-based search on structured data sources ”, il progetto che vede in prima fila l’Università degli Studi di Modena e Reggio Emilia e finanziato nell’ambito di azioni COST (Cooperation europeenne dans le domaine de la recherche Scientifique et Technique).
Li guiderà il prof. Francesco Guerra dell’Università degli Studi di Modena e Reggio Emilia
La semplificazione e facilitazione della ricerca sul web per parole chiave passa dal successo di un’azione “KEYSTONE – Semantic keyword-based search on structured data sources ” (Ricerca semantica basata su keyword rivolta a sorgenti di dati strutturati), finanziata nell’ambito di un quadro intergovernativo di cooperazione europea, noto come COST (Cooperation europeenne dans le domaine de la recherche Scientifique et Technique), di cui è responsabile il ricercatore prof. Francesco Guerra del Dipartimento di Ingegneria “Enzo Ferrari” dell’Università degli Studi di Modena e Reggio Emilia.
A lui, cui sarà affiancato nel ruolo di vice il portoghese prof. Jorge Cardoso, il compito di coordinare questo progetto avviato da pochi giorni (15 ottobre) e della durata di 4 anni, che vede coinvolti gruppi di ricercatori espressione di 23 paesi (Croazia, Estonia, Finlandia, Francia, Macedonia, Germania, Grecia, Irlanda, Israele, Italia, Malta, Paesi Bassi, Norvegia, Polonia, Portogallo, Romania, Serbia, Spagna, Svizzera, Svezia, Turchia, Regno Unito e Belgio, ma a cui potrebbero aggiungersi anche colleghi di Bulgaria, e Austria. E’ la prima volta dal 1971, da quando è operativa questa cooperazione a livello europeo, che un ricercatore dell’Università degli Studi di Modena e Reggio Emilia è posto alla guida di un’azione così ambiziosa e complessa per l’elevato numero di partner coinvolti.
Obiettivo scientifico dell’azione KEYSTONE è quello di analizzare, progettare, sviluppare e valutare tecniche per la ricerca per keyword (parole chiave) su grandi quantitativi di dati strutturati.
“Si tratta – afferma il prof. Francesco Guerra, docente di Informatica all’Università degli Studi di Modena e Reggio Emilia – di un problema che ha un forte impatto sia a livello scientifico sia a livello socio-economico. A livello scientifico, la comunità ha sviluppato tecniche efficienti per fare ricerche all’interno di documenti testuali (si pensi a un qualsiasi motore di ricerca, come Google, Yahoo, Bing in grado di permettere di trovare informazioni all’interno di pagine web). Purtroppo, le tecniche sviluppate finora per fare ricerca con keyword non sono così performanti se applicate a dati strutturati (quelli all’interno di database), dove il contenuto informativo è memorizzato in opportune strutture (chiamate tabelle ad esempio nel caso di database relazionali)”.
L’ostacolo è rappresentato dal fatto che finora la ricerca all’interno di database è permessa principalmente attraverso interrogazioni, scritte mediante un opportuno linguaggio, che devono quindi rispettare un opportuno formalismo sintattico. La conoscenza di un linguaggio limita la possibilità di interrogare dati strutturati a chi conosce tale linguaggio: sicuramente non l’utente generico di internet. “Per questo – aggiunge Francesco Guerra dell’Università degli Studi di Modena e Reggio Emilia – è fondamentale sviluppare delle tecniche che permettano di interrogare per keyword (alla google per intenderci) tali sorgenti dati. Proposte sono già state fatte: anche noi, all’interno del DBGroup, il gruppo di ricerca sui database di UNIMORE coordinato dalla prof. ssa Sonia Bergamaschi, abbiamo sviluppato delle tecniche apprezzate in letteratura. Il tema è <caldo> e la necessità di collaborare, per sviluppare tecniche efficaci ed efficienti, elevata”.
Molti studi hanno dimostrato che la maggior parte dell’informazione presente sul web è posta all’interno di database (tecnicamente viene chiamato deep-web) e questo contenuto non è sempre indicizzato dai normali motori di ricerca. Inoltre, le istituzioni europee, i governi nazionali e locali stanno promuovendo la pubblicazione di dati relativi alle proprie attività in formato strutturato permettendo l’accesso e l’uso di questi dati da parte di qualsiasi persona, istituzione o impresa (si parla di open data). “L’accesso a tali dati – fa presente il prof. Francesco Guerra – sarà possibile a chiunque solo se accompagnato da un linguaggio per interrogare tali dati, semplice per chiunque. Si tratta di dati dal forte valore economico”.
Uno studio recente stima il mercato complessivo di informazioni del settore pubblico nel 2008 a 28 miliardi di euro, considerando tutta l’Unione Europea. Lo stesso studio stima nell’ordine di 140 miliardi di euro all’anno i guadagni totali economici diretti e indiretti provenienti da un più facile accesso e riuso di dati del settore pubblico in tutta l’economia dell’Unione Europea. “Appare quindi evidente anche da questi pochi elementi – ammonisce il prof. Francesco Guerra – il forte impatto socio- economico della proposta”.
Per perseguire i suoi obiettivi l’azione KEYSTONE avrà a disposizione per il 2014 un finanziamento di 150.000 euro per la realizzazione di meeting, il supporto ad attività di visiting e la realizzazione di scuole di formazione.
E’ importante tener presente che COST finanzia esclusivamente il coordinamento di ricerche nazionali e non finanzia l’attività di ricerca in sé: i fondi COST possono aiutare a sostenere spese di mobilità dei partecipanti alle azioni, ma non eventuali costi della ricerca, come acquisto di materiale sperimentale e assunzione di personale.
“Attraverso KEYSTONE – conclude il prof. Francesco Guerra -”ci aspettiamo di ottenere dei successi in ambito scientifico (pubblicazioni e brevetti), ottenuti attraverso la collaborazione tra diverse istituzioni. Ci aspettiamo inoltre con gli scambi tra ricercatori e con le scuole di formazione di contribuire alla formazione di nuovi ricercatori che svilupperanno nuove tecnologie. Ci aspettiamo inoltre che istituzioni e imprese appartenenti a KEYSTONE collaborino insieme per effettuare nuove proposte di progetti congiunti da sottoporre alle prossime chiamate di finanziamenti europei. Vorrei infine sottolineare il ruolo fondamentale dell’Ufficio Ricerca dell’Ateneo in ogni fase del percorso che ha portato alla definizione della proposta”.
Il Dipartimento di Ingegneria “Enzo Ferrari” assumerà un ruolo chiave in KEYSTONE: a esso è stato attribuito da parte dei partner della proposta il ruolo di Grant Holder, ruolo che comporta la gestione amministrativa del finanziamento per conto di tutti i partner.
“Questo progetto KEYSTONE – afferma il Rettore dell’Università dagli studi di Modena e Reggio Emilia prof. Angelo O. Andrisano – rappresenta, da un lato, una valida occasione per riaffermare il ruolo internazionale che è capace di giocare il nostro Ateneo quanto per valorizzarne le competenze presenti, tanto dal punto di vista scientifico, poiché gli è affidata la direzione di un progetto tanto innovativo ed avanzato, che dal punto di vista amministrativo, con la gestione di un consorzio molto esteso, fatto di ricercatori espressione di 23 nazioni ”.
Francesco Guerra docente all’Università degli Studi di Modena e Reggio Emilia
Francesco Guerra (http://www.dbgroup.unimo.it/~guerra/) ha ottenuto il Dottorato di Ricerca in Ingegneria dell’Informazione nel 2004 e dal novembre 2005 è ricercatore, prima presso la Facoltà di Economia “Marco Biagi”, poi dal 2012 presso il Dipartimento di Ingegneria “Enzo Ferrari” dell’Università degli Studi di Modena e Reggio Emilia. Nell’anno accademico 2013/2014 ingegna Big Data Analysis presso la laurea magistrale in Ingegneria Informatica (Dipartimento di Ingegneria “Enzo Ferrari”) e Informatica presso i corsi di laurea di Economia e Finanza e Economia Aziendale (Dipartimento di Economia “Marco Biagi”). La sua attività di ricerca che si svolge all’interno del DBGROUP (gruppo di ricerca sui database coordinato dalla prof. ssa Sonia Bergamaschi) è rivolta all’integrazione intelligente di informazioni, all’uso di agenti software intelligenti, al semantic web e alla ricerca semantica basata su keyword. Tra le principali attività di ricerca a cui ha collaborato, si elenca: (i) MOMIS, un sistema per l’integrazione di sorgenti dati basandosi su tecniche semantiche. MOMIS è stato utilizzato anche nell’ambito del Semantic Web come per la creazione di integrazione di ontologie. (ii) RELEVANT, un insieme di tecniche per l’individuazione dei “valori rilevanti” tra quelli del dominio di attributi di sorgenti dati. (iii) KEYMANTIC/KEYRY/QUEST: sistemi di keyword search basato su tecniche semantiche. Ha partecipato a progetti di ricerca nazionali ed europei. E’ membro del Program Commitee di importanti conferenze e workshop internazionali. E’ stato co-organizzatore di workshop internazionali e co-editore di numeri speciali di riviste internazionali. E’ co-editore del libro “Searching over the web” (Springer 2012).