Knowedge Engineering
Benvenuto nella pagina del corso di Knowledge Engineering, dedicato alle tematiche della rappresentazione e gestione della conoscenza, con particolare riferimento al Semantic Web e i Linked Open Data. Questa pagina contiene tutto il materiale didattico aggiornato.
Avvisi
Le lezioni del 07/11/2022 e del 09/11/2022 sono annullate, come preannunciato, dato che il docente è in missione.Programma
Introduzione ai dati aperti. I 5 livelli di qualità dei dati aperti fissati dalla W3C. Licenze sui dati: licenze libere/aperte. Dati, metadati, vocabolari dei dati, ontologie, tesauri: ambiguità terminologiche in uno scenario inerentemente intersettoriale. Il valore economico dei dati. Open Data per il dominio dei Patrimoni Culturali. Il Web Semantico: una introduzione. Il Web Semantico e gli Open Data: Linked Open Data e il Web. Modelli dei dati e della conoscenza per il Web. Multilingualità e diffusione: aspetti denotazionali, proprietà terminologiche e modelli di lessico avanzato. Interazione lessico-semantica. SPARQL: un linguaggio di interrogazione dei dati RDF e assieme un protocollo di accesso ai dati aperti Metadati: importanza dei metadata e nel loro ruolo per l’autonomia delle macchine nel web LOD Cloud: la “nuvola” dei Linked Open Data nel Web, un bootstrap del Semantic Web, ma anche una contraddizione in essere Dataset repositories e portali; Tecnologie per i Linked Open Data: Triple stores. RDF API e Middleware. Ontology Editors, Thesauri Editors, differenti paradigmi e dimensioni d’uso ETL in chiave RDF: triplificazione di sorgenti legacy e/o non strutturate. Pubblicazione dei dati aperti: standard e best practices. Validazione sintattica di RDF: SHACL.
Ripasso di argomenti del corso di IA1: Rappresentazione della Conoscenza; Logiche Descrittive
Materiale didattico di accompagno al corso
Oltre al libro Semantic Web for the Working Ontologist (2nd edition) gli studenti avranno a disposizione diverse slide preparate dal docente, che includono link ad ulteriore materiale di approfondimento.
Di seguito, gli argomenti del corso e le relative slide e/o materiale di riferimento
- Slide: KE - 1. Introduzione al Corso
- Una UI Web-based SPARQL per interrogare SPARQL endpoint sul Web: YASGUI
- Il portale dei dati del Senato: dati.senato.it
- Il tesauro Agrovoc: http://agrovoc.uniroma2.it/agrovoc/
- Il file VoID dei metadati machine-exploitable di Agrovoc: aims.fao.org/aos/agrovoc/void.ttl
- Slide: KE - 2. Gli Open Data
- Slide: KE - 3. Semantic Web Intro
- Slide: KE - 4. RDF/RDFS
- Slide: KE - 5. OWL
- Slide: KE - 6. Linked Open Data
- Slide: KE - 7. OWL2
- Slide: IC - 8. SPARQL
- Slide: KE - 9. SPARQL 1.1
- Slide: KE - 10. SKOS Intro
- Slide: KE - 11. SKOS
- Slide: KE - 12. Ontolex-Lemon
- Slide: KE - 13. RDF4J
- Slide: KE - 14. GraphDB + LOV
- Slide: KE - 15. Esercizi Reasoning
- Slide: KE - 16. SHACL by example
- Slide: KE - 17. Protege e VocBench
Introduzione al Corso, una "passeggiata" per i Linked Open Data. Lista delle risorse utilizzate e dei siti, pagine e dataset visitati
Introduzione ai dati aperti. Il valore economico dei dati. I 5 livelli di qualità dei dati aperti fissati dalla W3C. Licenze sui dati: licenze libere/aperte.
Il Web Semantico: una introduzione.
RDF: Resource Description Framework; RDFS: da un modello dei dati ad un modello di conoscenza
OWL: Il Web Ontology Language
Un bootstrap al Semantic Web: i Linked Open Data
L'evoluzione del Web Ontology Language: OWL2
Un protocollo di accesso ai dati e un linguaggio di interrogazione per il Web: SPARQL
SPARQL 1.1, per un read-write Semantic Web
Thesauri building with SKOS
SKOS - Simple Knowledge Organization System
OntoLex-Lemon, rappresentazione di lessici e di interfacce ontolinguistiche
RDF4J, uno dei più noti middleware Java per la gestione di dati RDF
GraphDB, un triple store altamente performante per lo storage di dati RDF e per reasoning OWL Linked Open Vocabularies: un vocabolario di metadati per ontologie OWL
Esercizi di Reasoning: sessioni pratiche su GraphDB
SHACL by example: RDF validation tutorial
Protege e VocBench
Esercizi
Codice degli esempi mostrati durante l'esercitazione su RDF4J
Alcuni esempi basilari su OWL Reasoning
Alcuni esercizi su OWL Reasoning
Ulteriori esercizi su OWL Reasoning
Compiti di Prova
Riportiamo alcuni esempi di prove d'esame, prese da compiti realmente assegnati negli anni precedenti:
- Corte dei Re (OWL Reasoning) + Formula 1 (SPARQL)
- OWL Reasoning: Beni Immobili
- SPARQL: Multe sul Treno
Modalità d'esame
La prova d'esame è articolata in
- scritto
- orale
- progetto (solo per chi ha la versione del corso da 9 c.f.u., ossia chi nell'AA2019-2020 era al secondo anno)
Lo scritto consta di due macro esercizi:
- il primo esercizio fornisce un frammento di ontologia e chiede di derivare tutto ciò che può essere inferito (ulteriori assiomi, materializzazioni di tipi di istanze etc..) e di scovare eventuali inconsistenze
- il secondo, partendo da un file RDF contentente sia un vocabolario che una piccola base di conoscenza modellata tramite esso, richiede di:
- di descrivere alcuni concetti complessi (ogni sintassi è accetta: in DL, manchester syntax o qls sintassi owl)
- di fare delle query sparql
- di fare delle update sparql
Al fine di svolgere il compito, sono utili o necessari i seguenti:
- un computer, dove poter quantomeno visualizzare il testo RDF degli esercizi e leggere/caricare i compiti, e poter avviare in caso i seguenti software
- un triple store con interfaccia SPARQL (e.g. il workbench di GraphDB)
- un sistema di data management visuale (e.g. VocBench)
Dei due software, suggerirei almeno il triple store con interfaccia SPARQL (per poter verificare le query/update SPARQL sviluppate), anche se il secondo può coprire anche le esigenze del primo (e.g. se usate VocBench, avete una interfaccia SPARQL oltre alla visione delle gerarchie di classi, proprietà, concetti e dei dettagli degli stessi)
La modalità di esame a distanza dettata dall'emergenza COVID-19 prevede la stessa tipologia di esame, svolto su piattaforma Teams, secondo le modalità dettate dall'Ateneo. Gli scritti verranno acceduti tramite una "Attività" in Teams e sarà possibile, mediamente lo stesso strumento, caricare una versione elettronica del compito svolto.si ricordano i requisiti tecnologici per poter svolgere l'esame in modalità a distanza
- a. Requisiti Hardware: un computer dotato di webcam e microfono (in alternativa anche un tablet o uno smartphone, purché dotati di una buona velocità di connessione).
- b. Requisiti software: aver attivato un account Office365 secondo le istruzioni di Ateneo, TEAMS desktop, da scaricare da https://teams.microsoft.com/downloads
- c. Requisiti di rete: Per una videochiamata di gruppo di buona qualità i requisiti minimidi rete sono 500kbps (upload) / 1Mbps (download). Si raccomanda di verificare la velocità di connessione, effettuando, eventualmente, uno speed test online (per esempio con https://www.speedtest.net/).
È stato attivato il 16/06 il corso su Delphi (solamente ai fini degli esami) e di conseguenza il corso su Teams, chiamato "STELLATO-8066497-INTELLIGENZA_ARTIFICIALE_2". Vi verrà comunicato prima dell'esame il canale cui iscrivervi