|
Web Mining e Retrieval (a.a. 2013/014) Secondo Semestre |
|
|
Elenco dei File nel deposito |
|
Sommario Contenuti
1.Novità
2.Programma del Corso
3.Testi di Riferimento
4.Link Utili
5.Diapositive delle lezioni
6.Progetti ed Esercizi Proposti
|
Novità
- Risultati della Prova del 12 Settembre 2014
Verbalizzazione:
La verbalizzazione potra' essere effettuata il giorno 29 Settembre 2014 a partire dalle ore 16:30 presso l'ufficio del docente.
-
Sessione Recupero di Settembre:
Le prove dell'esame nel mese di Settembre seguiranno il seguente orairo:
- Primo appello recupero: 12/09/2014, alle ore 14:30, Aula B2.
- Secondo appello recupero: 25/09/2014, alle ore 14:30, Aula B2.
.
Si ricorda di procedere alla registrazione all'esame presso il sito: DELPHI .
-
ANNUNCIO:
Cambiamento dell'orario della prova ORALE:
La prova orale prevista per il 4 Agosto alle ore 15:30 è SPOSTATA alle ore 13:00 dello stesso giorno.
- Risultati della Prova del 23 Luglio 2014
ORALE:
La prova orale potra' essere effettuata da tutti gli studenti ammessi all'orale il giorno 31 Luglio 2014 a partie dalle ore 14:30.
Scelta dei Progetti. Gli studenti sono invitati a concordare i progetti con uno dei docenti del Corso. Alternativamente gli studenti possono presentare all'orale (mediante slide Powerpoint) la discussione di uno o più paper scientifici sui temi dl Corso, cosi' come proposti alla seguente PAGINA.
Date alternative. Gli studenti sono pregati di contattare il docente per concordare date alternative.
.
-
Si comunica che l'Aula della Prova del 23 Luglio sara' l'Aula C7
.
-
Lavori utili per la selezione degli articoli scientifici da discutere durante la prova orale.
Durante la prova orale potra' essere utilizzata una presentazione a sintesi e commento critico del lavoro (o dei lavori) prescelti o a supporto alla presentazione del progetto e dei risultati sperimentali.
Gli studenti sono invitati a comunicare al docente la scelta dei lavori o del progetto per l'orale.
.
-
Risultati della Prova del 7 Luglio
La prova orale potra' essere effettuata il giorno 23 Luglio durante la prova scritta. Gli studenti sono pregati di contattare il docente per concordare date alternative.
.
-
ATTENZIONE tutti gli studenti che hanno superato il primo esonero sono pregati di effettuare la registrazione alla prova del 7 o del 23 Luglio 2014 per consentire la registrazione del verbale d'esame.
.
-
Sono disponibili esercizi d'esame per la preparazione del Secondo esonero .
.
-
Date appelli della Sessione Estiva::
- Secondo esonero / Primo appello: Lunedì 7 Luglio 2014, Aula da confermare.
- Secondo appello: Mercoledì 23 Luglio 2014, Aula C7.
.
-
Attenzione!! La lezione di oggi, Lunedi' 16 Giugno alle ore 16:00 è cancellata a causa di gravi motivi personali che coinvolgono il gruppo dei docenti coinvolti el Corso. La lezione verrà recuperata Lunedi' 23 Giugno.
- Risultati Definitivi del Test a Risposte Multiple del Test Intermedio di Lunedi' 12 Maggio.
-
Risultati del Test a Risposte Multiple del Test Intermedio di Lunedi' 12 Maggio.
-
Sono disponibili ulteriori esercizi d'esame per la preparazione del Test Intermedio (prova a risposta multipla e domanda aperta)che si terra' Lunedi' 12 Maggio 2014 alle ore 16:00 durante (e nell'aula del)la lezione. Si ricorda di procedere alla registrazione all'esame presso il sito: DELPHI .
-
Il Test Intermedio (prova a risposta multipla e domanda aperta) si terra' Lunedi' 12 Maggio 2014 alle ore 16:00 durante (e nell'aula del)la lezione. Gli studenti sono pregati di registrarsi all'esame presso il sito: DELPHI .
- Lezione di Introduzione al Test Intermedio (a.a. 2013-2014).
-
Clustering Exercise.
Design of Clustering Algorithms on Controlled Datasets.
The full accomplishent of the exercise can be delivered by e-mail to the teacher, and WILL BE PART of the final Course evaluation.
-
A Day with Robots: Human-Robot Interaction Seminar
Il giorno Venerdi' 7 Marzo alle ore 15:30 si terra' in Aula B3, un laboratorio di Robotica ed Intelligenza Artificiale, dove gli studenti potranno interagire con robot in grado di eseguire attività domestiche, controllati da interfacce vocali. Nell'incontro verranno presentati i principali paradigmi delle tecnologie di Human Robot Interaction e la loro applicazione nei domini della domotica e della Robocup.
- Programma del Corso, a.a. 2012-13
Le diapositive delle lezioni saranno pubblicate durante il ciclo di lezioni su queste pagine.
- ATTENZIONE - Gli orari ed aule delle lezioni per l'anno accademico 2013-2014 sono i seguenti:
- Lunedi' 16:00 - 18:00 AULA C3 - Edificio Nuovo della Didattica, presso la Facolta' di Ingegneria
- Martedi' 16:30 - 18:00 AULA C4 - Edificio Nuovo della Didattica, presso la Facolta' di Ingegneria
- Mercoledi' 16:30 - 18:00 AULA C3 - Edificio Nuovo della Didattica, presso la Facolta' di Ingegneria
|
Programma
Programma del Corso (a.a. 2013/14)
|
Testi di Riferimento
-
IR - Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. Find the book Home page HERE.
-
ML - Pattern Recognition and Machine learning, C. Bishop. Springer. 2006.
-
ML ed IR - Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
-
Web IR - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, July 2011, Springer.
- Dispense fornite dal docente
|
Lezioni (Lucidi)
-
Lezione 0: Introduzione al Corso WMR. Organizzazione e Modalita' didattiche.
-
Lezione 1: Introduzione al Web Mining & Retrieval
-
Lezione 2: Probability and Learning: an introduction to Naive Bayes classifiers
-
Lezione 3: Introduction to Geometrical models of text classification: Profile-based classification, Rocchio and k-NN.
-
Lezione 4: Introduction to Unsupervised Learning as applied in Instance Clustering: similarity, metrics, algorithms and evaluation.
-
Clustering Exercise.
Design of Clustering Algorithms on Controlled Datasets.
The full accomplishent of the exercise can be delivered by e-mail to the teacher, and WILL BE PART of the final Course evaluation.
-
Lezione 5: Evaluation of Machine Learning algorithms.
-
Lezione 6: Introduction to Markov models: Sequence classification, Language Models, Hidden Markov Models. (Versione per la stampa BN QUI)
- (Argomento Facoltativo non trattato a lezione) Lezione 6A Estimation. (Versione per la stampa BN QUI)
- Lezione 7 Introduction to PAC learning and VC dimension.
The slides used for the 2011-12 course have been postedited from a kindly published version by Ethem Alpaydin, that you can find HERE.
Further details on the PAC learnability and proof of the structural risk analysis over rectangles are given HERE (PAC Learning) and HERE (VC dimension).
- Lezione 8 (Modified: ) Support Vector Machines.
- Lezione 8a. Esercitazione pratica sulla piattaforma SVM Light:
utilizzo della piattaforma per la classificazione di un dataset fornito secondo la sintassi Weka. Risorse:
- Lezione 9 Kernel-based learning.
- Lezione 9.1 : Tree Kernels.
- Kernel exercise: Question Classification training/test material. In the folder you can find the original data, as well as the Bag-of-Word and Tree representations for the Entity class.
- Lezione 10 Latent Semantic Analysis and Machine Learning.
-
Lezione 11Introduction to On-Line Learning algorithms. See also:
-
Lezione 12: Ensemble Classifiers and Semi-supervised learning (edited version of slides from Chapter 3 and Chapter 5 of "Web Data Mining”, by Bing Liu)..
- Lezione 13: Introduzione all'Information Retrieval
- Lezione 14: Modelli di Information Retrieval. Una presentazione di H. Schutze sui differenti modelli di weighting e sulle varianti utilizzate nei sistemi correnti e' presente presso il "sito del libro di testo
.
- Lezione 15 Metodi di query processing (dalle slide di H. Schutze disponibili QUI)
-
Lezione 16: un Sistema di Information Retrieval: Lucene.
- Lezione 17 Introduzione al Web Search (dalle lezioni di Hinrich Shutze)
- Lezione 18 Link Analysis and Web Search (dalle lezioni di Hinrich Shutze)
- Dal Web Search al Question Answering
- Lezione 20. Web Crawling and Clustering.
- Lezione 21 Opinion Mining.
See also:
- Lezione 22 A survey of Semantic Methods in Web applications: Machine Learning, Language Processing and Web Mining.
- Lezione 23 Use of a Content-Processing tool for Topical Classification or Sentiment Analysis over Social Media data..
- Access to the Java code ad resources HERE.
- Lezione 24 Statistical NL Parsing..
- Lezione 25 Shallow Parsing with SVM-HMM..
|
Link Utili
|
Progetti ed Esercizi
|