
Modelització de Dades Complexes
Codi: 104864 Crèdits: 6| Titulació | Tipus | Curs |
|---|---|---|
| 2503852 Estadística Aplicada | OB | 3 |
Professor/a de contacte
- Nom:
- Rosario Delgado De la Torre
- Correu electrònic:
- rosario.delgado@uab.cat
Equip docent
- Rosario Delgado De la Torre
Idiomes dels grups
Podeu consultar aquesta informació al final del document.
Prerequisits
Es suposa que l'alumne que cursa aquesta assignatura ha adquirit les competències pròpies de les assignatures de
- Càlcul 1,
- Eines informàtiques per a l'Estadística i Introducció a la Programació,
- Introducció a la Probabilitat i Inferència Estdística 1, i
- Aprenentatge Automàtic 1.
Caldrà un bon nivell i pràctica en la programació amb R.
Objectius
Aprendre què són i com es fan servir les Xarxes Bayesianes: són un model probabilístic que es fa servir a l'Aprenentatge Automàtic Supervisat i que descriu les relacions de tipus probabilístic entre les variables que afecten determinat fenomen d'interès (que pot ser un sistema complex) i es poden fer servir com a classificadors.
Entendre com les Xarxes Bayesianes es fan servir per avaluar i quantificar riscos, entre altres aplicacions.
Conèixer diferents metodologies que s'hauran d'aplicar, o no, quan es treballi amb aquests models, dependent de les seves característiques, en la fase de pre-procés de la base de dades o bé en la fase de construcció del model predictiu.
Conèixer diferents mètriques de comportament per a fer la validació del model i entendre la seva utilitat i adequació, en funció de les característiques de la base de dades.
Aprendre com construir scripts de R que permetin aprendre aquests models a partir d'una base de dades i fer la seva validació, fent servir les llibreries pertinents. Aplicar-ho amb dades reals.
Resultats d'aprenentatge
- CM09 (Competència) Valorar l'adequació dels models amb la utilització i interpretació correcta d'indicadors i gràfics.
- CM09 (Competència) Valorar l'adequació dels models amb la utilització i interpretació correcta d'indicadors i gràfics.
- CM10 (Competència) Modificar el programari existent, si el model estadístic proposat ho requereix, o crear un nou programari, si és necessari.
- KM12 (Coneixement) Proporcionar les hipòtesis experimentals de la modelització, tenint en compte les implicacions tècniques i ètiques que s'hi relacionen.
- KM12 (Coneixement) Proporcionar les hipòtesis experimentals de la modelització, tenint en compte les implicacions tècniques i ètiques que s'hi relacionen.
- SM12 (Habilitat) Interpretar els resultats obtinguts per a formular conclusions sobre les hipòtesis experimentals.
- SM13 (Habilitat) Comparar el grau d'ajust entre diversos models estadístics.
- SM14 (Habilitat) Utilitzar gràfics de visualització de l'ajust i de l'adequació del model.
Continguts
- Introducció a les Xarxes Bayesianes (XBs).
Definició.
Inferència amb XBs.
Aprenentatge de XBs (tant d'estructura com de paràmetres). - Les XB com a classificadors.
La tasca de classificació dins l'Aprenentatge Automàtic Supervisat.
El criteri MAP.
Tipus de XB (Naive Bayes, Augmented Naive, TAN).
Tipus de classificació: binària, multi-class, multi-label. - La validació i les mètriques que comportament.
Validació creuada.
Mètriques pel cas binari i multi-class.
Mètriques pel cas de classificació ordinal. - Altres aspectes.
Classificació multi-dimensional.
Ensembles de classificadors.
El "concept drive" i les XBs dinàmiques.
XBs gaussianes i híbrides.
Classificació multi-instance.
Activitats formatives i Metodologia
| Títol | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|
| Tipus: Dirigides | |||
| Problemes | 14 | 0,56 | |
| Pràctiques (lliuraments, controls) | 12 | 0,48 | |
| Teoria | 26 | 1,04 | |
| Tipus: Supervisades | |||
| Tutories | 10 | 0,4 | |
| Tipus: Autònomes | |||
| Estudi i pensar problemes | 40 | 1,6 | |
| Treball pràctic amb instruments informàtics | 30 | 1,2 |
L’assignatura s’estructura a partir de classes teòriques, de problemes i de pràctiques. El seguiment de l’assignatura és presencial, però caldrà ampliar les explicacions del professor amb l’estudi autònom de l’alumne, amb el suport de la bibliografia de referència i del material facilitat pel professor.
La classe de problemes es dedicaran a la resolució orientada d’alguns problemes proposats. A les classes pràctiques es treballarà amb R i les seves llibreries. Es valorarà especialment la participació dels estudiants a les classes de problemes i pràctiques.
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.
Avaluació
Activitats d'avaluació continuada
| Títol | Pes | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|---|
| Examen | 60% | 3 | 0,12 | CM09, SM12, SM13 |
| PAC1 | 20% | 6 | 0,24 | CM09, CM10, KM12, SM12, SM13, SM14 |
| PAC2 | 20% | 9 | 0,36 | CM09, SM13 |
La qualificació final d'aquesta assignatura s'obté com la mitjana ponderada de les notes de:
- PAC1 (20%)
- PAC2 (20%)
- Examen (60%)
Les proves davaluació contínua PAC1 i PAC2 consisteixen en un lliurament de problemes/exercicis de pràctiques/treballs amb R, que es concretaran al llarg del curs, i en el seu desenvolupament en les classes presencials al llarg del semestre.
Només es tindran en compte en el càlcul de la mitjana ponderada aquelles notes que siguin com a mínim 3.5 sobre 10 (les que no ho compleixin ponderaran 0).
Per a superar l'assignatura cal que aquesta mitjana sigui almenys 5.0 sobre 10.
Si no es supera l'assignatura en primera convocatòria, l'alumne es pot presentar a recuperació. L'examen de recuperació representa el 100% de la nota final per a aquells alumnes que es presenten a la recuperació, que només poden ser alumnes que no han superat l'assignatura a la primera convocatòria (l'examen de recuperació no serveix per a millorar la nota d'alumnes que ja han aprovat).
Es considera avaluable l'alumne que hagi presentat els lliuraments PAC1 o PAC2, o s'hagi presentat a l'examen o l'examen de recuperació. En cas contrari constarà a l'acta com a No Avaluable.
Per a l'eventual assignació de Matrícules d'Honor no es tindran en compte les notes de la segona convocatòria.
Bibliografia
- Norman Fenton and Martin Neil, "Risk Assessment and Decision Analysis with Bayesian Networks", CRC Press. A Chapman & Hall Book, 2013. (Disponible en línia)
- Radhakrishnan Nagarajan, Marco Scutari and Sophie Lèbre, "Bayesian Networks in R with applications in Systems Biology", Springer, 2013. (Disponible en línia)
- Oliver Pourret, Patrick Naïm and Bruce Marcot, "Bayesian Networks. A practical guide to Applications", Series: Statistics in Practice. Wiley, 2008. (Disponible en línia)
- Richard E. Neapolitan, "Learning Bayesian Networks", Prentice Hall Series in Artificial Intelligence, 2004.
- Adnan Darwiche, "Modeling and reasoning with Bayesian networks", Cambridge, 2009.
- Kevin B. Korb and Ann E. Nicholson, "Bayesian Artificial Intelligence" (2nd edition), Series: Computer Science and Data Analysis. CRC Press. A Chapman & Hall book, 2011. (Disponible en línia)
- Daphne Koller and Nir Friedman, "Probabilistic Graphical Models", The MIT Press Cambridge, Massachusetts London, England, 2009. http://mcb111.org/w06/KollerFriedman.pdf
- Radhakrishnan Nagarajan, Marco Scutari and Sophie Lèbre, "Bayesian Networks in R with applications in systems biology", Series: Use R! Springer, 2013. (Disponible en línia)
- Marco Scutari and Jean-Baptiste Denis, "Bayesian networks with examples in R", Series: Texts in Statistical Science. CRC Press. A Chapman & Hall Book, 2015.
Programari
Es farà servir el programari R amb algunes llibreries que s'indicaran oportunament al llarg del curs. Preferiblement en l'entorn RStudio.
Llista d'idiomes
| Nom | Grup | Idioma | Semestre | Torn |
|---|---|---|---|---|
| (PLAB) Pràctiques de laboratori | 1 | Català | segon quadrimestre | tarda |
| (TE) Teoria | 1 | Català | segon quadrimestre | tarda |