
Introducció a la Visió Humana i per Computador
Codi: 44772 Crèdits: 6| Titulació | Tipus | Curs |
|---|---|---|
| Visió per Computador | OB | 1 |
Professor/a de contacte
- Nom:
- Maria Vanrell Martorell
- Correu electrònic:
- maria.vanrell@uab.cat
Equip docent
- Javier Vazquez Corral
- Javier Ruiz Hidalgo
- Ramon Morros Rubio
- Philippe Salembier Clairon
Idiomes dels grups
Podeu consultar aquesta informació al final del document.
Prerequisits
Grau en Enginyeria, Matemàtiques, Física o similar.
Objectius
Coordinador del mòdul: Dr. Philippe Salembier
L'objectiu d'aquest mòdul és presentar als estudiants la visió per ordinador, inclosos els conceptes bàsics del sistema visual humà i la percepció, l'adquisició i el processament d'imatges. En termes de processament, el mòdul se centra en transformacions de baix nivell (basades en píxels), filtrat lineal, no lineal i morfològic, anàlisi de Fourier, representacions multiescala, extracció de característiques simples i descripcions d'imatges. A més, es presenten estratègies de classificació, segmentació i classificació elemental, així com metodologies d'avaluació de la qualitat dels algoritmes de processament d'imatges. Per posar en pràctica els algoritmes i tècniques, els estudiants treballaran en un projecte concret al llarg del curs. L'objectiu és proporcionar un coneixement aplicat d'una àmplia varietat de tècniques de visió per ordinador aplicades per resoldre problemes de visió del món real. L'objectiu del projecte és detectar objectes específics en imatges utilitzant tècniques bàsiques com segmentació, filtrat lineal i no lineal, agrupació, reconocimeinto de patrons, modelatge, etc. El coneixement obtingut es pot utilitzar per a una àmplia varietat d'aplicacions, per exemple, el control de qualitat, la detecció d'objectes genèrics, aplicacions de seguretat, etc.
Resultats d'aprenentatge
- CA06 (Competència) Aconseguir els objectius d'un projecte de visió fet en equip.
- KA01 (Coneixement) Identificar els mòduls de baix nivell, com ara preprocessament, extracció o agrupació de característiques, que són necessaris per solucionar un problema de visió.
- KA08 (Coneixement) Seleccionar els millors algoritmes que es poden fer servir per solucionar cadascun dels components d'un sistema de visió de baix nivell.
- SA01 (Habilitat) Aplicar i avaluar tècniques de processament de baix nivell per solucionar un problema particular.
- SA07 (Habilitat) Aplicar tècniques estadístiques d'anàlisi de dades i d'avaluació del rendiment a diferents problemes.
- SA08 (Habilitat) Seleccionar les millors eines de programari per codificar les tècniques de processament de baix nivell per solucionar un problema particular.
- SA15 (Habilitat) Preparar un informe que descrigui, justifiqui i il·lustri el desenvolupament d'un projecte de visió.
- SA17 (Habilitat) Preparar presentacions orals que permetin debatre els resultats del desenvolupament d'un projecte de visió.
Continguts
Activitats formatives i Metodologia
| Títol | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|
| Tipus: Dirigides | |||
| Clases de teoria | 20 | 0,8 | CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17 |
| Tipus: Supervisades | |||
| Sessions supervisades | 8 | 0,32 | CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17 |
| Tipus: Autònomes | |||
| Treball personal | 113 | 4,52 | CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17 |
Sessions supervisades: (algunas d'aquestes sessions podrien ser en-línia síncrones)
• Classes de teoria on els professors explicaran continguts generals sobre els temes. Alguns d'ells seran utilitzades per resoldre els problemes.
Sessions dirigides:
• Sessions del projecte, on es presentaran i debatran els problemes i les metes dels projectes, els estudiants interactuaran amb el coordinador del projecte sobre problemes i idees per resoldre el projecte (aproximadament 1 hora / setmana).
• Sessió de presentació, on els estudiants fan una presentació oral sobre com han resolt el projecte i una demostració dels resultats.
• Sessió d'examen, on els estudiants són avaluats individualment. Assoliments de coneixement i habilitats per resoldre problemes.
Treball autònom:
• L'estudiant estudiarà i treballarà de manera autònoma amb els materials derivats de les classes.
• L'alumne treballarà en grups per resoldre els problemes dels projectes amb lliurables:
• Codi
• Informes
• Presentacions orals
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, perquè els alumnes completin les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura.
Avaluació
Activitats d'avaluació continuada
| Títol | Pes | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|---|
| Assistència | 5% | 0,5 | 0,02 | CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17 |
| Exàmen | 40% | 2,5 | 0,1 | KA01, KA08, SA01, SA07, SA08 |
| Projecte | 55% | 6 | 0,24 | CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17 |
Les qualificacions finals per aquest mòdul es calcularan amb la següent fórmula:
Puntuació final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència
on,
Examen: és la nota obtinguda en l'examen del mòdul (ha de ser> = 3).
Assistència: és la qualificació derivada del control d'assistència a les conferències (mínim 70%)
Projecte: és la qualificació proporcionada pel coordinador del projecte en funció del seguiment setmanal del projecte i els resultats (ha de ser> = 5). Tot d'acord amb criteris específics com:
- Participació en sessions de discussió i en treball en equip (avaluacions entre membres)
- Lliurament d'exercicis obligatoris i opcionals.
- Desenvolupament de codi (estil, comentaris, etc.)
- Informe (justificació de les decisions en el desenvolupament del seu projecte)
- Presentació (Xerrada i demostracions sobre el seu projecte)
Només els estudiants que han suspès (Nota final < 5.0) poden fer l'examen de recuperació.
Bibliografia
- Rafael C. Gonzalez, Richard E. Woods, “Digital Image Processing”, 3rd Edition.
- David Marr, “Vision: A Computational Investigation into the Human Representation and Processing of Visual Information”, Freeman, 1982.
- Richard Szeliski, “Computer Vision: Algorithms and Applications”, Springer-Verlag New York, Inc. New York, USA 2010.
Programari
Entorn de programació en Python amb especial atenció a les llibreries de visió per computador i processament d'imatges.
Grups i idiomes de l'assignatura
La informació proporcionada és provisional fins al 30 de novembre de 2025. A partir d'aquesta data, podreu consultar l'idioma de cada grup a través daquest enllaç. Per accedir a la informació, caldrà introduir el CODI de l'assignatura
| Nom | Grup | Idioma | Semestre | Torn |
|---|---|---|---|---|
| (TEm) Teoria (màster) | 1 | Anglès | primer quadrimestre | matí-mixt |