
Obtenció i Emmagatzematge de Dades
Codi: 104851 Crèdits: 6| Titulació | Tipus | Curs |
|---|---|---|
| Estadística Aplicada | FB | 1 |
Professor/a de contacte
- Nom:
- Marc Vallribera Ros
- Correu electrònic:
- marc.vallribera@uab.cat
Equip docent
- Jordi Castilla Miro
Idiomes dels grups
Podeu consultar aquesta informació al final del document.
Prerequisits
Coneixements sobre operacions lògiques.
Coneixements sobre conjunts i relacions entre conjunts.
Coneixements bàsics de Python.
Objectius
En aquesta assignatura s'introdueixen els conceptes bàsics de Bases de Dades (BD) necessaris tant a nivell de dissenyador de BD com d'usuari, així com els mecanismes d'obtenció d'informació d'internet a través de "WebScraping", i emmagatzematge d'aquesta informació en les BD.
Resultats d'aprenentatge
- CM03 (Competència) Depurar la informació, tenint-ne en compte les implicacions ètiques, per a emmagatzemar-la en suport informàtic per a l'explotació i ús ulteriors.
- KM06 (Coneixement) Reconèixer els conceptes bàsics de les bases de dades, tant pel que fa a l'usuari com al dissenyador, tenint cura de les implicacions ètiques vinculades a la informació recollida.
- SM05 (Habilitat) Obtenir informació a través de webscrapping per a emmagatzemar-la en bases de dades adequades.
- SM06 (Habilitat) Explotar bases de dades de qualsevol volum.
Continguts
- Introducció a les bases de dades
- Sistemes d'informació i bases de dades
- Bases de dades
- Conceptes
- Característiques
- Evolució de les Bases de Dades
- Definició i característiques d'un SGBD
- Arquitectura dels SGBD
- Principals SGBD
- Fases de desenvolupament d'aplicacions de BD
- Etapes del disseny d'una BD
- Disseny conceptual
- Disseny lògic
- Disseny d'aplicacions
- El model Entitat - Relació (E-R)
- El diagrama E-R
- Entitats, atributs, interrelacions
- Atributs de les interrelacions
- Dependència d'existència i participació
- El Model Relacional
- Concepte de relació o taula, atributs, tuples, dominis, claus primàries i foranies
- Restriccions de domini, integritat de claus i referència
- Transformació del model E/R al relacional
- Operadors d'àlgebra relacional
- Implementació de les Bases de Dades
- Structured Query Language (SQL)
- Tractament de les dades
- Consulta de les dades
- Gestió de la Base de Dades amb SQL
- Treballant amb bases de dades SQLite
- Nocions de HTML i expressions regulars
- Estructura del codi d’una pàgina web
- Etiquetes i atributs HTML i CSS
- Cerca de textos amb expressions regulars
- Caràcters especials, conjunts, agrupaments i repeticions
- Obtenció i emmagatzemament de dades de pàgines web
- Introducció a les eines de Web Scraping
- Programació d'eines de Web Scraping en Python
- Cerca i obtenció d'informació amb expressions regulars
- Cerca i obtenció d'informació amb Beautiful Soup
- Emmagatzemament en Bases de Dades
- Exportació de resultats en fitxers de valors separats per comes
Activitats formatives i Metodologia
| Títol | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|
| Tipus: Dirigides | |||
| Classes de teoria | 26 | 1,04 | |
| Tipus: Supervisades | |||
| Entregues d'exercicis individuals | 9 | 0,36 | |
| Pràctiques | 36 | 1,44 | |
| Tipus: Autònomes | |||
| Estudi | 15 | 0,6 | |
| Lectura de llibres | 20 | 0,8 | |
| Preparació de les pràctiques | 10 | 0,4 | |
| Problemes proposats | 23 | 0,92 |
Teoria
Les classes de teoria s'imparteixen mitjançant classes magistrals amb transparències. Aquestes transparències són accessibles, i els alumnes les poden obtenir des de la pàgina web de l'assignatura del Campus Virtual.
Exercicis
Es realitzaran 2 entregues (individuals) per tal que l'alumne pugui demostrar que està adquirint els coneixements que s'expliquen a classe. L'entrega es realitzarà a través del Moodle que hi ha al Campus Virtual.
Problemes proposats
Durant el transcurs del curs s'entregarà un llistat de problemes, referent als temes més pràctics de l'assignatura, per tal que l'alumne pugui adquirir i/o afermar el seus coneixements sobre les diferents etapes en el disseny, implementació i explotació de les bases de dades.
Preparació de les pràctiques
L'alumne haurà d'haver llegit i preparat les pràctiques per tal de poder-les realitzar dins l'horari de pràctiques establert i fora d'aquest.
Pràctiques
L'objectiu de les sessions de laboratori és donar una amplia visió de les bases de dades, des de la gestió i creació fins a la connexió amb un aplicatiu que permeti consultar i modificar la base de dades. L'alumne haurà d'assolir competències en creació, gestió i manipulació de bases de dades, així com l'obtenció de informació d'internet, i l'emmagatzematge d'aquesta a la Base de Dades.
Al llarg d'aquestes sessions de laboratori, el professor anirà supervisant i guiant cada grup d'alumnes durant el procés de realització de la pràctica.
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, perquè els alumnes completin les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura.
Avaluació
Activitats d'avaluació continuada
| Títol | Pes | Hores | ECTS | Resultats d'aprenentatge |
|---|---|---|---|---|
| Examen final | 40% | 3 | 0,12 | KM06, SM05, SM06 |
| Lliurament de les pràctiques | 30% | 5 | 0,2 | CM03, KM06, SM05, SM06 |
| Lliurament excercicis | 30% | 3 | 0,12 | SM05, SM06 |
Un 70% de la nota de l'assignatura es basarà en la nota de pràctiques i un examen final, que es podrà recuperar. El 30% restant s'avaluarà a traves de les entregues de l'avaluació continuada. Totes les notes que s'indiquen a continuació són sobre 10.
La nota final serà: Nota Final = 0.4 * Nota examen + 0.3 * Nota pràctiques + 0.3 * Nota exercicis
Per aprovar l'assignatura caldrà aprovar les pràctiques i l'examen per separat.
Examen (40%): L'examen principal de l'assignatura i l'examen de recuperació es realitzaran el dia reservat a aquesta assignatura dins el calendari d'exàmens. L'examen de recuperació només es podrà fer si s'ha tret un mínim de 3 en l'examen final.
Pràctiques (30%): Es faran dues entregues avaluades de les pràctiques, resultat de les diferents sessions.
A final de curs es podran recuperar les pràctiques, fent una entrega especial. La nota màxima que es podrà obtenir a la recuperació de les pràctiques serà un 5.
Exercicis (30%): La nota d'exercicis s'obtindrà a partir dels problemes que s'aniran entregant durant el transcurs de l'assignatura. La manera concreta i els dies que es faran les entregues dels problemes s'avisarà amb suficient antelació al Campus Virtual de l'assignatura. La nota dels exercicis no és recuperable.
Avaluació Única
En cas d'acollir-se a la Avaluació Única, a final de curs es demanarà fer una entrega d'un exercici similar als realitzats a les pràctiques, a més de fer un examen amb algunes preguntes addicionals. En aquest cas la nota serà del 70% de l'examen final i 30% de l'entrega de l'exercici.
S’aplicarà el mateix sistema de recuperació que per l’avaluació continuada.
La revisió de la qualificació final segueix el mateix procediment que per a l’avaluació continuada.
Bibliografia
A. Silberschatz, H.F. Korth, S. Sudarshan (2006), Fundamentos de Bases de Datos, McGraw-Hill
Ian Mackie (2020), A Begginners Guide to Python 3 Programming
https://bibcercador.uab.cat/permalink/34CSUC_UAB/1eqfv2p/alma991010431569006709
Michael Heydt (2018), Python web scraping cookbook: over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS
https://bibcercador.uab.cat/permalink/34CSUC_UAB/1eqfv2p/alma991009832849706709
Ryan Mitchell (2018), Web scraping with Python: collecting data from the modern web
https://bibcercador.uab.cat/permalink/34CSUC_UAB/1eqfv2p/alma991009832809706709
Programari
- Visual Studio Code - Code Editing. Redefined: Es farà servir per crear els programes en Python per fer Web Scraping i exportar les dades a una Base de Dades o a un fitxer.
- Welcome to Python.org: Llenguatge de programació utilitzat per al Web Scraping.
- SQLiteStudio: Entorn de gestió de Bases de Dades en SQLite.
Grups i idiomes de l'assignatura
La informació proporcionada és provisional fins al 30 de novembre de 2025. A partir d'aquesta data, podreu consultar l'idioma de cada grup a través daquest enllaç. Per accedir a la informació, caldrà introduir el CODI de l'assignatura
| Nom | Grup | Idioma | Semestre | Torn |
|---|---|---|---|---|
| (PLAB) Pràctiques de laboratori | 1 | Català | segon quadrimestre | tarda |
| (PLAB) Pràctiques de laboratori | 2 | Català | segon quadrimestre | tarda |
| (SEM) Seminaris | 1 | Català | segon quadrimestre | tarda |
| (SEM) Seminaris | 2 | Català | segon quadrimestre | tarda |
| (TE) Teoria | 1 | Català | segon quadrimestre | tarda |