
Core Bioinformatics
Código: 42397 Créditos ECTS: 12| Titulación | Tipo | Curso |
|---|---|---|
| Bioinformática / Bioinformatics | OB | 0 |
Contacto
- Nombre:
- Sònia Casillas Viladerrams
- Correo electrónico:
- sonia.casillas@uab.cat
Equipo docente
- Antoni Barbadilla Prados
- Leonardo Pardo Carrasco
- Miquel Àngel Senar Rosell
- Jean Didier Pierre Marechal
- Amanda Fernandez Fontelo
- Angel Gonzalez Wong
- Jaime Martinez Urtaza
- Isaac Salazar Ciudad
- Oscar Conchillo Solé
- Marta Puig Font
- (Externo) Emanuel Raineri
- (Externo) Sebastián Ramos
Idiomas de los grupos
Puede consultar esta información al final del documento.
Prerrequisitos
Se recomienda un nivel B2 de inglés o equivalente.
Objetivos y contextualización
Este módulo se centra en el desarrollo de diversas herramientas y recursos bioinformáticos comúnmente utilizados en la investigación de las ómicas. Nuestra intención es que cubra varios aspectos de la bioinformática en una serie de temas breves, en forma de "catas". Por lo tanto, no es un módulo acumulativo, sino uno transversal, que debe proporcionar una amplia gama de ideas y enfoques que ofrece la bioinformática, de la mano de expertos. El objetivo principal es proporcionar a los estudiantes la base necesaria para aplicar la bioinformática a diferentes áreas de la investigación científica. Con el tiempo, cada estudiante podrá obtener toda la profundidad que se proponga sobre cualquiera de estos temas, el que finalmente represente su marco de investigación.
Competencias
- Actuar en el ámbito de conocimiento propio evaluando las desigualdades por razón de sexo/género.
- Analizar e interpretar bioinformáticamente los datos que se derivan de las tecnologías ómicas.
- Comprender las bases moleculares y las técnicas experimentales estándares más comunes en las investigaciones ómicas (genómica, transcriptómica, proteómica, metabolómica, interactómica, etc.).
- Diseñar y aplicar la metodología científica en la resolución de problemas.
- Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- Proponer soluciones bioinformáticas a problemas derivados de las investigaciones ómicas.
- Proponer soluciones innovadoras y emprendedoras en su campo de estudio.
- Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
- Utilizar sistemas operativos, programas y herramientas de uso común en bioinformática, así como, manejar plataformas de cómputo de altas prestaciones, lenguajes de programación y análisis bioinformáticos.
- Utilizar y gestionar información bibliográfica y recursos informáticos en el ámbito de estudio.
Resultados de aprendizaje
- Actuar en el ámbito de conocimiento propio evaluando las desigualdades por razón de sexo/género.
- Buscar herramientas bioinformáticas específicas y recursos bioinformáticos en la red.
- Comprender las bases teóricas, estadísticas y biológicas, en las que se basan los programas de análisis bioinformático: alineamiento de secuencias, búsqueda por similitud y alineamiento múltiple, predicción de estructura, anotación de genomas, análisis filogenético y evolutivo.
- Crear y promover los algoritmos, las técnicas de cálculo y estadística y la teoría para resolver problemas formales y prácticos derivados de la gestión y el análisis de datos biológicos.
- Diseñar y aplicar la metodología científica en la resolución de problemas.
- Identificar y aplicar los algoritmos en los que se basan los programas de análisis bioinformático.
- Identificar y caracterizar los principales tipos de datos biomoleculares que se obtienen de las tecnologías ómicas.
- Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- Proponer soluciones innovadoras y emprendedoras en su campo de estudio.
- Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
- Sintetizar e interpretar, de forma lógica y razonada, la información procedente de bases de datos moleculares y analizarla mediante herramientas bioinformáticas.
- Usar las principales bases de datos moleculares, los principales formatos estándares de datos moleculares e integrar datos de distintas fuentes de datos
- Utilizar y gestionar información bibliográfica y recursos informáticos en el ámbito de estudio.
Contenido
BLOQUE 1. ESTADÍSTICA
Inferencia estadística
Profesor Antonio Barbadilla
- Estadística: puente entre datos y modelos.
- Tipos de datos
- Población y muestra
- Diseño experimental
- Calidad de datos
- Exploración de datos
- Distribución de la muestra y ley de grandes números
- Inferencia estadística
- Teorema del límite central
- Estimación de puntos
- Estimación del intervalo de confianza
- Hipótesis
- Elementos de una prueba: H0, H1, prueba estadística, valor de p, nivel de significación, errores de tipo I y II, potencia
- Prueba Z, prueba t, prueba chi-cuadrada, prueba de correlación, regresión, análisis de varianza
- Interpretación de significación estadística
- Pruebas paramétricas versus no paramétricas
- Selección de la prueba estadística apropiada (árbol de decisión)
- Pruebas multivariadas
- Remuestreo
Estadística y procesos estocásticos para el análisis de secuencias.
Profesora Amanda Fernandez
a. Fundamentos de probabilidad
Conjuntos y eventos. Propiedades La probabilidad condicional. Independencia. Alfabeto y secuencias. Modelos probabilísticos.
b. El modelo multinomial.
Simulando una secuencia multinomial. Estimación de probabilidades.
c. El paquete seqinr
d. Modelos de cadena de markov
Concepto y ejemplos. Clasificación de estados. Código r Simulando una secuencia de cadenas de Markov.Estimación de las probabilidades de transición. La probabilidad de una secuencia. Usando la cadena de Markov para la discriminación.
e. Cadenas de Markov de orden superior.
Concepto y ejemplos. Estimación de las probabilidades de transición. Comparación de las cadenas de Markov de orden superior.
f. Cadenas ocultas de Markov.
Concepto y ejemplos. Estimación de parámetros. Estimación de estados ocultos.
g. Una introducción a los modelos lineales generalizados.
Conceptos básicos de GLM. El modelo logístico. El modelo de Poisson.
Inferencia bayesiana
Profesor Emmanuele Raineri
1. Ajuste de la curva.
- Estimación de parámetros de distribuciones de probabilidad: binomial, poisson y gaussiana.
- Ejemplo: ajustar un conjunto de datos ruidoso.
- Validación cruzada, sobreajuste y regularización.
2. Reducción dimensional.
- Análisis de componentes principales, escalamiento multidimensional.
- Ejemplo: distinguir los tipos de células utilizando perfiles de metilación.
3. Regresión del lazo.
- Selección de variables en modelos lineales.
- Regresión penalizada: Lazo y Red Elástica.
- Ejemplo: regresión de lazo en R.
BLOQUE 2. UTILIDADES BÁSICAS
El genoma humano
Profesor Marta Puig
a. Introducción a los genomas.
Genomas secuenciados. Organización y tamaño de los genomas eucariotas. Construyendo un genoma: métodos NGS para genómica y transcriptómica.
b. El genoma humano: ¿dónde estamos ahora?
Ensamblaje actual del genoma humano. El proyecto ENCODE: elementos funcionales en el genoma humano.Contenido repetitivo del genoma humano.
Bases de datos y formatos de secuencia
Profesor Oscar Conchillo
a. Formatos de secuencia
Nomenclatura. Editores de texto. Formato FASTA y sus variantes. Formato sin formato / plano. Formato de secuenciade genbank. Formato de secuencia EMBL. GCG, NBRF / PIR, MSA, PHYLIP, NEXUS. Conversión de formato.
b. Bases dedatos
Concepto. Búsquedas booleanas. Los comodines y las expresiones regulares. Identificadores y números de acceso.Clasificación. Recopilación de bases de datos NAR. GenBank y otras bases de datos NCBI. EMBL. DDBJ. Meta-bases de datos integradas. Principales bases de datos de nucleótidos, proteínas, estructura, taxonomía, etc.
Ingeniería de software
Profesor Miquel Àngel Senar
a. Sistema de control de versiones con Git y GitHub.
b. Estrategias de paralelización y HPC.
c. Computación en la nube con Amazon Web Services
BLOQUE 3. BIOINFORMÁTICA ESTRUCTURAL
Estructura proteica
Profesores Leonardo Pardo, Óscar Conchillo y Ángel Gonzalez
a. Introducción
Aminoácidos, proteínas y enlaces peptídicos. Cuatro niveles de estructura proteica. Plegamiento y estabilidad de proteínas. Interacciones moleculares. Métodos experimentales para la determinación de la estructura.
b. Motivos y dominios.
c. Análisis
Bases de datos UNIPROT, PDB, PFAM, CATH y SCOP. Alineamiento de proteínas, morphing, superficies moleculares, potencial electrostático molecular.
d. Membrana celular
Proteínas de membrana, segmentos transmembrana.
Modelado molecular
ProfesoresLeonardo Pardo y Jean-Didier Maréchal
a. Modelado por homología
b. Modelado molecular
Modelos atómicos. Energía potencial. Mecánica cuántica y molecular. Técnicas de exploración conformacional.
BLOQUE 4. GENÓMICA
Introducción: Genomas y datos ómicos
Profesor Jaime Martínez Urtaza
a. Principales hitos del proyecto de secuenciación del genoma: secuenciación, ensamblaje y anotación.
b. Secuenciación. Secuenciación clásica por el método de Sanger. Técnicas de secuenciación de próxima generación (NGS). Técnicas de segunda generación: 454/Roche (pirosecuenciación), Illumina (terminación reversible), SOLiD (secuenciación por ligación), Ion Torrent (detección de protones). Técnicas de tercera generación. Desafíos y diferencias con las técnicas de segunda generación. Pacific Biosciences (PacBio; Molécula Única en Tiempo Real, SMART). Oxford Nanopore (Minion).
c. Ensamblaje. Ensamblaje de novo versus mapeo contra referencia. Lecturas y contigs. Medida de la calidad de un ensamblaje: calidad deuna base o puntuación Phred (Q), redundancia (cobertura), N50 y L50. Lecturas apareadas y scaffolds.
Genómica de poblaciones
Profesor Isaac Salazar
a. Genómica poblacional bajo neutralidad en una población finita.
Introducción. Deriva genética. Tamaño efectivo de la población. Probabilidad de fijación de mutaciones neutras.
b. Genómica de poblaciones bajo selección.
Seleccion natural. Probabilidad de fijación de mutaciones seleccionadas. Distribución de fitness de nuevas mutaciones. Tasa de evolución.
c. Evolución adaptativa y tamaño de la población.
Filogenia y evolución molecular
Profesor Sebastián Ramos
a. Modelos de evolución de secuencias.
Secuencia deADN Modelo de Jukes y Cantor. Modelos más realistas. Selección delmodelo.
b. Filogenia
Concepto. Árboles de especies versus árboles degenes. Métodos de reconstrucción de árboles: métodos de distancia, parsimonia máxima, probabilidad máxima, inferencia bayesiana. Apoyo. Filogenómica. Construyendo árboles con R.
Biología de sistemas
Profesor Isaac Salazar
a. Biología de sistemas de la edad clásica y genómica.
El paradigma de la biología de sistemas a la luz de los desarrollos tecnológicos de los últimos 100 años. Cuellos de botella en la integración de datos.
b. Modelización matemática de circuitos moleculares.
Modelos conceptuales. Desde modelos conceptuales hasta modelos matemáticos. Formalismos matemáticos.Modelos basados en datos.
c. Principios de diseño y organización en circuitos moleculares.
Concepto de principiodediseño. Comparaciones controladas matemáticamente. Análisis de viabilidad. Espacios de diseño. Biología sintética.
Actividades formativas y Metodología
| Título | Horas | ECTS | Resultados de aprendizaje |
|---|---|---|---|
| Tipo: Dirigidas | |||
| Clases teóricas | 39 | 1,56 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
| Resolución de problemas en clase y tareas en el laboratorio biocomputacional | 39 | 1,56 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
| Tipo: Supervisadas | |||
| Realización de trabajos individuales y en grupo | 40 | 1,6 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
| Tipo: Autónomas | |||
| Estudio autónomo individual | 178 | 7,12 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
La metodología combinará clases magistrales, resolución de problemas prácticos y casos reales, trabajo en el laboratorio de computación, trabajo individual y en equipo, lectura de artículos relacionados con los bloques temáticos y autoestudio independiente. Se utilizará la plataforma virtual.
Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.
Evaluación
Actividades de evaluación continuada
| Título | Peso | Horas | ECTS | Resultados de aprendizaje |
|---|---|---|---|---|
| Habilidades blandas | 10% | 0 | 0 | 1, 5, 9, 10, 8 |
| Portafolio del estudiante | 55% | 0 | 0 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
| Test teórico y práctico individual | 35% | 4 | 0,16 | 2, 3, 4, 5, 6, 7, 9, 10, 11, 8, 13, 12 |
El sistema de evaluación está organizado en tres actividades principales. Habrá, además, un examen de recuperación. Los detalles de las actividades son:
Actividades de evaluación principales
- Portafolio del estudiante (55%): trabajo hecho y presentado por el alumnado a lo largo del curso. Ninguna de las actividades de evaluación individuales representará más del 50% de la nota final.
- Prueba teórica y práctica individual (35%): habrá un examen al final de este módulo. Consistirá en una o dos cuestiones de selección múltiple o de respuesta corta por parte del profesorado del módulo.
- Habilidades blandas (10%): asistencia, puntualidad y participación activa en clase.
Examen de recuperación
Para poder participar en el proceso de recuperación, el alumnado deberá previamente haber participado en como mínimo el equivalente a dos tercios de la nota final del módulo en actividades de evaluación. El profesorado informará de los procedimientos y plazos para el proceso de recuperación. Nótese que las habilidades blandas no pueden recuperarse.
No evaluable
El alumnado será calificado como “No evaluable” cuando el peso de la evaluación en la que ha participado sea inferior al equivalente al 67% de la nota final del módulo.
Evaluación única
Esta asignatura/módulo no contempla el sistema de evaluación única.
Bibliografía
El profesorado recomendará la bibliografía actualizada en cada sesión de este módulo, y los enlaces se pondrán a disposición en el Área del Estudiante del sitio web oficial de MSc Bioinformatics.
Software
El profesor recomendará el software actualizado en cada sesión de este módulo, y los enlaces se pondrán a disposición en el Área del Estudiante del sitio web oficial de MSc Bioinformatics.
Grupos e idiomas de la asignatura
La información proporcionada es provisional hasta el 30 de noviembre de 2025. A partir de esta fecha, podrá consultar el idioma de cada grupo a través de este enlace. Para acceder a la información, será necesario introducir el CÓDIGO de la asignatura
| Nombre | Grupo | Idioma | Semestre | Turno |
|---|---|---|---|---|
| (PLABm) Prácticas de laboratorio (máster) | 1 | Inglés | primer cuatrimestre | manaña-mixto |
| (TEm) Teoría (máster) | 1 | Inglés | primer cuatrimestre | manaña-mixto |