Logo Studenta

Cover_Credits_Bios_Index

¡Este material tiene más páginas!

Vista previa del material en texto

Bioinformática con Ñ
Volumen I: Principios de Bioinformática
Edición y coordinación:
Álvaro Sebastián y Alberto Pascual-Garćıa
Autores:
F. Abascal, J. Aguirre, E. Andrés-León, D. Bajic, D. Baú, J. A. Bueren-Calabuig,
Á. Cortés-Cabrera, I. Dotu, J. M. Fernández, H. G. D. Santos, B. Garćıa-Jiménez,
R. Guantes, I. Irisarri, N. Jiménez-Lozano, J. Klett, R. Méndez, A. Morreale,
A. Pascual-Garćıa, A. Perona, A. Sebastian, M. Stich, S. Tarazona, I. Yruela y R. Zardoya
Portada:
Enrique Sahagún (http://www.scixel.es)
Maquetación:
Álvaro Sebastián
Usando LATEX(http://www.latex-project.org) y Texmaker
(http://www.xm1math.net/texmaker)
Editorial:
Libro autoeditado e impreso por CreateSpace (http://www.createspace.com)
Depósito legal: SE-NNNNNNN
ISBN: NNNNNNN
Copyright de la portada:
© 2014 Enrique Sahagún
Copyright de los textos:
© 2014 Los respectivos autores
Copyright de las figuras:
© 2014 Los respectivos autores, si no se indica lo contrario
Licencia de las figuras:
La establecida por sus autores en los textos originales
Licencia de los textos:
Creative Commons BY-NC-SA 4.0 (http://creativecommons.org/licenses/by-nc-sa/4.0/)
La licencia Creative Commons BY-NC-SA 4.0 permite:
Compartir: copiar y redistribuir el material en cualquier medio o formato
Adaptar: mezclar, transformar y crear a partir del material
Bajo los siguientes términos:
Atribución: se debe dar el crédito de la obra a los autores originales, proveer un enlace a la licencia
e indicar los cambios realizados.
NoComercial: no se puede hacer uso del material con fines comerciales.
CompartirIgual: Si se mezcla, transforma o crea nuevo material a partir de esta obra, sólo se
podrá distribuir utilizando la misma licencia que la obra original.
http://www.scixel.es
http://www.latex-project.org
http://www.xm1math.net/texmaker
http://www.createspace.com
http://creativecommons.org/licenses/by-nc-sa/4.0/
Prólogo Volumen I. Principios de
bioinformática.
5
Prólogo
La bioinformática y la bioloǵıa computacional persiguen ordenar el conocimiento que se deriva del
análisis de datos biológicos, fundamentalmente secuencias y genomas, con ayuda de algoritmos y sis-
temas informáticos. Por su naturaleza transversal han colonizado a otras disciplinas y ya son parte
integral de los métodos de trabajo de áreas tan amplias como la biotecnoloǵıa, la ecoloǵıa, la bioloǵıa o
la medicina. Proyectos cient́ıficos de gran impacto en nuestras vidas, como la secuenciación del genoma
humano, la caracterización de las diferentes variedades de cáncer, el diseño de nuevos medicamentos
o la selección genómica en el sector agropecuario han sido y seguirán siendo posibles gracias, en gran
medida, a los avances de la bioinformática. Todo esto ha ocurrido en los últimos 30 años, y a un ritmo
muy dif́ıcil de seguir incluso para los especialistas. De hecho, es fácil abrumarse con el volumen de
literatura al alcance de la mano, ya sea en canales convencionales como las revistas Bioinformatics o
PLoS Computational Biology, editadas por cient́ıficos de prestigio, o foros como Biostar o SEQanswers,
donde usuarios de todo el mundo comparten protocolos y experiencia al estilo peer to peer.
Como dećıa, la bioinformática ha evolucionado rápidamente en años recientes y eso se ha traducido en
una demanda creciente de profesionales cualificados en el diseño y aplicación de esta clase de herra-
mientas computacionales. Estos especialistas pueden tener curŕıculum vitae muy distintos, habiendo
recorrido itinerarios académicos posiblemente diferentes, pero finalmente han de tener una serie de ha-
bilidades fundamentales como son conocimientos en genética y bioloǵıa molecular, dominio de lenguajes
de programación y la capacidad de administrar y sacar el máximo rendimiento a los datos y el hardware
disponible, ya sea en un laboratorio de investigación o una pequeña empresa biotecnológica. Aunque
la bioinformática tiene una dimensión global y se habla en inglés, también es cierto que en muchas
universidades a éste y al otro lado del Atlántico la lengua vehicular para la enseñanza es el español.
En consecuencia hay un espacio y una demanda real de materiales educativos en español, y muestra
de ellos son los cada vez más numerosos blogs y bitácoras que tratan sobre esta materia en nuestra
lengua. Este libro es el esfuerzo colectivo de un buen elenco de investigadores expertos, en su mayoŕıa
por debajo de los 40 años, por contribuir a llenar ese espacio con contenidos cient́ıficos. En efecto,
tras el texto pionero publicado por el profesor Lahoz-Beltrá en 2004, este libro es el primero escrito en
nuestra lengua que hace un repaso tan amplio y ambicioso del área, y complementa de manera natural
los recursos disponibles en la Red.
En esta edición inicial los autores tocan de forma exhaustiva una selección de temas fundamentales de
la bioloǵıa computacional, y por tanto es de esperar que este libro se convierta en un recurso valio-
so para estudiantes y profesores de las universidades de habla hispana. Para los estudiantes, porque
aqúı podrán encontrar material para ahondar en su estudio de la bioinformática, incluyendo citas a
art́ıculos de la literatura cient́ıfica, normalmente en inglés; para los profesores universitarios, porque
podrán apoyarse en este libro para programar y dotar de contenido a las asignaturas y materias re-
lacionadas con la bioinformática, que todav́ıa en muchas universidades son claramente insuficientes.
Finalmente, seguramente este libro contribuya a introducir y traducir al español el caudal constante
de términos y conceptos de la bioinformática. El reto que tiene por delante será sin duda el de la
renovación permanente para no sucumbir a la evolución del área, de modo que los temas incluidos sean
representativos de las áreas vigentes de la disciplina. La filosof́ıa colaborativa de este proyecto, donde
tanto el editor como los autores han participado en la selección de materiales y en la toma de deciciones
editoriales, parece adecuada para este fin.
Bruno Contreras Moreira
Zaragoza, Septiembre de 2014
El Dr. Bruno Contreras es director del Laboratorio de Bioloǵıa Computacional en la Estación Experimental de Aula Dei
(EEAD/CSIC, Zaragoza, España) y profesor invitado de la Universidad Autónoma de México (Cuernavaca, México).
Prólogo Volumen II. Bioloǵıa
estructural y de sistemas.
9
Prólogo
Mi primera impresión cuando examiné la recopilación de caṕıtulos que se agrupan en este volumen
doble fue la de que, ¡por fin!, alguien hab́ıa cogido al toro por los cuernos y acometido la ingente
tarea de explicar y dar forma a una serie de conceptos y disciplinas de actualidad relacionados con los
nuevos enfoques sobre los seres vivos. Cabŕıa pensar que este conocimiento, que dirige una buena parte
de los esfuerzos cient́ıficos encaminados a comprender la vida y aliviar las enfermedades, se estuviera
impartiendo en todos o la mayoŕıa de los grados universitarios actuales en ciencias de la salud. La
sobria realidad es que, lamentablemente, sigue siendo mayoritariamente ignorado aunque esta carencia
se pueda paliar posteriormente en másteres o cursos de especialización.
La sorpresa que vino a continuación fue que esta valent́ıa correspond́ıa a dos jóvenes investigadores
que han conseguido coordinar las aportaciones de otros colegas igual de jóvenes (¡o incluso más!), con
flamantes doctorados en materias relacionadas con los temas tratados, y que demuestran haber recogido
el testigo recibido de profesores y maestros para facilitar la tarea a cualquier persona hispanohablante
interesada en introducirse en el fascinante mundo de la información biológica moderna, su tratamiento
y algunas de sus aplicaciones. Entre estas últimas se encuentran metodoloǵıas de diseño de fármacos
basadas en el conocimiento estructural con detalle atómico de la macromolécula diana, la simulación
de los movimientos de estos componentes de la maquinariaque hace posible la vida y el apasionante
mundo de los complejos procesos interrelacionados que constituyen la bioloǵıa de sistemas.
Estos dos volúmenes son como los abrigos crecederos que se compran a los niños para que les duren
más de una temporada. Por un parte, cada caṕıtulo recoge una información más que abundante para
una introducción a la materia y, por otro lado, hay espacio suficiente entre caṕıtulos para rellenar los
huecos que una obra de este tipo necesariamente deja sin cubrir, a la espera de ediciones posteriores.
Desde estas breves ĺıneas env́ıo mi felicitación a coordinadores y autores, agradeciéndoles su dedicación
y buen hacer, que tendrá como merecida recompensa el reconocimiento de sus lectores, que no dudo
serán numerosos a ambos lados del Atlántico.
Federico Gago Badenas
Madrid, Septiembre de 2014
El Dr. Federico Gago es director del grupo de investigación ‘Mecanismo de acción de moléculas con actividad biológica’
en la Universidad de Alcalá (Madrid, España), además de catedrático y profesor en la misma universidad.
Autores
13
Álvaro Sebastián Yagüe (editor)
Álvaro Sebastián es licenciado en Qúımica y Bioqúımica,
ambos por la Universidad de Zaragoza (2005). Cursó los es-
tudios de máster en Bioinformática en la Universidad Com-
plutense de Madrid y realizó prácticas en la empresa Crys-
tax Pharmaceuticals (Barcelona). Posteriormente volvió al
wet lab para realizar la tesis doctoral sobre la protéına hu-
mana ITIH4 en la Universidad de Zaragoza donde también
cursó estudios de doctorado en Ingenieŕıa Biomédica.
Al final del doctorado comenzó una aventura empresarial
fundando Idibay Consulting S.L., empresa de diseño web y
consultoŕıa informática. En el año 2009 fue contratado como
investigador del CSIC en el proyecto europeo STREG para
el estudio de la regulación transcripcional en plantas en el
laboratorio del Dr. Bruno Contreras en la Estación Experimental de Aula Dei. En 2013 comenzó su
periplo internacional realizando una estancia en el laboratorio del Prof. Janusz Bujnicki para el diseño de
potenciales de docking protéına-protéına y más tarde se incorporó al laboratorio de Bioloǵıa Evolutiva
en la Universidad Adam Mickiewicz (Poznan, Polonia), donde trabaja actualmente con el Prof. Jacek
Radwan en el genotipado de la familia de genes del complejo mayor de histocompatibilidad y del
receptor de linfocitos T usando tecnoloǵıas de secuenciación de nueva generación.
Su corta carrera cient́ıfica se caracteriza por un vaivén en diferentes áreas y técnicas, desde la śıntesis
qúımica asimétrica, pasando por el laboratorio bioqúımico hasta finalizar en el campo de la bioin-
formática. La última “aventura” cient́ıfica, y quizás la más arriesgada y compleja, ha sido coordinar y
editar el presente libro.
Alberto Pascual Garćıa (editor)
Alberto Pascual Garćıa es licenciado en F́ısica por la Universi-
dad Complutense de Madrid y máster en Biof́ısica por la Uni-
versidad Autónoma de Madrid. Ha trabajado en el Laboratorio
de Circuitos Neuronales del Hospital Ramón y Cajal, y en la
Unidad de Bioinformática del Centro de Bioloǵıa Molecular Se-
vero Ochoa (CSIC-UAM), donde finaliza su tesis doctoral sobre
patrones emergentes en sistemas biológicos complejos, dirigida
por el Dr. Ugo Bastolla.
Ha participado en diversos proyectos de investigación en te-
mas tan diversos como evolución de estructura de protéınas,
redes de interacción mutualistas o ecoloǵıa bacteriana, desde
una perspectiva multidisciplinar. Ha realizado estancias de in-
vestigación en el laboratorio del Prof. Andrés Moya (Centro
de Investigación en Salud Pública de Valencia, España) y del
Prof. Julián Echave (Universidad Nacional de San Mart́ın, Argentina). En los últimos años ha sido
coordinador y profesor de la asignatura de Bioinformática del Máster en Biof́ısica de la Universidad
Autónoma de Madrid.
Federico Abascal Sebastián de Erice
Federico Abascal se licenció y doctoró en Bioloǵıa Molecular en la Uni-
versidad Autónoma de Madrid. Ha desarrollado su labor de investiga-
ción en campos diversos de la Bioloǵıa, como el análisis de secuencias
de protéınas y la genómica, siempre utilizando los ordenadores como
herramienta y desde un enfoque evolutivo.
Actualmente trabaja como investigador contratado en el Centro Na-
cional de Investigaciones Oncológicas, en el grupo del Prof. Alfon-
so Valencia, con quien hizo la tesis doctoral en el Centro Nacio-
nal de Biotecnoloǵıa. También ha trabajado con los Prof. David Po-
sada (Universidad de Vigo) y Rafael Zardoya (Museo Nacional de
Ciencias Naturales), principales culpables de su afición a lo evoluti-
vo.
Jacobo Aguirre Araujo
Jacobo Aguirre Araujo (Madrid, 1975) se licenció en F́ısica, especiali-
dad Astrof́ısica, por la Universidad Complutense de Madrid en 1999.
Fue profesor de la Universidad Rey Juan Carlos hasta 2006, investiga-
dor del Centro de Astrobioloǵıa (CSIC-INTA) hasta junio de 2014, y
actualmente trabaja en el Centro Nacional de Biotecnoloǵıa (CSIC).
Su investigación versa sobre el análisis y la modelización de procesos
evolutivos en f́ısica y bioloǵıa en el contexto de la dinámica no lineal
y las redes complejas. Actualmente, está centrado en el estudio de
la evolución de virus y RNA. Ha realizado estancias de investigación
en Dinamarca, Alemania y EEUU. En 2003 fundó el Grupo de Astro-
nomı́a de la URJC y en 2005 recibió el Premio Nacional al Investigador
Novel en su modalidad de F́ısica Teórica.
Eduardo Andrés León
Eduardo Andrés León trabaja en el Instituto de Biomedicina de
Sevilla (IBIS) dentro del grupo de Bioloǵıa Computacional y Bioin-
formática (CbBio), donde es el responsable técnico de la unidad de
cálculo cient́ıfico de alto rendimiento. Estudió Bioloǵıa Molecular
en la Universidad Autónoma de Madrid y ha trabajado en el Cen-
tro Nacional de Biotecnoloǵıa (CNB-CSIC), Instituto Nacional de
Bioinformática y Centro Nacional de Investigaciones Oncológicas
(CNIO).
Actualmente colabora con la Fundación Española de Hipercoleste-
rolemia Familiar y con la Escuela Nacional de Sanidad del Instituto de salud Carlos III, donde desarrolla
labores docentes. Está interesado en el análisis y estudio integrativo de datos genómicos a gran escala
y en la regulación génica basada en elementos no codificantes como los “small RNAs”.
Djordje Bajic
Djordje es licenciado en Bioqúımica y máster en Biof́ısica
por la Universidad Autónoma de Madrid. Actualmente es
estudiante de doctorado en el laboratorio de Lógica de Sis-
temas Genómicos en el Centro Nacional de Biotecnoloǵıa
(Madrid).
Su investigación versa en el uso de modelos computaciona-
les y genómica comparativa para comprender la evolución
de la expresión génica.
Davide Baù
Después de haber obtenido un máster en Qúımica en la Universidad
de Padua y completar un curso de Bioinformática en la Universidad de
Colonia, Davide se trasladó a la Universidad de Dubĺın (UCD), donde,
en 2008, obtuvo su doctorado en la Facultad de Ciencias de la Compu-
tación e Informática, bajo la supervisión del Dr. Gianluca Pollastri.
Su tesis se centró en el desarrollo de un algoritmo de predicción de es-
tructuras de protéınas bajo la gúıa de un potencial estad́ıstico basado
en técnicas de aprendizaje automático o “machine learning”.
Davide realizó su postdoctorado en el laboratorio del Dr. Marc Marti-
Renom, donde comenzó a trabajar en la determinación de estructuras
de dominios genómicos y genomas. Durante este tiempo, desarrolló los
métodos que llevaron a la determinación del primer modelo de alta
resolución de una región genómica humana, el dominio α-globina y del
primer modelo tridimensional del genoma completo de una bacteria (Caulobacter crescentus). Actual-
mente está involucrado en diferentes colaboraciones que tienen como objetivo determinar la arquitec-
tura del genoma de varios organismos incluyendo humano, levadura,Mycoplasma pneumoniae, mosca
y ratón.
Juan Bueren Calabuig
Juan Bueren es licenciado en Farmacia por la Universidad
Complutense de Madrid y doctor en Farmacoloǵıa por la
Universidad de Alcalá (Madrid).
Juan ha realizando estudios de mecánica cuántica y dinámi-
ca molecular sobre el mecanismo cataĺıtico de diversas en-
zimas implicadas en la evasión del sistema inmune por el
parásito Trypanosoma cruzi causante de la enfermedad de
Chagas en la Universidad de Florida. También ha trabajado
en la Universidad de Edimburgo con el Dr. Julien Michel
estudiando el mecanimo de acción de protéınas intŕınsi-
camente desordenadas y a partir de septiembre de 2014
será investigador en la Universidad de Dundee para realizar estudios de protéınas de membrana.
Ivan Dotu
Ivan Dotu se doctoró en Ingenieŕıa Informática en la Universi-
dad Autónoma de Madrid, especializándose en Programación
con Restricciones y Búsqueda Local. En 2007 consiguió un beca
de la Fundación Caja Madrid para realizar un postdoctorado
en Brown University, donde trabajó en predicción de estructu-
ra de protéınas. Tras un año trabajando en la empresa privada,
Ivan Dotu volvió a la academia con un puesto de Profesor In-
vestigador en el Departamento de Bioloǵıa de Boston College,
donde trabajó, dentro del laboratorio de Bioloǵıa Estructural
liderado por el Prof. Peter Clote, en temas relacionados con la
estructura de RNA y la búsqueda y diseño de RNA funcional.
Ivan Dotu ha publicado decenas de art́ıculos en diversas áreas, ha sido co-PI de un proyecto de NSF
y ha co-organizado 2 escuelas de verano en Boston College sobre Métodos Computacionales de RNA.
También ha sido o es miembro del comité de programa de conferencias como CP, ECAI y AAAI y
revisor de art́ıculos para revistas como BMC Evolutionary Biology, PLOS ONE, PLOS Computational
Biology o Nucleic Acids Research. Actualmente, Ivan Dotu es un investigador visitante en la Univer-
sidad Politécnica de Cataluña y es colaborador renumerado de un proyecto NIH sobre la interacción
entre RNA y protéınas.
José Maŕıa Fernández González
José Maŕıa Fernández es un bioinformático perteneciente al Nodo 2
del Instituto Nacional de Bioinformática, en el Programa de Bioloǵıa
Estructural y Biocomputación del Centro Nacional de Investigaciones
Oncológicas. Tiene el t́ıtulo de Ingeniero en Informática por la Uni-
versidad de Málaga, y al acabar los estudios se interesó por la bioin-
formática, entrando en 1999 a formar parte del Protein Design Group
en el Centro Nacional de Bioinformática. Alĺı participó en varios pro-
yectos, entre ellos REGIA (REgulatory Gene Initiative in Arabidop-
sis), PlaNet Consortium y el proyecto de secuenciación de Buchnera
aphidicola, creó para el proyecto ORIEL los iHOP web services y cola-
boró en el germen del actual INB. En 2002 obtuvo el T́ıtulo de Estudios
Avanzados en el departamento de Informática de la Universidad Autónoma de Madrid. En 2006 se tras-
ladó junto con el grupo de Alfonso Valencia al CNIO, ya como bioinformático del INB, participando
en proyectos como EMBRACE, ENFIN, ICGC, BLUEPRINT y RD-Connect.
Sus principales ĺıneas de desarrollo a lo largo de estos años han sido el procesamiento, consulta y análisis
de secuencias y de grandes volúmenes de información; el diseño y uso de bases de datos de distinto tipo
(SQL, XML, NoSQL) con el volumen de datos a nivel bioinformático, y de modelos de datos que se
amoldaran a las necesidades de la bioinformática; desarrollo de servicios web en distintos paradigmas
(REST, SOAP+WSDL, etc...), aśı como la colaboración en el diseño e implementación del estándar
BioMOBY.
Álvaro Cortés Cabrera
Álvaro Cortés es licenciado en Farmacia y máster en Biof́ısi-
ca. Actualmente compagina sus estudios de doctorado en la
Unidad de Bioinformática del Centro de Bioloǵıa Molecular
Severo Ochoa y su trabajo como profesor en la Universidad de
Alcalá.
Su investigación versa en estudios de docking protéına-ligando
y protéına-protéına.
Beatriz Garćıa Jiménez
Beatriz Garćıa Jiménez es investigadora postdoctoral Isaac Peral en el
Grupo de Bioinformática del Centro de Biotecnoloǵıa y Genómica de
Plantas UPM-INIA desde Septiembre del 2013.
Obtuvo su tesis doctoral, titulada “Anotación Funcional de Protéınas
basada en Representación Relacional en el entorno de la Bioloǵıa de
Sistemas”, por la Universidad Carlos III de Madrid (UC3M) en 2012,
dirigida por el Dr. Alfonso Valencia (Bio-CNIO) y la Dra. Araceli
Sanchis (Inf-UC3M). Fue profesora ayudante del departamento de In-
formática de la UC3M desde Marzo del 2006 hasta Agosto de 2013.
Realizó una estancia postdoctoral en el departamento de Bioloǵıa
Computacional y Algoritmos aplicados en el Instituto Max-Planck de
Informática (MPII) de Febrero a Junio de 2013.
Su tesis ganó el Premio Nacional a la mejor tesis, en el área de ciencias experimentales y tecnológicas,
concedido por la Real Academia de Doctores de España. Además, ha recibido otros premios de la UC3M
(Premio Extraordinario de Doctorado, 2011-2012), y de la Comunidad de Madrid (Aprovechamiento
Académico Excelente, 2004-2005), entre otros.
Está especializada en aprendizaje automático aplicado a la bioinformática, principalmente en predicción
de anotación funcional. Sus intereses cient́ıficos incluyen representación relacional del conocimiento,
mineŕıa de datos, anotación funcional, workflows y redes de protéınas.
Actualmente estudia cómo extraer información de los workflows bioinformáticos, anotándolos semánti-
camente e identificando fragmentos reusables de conocimiento cient́ıfico bioinformático, y participa en
un proyecto de localización de marcadores de Alzheimer.
Helena Gomes Dos Santos
Helena Gomes Dos Santos se licenció en Bioloǵıa por la Universidad
Autónoma de Madrid, donde además cursó un máster en Biof́ısica
y recientemente se doctoró en Biociencias Moleculares bajo la su-
pervisión del Dr. Ugo Bastolla y el Dr. Antonio Morreale (Centro
de Bioloǵıa Molecular Severo Ochoa, CSIC-UAM, Madrid).
Sus inicios en la bioinformática se remontan al último año de ca-
rrera, el laboratorio del Dr. Angelo Messina (Universidad de Cata-
nia). Desde muy temprano mostró un especial interés en el mun-
do computacional, colaborando en el desarrollo e implementación
de nuevas herramientas bioinformáticas aśı como su aplicación en
casos reales mediante numerosas colaboraciones con grupos expe-
rimentales.
Su labor investigadora se ha centrado principalmente en el estudio de la variabilidad estructural, la
dinámica y las posibles interacciones entre protéınas y otras moléculas. Como complemento a dicha
formación, en la actualidad se encuentra realizando su investigación postdoctoral en el laboratorio de la
Dra. Siltberg-Liberles (Universidad Internacional de Florida), donde evolución y dinámica de protéınas
se combinan para ofrecernos una imagen más completa del funcionamiento y posible modulación de
las funciones proteicas con una directa aplicación en la mejora del diseño de fármacos asistido por
ordenador y la terapia personalizada.
Raúl Guantes Navacerrada
Raúl Guantes es profesor contratado doctor de la Universidad
Autónoma de Madrid, donde coordina desde el año 2008 un
programa oficial de posgrado en Biof́ısica y dirige el laboratorio
de Biodinámica y Bioloǵıa Computacional.
Es doctor en Ciencias Qúımicas por la misma universidad y
ha investigado en diversos campos de la F́ısica y la Bioloǵıa
desde una perspectiva teórica: f́ısica no lineal y de sistemas
complejos, f́ısica estad́ıstica, f́ısica de superficies, neurociencia
y bioloǵıa de sistemas.
Desde el año 2006 centra su investigación en el estudio de las
redes biológicas y sus principios de diseño, aśı como en los
oŕıgenes y consecuencias de la variabilidad celular no genética.
Iker Irisarri Anguita
Iker Irisarri se licenció en Bioloǵıa por la Universidad de Navarra y obtuvo
su doctoradopor la Universidad Autónoma de Madrid en 2012, desem-
peñando su labor investigadora en el Museo Nacional de Ciencias Na-
turales (CSIC) bajo la dirección del Prof. Rafael Zardoya. Durante es-
te periodo, se especializó en filogenia y evolución molecular de anima-
les, y realizó estancias de investigación en Alemania, Australia y Califor-
nia.
En la actualidad, trabaja como investigador postdoctoral en la Universi-
dad de Constanza (Alemania) en filogenómica y genómica comparada de
vertebrados.
Natalia Jiménez Lozano
Natalia Jiménez es licenciada en Bioqúımica por la Universidad de
Granada. Realizó su doctorado en el Departamento de Biocomputación
del Centro Nacional de Biotecnoloǵıa.
Cuando terminó el doctorado emprendió el reto de montar desde ce-
ro una Unidad de Bioinformática perteneciente al Instituto Nacional
de Bioinformática, al que ha pertenecido hasta el año 2012, en el que
entró a formar parte de la empresa Bull con la responsabilidad de
desarrollar el negocio de la sanidad y ciencias de la vida a nivel inter-
nacional.
Javier Klett Arroyo
Javier Klett es licenciado en Matemáticas, máster en
Biof́ısica por la Universidad Autónoma de Madrid y
realizó su doctorado en la Unidad de Bioinformática del
Centro de Bioloǵıa Molecular Severo Ochoa (Madrid).
Su especialidad son los estudios energéticos y potenciales
de unión protéına-protéına. Actualmente compagina la in-
vestigación postdoctoral en el grupo de Qúımica y Bioloǵıa
Computacional en el Centro de Investigaciones Biológicas
de Madrid y su trabajo como profesor en el Departamento
de Bioingenieŕıa e Ingenieŕıa Aeroespacial de la Universi-
dad Carlos III (Madrid).
Raúl Méndez Giráldez
Raúl Méndez Giráldez, es licenciado en Qúımica por la Universi-
dad de Barcelona y doctor en Ciencias por la Universidad Libre
de Bruselas. Su carrera profesional se ha desarrollado en el campo
de la bioinformática estructural, inicialmente durante su doctorado
evaluando los métodos para predecir la estructura de los complejos
de protéına, y más tarde se ha ido centrando en el desarrollo de
métodos computacionales de red elástica para estudiar la flexibili-
dad de la protéınas.
En la actualidad trabaja como investigador postdoctoral en el de-
partamento de Bioqúımica y Biof́ısica de la Universidad de Ca-
rolina del Norte (EEUU) utilizando métodos de dinámica mole-
cular y diseño racional de protéınas con aplicaciones terapéuti-
cas.
Antonio Morreale
Antonio Morreale estudió Ciencias Qúımicas en la Universidad
de Alcalá de Henares, Madrid, donde se doctoró en el año 2001
bajo la supervisión de la Dra. Isabel Iriepa tras una estancia de
dieciocho meses en el Chemistry Department de la IUPUI (In-
diana, USA) como estudiante de doctorado donde trabajó con
los Profs. Kenny B. Lipkowitz (codirector de su tesis) y Donald
B. Boyd. Después realizó una estancia postdoctoral en el labo-
ratorio de los Profs. Modesto Orozco y Javier Luque durante
casi dos años y medio.
A su vuelta a Madrid (2004) se incorporó a la Unidad de Bio-
informática (UB) creada por el Dr. Ángel R. Ortiz en el centro
de Bioloǵıa Molecular Severo Ochoa (CBMSO), primero como
postdoctoral asociado (2004-2008) y luego como director de la
ĺınea de diseño de fármacos y codirector del Servicio de Bioinformática del CBMSO. A finales de 2012
se incorpora como tecnólogo senior al área de bioenerǵıa de la compañ́ıa Repsol S.A.
Antonio Morreale es autor de unos 60 art́ıculos de investigación en publicaciones especializadas inclu-
yendo revisiones bibliográficas y caṕıtulos de libro. Además, es coinventor de varias patentes, dos de
las cuales han sido licenciadas. Ha dirigido cuatro tesis doctorales y ha participado como organizador
y profesor en numerosos cursos y másteres.
Su trayectoria cient́ıfica ha sido una evolución continua desde los principios que rigen las interacciones
entre moléculas (tanto cuánticos como clásicos) hasta la aplicación de éstos en el diseño racional de
fármacos. En la actualidad trabaja en el modelado y simulación de reacciones cataĺıticas claves en
ciertas rutas metabólicas con la finalidad de obtener nuevos biocombustibles.
Almudena Perona
Almudena Perona es directora de proyectos en la empresa SmartLigs,
compañ́ıa biotecnológica dedicada al descubrimiento y desarrollo de
nuevos fármacos mediante tecnoloǵıas de qúımica computacional. Doc-
tora en Qúımica Orgánica por la Universidad Nacional de Educación
a Distancia (UNED), especialista en śıntesis orgánica de heterociclos
y caracterización de moléculas orgánicas sencillas por NMR.
Como investigadora postdoctoral en la Unidad de Bioinformáti-
ca del Centro de Bioloǵıa Molecular Severo Ochoa (CSIC-UAM)
ha colaborado en proyectos de diseño de fármacos mediante estu-
dio in silico de la interacción entre protéınas y moléculas senci-
llas, usando herramientas bioinformáticas, principalmente programas
de docking protéına-ligando, protéına-protéına y dinámica molecu-
lar.
Michael Stich
Después de estudiar F́ısica en la Freie Universität Berlin y la Universidad
de Granada, Michael realizó el doctorado en el Fritz-Haber-Institut de la
Max Planck Society en Berĺın que terminó en el año 2003.
Obtuvo una beca Marie Curie postdoctoral para estar en la Universidad
Complutense de Madrid, y trabajó de postdoc y posteriormente como
investigador contratado en el Centro de Astrobioloǵıa (CSIC/INTA), a
la vez de ser profesor asociado en la Universidad Politécnica de Madrid.
Después de ser investigador asociado en la Harvard University, se incor-
poró como docente en la Aston University (Birmingham, UK) en 2013. Su
trabajo reciente está enfocado en la modelización de sistemas biológicos
complejos y de procesos evolutivos, p.ej. RNA.
Rafael Zardoya San Sebastián
Rafael Zardoya se doctoró en Bioloǵıa en la Universidad Compluten-
se de Madrid en 1994. Tras una estancia postdoctoral de 2 años en
la Universidad del Estado de Nueva York en Stony Brook (EEUU),
regresó en 1997 al Museo Nacional de Ciencias Naturales de Madrid
donde es profesor de investigación del CSIC desde 2008.
Su ĺınea de investigación se centra en el estudio de los mecanismos
evolutivos que generan la diversidad biológica. En particular utiliza
secuencias de DNA (genomas mitocondriales, transcriptomas) para la
reconstrucción de las relaciones filogenéticas de los grandes grupos de
vertebrados y moluscos y realiza análisis genómico/transcriptómicos
comparados en un marco evolutivo.
Sonia Tarazona Campos
Sonia Tarazona se licenció en Matemáticas (1997) y Ciencias y
Técnicas Estad́ısticas (2001) por la Universitat de València. Des-
de 2005 es profesora asociada en el Departamento de Estad́ıstica
e Investigación Operativa Aplicadas y Calidad de la Universitat
Politècnica de València.
Desde 2008 forma parte del grupo de Genómica de la Expresión
Génica liderado por la Dra. Ana Conesa en el Centro de In-
vestigación Pŕıncipe Felipe (Valencia). Durante este tiempo, ha
colaborado en diversos proyectos de investigación y actualmente
forma parte del proyecto europeo STATegra cuyo objetivo es el
desarrollo de métodos estad́ısticos para la integración de distin-
tos datos “ómicos”.
En paralelo, ha realizado su tesis doctoral que lleva co-
mo t́ıtulo “Statistical methods for transcriptomics: from
microarrays to RNA-seq” y que será defendida en bre-
ve.
Inmaculada Yruela Guerrero
Inmaculada Yruela es doctora en Qúımica por la Universidad de Se-
villa. Después de realizar una estancia postdoctoral en el Max-Planck
Institute for Bioinorganic Chemistry en Mülheim and der Ruhr (Ale-
mania) ocupó su actual posición de investigador cient́ıfico en la Esta-
ción Experimental de Aula Dei del Consejo Superior de Investigaciones
Cient́ıficas (EEAD-CSIC), Zaragoza.
Su investigación se ha centrado en el estudio de la estructura y la
función de los fotosistemas y metaloprotéınas que intervienen en el
transporteelectrónico fotosintético, en la homeostasis del Cu en el
cloroplasto y en aspectos evolutivos de las enzimas FAD sintetasas
cloroplásticas.
Recientemente sus investigaciones se orientan a entender la dinámi-
ca evolutiva de las protéınas intŕınsecamente desordenadas (IDPs) en
plantas y descubrir nuevas redes de regulación transcripcional en estos
organismos. Sus actuales proyectos se desarrollan en el Grupo de Bioloǵıa Computacional y Estructural
de la EEAD-CSIC y colabora con el Instituto de Biocomputación y F́ısica de Sistemas Complejos de
la Universidad de Zaragoza.
Índice general
I Fundamentos de bioinformática, estad́ıstica y gestión de información cient́ıfi-
ca 1
1. Bases de datos biomédicas, servidores web y otros recursos online 3
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. ¿Qué es un dato biológico? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2. Dato crudo y dato procesado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3. Dato, información y conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4. Caracteŕısticas de los datos biológicos . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.5. Tipos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.6. Ciclo de vida de los datos biológicos . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Historia de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1. ¿Por qué son esenciales las bases de datos? . . . . . . . . . . . . . . . . . . . . . 7
1.2.2. Diversidad de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Estructura de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4. Interrelación entre bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5. Calidad y revisión de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.1. Anotación de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2. Vocabularios controlados y ontoloǵıas . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5.3. Revisores ¿quiénes son y qué hacen? . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6. Números de acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7. Gestión de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.8. Tipos de bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.8.1. Procedencia de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.8.2. Revisión de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.8.3. Clasificación EBI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.8.4. Clasificación NCBI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8.5. Clasificación NAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8.6. Redundancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8.7. Acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.8.8. Búsqueda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.9. Bases de datos más relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.9.1. UniProt Knowledgebase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.9.2. GenBank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.10. Obtención de secuencias y formatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.11. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.12. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2. Gestión de bibliograf́ıa e información y escritura de art́ıculos cient́ıficos 29
i
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2. Bases de datos de literatura cient́ıfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1. Servidores de art́ıculos por publicar . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.2. PubMed y PubMed Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.3. Google Scholar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3. Índices y medidas de impacto cient́ıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4. Gestores de bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.1. Zotero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.2. Mendeley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.3. Biblioteca de Google Scholar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5. Escritura de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5.1. Formato y plantillas de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.2. Proceso de env́ıo y revisión de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . 45
2.6. Primeros pasos con LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.6.1. Crear un art́ıculo con LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.6.2. Compilar código LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.6.3. Editores LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.6.4. Instalación de una distribución LaTeX . . . . . . . . . . . . . . . . . . . . . . . . 53
2.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3. Estad́ıstica y R 57
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.1.1. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.1.2. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.1.3. Introducción a R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2. Estad́ıstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.1. Parámetros de posición y dispersión . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.2. Gráficos en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.2. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3.3. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.3.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4. Inferencia estad́ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4.1. Estad́ıstica paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4.2. Estad́ıstica no paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4.3. Remuestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4.4. Corrección por tests múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.4.5. Enfoquebayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.5. Modelos lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.5.1. Modelos ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.5.2. Regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.5.3. Modelos lineales generalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.6. Métodos multivariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.6.1. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.6.2. Análisis de Componentes Principales . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4. Fundamentos de programación 99
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2. Tipos de lenguajes de programación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.1. Abstracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.2. Ejecución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.2.3. Paradigma de programación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.2.4. ¿Que lenguaje de programación usar? . . . . . . . . . . . . . . . . . . . . . . . . 101
4.3. Consola de Linux, Mac OS X y Windows. Operaciones básicas . . . . . . . . . . . . . . 102
4.3.1. Tipos de Shell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4. Perl y BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.4.1. Introducción a Perl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.4.2. Instalación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.4.3. Programando en Perl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4.4. BioPerl y la programación orientada a objetos . . . . . . . . . . . . . . . . . . . 112
4.4.5. Programando con BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.4.6. Ejercicios con BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4.7. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5. Mineŕıa de datos 119
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.1.1. Aplicaciones de la mineŕıa de datos . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.1.2. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.1.3. Herramienta: Weka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.2. Retos de la mineŕıa de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.3. Recopilación y selección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.3.1. Repositorios de datos biológicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.3.2. Servicios web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.3.3. Libreŕıas de programación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.4. Preprocesamiento y transformación de datos . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.4.1. Balanceo de clases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.4.2. Gestión de valores desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.4.3. Normalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.4. Discretización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.5. Selección de atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.4.6. Extracción de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.4.7. Conjuntos no redundantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.5. Modelado. Aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
5.6. Evaluación e interpretación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.6.1. Estimación del rendimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.6.2. Medidas de rendimiento unidimensionales . . . . . . . . . . . . . . . . . . . . . . 146
5.6.3. Medidas de rendimiento bidimensionales . . . . . . . . . . . . . . . . . . . . . . . 150
5.6.4. Interpretación biológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6. Computación paralela y clústeres de cálculo 157
6.1. Computación paralela y ejemplos de programación . . . . . . . . . . . . . . . . . . . . . 158
6.1.1. Paralelización en Perl (threads) . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.1.2. Paralelización en Python (multiprocessing y subprocess) . . . . . . . . . 163
6.2. Clústeres de cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.2.1. Nodos, memoria, procesadores, núcleos, procesos e hilos . . . . . . . . . . . . . . 168
6.2.2. Rendimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.3. Conexión remota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.3.1. Protocolo SSH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.3.2. Nodo de acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
6.4. Transferencia remota de archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
6.4.1. Protocolo SCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.5. Sistema gestor de colas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.6. Sun Grid Engine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
6.6.1. Ejecución ordinaria de trabajos (qrsh) . . . . . . . . . . . . . . . . . . . . . . . . 175
6.6.2. Procesamiento por lotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.6.3. Ejecución de procesos por lotes (qsub) . . . . . . . . . . . . . . . . . . . . . . . . 176
6.6.4. Control del estado de los trabajos (qstat) . . . . . . . . . . . . . . . . . . . . . . 178
6.6.5. Eliminarción de procesos (qdel), errores y salida estándar . . . . . . . . . . . . . 180
6.6.6. Requerimientos de memoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
6.6.7. Uso de múltiples slots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
II Macromoléculas biológicas, alineamiento de secuencias y filogenia 183
7. Macromoléculas biológicas: protéınas, DNA y RNA 185
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
7.2. Genes y protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
7.3. Estructura primaria de DNA y RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.4. El código genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
7.5. Aminoácidos y enlace pept́ıdico . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.5.1. Aminoácidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.5.2. Enlace pept́ıdico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
7.5.3. Ángulos de torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.6. Niveles estructurales en protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
7.6.1. Estructura primaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
7.6.2. Estructura secundaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
7.6.3. Estructura terciaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.6.4. Estructura cuaternaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.7. Métodos emṕıricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
7.7.1. Cristalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
7.7.2. Difracción de rayos X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
7.7.3. Resonancia magnética nuclear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
7.8. Herramientas bioinformáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.8.1. Protein Data Bank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.8.2. Visualización de estructuras en 3D . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.9. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8. Análisis de secuencias biológicas 211
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
8.1.1. Homoloǵıa de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
8.1.2. Diferencias alineamiento DNA y protéınas . . . . . . . . . . . . . . . . . . . . . . 213
8.2. Obtención de secuencias y formatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
8.2.1. Bases de datos de secuencias de DNA y protéınas . . . . . . . . . . . . . . . . . . 214
8.2.2. Formatos de archivos de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . 214
8.2.3. Ejemplo lectura fichero de secuencia . . . . . . . . . . . . . . . . . . . . . . . . . 216
8.3. Alineamiento de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
8.3.1. Definición de similitud e identidad . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.3.2. Matrices de sustitución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.3.3. Significación estad́ıstica y E-value . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.3.4. El twilight u ‘ocaso’ de los alineamientos . . . . . . . . . . . . . . . . . . . . . . . 222
8.3.5. Técnicas y programas de alineamiento . . . . . . . . . . . . . . . . . . . . . . . . 223
8.3.6. Alineamiento local de pares de secuencias . . . . . . . . . . . . . . . . . . . . . . 224
8.3.7. Alineamiento global de pares de secuencias . . . . . . . . . . . . . . . . . . . . . 225
8.3.8. Alineamiento múltiple de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . 226
8.3.9. Edición y visualización de alineamientos . . . . . . . . . . . . . . . . . . . . . . . 227
8.4. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9. Filogenia y evolución molecular 231
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.1.1. Teoŕıa de la Evolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
9.1.2. Evolución molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
9.1.3. Interpretación de un árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
9.2. Métodos de reconstrucción filogenética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.2.1. Alineamiento múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.2.2. Modelos de evolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.2.3. Métodos de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
9.2.4. Métodos probabiĺısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
9.3. Contrastes de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
9.3.1. Contrastes entre modelos evolutivos . . . . . . . . . . . . . . . . . . . . . . . . . 247
9.3.2. Robustez y contraste de árboles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
9.4. Reconstrucción de estados ancestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
9.5. Gúıa rápida de reconstrucción filogenética . . . . . . . . . . . . . . . . . . . . . . . . . . 252
9.6. Programas recomendados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
9.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
III Bioloǵıa estructural de protéınas 261
10.Alineamiento de estructura de protéınas 263
10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
10.2. Descripción general del método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
10.3. Comparaciones locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
10.4. Construcción del alineamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
10.5. Medidas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
10.5.1. Medidas crudas y normalizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 272
10.5.2. Una medida con motivación evolutiva . . . . . . . . . . . . . . . . . . . . . . . . 274
10.6. Alineamiento múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
10.6.1. Primeros pasos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
10.6.2. Construcción del alineamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
10.7. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
10.8. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
11.Modelos simplificados de plegamiento de protéınas 283
11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
11.2. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
11.2.1. Paradoja de Levinthal y experimento de Anfinsen . . . . . . . . . . . . . . . . . 285
11.2.2. Paisaje energético y principio de mı́nima frustración . . . . . . . . . . . . . . . . 286
11.3. Fundamentos teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
11.3.1. paisaje energético del modelo de enerǵıa al azar . . . . . . . . . . . . . . . . . . . 289
11.3.2. Un paisaje energético un poco más realista . . . . . . . . . . . . . . . . . . . . . 292
11.3.3. Cinética del plegamiento y gap de estabilidad . . . . . . . . . . . . . . . . . . . . 294
11.3.4. Diagrama de fases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
11.4. Algunos ejemplos computacionales sencillos . . . . . . . . . . . . . . . . . . . . . . . . . 299
11.4.1. Modelos de grano grueso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
11.4.2. La transición v́ıtrea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
11.4.3. Diseñabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
11.4.4. Plegamientode una protéına simplificada . . . . . . . . . . . . . . . . . . . . . . 305
11.5. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
11.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
12.Evolución de estructura de protéınas 313
12.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
12.2. Origen de nuevas protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
12.3. Divergencia estructural gradual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
12.3.1. Clasificación de estructura de protéınas . . . . . . . . . . . . . . . . . . . . . . . 318
12.3.2. Cuantificando la divergencia estructural . . . . . . . . . . . . . . . . . . . . . . . 322
12.4. Evolución estructural mediante ensamblaje de módulos . . . . . . . . . . . . . . . . . . . 323
12.4.1. Péptidos ancestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
12.4.2. Búsqueda por recurrencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
12.5. Divergencia estructural Vs. ensamblaje de módulos . . . . . . . . . . . . . . . . . . . . . 326
12.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
13.Protéınas desordenadas 333
13.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
13.2. Desorden en protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
13.3. Predición de desorden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
13.3.1. Métodos bioinformáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
13.4. Composición, distribución y función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
13.5. Enfermedades asociadas a protéınas desordenadas . . . . . . . . . . . . . . . . . . . . . . 344
13.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
IV Bioloǵıa estructural de ácidos nucleicos 349
14.Estructura, plegamiento y evolución del RNA 351
14.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
14.2. Tipos de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
14.3. Niveles estructurales del RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
14.3.1. Composición qúımica y estructura primaria . . . . . . . . . . . . . . . . . . . . . 353
14.3.2. Estructura secundaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
14.3.3. Estructura terciaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
14.3.4. Ejemplo estructura tRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
14.3.5. Arquitectura del RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
14.4. Plegamiento de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
14.4.1. Aspectos generales del plegamiento de RNA . . . . . . . . . . . . . . . . . . . . . 360
14.4.2. Predicción de estructuras de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . 362
14.4.3. Otros problemas relacionados con el plegamiento . . . . . . . . . . . . . . . . . . 368
14.4.4. Bioloǵıa Sintética de RNA: plegamiento inverso . . . . . . . . . . . . . . . . . . . 370
14.5. Evolución de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
14.5.1. El RNA como modelo evolutivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
14.5.2. Redes neutrales de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
14.5.3. Modelización matemática de la evolución . . . . . . . . . . . . . . . . . . . . . . 374
14.5.4. Limitaciones y ĺıneas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
14.5.5. Evolución dirigida a una estructura objetivo . . . . . . . . . . . . . . . . . . . . . 379
14.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
15.Estructura y organización del DNA 387
15.0.1. Niveles de organización del DNA en la cromatina . . . . . . . . . . . . . . . . . . 387
15.0.2. Determinación de la estructura de dominios genómicos . . . . . . . . . . . . . . . 388
15.0.3. Determinación de estructura con IMP . . . . . . . . . . . . . . . . . . . . . . . . 390
15.0.4. Ejemplo de determinación de estructura por IMP . . . . . . . . . . . . . . . . . . 394
15.0.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
15.1. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
V Dinámica estructural y diseño de fármacos 399
16.Diseño de fármacos asistido por ordenador 401
16.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
16.2. Docking protéına-ligando . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
16.2.1. Definición del problema del docking . . . . . . . . . . . . . . . . . . . . . . . . . 402
16.2.2. Componente estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
16.2.3. Componente energética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
16.2.4. Docking : consideraciones teóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
16.2.5. El proceso de docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
16.2.6. Evaluación de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
16.3. Cribado virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
16.3.1. Posibles escenarios para el VS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
16.3.2. Estudios de VS retrospectivos y prospectivos . . . . . . . . . . . . . . . . . . . . 414
16.3.3. Herramientas de virtual screening . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
16.4. Docking protéına-protéına . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.4.1. El proceso de docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
16.4.2. Clasificación y post-procesado de las soluciones . . . . . . . . . . . . . . . . . . . 419
16.5. Docking protéına-ácido nucleico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
16.6. Conclusiones y perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
16.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
17.Dinámica molecular 425
17.1. Introdución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.2. Mecánica molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
17.2.1. El campo de fuerzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
17.2.2. Términos enlazados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
17.2.3. Términos no enlazados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
17.2.4. Parametrización del campo de fuerzas . . . . . . . . . . . . . . . . . . . . . . . . 430
17.2.5. Minimización de enerǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430
17.3. Simulaciones de dinámica molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
17.3.1. Cálculo de las fuerzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
17.3.2. Integración de las ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . . 432
17.3.3. Condiciones de ĺımite periódico . . . . . . . . . . . . . . . . . .. . . . . . . . . . 433
17.3.4. Cálculo de las interacciones no enlazantes . . . . . . . . . . . . . . . . . . . . . . 433
17.3.5. Preparación y ejecución de una DM . . . . . . . . . . . . . . . . . . . . . . . . . 434
17.3.6. Simulaciones de macromoléculas biológicas . . . . . . . . . . . . . . . . . . . . . 435
17.4. Métodos h́ıbridos QM/MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
17.5. Programas y tutoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439
17.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
18.Análisis de modos normales 443
18.1. Introducción al análisis de modos normales . . . . . . . . . . . . . . . . . . . . . . . . . 443
18.1.1. El oscilador armónico simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
18.1.2. Modos normales en espacio cartesiano . . . . . . . . . . . . . . . . . . . . . . . . 445
18.1.3. Modos mormales en espacio diedro . . . . . . . . . . . . . . . . . . . . . . . . . . 448
18.2. Modelos de redes elásticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
18.2.1. El modelo de red Gaussiana o GNM . . . . . . . . . . . . . . . . . . . . . . . . . 450
18.2.2. El modelo de red Anisotrópica o ANM . . . . . . . . . . . . . . . . . . . . . . . . 451
18.3. La molécula triatómica lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
18.4. Ejemplos prácticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
18.4.1. Introducción a ProDy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
18.4.2. Cálculo de modos normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
18.4.3. Cálculo de los factores B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
18.4.4. Cálculo de una estructura deformada . . . . . . . . . . . . . . . . . . . . . . . . . 462
18.5. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
VI Bioloǵıa de sistemas 467
19.Bioloǵıa de sistemas 469
19.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
19.2. Redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
19.2.1. Definición de red compleja y conceptos básicos . . . . . . . . . . . . . . . . . . . 471
19.2.2. Propiedades de las redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . 472
19.2.3. Breve descripción de las redes biológicas . . . . . . . . . . . . . . . . . . . . . . . 477
19.3. Redes de regulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478
19.3.1. Modelos lógicos o booleanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478
19.3.2. Modelos cinéticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
19.3.3. Modelos termodinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
19.3.4. Regulación combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
19.3.5. Análisis de motivos de red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
19.3.6. Ruido en expresión genética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
19.3.7. Modelos cinéticos estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496
19.3.8. Diferentes fuentes de ruido en expresión genética . . . . . . . . . . . . . . . . . . 499
19.4. Redes metabólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502
19.5. Robustez en los sistemas biológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506
19.5.1. Redundancia por duplicación génica . . . . . . . . . . . . . . . . . . . . . . . . . 507
19.5.2. Robustez distribuida en el metabolismo . . . . . . . . . . . . . . . . . . . . . . . 508
19.6. Lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512
19.7. Herramientas computacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513
19.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514
19.9. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517

Continuar navegando

Materiales relacionados