Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Bioinformática con Ñ Volumen I: Principios de Bioinformática Edición y coordinación: Álvaro Sebastián y Alberto Pascual-Garćıa Autores: F. Abascal, J. Aguirre, E. Andrés-León, D. Bajic, D. Baú, J. A. Bueren-Calabuig, Á. Cortés-Cabrera, I. Dotu, J. M. Fernández, H. G. D. Santos, B. Garćıa-Jiménez, R. Guantes, I. Irisarri, N. Jiménez-Lozano, J. Klett, R. Méndez, A. Morreale, A. Pascual-Garćıa, A. Perona, A. Sebastian, M. Stich, S. Tarazona, I. Yruela y R. Zardoya Portada: Enrique Sahagún (http://www.scixel.es) Maquetación: Álvaro Sebastián Usando LATEX(http://www.latex-project.org) y Texmaker (http://www.xm1math.net/texmaker) Editorial: Libro autoeditado e impreso por CreateSpace (http://www.createspace.com) Depósito legal: SE-NNNNNNN ISBN: NNNNNNN Copyright de la portada: © 2014 Enrique Sahagún Copyright de los textos: © 2014 Los respectivos autores Copyright de las figuras: © 2014 Los respectivos autores, si no se indica lo contrario Licencia de las figuras: La establecida por sus autores en los textos originales Licencia de los textos: Creative Commons BY-NC-SA 4.0 (http://creativecommons.org/licenses/by-nc-sa/4.0/) La licencia Creative Commons BY-NC-SA 4.0 permite: Compartir: copiar y redistribuir el material en cualquier medio o formato Adaptar: mezclar, transformar y crear a partir del material Bajo los siguientes términos: Atribución: se debe dar el crédito de la obra a los autores originales, proveer un enlace a la licencia e indicar los cambios realizados. NoComercial: no se puede hacer uso del material con fines comerciales. CompartirIgual: Si se mezcla, transforma o crea nuevo material a partir de esta obra, sólo se podrá distribuir utilizando la misma licencia que la obra original. http://www.scixel.es http://www.latex-project.org http://www.xm1math.net/texmaker http://www.createspace.com http://creativecommons.org/licenses/by-nc-sa/4.0/ Prólogo Volumen I. Principios de bioinformática. 5 Prólogo La bioinformática y la bioloǵıa computacional persiguen ordenar el conocimiento que se deriva del análisis de datos biológicos, fundamentalmente secuencias y genomas, con ayuda de algoritmos y sis- temas informáticos. Por su naturaleza transversal han colonizado a otras disciplinas y ya son parte integral de los métodos de trabajo de áreas tan amplias como la biotecnoloǵıa, la ecoloǵıa, la bioloǵıa o la medicina. Proyectos cient́ıficos de gran impacto en nuestras vidas, como la secuenciación del genoma humano, la caracterización de las diferentes variedades de cáncer, el diseño de nuevos medicamentos o la selección genómica en el sector agropecuario han sido y seguirán siendo posibles gracias, en gran medida, a los avances de la bioinformática. Todo esto ha ocurrido en los últimos 30 años, y a un ritmo muy dif́ıcil de seguir incluso para los especialistas. De hecho, es fácil abrumarse con el volumen de literatura al alcance de la mano, ya sea en canales convencionales como las revistas Bioinformatics o PLoS Computational Biology, editadas por cient́ıficos de prestigio, o foros como Biostar o SEQanswers, donde usuarios de todo el mundo comparten protocolos y experiencia al estilo peer to peer. Como dećıa, la bioinformática ha evolucionado rápidamente en años recientes y eso se ha traducido en una demanda creciente de profesionales cualificados en el diseño y aplicación de esta clase de herra- mientas computacionales. Estos especialistas pueden tener curŕıculum vitae muy distintos, habiendo recorrido itinerarios académicos posiblemente diferentes, pero finalmente han de tener una serie de ha- bilidades fundamentales como son conocimientos en genética y bioloǵıa molecular, dominio de lenguajes de programación y la capacidad de administrar y sacar el máximo rendimiento a los datos y el hardware disponible, ya sea en un laboratorio de investigación o una pequeña empresa biotecnológica. Aunque la bioinformática tiene una dimensión global y se habla en inglés, también es cierto que en muchas universidades a éste y al otro lado del Atlántico la lengua vehicular para la enseñanza es el español. En consecuencia hay un espacio y una demanda real de materiales educativos en español, y muestra de ellos son los cada vez más numerosos blogs y bitácoras que tratan sobre esta materia en nuestra lengua. Este libro es el esfuerzo colectivo de un buen elenco de investigadores expertos, en su mayoŕıa por debajo de los 40 años, por contribuir a llenar ese espacio con contenidos cient́ıficos. En efecto, tras el texto pionero publicado por el profesor Lahoz-Beltrá en 2004, este libro es el primero escrito en nuestra lengua que hace un repaso tan amplio y ambicioso del área, y complementa de manera natural los recursos disponibles en la Red. En esta edición inicial los autores tocan de forma exhaustiva una selección de temas fundamentales de la bioloǵıa computacional, y por tanto es de esperar que este libro se convierta en un recurso valio- so para estudiantes y profesores de las universidades de habla hispana. Para los estudiantes, porque aqúı podrán encontrar material para ahondar en su estudio de la bioinformática, incluyendo citas a art́ıculos de la literatura cient́ıfica, normalmente en inglés; para los profesores universitarios, porque podrán apoyarse en este libro para programar y dotar de contenido a las asignaturas y materias re- lacionadas con la bioinformática, que todav́ıa en muchas universidades son claramente insuficientes. Finalmente, seguramente este libro contribuya a introducir y traducir al español el caudal constante de términos y conceptos de la bioinformática. El reto que tiene por delante será sin duda el de la renovación permanente para no sucumbir a la evolución del área, de modo que los temas incluidos sean representativos de las áreas vigentes de la disciplina. La filosof́ıa colaborativa de este proyecto, donde tanto el editor como los autores han participado en la selección de materiales y en la toma de deciciones editoriales, parece adecuada para este fin. Bruno Contreras Moreira Zaragoza, Septiembre de 2014 El Dr. Bruno Contreras es director del Laboratorio de Bioloǵıa Computacional en la Estación Experimental de Aula Dei (EEAD/CSIC, Zaragoza, España) y profesor invitado de la Universidad Autónoma de México (Cuernavaca, México). Prólogo Volumen II. Bioloǵıa estructural y de sistemas. 9 Prólogo Mi primera impresión cuando examiné la recopilación de caṕıtulos que se agrupan en este volumen doble fue la de que, ¡por fin!, alguien hab́ıa cogido al toro por los cuernos y acometido la ingente tarea de explicar y dar forma a una serie de conceptos y disciplinas de actualidad relacionados con los nuevos enfoques sobre los seres vivos. Cabŕıa pensar que este conocimiento, que dirige una buena parte de los esfuerzos cient́ıficos encaminados a comprender la vida y aliviar las enfermedades, se estuviera impartiendo en todos o la mayoŕıa de los grados universitarios actuales en ciencias de la salud. La sobria realidad es que, lamentablemente, sigue siendo mayoritariamente ignorado aunque esta carencia se pueda paliar posteriormente en másteres o cursos de especialización. La sorpresa que vino a continuación fue que esta valent́ıa correspond́ıa a dos jóvenes investigadores que han conseguido coordinar las aportaciones de otros colegas igual de jóvenes (¡o incluso más!), con flamantes doctorados en materias relacionadas con los temas tratados, y que demuestran haber recogido el testigo recibido de profesores y maestros para facilitar la tarea a cualquier persona hispanohablante interesada en introducirse en el fascinante mundo de la información biológica moderna, su tratamiento y algunas de sus aplicaciones. Entre estas últimas se encuentran metodoloǵıas de diseño de fármacos basadas en el conocimiento estructural con detalle atómico de la macromolécula diana, la simulación de los movimientos de estos componentes de la maquinariaque hace posible la vida y el apasionante mundo de los complejos procesos interrelacionados que constituyen la bioloǵıa de sistemas. Estos dos volúmenes son como los abrigos crecederos que se compran a los niños para que les duren más de una temporada. Por un parte, cada caṕıtulo recoge una información más que abundante para una introducción a la materia y, por otro lado, hay espacio suficiente entre caṕıtulos para rellenar los huecos que una obra de este tipo necesariamente deja sin cubrir, a la espera de ediciones posteriores. Desde estas breves ĺıneas env́ıo mi felicitación a coordinadores y autores, agradeciéndoles su dedicación y buen hacer, que tendrá como merecida recompensa el reconocimiento de sus lectores, que no dudo serán numerosos a ambos lados del Atlántico. Federico Gago Badenas Madrid, Septiembre de 2014 El Dr. Federico Gago es director del grupo de investigación ‘Mecanismo de acción de moléculas con actividad biológica’ en la Universidad de Alcalá (Madrid, España), además de catedrático y profesor en la misma universidad. Autores 13 Álvaro Sebastián Yagüe (editor) Álvaro Sebastián es licenciado en Qúımica y Bioqúımica, ambos por la Universidad de Zaragoza (2005). Cursó los es- tudios de máster en Bioinformática en la Universidad Com- plutense de Madrid y realizó prácticas en la empresa Crys- tax Pharmaceuticals (Barcelona). Posteriormente volvió al wet lab para realizar la tesis doctoral sobre la protéına hu- mana ITIH4 en la Universidad de Zaragoza donde también cursó estudios de doctorado en Ingenieŕıa Biomédica. Al final del doctorado comenzó una aventura empresarial fundando Idibay Consulting S.L., empresa de diseño web y consultoŕıa informática. En el año 2009 fue contratado como investigador del CSIC en el proyecto europeo STREG para el estudio de la regulación transcripcional en plantas en el laboratorio del Dr. Bruno Contreras en la Estación Experimental de Aula Dei. En 2013 comenzó su periplo internacional realizando una estancia en el laboratorio del Prof. Janusz Bujnicki para el diseño de potenciales de docking protéına-protéına y más tarde se incorporó al laboratorio de Bioloǵıa Evolutiva en la Universidad Adam Mickiewicz (Poznan, Polonia), donde trabaja actualmente con el Prof. Jacek Radwan en el genotipado de la familia de genes del complejo mayor de histocompatibilidad y del receptor de linfocitos T usando tecnoloǵıas de secuenciación de nueva generación. Su corta carrera cient́ıfica se caracteriza por un vaivén en diferentes áreas y técnicas, desde la śıntesis qúımica asimétrica, pasando por el laboratorio bioqúımico hasta finalizar en el campo de la bioin- formática. La última “aventura” cient́ıfica, y quizás la más arriesgada y compleja, ha sido coordinar y editar el presente libro. Alberto Pascual Garćıa (editor) Alberto Pascual Garćıa es licenciado en F́ısica por la Universi- dad Complutense de Madrid y máster en Biof́ısica por la Uni- versidad Autónoma de Madrid. Ha trabajado en el Laboratorio de Circuitos Neuronales del Hospital Ramón y Cajal, y en la Unidad de Bioinformática del Centro de Bioloǵıa Molecular Se- vero Ochoa (CSIC-UAM), donde finaliza su tesis doctoral sobre patrones emergentes en sistemas biológicos complejos, dirigida por el Dr. Ugo Bastolla. Ha participado en diversos proyectos de investigación en te- mas tan diversos como evolución de estructura de protéınas, redes de interacción mutualistas o ecoloǵıa bacteriana, desde una perspectiva multidisciplinar. Ha realizado estancias de in- vestigación en el laboratorio del Prof. Andrés Moya (Centro de Investigación en Salud Pública de Valencia, España) y del Prof. Julián Echave (Universidad Nacional de San Mart́ın, Argentina). En los últimos años ha sido coordinador y profesor de la asignatura de Bioinformática del Máster en Biof́ısica de la Universidad Autónoma de Madrid. Federico Abascal Sebastián de Erice Federico Abascal se licenció y doctoró en Bioloǵıa Molecular en la Uni- versidad Autónoma de Madrid. Ha desarrollado su labor de investiga- ción en campos diversos de la Bioloǵıa, como el análisis de secuencias de protéınas y la genómica, siempre utilizando los ordenadores como herramienta y desde un enfoque evolutivo. Actualmente trabaja como investigador contratado en el Centro Na- cional de Investigaciones Oncológicas, en el grupo del Prof. Alfon- so Valencia, con quien hizo la tesis doctoral en el Centro Nacio- nal de Biotecnoloǵıa. También ha trabajado con los Prof. David Po- sada (Universidad de Vigo) y Rafael Zardoya (Museo Nacional de Ciencias Naturales), principales culpables de su afición a lo evoluti- vo. Jacobo Aguirre Araujo Jacobo Aguirre Araujo (Madrid, 1975) se licenció en F́ısica, especiali- dad Astrof́ısica, por la Universidad Complutense de Madrid en 1999. Fue profesor de la Universidad Rey Juan Carlos hasta 2006, investiga- dor del Centro de Astrobioloǵıa (CSIC-INTA) hasta junio de 2014, y actualmente trabaja en el Centro Nacional de Biotecnoloǵıa (CSIC). Su investigación versa sobre el análisis y la modelización de procesos evolutivos en f́ısica y bioloǵıa en el contexto de la dinámica no lineal y las redes complejas. Actualmente, está centrado en el estudio de la evolución de virus y RNA. Ha realizado estancias de investigación en Dinamarca, Alemania y EEUU. En 2003 fundó el Grupo de Astro- nomı́a de la URJC y en 2005 recibió el Premio Nacional al Investigador Novel en su modalidad de F́ısica Teórica. Eduardo Andrés León Eduardo Andrés León trabaja en el Instituto de Biomedicina de Sevilla (IBIS) dentro del grupo de Bioloǵıa Computacional y Bioin- formática (CbBio), donde es el responsable técnico de la unidad de cálculo cient́ıfico de alto rendimiento. Estudió Bioloǵıa Molecular en la Universidad Autónoma de Madrid y ha trabajado en el Cen- tro Nacional de Biotecnoloǵıa (CNB-CSIC), Instituto Nacional de Bioinformática y Centro Nacional de Investigaciones Oncológicas (CNIO). Actualmente colabora con la Fundación Española de Hipercoleste- rolemia Familiar y con la Escuela Nacional de Sanidad del Instituto de salud Carlos III, donde desarrolla labores docentes. Está interesado en el análisis y estudio integrativo de datos genómicos a gran escala y en la regulación génica basada en elementos no codificantes como los “small RNAs”. Djordje Bajic Djordje es licenciado en Bioqúımica y máster en Biof́ısica por la Universidad Autónoma de Madrid. Actualmente es estudiante de doctorado en el laboratorio de Lógica de Sis- temas Genómicos en el Centro Nacional de Biotecnoloǵıa (Madrid). Su investigación versa en el uso de modelos computaciona- les y genómica comparativa para comprender la evolución de la expresión génica. Davide Baù Después de haber obtenido un máster en Qúımica en la Universidad de Padua y completar un curso de Bioinformática en la Universidad de Colonia, Davide se trasladó a la Universidad de Dubĺın (UCD), donde, en 2008, obtuvo su doctorado en la Facultad de Ciencias de la Compu- tación e Informática, bajo la supervisión del Dr. Gianluca Pollastri. Su tesis se centró en el desarrollo de un algoritmo de predicción de es- tructuras de protéınas bajo la gúıa de un potencial estad́ıstico basado en técnicas de aprendizaje automático o “machine learning”. Davide realizó su postdoctorado en el laboratorio del Dr. Marc Marti- Renom, donde comenzó a trabajar en la determinación de estructuras de dominios genómicos y genomas. Durante este tiempo, desarrolló los métodos que llevaron a la determinación del primer modelo de alta resolución de una región genómica humana, el dominio α-globina y del primer modelo tridimensional del genoma completo de una bacteria (Caulobacter crescentus). Actual- mente está involucrado en diferentes colaboraciones que tienen como objetivo determinar la arquitec- tura del genoma de varios organismos incluyendo humano, levadura,Mycoplasma pneumoniae, mosca y ratón. Juan Bueren Calabuig Juan Bueren es licenciado en Farmacia por la Universidad Complutense de Madrid y doctor en Farmacoloǵıa por la Universidad de Alcalá (Madrid). Juan ha realizando estudios de mecánica cuántica y dinámi- ca molecular sobre el mecanismo cataĺıtico de diversas en- zimas implicadas en la evasión del sistema inmune por el parásito Trypanosoma cruzi causante de la enfermedad de Chagas en la Universidad de Florida. También ha trabajado en la Universidad de Edimburgo con el Dr. Julien Michel estudiando el mecanimo de acción de protéınas intŕınsi- camente desordenadas y a partir de septiembre de 2014 será investigador en la Universidad de Dundee para realizar estudios de protéınas de membrana. Ivan Dotu Ivan Dotu se doctoró en Ingenieŕıa Informática en la Universi- dad Autónoma de Madrid, especializándose en Programación con Restricciones y Búsqueda Local. En 2007 consiguió un beca de la Fundación Caja Madrid para realizar un postdoctorado en Brown University, donde trabajó en predicción de estructu- ra de protéınas. Tras un año trabajando en la empresa privada, Ivan Dotu volvió a la academia con un puesto de Profesor In- vestigador en el Departamento de Bioloǵıa de Boston College, donde trabajó, dentro del laboratorio de Bioloǵıa Estructural liderado por el Prof. Peter Clote, en temas relacionados con la estructura de RNA y la búsqueda y diseño de RNA funcional. Ivan Dotu ha publicado decenas de art́ıculos en diversas áreas, ha sido co-PI de un proyecto de NSF y ha co-organizado 2 escuelas de verano en Boston College sobre Métodos Computacionales de RNA. También ha sido o es miembro del comité de programa de conferencias como CP, ECAI y AAAI y revisor de art́ıculos para revistas como BMC Evolutionary Biology, PLOS ONE, PLOS Computational Biology o Nucleic Acids Research. Actualmente, Ivan Dotu es un investigador visitante en la Univer- sidad Politécnica de Cataluña y es colaborador renumerado de un proyecto NIH sobre la interacción entre RNA y protéınas. José Maŕıa Fernández González José Maŕıa Fernández es un bioinformático perteneciente al Nodo 2 del Instituto Nacional de Bioinformática, en el Programa de Bioloǵıa Estructural y Biocomputación del Centro Nacional de Investigaciones Oncológicas. Tiene el t́ıtulo de Ingeniero en Informática por la Uni- versidad de Málaga, y al acabar los estudios se interesó por la bioin- formática, entrando en 1999 a formar parte del Protein Design Group en el Centro Nacional de Bioinformática. Alĺı participó en varios pro- yectos, entre ellos REGIA (REgulatory Gene Initiative in Arabidop- sis), PlaNet Consortium y el proyecto de secuenciación de Buchnera aphidicola, creó para el proyecto ORIEL los iHOP web services y cola- boró en el germen del actual INB. En 2002 obtuvo el T́ıtulo de Estudios Avanzados en el departamento de Informática de la Universidad Autónoma de Madrid. En 2006 se tras- ladó junto con el grupo de Alfonso Valencia al CNIO, ya como bioinformático del INB, participando en proyectos como EMBRACE, ENFIN, ICGC, BLUEPRINT y RD-Connect. Sus principales ĺıneas de desarrollo a lo largo de estos años han sido el procesamiento, consulta y análisis de secuencias y de grandes volúmenes de información; el diseño y uso de bases de datos de distinto tipo (SQL, XML, NoSQL) con el volumen de datos a nivel bioinformático, y de modelos de datos que se amoldaran a las necesidades de la bioinformática; desarrollo de servicios web en distintos paradigmas (REST, SOAP+WSDL, etc...), aśı como la colaboración en el diseño e implementación del estándar BioMOBY. Álvaro Cortés Cabrera Álvaro Cortés es licenciado en Farmacia y máster en Biof́ısi- ca. Actualmente compagina sus estudios de doctorado en la Unidad de Bioinformática del Centro de Bioloǵıa Molecular Severo Ochoa y su trabajo como profesor en la Universidad de Alcalá. Su investigación versa en estudios de docking protéına-ligando y protéına-protéına. Beatriz Garćıa Jiménez Beatriz Garćıa Jiménez es investigadora postdoctoral Isaac Peral en el Grupo de Bioinformática del Centro de Biotecnoloǵıa y Genómica de Plantas UPM-INIA desde Septiembre del 2013. Obtuvo su tesis doctoral, titulada “Anotación Funcional de Protéınas basada en Representación Relacional en el entorno de la Bioloǵıa de Sistemas”, por la Universidad Carlos III de Madrid (UC3M) en 2012, dirigida por el Dr. Alfonso Valencia (Bio-CNIO) y la Dra. Araceli Sanchis (Inf-UC3M). Fue profesora ayudante del departamento de In- formática de la UC3M desde Marzo del 2006 hasta Agosto de 2013. Realizó una estancia postdoctoral en el departamento de Bioloǵıa Computacional y Algoritmos aplicados en el Instituto Max-Planck de Informática (MPII) de Febrero a Junio de 2013. Su tesis ganó el Premio Nacional a la mejor tesis, en el área de ciencias experimentales y tecnológicas, concedido por la Real Academia de Doctores de España. Además, ha recibido otros premios de la UC3M (Premio Extraordinario de Doctorado, 2011-2012), y de la Comunidad de Madrid (Aprovechamiento Académico Excelente, 2004-2005), entre otros. Está especializada en aprendizaje automático aplicado a la bioinformática, principalmente en predicción de anotación funcional. Sus intereses cient́ıficos incluyen representación relacional del conocimiento, mineŕıa de datos, anotación funcional, workflows y redes de protéınas. Actualmente estudia cómo extraer información de los workflows bioinformáticos, anotándolos semánti- camente e identificando fragmentos reusables de conocimiento cient́ıfico bioinformático, y participa en un proyecto de localización de marcadores de Alzheimer. Helena Gomes Dos Santos Helena Gomes Dos Santos se licenció en Bioloǵıa por la Universidad Autónoma de Madrid, donde además cursó un máster en Biof́ısica y recientemente se doctoró en Biociencias Moleculares bajo la su- pervisión del Dr. Ugo Bastolla y el Dr. Antonio Morreale (Centro de Bioloǵıa Molecular Severo Ochoa, CSIC-UAM, Madrid). Sus inicios en la bioinformática se remontan al último año de ca- rrera, el laboratorio del Dr. Angelo Messina (Universidad de Cata- nia). Desde muy temprano mostró un especial interés en el mun- do computacional, colaborando en el desarrollo e implementación de nuevas herramientas bioinformáticas aśı como su aplicación en casos reales mediante numerosas colaboraciones con grupos expe- rimentales. Su labor investigadora se ha centrado principalmente en el estudio de la variabilidad estructural, la dinámica y las posibles interacciones entre protéınas y otras moléculas. Como complemento a dicha formación, en la actualidad se encuentra realizando su investigación postdoctoral en el laboratorio de la Dra. Siltberg-Liberles (Universidad Internacional de Florida), donde evolución y dinámica de protéınas se combinan para ofrecernos una imagen más completa del funcionamiento y posible modulación de las funciones proteicas con una directa aplicación en la mejora del diseño de fármacos asistido por ordenador y la terapia personalizada. Raúl Guantes Navacerrada Raúl Guantes es profesor contratado doctor de la Universidad Autónoma de Madrid, donde coordina desde el año 2008 un programa oficial de posgrado en Biof́ısica y dirige el laboratorio de Biodinámica y Bioloǵıa Computacional. Es doctor en Ciencias Qúımicas por la misma universidad y ha investigado en diversos campos de la F́ısica y la Bioloǵıa desde una perspectiva teórica: f́ısica no lineal y de sistemas complejos, f́ısica estad́ıstica, f́ısica de superficies, neurociencia y bioloǵıa de sistemas. Desde el año 2006 centra su investigación en el estudio de las redes biológicas y sus principios de diseño, aśı como en los oŕıgenes y consecuencias de la variabilidad celular no genética. Iker Irisarri Anguita Iker Irisarri se licenció en Bioloǵıa por la Universidad de Navarra y obtuvo su doctoradopor la Universidad Autónoma de Madrid en 2012, desem- peñando su labor investigadora en el Museo Nacional de Ciencias Na- turales (CSIC) bajo la dirección del Prof. Rafael Zardoya. Durante es- te periodo, se especializó en filogenia y evolución molecular de anima- les, y realizó estancias de investigación en Alemania, Australia y Califor- nia. En la actualidad, trabaja como investigador postdoctoral en la Universi- dad de Constanza (Alemania) en filogenómica y genómica comparada de vertebrados. Natalia Jiménez Lozano Natalia Jiménez es licenciada en Bioqúımica por la Universidad de Granada. Realizó su doctorado en el Departamento de Biocomputación del Centro Nacional de Biotecnoloǵıa. Cuando terminó el doctorado emprendió el reto de montar desde ce- ro una Unidad de Bioinformática perteneciente al Instituto Nacional de Bioinformática, al que ha pertenecido hasta el año 2012, en el que entró a formar parte de la empresa Bull con la responsabilidad de desarrollar el negocio de la sanidad y ciencias de la vida a nivel inter- nacional. Javier Klett Arroyo Javier Klett es licenciado en Matemáticas, máster en Biof́ısica por la Universidad Autónoma de Madrid y realizó su doctorado en la Unidad de Bioinformática del Centro de Bioloǵıa Molecular Severo Ochoa (Madrid). Su especialidad son los estudios energéticos y potenciales de unión protéına-protéına. Actualmente compagina la in- vestigación postdoctoral en el grupo de Qúımica y Bioloǵıa Computacional en el Centro de Investigaciones Biológicas de Madrid y su trabajo como profesor en el Departamento de Bioingenieŕıa e Ingenieŕıa Aeroespacial de la Universi- dad Carlos III (Madrid). Raúl Méndez Giráldez Raúl Méndez Giráldez, es licenciado en Qúımica por la Universi- dad de Barcelona y doctor en Ciencias por la Universidad Libre de Bruselas. Su carrera profesional se ha desarrollado en el campo de la bioinformática estructural, inicialmente durante su doctorado evaluando los métodos para predecir la estructura de los complejos de protéına, y más tarde se ha ido centrando en el desarrollo de métodos computacionales de red elástica para estudiar la flexibili- dad de la protéınas. En la actualidad trabaja como investigador postdoctoral en el de- partamento de Bioqúımica y Biof́ısica de la Universidad de Ca- rolina del Norte (EEUU) utilizando métodos de dinámica mole- cular y diseño racional de protéınas con aplicaciones terapéuti- cas. Antonio Morreale Antonio Morreale estudió Ciencias Qúımicas en la Universidad de Alcalá de Henares, Madrid, donde se doctoró en el año 2001 bajo la supervisión de la Dra. Isabel Iriepa tras una estancia de dieciocho meses en el Chemistry Department de la IUPUI (In- diana, USA) como estudiante de doctorado donde trabajó con los Profs. Kenny B. Lipkowitz (codirector de su tesis) y Donald B. Boyd. Después realizó una estancia postdoctoral en el labo- ratorio de los Profs. Modesto Orozco y Javier Luque durante casi dos años y medio. A su vuelta a Madrid (2004) se incorporó a la Unidad de Bio- informática (UB) creada por el Dr. Ángel R. Ortiz en el centro de Bioloǵıa Molecular Severo Ochoa (CBMSO), primero como postdoctoral asociado (2004-2008) y luego como director de la ĺınea de diseño de fármacos y codirector del Servicio de Bioinformática del CBMSO. A finales de 2012 se incorpora como tecnólogo senior al área de bioenerǵıa de la compañ́ıa Repsol S.A. Antonio Morreale es autor de unos 60 art́ıculos de investigación en publicaciones especializadas inclu- yendo revisiones bibliográficas y caṕıtulos de libro. Además, es coinventor de varias patentes, dos de las cuales han sido licenciadas. Ha dirigido cuatro tesis doctorales y ha participado como organizador y profesor en numerosos cursos y másteres. Su trayectoria cient́ıfica ha sido una evolución continua desde los principios que rigen las interacciones entre moléculas (tanto cuánticos como clásicos) hasta la aplicación de éstos en el diseño racional de fármacos. En la actualidad trabaja en el modelado y simulación de reacciones cataĺıticas claves en ciertas rutas metabólicas con la finalidad de obtener nuevos biocombustibles. Almudena Perona Almudena Perona es directora de proyectos en la empresa SmartLigs, compañ́ıa biotecnológica dedicada al descubrimiento y desarrollo de nuevos fármacos mediante tecnoloǵıas de qúımica computacional. Doc- tora en Qúımica Orgánica por la Universidad Nacional de Educación a Distancia (UNED), especialista en śıntesis orgánica de heterociclos y caracterización de moléculas orgánicas sencillas por NMR. Como investigadora postdoctoral en la Unidad de Bioinformáti- ca del Centro de Bioloǵıa Molecular Severo Ochoa (CSIC-UAM) ha colaborado en proyectos de diseño de fármacos mediante estu- dio in silico de la interacción entre protéınas y moléculas senci- llas, usando herramientas bioinformáticas, principalmente programas de docking protéına-ligando, protéına-protéına y dinámica molecu- lar. Michael Stich Después de estudiar F́ısica en la Freie Universität Berlin y la Universidad de Granada, Michael realizó el doctorado en el Fritz-Haber-Institut de la Max Planck Society en Berĺın que terminó en el año 2003. Obtuvo una beca Marie Curie postdoctoral para estar en la Universidad Complutense de Madrid, y trabajó de postdoc y posteriormente como investigador contratado en el Centro de Astrobioloǵıa (CSIC/INTA), a la vez de ser profesor asociado en la Universidad Politécnica de Madrid. Después de ser investigador asociado en la Harvard University, se incor- poró como docente en la Aston University (Birmingham, UK) en 2013. Su trabajo reciente está enfocado en la modelización de sistemas biológicos complejos y de procesos evolutivos, p.ej. RNA. Rafael Zardoya San Sebastián Rafael Zardoya se doctoró en Bioloǵıa en la Universidad Compluten- se de Madrid en 1994. Tras una estancia postdoctoral de 2 años en la Universidad del Estado de Nueva York en Stony Brook (EEUU), regresó en 1997 al Museo Nacional de Ciencias Naturales de Madrid donde es profesor de investigación del CSIC desde 2008. Su ĺınea de investigación se centra en el estudio de los mecanismos evolutivos que generan la diversidad biológica. En particular utiliza secuencias de DNA (genomas mitocondriales, transcriptomas) para la reconstrucción de las relaciones filogenéticas de los grandes grupos de vertebrados y moluscos y realiza análisis genómico/transcriptómicos comparados en un marco evolutivo. Sonia Tarazona Campos Sonia Tarazona se licenció en Matemáticas (1997) y Ciencias y Técnicas Estad́ısticas (2001) por la Universitat de València. Des- de 2005 es profesora asociada en el Departamento de Estad́ıstica e Investigación Operativa Aplicadas y Calidad de la Universitat Politècnica de València. Desde 2008 forma parte del grupo de Genómica de la Expresión Génica liderado por la Dra. Ana Conesa en el Centro de In- vestigación Pŕıncipe Felipe (Valencia). Durante este tiempo, ha colaborado en diversos proyectos de investigación y actualmente forma parte del proyecto europeo STATegra cuyo objetivo es el desarrollo de métodos estad́ısticos para la integración de distin- tos datos “ómicos”. En paralelo, ha realizado su tesis doctoral que lleva co- mo t́ıtulo “Statistical methods for transcriptomics: from microarrays to RNA-seq” y que será defendida en bre- ve. Inmaculada Yruela Guerrero Inmaculada Yruela es doctora en Qúımica por la Universidad de Se- villa. Después de realizar una estancia postdoctoral en el Max-Planck Institute for Bioinorganic Chemistry en Mülheim and der Ruhr (Ale- mania) ocupó su actual posición de investigador cient́ıfico en la Esta- ción Experimental de Aula Dei del Consejo Superior de Investigaciones Cient́ıficas (EEAD-CSIC), Zaragoza. Su investigación se ha centrado en el estudio de la estructura y la función de los fotosistemas y metaloprotéınas que intervienen en el transporteelectrónico fotosintético, en la homeostasis del Cu en el cloroplasto y en aspectos evolutivos de las enzimas FAD sintetasas cloroplásticas. Recientemente sus investigaciones se orientan a entender la dinámi- ca evolutiva de las protéınas intŕınsecamente desordenadas (IDPs) en plantas y descubrir nuevas redes de regulación transcripcional en estos organismos. Sus actuales proyectos se desarrollan en el Grupo de Bioloǵıa Computacional y Estructural de la EEAD-CSIC y colabora con el Instituto de Biocomputación y F́ısica de Sistemas Complejos de la Universidad de Zaragoza. Índice general I Fundamentos de bioinformática, estad́ıstica y gestión de información cient́ıfi- ca 1 1. Bases de datos biomédicas, servidores web y otros recursos online 3 1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.1. ¿Qué es un dato biológico? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.2. Dato crudo y dato procesado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.3. Dato, información y conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.1.4. Caracteŕısticas de los datos biológicos . . . . . . . . . . . . . . . . . . . . . . . . 4 1.1.5. Tipos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.6. Ciclo de vida de los datos biológicos . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2. Historia de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.1. ¿Por qué son esenciales las bases de datos? . . . . . . . . . . . . . . . . . . . . . 7 1.2.2. Diversidad de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3. Estructura de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.4. Interrelación entre bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.5. Calidad y revisión de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.1. Anotación de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.2. Vocabularios controlados y ontoloǵıas . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.3. Revisores ¿quiénes son y qué hacen? . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.6. Números de acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.7. Gestión de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.8. Tipos de bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.8.1. Procedencia de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.8.2. Revisión de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.8.3. Clasificación EBI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.8.4. Clasificación NCBI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.8.5. Clasificación NAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.8.6. Redundancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.8.7. Acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.8.8. Búsqueda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.9. Bases de datos más relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.9.1. UniProt Knowledgebase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.9.2. GenBank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.10. Obtención de secuencias y formatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.11. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.12. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2. Gestión de bibliograf́ıa e información y escritura de art́ıculos cient́ıficos 29 i 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2. Bases de datos de literatura cient́ıfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.2.1. Servidores de art́ıculos por publicar . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.2.2. PubMed y PubMed Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.2.3. Google Scholar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.3. Índices y medidas de impacto cient́ıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.4. Gestores de bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.4.1. Zotero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.4.2. Mendeley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.4.3. Biblioteca de Google Scholar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.5. Escritura de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.5.1. Formato y plantillas de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.5.2. Proceso de env́ıo y revisión de art́ıculos . . . . . . . . . . . . . . . . . . . . . . . 45 2.6. Primeros pasos con LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.6.1. Crear un art́ıculo con LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.6.2. Compilar código LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.6.3. Editores LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 2.6.4. Instalación de una distribución LaTeX . . . . . . . . . . . . . . . . . . . . . . . . 53 2.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3. Estad́ıstica y R 57 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.1.1. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.1.2. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.1.3. Introducción a R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.2. Estad́ıstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.2.1. Parámetros de posición y dispersión . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.2.2. Gráficos en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.2.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.3.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.3.2. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.3.3. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.3.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.4. Inferencia estad́ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.4.1. Estad́ıstica paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.4.2. Estad́ıstica no paramétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.4.3. Remuestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.4.4. Corrección por tests múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 3.4.5. Enfoquebayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.5. Modelos lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.5.1. Modelos ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.5.2. Regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.5.3. Modelos lineales generalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.6. Métodos multivariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.6.1. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.6.2. Análisis de Componentes Principales . . . . . . . . . . . . . . . . . . . . . . . . . 94 3.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4. Fundamentos de programación 99 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.2. Tipos de lenguajes de programación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.2.1. Abstracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.2.2. Ejecución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.2.3. Paradigma de programación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.2.4. ¿Que lenguaje de programación usar? . . . . . . . . . . . . . . . . . . . . . . . . 101 4.3. Consola de Linux, Mac OS X y Windows. Operaciones básicas . . . . . . . . . . . . . . 102 4.3.1. Tipos de Shell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.4. Perl y BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.4.1. Introducción a Perl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.4.2. Instalación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.4.3. Programando en Perl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 4.4.4. BioPerl y la programación orientada a objetos . . . . . . . . . . . . . . . . . . . 112 4.4.5. Programando con BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.4.6. Ejercicios con BioPerl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 4.4.7. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 4.5. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5. Mineŕıa de datos 119 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 5.1.1. Aplicaciones de la mineŕıa de datos . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.1.2. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 5.1.3. Herramienta: Weka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 5.2. Retos de la mineŕıa de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 5.3. Recopilación y selección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 5.3.1. Repositorios de datos biológicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.3.2. Servicios web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 5.3.3. Libreŕıas de programación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 5.4. Preprocesamiento y transformación de datos . . . . . . . . . . . . . . . . . . . . . . . . . 136 5.4.1. Balanceo de clases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 5.4.2. Gestión de valores desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 5.4.3. Normalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.4.4. Discretización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.4.5. Selección de atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 5.4.6. Extracción de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5.4.7. Conjuntos no redundantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5.5. Modelado. Aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 5.6. Evaluación e interpretación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5.6.1. Estimación del rendimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5.6.2. Medidas de rendimiento unidimensionales . . . . . . . . . . . . . . . . . . . . . . 146 5.6.3. Medidas de rendimiento bidimensionales . . . . . . . . . . . . . . . . . . . . . . . 150 5.6.4. Interpretación biológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 5.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 6. Computación paralela y clústeres de cálculo 157 6.1. Computación paralela y ejemplos de programación . . . . . . . . . . . . . . . . . . . . . 158 6.1.1. Paralelización en Perl (threads) . . . . . . . . . . . . . . . . . . . . . . . . . . 160 6.1.2. Paralelización en Python (multiprocessing y subprocess) . . . . . . . . . 163 6.2. Clústeres de cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2.1. Nodos, memoria, procesadores, núcleos, procesos e hilos . . . . . . . . . . . . . . 168 6.2.2. Rendimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.3. Conexión remota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 6.3.1. Protocolo SSH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 6.3.2. Nodo de acceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 6.4. Transferencia remota de archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 6.4.1. Protocolo SCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 6.5. Sistema gestor de colas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 6.6. Sun Grid Engine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 6.6.1. Ejecución ordinaria de trabajos (qrsh) . . . . . . . . . . . . . . . . . . . . . . . . 175 6.6.2. Procesamiento por lotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 6.6.3. Ejecución de procesos por lotes (qsub) . . . . . . . . . . . . . . . . . . . . . . . . 176 6.6.4. Control del estado de los trabajos (qstat) . . . . . . . . . . . . . . . . . . . . . . 178 6.6.5. Eliminarción de procesos (qdel), errores y salida estándar . . . . . . . . . . . . . 180 6.6.6. Requerimientos de memoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 6.6.7. Uso de múltiples slots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 II Macromoléculas biológicas, alineamiento de secuencias y filogenia 183 7. Macromoléculas biológicas: protéınas, DNA y RNA 185 7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 7.2. Genes y protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 7.3. Estructura primaria de DNA y RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 7.4. El código genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 7.5. Aminoácidos y enlace pept́ıdico . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . 190 7.5.1. Aminoácidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 7.5.2. Enlace pept́ıdico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 7.5.3. Ángulos de torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 7.6. Niveles estructurales en protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 7.6.1. Estructura primaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 7.6.2. Estructura secundaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 7.6.3. Estructura terciaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7.6.4. Estructura cuaternaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7.7. Métodos emṕıricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 7.7.1. Cristalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 7.7.2. Difracción de rayos X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 7.7.3. Resonancia magnética nuclear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 7.8. Herramientas bioinformáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 7.8.1. Protein Data Bank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 7.8.2. Visualización de estructuras en 3D . . . . . . . . . . . . . . . . . . . . . . . . . . 206 7.9. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 8. Análisis de secuencias biológicas 211 8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 8.1.1. Homoloǵıa de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 8.1.2. Diferencias alineamiento DNA y protéınas . . . . . . . . . . . . . . . . . . . . . . 213 8.2. Obtención de secuencias y formatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 8.2.1. Bases de datos de secuencias de DNA y protéınas . . . . . . . . . . . . . . . . . . 214 8.2.2. Formatos de archivos de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . 214 8.2.3. Ejemplo lectura fichero de secuencia . . . . . . . . . . . . . . . . . . . . . . . . . 216 8.3. Alineamiento de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 8.3.1. Definición de similitud e identidad . . . . . . . . . . . . . . . . . . . . . . . . . . 217 8.3.2. Matrices de sustitución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 8.3.3. Significación estad́ıstica y E-value . . . . . . . . . . . . . . . . . . . . . . . . . . 221 8.3.4. El twilight u ‘ocaso’ de los alineamientos . . . . . . . . . . . . . . . . . . . . . . . 222 8.3.5. Técnicas y programas de alineamiento . . . . . . . . . . . . . . . . . . . . . . . . 223 8.3.6. Alineamiento local de pares de secuencias . . . . . . . . . . . . . . . . . . . . . . 224 8.3.7. Alineamiento global de pares de secuencias . . . . . . . . . . . . . . . . . . . . . 225 8.3.8. Alineamiento múltiple de secuencias . . . . . . . . . . . . . . . . . . . . . . . . . 226 8.3.9. Edición y visualización de alineamientos . . . . . . . . . . . . . . . . . . . . . . . 227 8.4. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 9. Filogenia y evolución molecular 231 9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 9.1.1. Teoŕıa de la Evolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 9.1.2. Evolución molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 9.1.3. Interpretación de un árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 9.2. Métodos de reconstrucción filogenética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 9.2.1. Alineamiento múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 9.2.2. Modelos de evolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 9.2.3. Métodos de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 9.2.4. Métodos probabiĺısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 9.3. Contrastes de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 9.3.1. Contrastes entre modelos evolutivos . . . . . . . . . . . . . . . . . . . . . . . . . 247 9.3.2. Robustez y contraste de árboles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 9.4. Reconstrucción de estados ancestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 9.5. Gúıa rápida de reconstrucción filogenética . . . . . . . . . . . . . . . . . . . . . . . . . . 252 9.6. Programas recomendados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 9.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 III Bioloǵıa estructural de protéınas 261 10.Alineamiento de estructura de protéınas 263 10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 10.2. Descripción general del método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 10.3. Comparaciones locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 10.4. Construcción del alineamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 10.5. Medidas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 10.5.1. Medidas crudas y normalizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 272 10.5.2. Una medida con motivación evolutiva . . . . . . . . . . . . . . . . . . . . . . . . 274 10.6. Alineamiento múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 10.6.1. Primeros pasos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 10.6.2. Construcción del alineamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 10.7. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 10.8. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 11.Modelos simplificados de plegamiento de protéınas 283 11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 11.2. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 11.2.1. Paradoja de Levinthal y experimento de Anfinsen . . . . . . . . . . . . . . . . . 285 11.2.2. Paisaje energético y principio de mı́nima frustración . . . . . . . . . . . . . . . . 286 11.3. Fundamentos teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 11.3.1. paisaje energético del modelo de enerǵıa al azar . . . . . . . . . . . . . . . . . . . 289 11.3.2. Un paisaje energético un poco más realista . . . . . . . . . . . . . . . . . . . . . 292 11.3.3. Cinética del plegamiento y gap de estabilidad . . . . . . . . . . . . . . . . . . . . 294 11.3.4. Diagrama de fases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 11.4. Algunos ejemplos computacionales sencillos . . . . . . . . . . . . . . . . . . . . . . . . . 299 11.4.1. Modelos de grano grueso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 11.4.2. La transición v́ıtrea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 11.4.3. Diseñabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 11.4.4. Plegamientode una protéına simplificada . . . . . . . . . . . . . . . . . . . . . . 305 11.5. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 11.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 12.Evolución de estructura de protéınas 313 12.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 12.2. Origen de nuevas protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 12.3. Divergencia estructural gradual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 12.3.1. Clasificación de estructura de protéınas . . . . . . . . . . . . . . . . . . . . . . . 318 12.3.2. Cuantificando la divergencia estructural . . . . . . . . . . . . . . . . . . . . . . . 322 12.4. Evolución estructural mediante ensamblaje de módulos . . . . . . . . . . . . . . . . . . . 323 12.4.1. Péptidos ancestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 12.4.2. Búsqueda por recurrencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 12.5. Divergencia estructural Vs. ensamblaje de módulos . . . . . . . . . . . . . . . . . . . . . 326 12.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 13.Protéınas desordenadas 333 13.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 13.2. Desorden en protéınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 13.3. Predición de desorden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 13.3.1. Métodos bioinformáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 13.4. Composición, distribución y función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 13.5. Enfermedades asociadas a protéınas desordenadas . . . . . . . . . . . . . . . . . . . . . . 344 13.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 IV Bioloǵıa estructural de ácidos nucleicos 349 14.Estructura, plegamiento y evolución del RNA 351 14.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 14.2. Tipos de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 14.3. Niveles estructurales del RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 14.3.1. Composición qúımica y estructura primaria . . . . . . . . . . . . . . . . . . . . . 353 14.3.2. Estructura secundaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 14.3.3. Estructura terciaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 14.3.4. Ejemplo estructura tRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 14.3.5. Arquitectura del RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 14.4. Plegamiento de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360 14.4.1. Aspectos generales del plegamiento de RNA . . . . . . . . . . . . . . . . . . . . . 360 14.4.2. Predicción de estructuras de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . 362 14.4.3. Otros problemas relacionados con el plegamiento . . . . . . . . . . . . . . . . . . 368 14.4.4. Bioloǵıa Sintética de RNA: plegamiento inverso . . . . . . . . . . . . . . . . . . . 370 14.5. Evolución de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 14.5.1. El RNA como modelo evolutivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 14.5.2. Redes neutrales de RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 14.5.3. Modelización matemática de la evolución . . . . . . . . . . . . . . . . . . . . . . 374 14.5.4. Limitaciones y ĺıneas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 14.5.5. Evolución dirigida a una estructura objetivo . . . . . . . . . . . . . . . . . . . . . 379 14.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 15.Estructura y organización del DNA 387 15.0.1. Niveles de organización del DNA en la cromatina . . . . . . . . . . . . . . . . . . 387 15.0.2. Determinación de la estructura de dominios genómicos . . . . . . . . . . . . . . . 388 15.0.3. Determinación de estructura con IMP . . . . . . . . . . . . . . . . . . . . . . . . 390 15.0.4. Ejemplo de determinación de estructura por IMP . . . . . . . . . . . . . . . . . . 394 15.0.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 15.1. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 V Dinámica estructural y diseño de fármacos 399 16.Diseño de fármacos asistido por ordenador 401 16.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 16.2. Docking protéına-ligando . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 16.2.1. Definición del problema del docking . . . . . . . . . . . . . . . . . . . . . . . . . 402 16.2.2. Componente estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 16.2.3. Componente energética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 16.2.4. Docking : consideraciones teóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 16.2.5. El proceso de docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409 16.2.6. Evaluación de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 16.3. Cribado virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412 16.3.1. Posibles escenarios para el VS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 16.3.2. Estudios de VS retrospectivos y prospectivos . . . . . . . . . . . . . . . . . . . . 414 16.3.3. Herramientas de virtual screening . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 16.4. Docking protéına-protéına . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416 16.4.1. El proceso de docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417 16.4.2. Clasificación y post-procesado de las soluciones . . . . . . . . . . . . . . . . . . . 419 16.5. Docking protéına-ácido nucleico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 16.6. Conclusiones y perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 16.7. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423 17.Dinámica molecular 425 17.1. Introdución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 17.2. Mecánica molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 17.2.1. El campo de fuerzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 17.2.2. Términos enlazados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427 17.2.3. Términos no enlazados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428 17.2.4. Parametrización del campo de fuerzas . . . . . . . . . . . . . . . . . . . . . . . . 430 17.2.5. Minimización de enerǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 17.3. Simulaciones de dinámica molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 17.3.1. Cálculo de las fuerzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 17.3.2. Integración de las ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . . 432 17.3.3. Condiciones de ĺımite periódico . . . . . . . . . . . . . . . . . .. . . . . . . . . . 433 17.3.4. Cálculo de las interacciones no enlazantes . . . . . . . . . . . . . . . . . . . . . . 433 17.3.5. Preparación y ejecución de una DM . . . . . . . . . . . . . . . . . . . . . . . . . 434 17.3.6. Simulaciones de macromoléculas biológicas . . . . . . . . . . . . . . . . . . . . . 435 17.4. Métodos h́ıbridos QM/MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 17.5. Programas y tutoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439 17.6. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441 18.Análisis de modos normales 443 18.1. Introducción al análisis de modos normales . . . . . . . . . . . . . . . . . . . . . . . . . 443 18.1.1. El oscilador armónico simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443 18.1.2. Modos normales en espacio cartesiano . . . . . . . . . . . . . . . . . . . . . . . . 445 18.1.3. Modos mormales en espacio diedro . . . . . . . . . . . . . . . . . . . . . . . . . . 448 18.2. Modelos de redes elásticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 18.2.1. El modelo de red Gaussiana o GNM . . . . . . . . . . . . . . . . . . . . . . . . . 450 18.2.2. El modelo de red Anisotrópica o ANM . . . . . . . . . . . . . . . . . . . . . . . . 451 18.3. La molécula triatómica lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 18.4. Ejemplos prácticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 18.4.1. Introducción a ProDy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 18.4.2. Cálculo de modos normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 18.4.3. Cálculo de los factores B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 18.4.4. Cálculo de una estructura deformada . . . . . . . . . . . . . . . . . . . . . . . . . 462 18.5. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 VI Bioloǵıa de sistemas 467 19.Bioloǵıa de sistemas 469 19.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 19.2. Redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471 19.2.1. Definición de red compleja y conceptos básicos . . . . . . . . . . . . . . . . . . . 471 19.2.2. Propiedades de las redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . 472 19.2.3. Breve descripción de las redes biológicas . . . . . . . . . . . . . . . . . . . . . . . 477 19.3. Redes de regulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478 19.3.1. Modelos lógicos o booleanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478 19.3.2. Modelos cinéticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480 19.3.3. Modelos termodinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 19.3.4. Regulación combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 19.3.5. Análisis de motivos de red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488 19.3.6. Ruido en expresión genética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 19.3.7. Modelos cinéticos estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496 19.3.8. Diferentes fuentes de ruido en expresión genética . . . . . . . . . . . . . . . . . . 499 19.4. Redes metabólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502 19.5. Robustez en los sistemas biológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 19.5.1. Redundancia por duplicación génica . . . . . . . . . . . . . . . . . . . . . . . . . 507 19.5.2. Robustez distribuida en el metabolismo . . . . . . . . . . . . . . . . . . . . . . . 508 19.6. Lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512 19.7. Herramientas computacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 19.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514 19.9. Bibliograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517
Compartir