Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Especial: Auditoría Informática 29 1. INTRODUCCIÓN El Proyecto del Genoma Humano (HUGE en inglés) ha exigido tal cantidad de esfuerzos cien- tíficos y tecnológicos que sus resultados directos no han sido más que una parte de todas las apor- taciones a la comunidad científica y a la sociedad en general1. Una de las consecuencias ha sido el surgimiento de nuevas disciplinas y de nuevos planteamientos interdisciplinares para científicos que antes solamente trabajaban en un campo extremadamente restringido10. También ha pro- vocado nuevos problemas sociales y éticos, en el manejo de la información genética de los indivi- duos, cuyos efectos ya están apareciendo6,9. Una de las nuevas disciplinas surgidas al ampa- ro del HUGE es la Bioinformática, que también se denomina Biología Computacional, aunque todo el mundo va adoptando el primer término de forma tácita. En esta disciplina se maneja infor- mación fundamentalmente de origen biológico, pero también de otras fuentes. En el caso de la investigación sobre humanos, parte de esas fuen- tes son de origen administrativo, familiar, clínico, etc. Esto tiene relación con los aspectos de priva- cidad y protección de la información personal, o con el uso adecuado y autorizado de la informa- ción según para qué fines2. Así, la Bioinformática ha provocado también efectos colaterales en la Bioética, ya que ésta ha tenido que ampliar su campo de acción y amparar la protección de la información genética cuando es de origen humano9. La rápida y espectacular evolución de la Bioinformática ha dejado atrás los enfoques metodológicos, técnicos y tecnológicos que la Auditoría de Sistemas de Información venía apli- cando a la Informática vista como Tecnología de la Información (TI). Esta nueva disciplina, en su vertiente informática, presenta un porcentaje muy alto de ciencia y menor de tecnología, hasta el punto que se podría hablar, en un sentido más restrictivo, de Ciencia y Tecnología de la Información Biológica (CTIB). Dadas estas circuns- tancias, se puede deducir que no existen actual- mente, o son muy incipientes, enfoques y normas relativos al control y análisis de la aplicación efi- ciente, metodológicamente correcta y ética de la Bioinformática, y también de las normas, proce- dimientos, técnicas y guías que contribuyan a la construcción de mecanismos de control de la práctica bioinformática2. Por tanto, el objetivo de este trabajo es hacer una breve introducción a la Bioinformática, su La disciplina de Bioinformática: definición y caracterización Autor: Coltell, Óscar RESUMEN Los recientes y espectaculares avances de la Medicina en el campo de la Genómica no son más que el preludio de lo que está por venir. El Proyecto del Genoma Humano (HUGE en inglés) ha establecido definitivamente la integración de disciplinas muy dis- tintas, la Biología Genética y Molecular y las Ciencias de la Computación, dando lugar a la Bioinformática. Los resultados del HUGE han provocado que se anali- cen las implicaciones éticas sobre quién, cómo, dónde, para qué y por qué utilizar la información genómica de los individuos con el soporte de las Tecnologías de la Información. Los experimentos genómicos generan ingentes cantidades de datos genéticos que plantean problemas de gestión y análisis. Así, la Bioinformática tiene que ir ofreciendo soluciones a estos problemas de tratamiento de la información genética, ambiental, clínica, etc. Dichas soluciones bioinformáticas son real- mente proyectos de ingeniería bioinformática que deben desarrollarse bajo criterios formales y de calidad del enfoque de ingeniería. PALABRAS CLAVE Bioinformática, Proyecto del Genoma Humano, soluciones bioinformáticas, proyectos de ingenie- ría bioinformática. Especial: Auditoría Informática 30 definición, los problemas que plantea y las fun- ciones que la componen. Así, se podrá enten- der el desarrollo empleado en los siguientes artículos donde se explica un marco metodoló- gico adaptado para la Auditoría Bioinformática, teniendo en cuenta los aspectos científicos, tec- nológicos y éticos de la disciplina. 2. DEFINICIÓN DE BIOINFORMÁTICA Según Backofen y Gilbert1, la Bioinformática es la resolución de problemas que provienen de la biología mediante metodologías aportadas por la ciencia de la computación. Estas meto- dologías no deben circunscribirse a la mera automatización de soluciones ya existentes en el campo de la biología, sino deben dedicarse a la revisión y adaptación de algoritmos y siste- mas existentes en el campo de la ciencia de la computación, e incluso diseñar nuevas aplica- ciones. Según Stephanopoulos10, la Bioinformática es el enfoque y el conjunto de métodos cuya misión es la extracción de conocimiento bioló- gico a partir de la secuenciación, la expresión, la proteómica y los datos distribuidos del traza- do isotópico. Establece además, que el tema principal de investigación es la mejora y actua- lización del contenido de la información. Una definición más completa, teniendo en cuenta lo que se ha mencionado en la sección anterior, es que la Bioinformática es una disci- plina científica y tecnológica en la que inte- raccionan en armonía los planteamientos investigadores de la Biología Genética y Molecular, con los enfoques metodológicos y tecnológicos de la Ciencia de la Computación y la Ingeniería Informática, para la obtención y gestión del conocimiento biológico genómi- co y proteómico. 3. LA INFORMÁTICA MÉDICA Y LA BIOINFORMÁTICA En una primera aproximación, se podría afir- mar que la Bioinformática no es Informática Médica, dados los planteamientos clásicos de la última. En la Informática Médica, existe una clara separación entre el informático, que es el diseñador, constructor, gestor, mantenedor y solucionador de incidencias en los sistemas informáticos sanitarios; frente al usuario, que es el médico clínico, o el administrativo, o el ges- tor, u otros profesionales de la sanidad, incluso los pacientes. Esta disciplina es relativamente genérica y extensa y está enfocada más hacia los aspectos de desarrollo, innovación y produc- ción 11,9. En cambio, en la Bioinformática se da la con- vergencia multidisciplinar, donde al menos un científico biólogo y otro científico informático colaboran estrechamente para alcanzar un objetivo común, para lo cual necesitan un len- guaje común y, además, aprender uno del otro los respectivos conocimientos fundamentales. Esta disciplina tiene un horizonte más estrecho orientado fundamentalmente a la investigación aplicada (a veces pura) relacionada principal- mente con las siguientes áreas: biología mole- cular, biología molecular y genética (genómi- ca, proteómica, etc.), ciencias biomédicas (epi- demiología genética y molecular y otras), cien- cias de la computación, matemáticas, física y estadística (Figura 1). Sin embargo, la Informática Médica también ha ido incorporando en los últimos años una importante faceta investigadora (tratamiento de imágenes, diseño de medicamentos, tera- pias asistidas, etc.) Además, ha adoptado con rapidez las tecnologías relacionadas con la genómica y la proteómica con el objetivo de potenciar la investigación clínica y epidemioló- gica aplicadas5,8. Esto ha cambiado un poco las posiciones de ambas disciplinas y se puede afir- mar que existe un importante solapamiento, que no subordinación, entre ambas. Hay que recordar que la Bioinformática también se apli- ca a la investigación biológica en otras especies vivas (e incluso muertas, como la paleogenó- mica). Figura 1. La Bioinformática como convergencia multidisciplinar Especial: Auditoría Informática 31 4. PRINCIPIOS Y ÁREAS DE INVESTIGACIÓN Se han formulado algunos principios que rigen la práctica de la Bioinformática o que vie- nen heredados de algunas de las disciplinas concurrentes: el Principio de Investigación en Bioinformática y el Principio del Dogma Central en Proteómica. El Principio de Investigación en Bioin- formática establece que la investigación en Bioinformática debe enfocarse fundamental- mente a la comprensióndel funcionamiento de los organismos vivos con distintas aplicaciones1. El Principio del Dogma Central en Proteómica establece que el flujo de información en biolo- gía, que permite que una secuencia de amino- ácidos produzca la estructura y la función de una proteína, está determinado esencialmente por la transcripción del ADN vía ARN. (Bakofen et al., 2001). El dogma central fue formulado inicialmente por Crick3. Estos dos principios, junto a otros menos rele- vantes, delimitan las áreas fundamentales de investigación en esta disciplina como las siguientes: Secuenciación de ADN12, compara- ción de secuencias de ácidos nucleicos10, expre- sión de ácidos nucleicos, análisis e interpreta- ción de datos genómicos8, etc. Las áreas directamente derivadas (en segun- do grado de relación), en las que se aplican efectivamente los resultados de las investigacio- nes bioinformáticas son las siguientes: Diseño de fármacos, identificación de factores de ries- go genéticos, terapia génica, modificación genética de alimentos, modificación genética de especies animales, etc1. Entre las áreas indi- rectamente derivadas (en tercer grado de rela- ción) se encuentran las que están, o planteadas teóricamente, o con un grado de desarrollo muy bajo, como las siguientes: Identificación biométrica genética, Seguridad y protección de datos genéticos, etc6. 5. ÁREAS DE APLICACIÓN La Bioinformática tiene aplicación en muchas áreas y, en un futuro próximo, dada la tendencia actual, la lista de aplicaciones se incrementará considerablemente. Pero es nece- sario sistematizar la estructura de aplicaciones mediante la definición de unas categorías prin- cipales de problemas que agrupan cualquier área que exista o que surja en un futuro. Estas categorías son las siguientes1: 1. Problemas relativos específicamente al Dogma Central: Esta categoría incluye pro- blemas relacionados con un nivel de infor- mación específico (análisis de secuencias, estructuras o funciones) y los relacionados con más de un nivel. 2. Problemas relativos a la Simulación de Procesos Biológicos: Esta categoría incluye problemas relacionados con la predicción del comportamiento dinámico de un sistema dinámico respecto de sus componentes. 3. Problemas relativos al Desarrollo de Nuevas Tecnologías y Organización: Esta categoría incluye problemas relacionados con el desa- rrollo y/o adaptación de nuevas tecnologías software, hardware y de instrumentación7,4, más la implantación de instituciones y pro- gramas que sienten las bases del apoyo a la investigación. 4. Problemas relativos a la Formación: Esta cate- goría incluye problemas relacionados con la formación en Bioinformática y su relación con la demanda empresarial y profesional. 5. Problemas relativos a los Datos en General: Esta categoría incluye problemas relaciona- dos con la adquisición, almacenamiento, presentación y análisis de datos. En la Tabla 1 se resumen las aplicaciones más comunes de las categorías y se puede apreciar la complejidad que comporta esta dis- ciplina en cuanto a organización, metodología, técnica, información, seguridad y calidad de los sistemas. 5. CONCLUSIONES La Bioinformática, que es una disciplina cien- tífico-tecnológica multidisciplinar donde concu- rren principalmente la Biología Molecular y Genética y la Ciencia de la Computación y la Ingeniería Informática, se ha encargado de ir ofreciendo soluciones a los problemas de inves- tigación en medicina y otras disciplinas de las ciencias de la salud y biológicas que tratan ingentes cantidades de datos. Dichas soluciones bioinformáticas son muy diversas obedeciendo a la diversidad de tipos de información que maneja esta disciplina. Pero lo que no puede perder de vista un bioinfomático es que debe plantear el diseño, construcción e implantación de cualquier solución bioinformática bajo los mismos criterios formales y de calidad que se aplican un los proyectos de ingeniería informá- tica, puesto que se trata realmente, de proyec- tos de ingeniería bioinformática. BIBLIOGRAFÍA Especial: Auditoría Informática 32 Categoría Subcategoría Área de Aplicación Problemas sobre análisis de secuencias Problemas sobre análisis de estructuras Problemas sobre análisis de funciones Problemas sobre Nuevas tecnologías Problemas sobre Organización y Gestión Problemas sobre alma- cenamiento y gestión de datos Problemas sobre gestión del conocimiento bioló- gico Problemas sobre adquisi- ción e intercambio de datos Problemas sobre análisis e interpretación de datos Problemas sobre seguri- dad y protección de dato • Correspondencia física: probandos y clones de ADN • Comparación y Alineación de estructuras • “Pattern Matching” • Identificación de Patrones • Árboles filogenéticos • Predicción de estructuras • Encaje de Proteínas y Enlace de Ligandos • Rutas metabólicos • Redes reguladoras • Simulación de encaje de proteínas • Simulación de rutas metabólicas • Adaptación y diseño de algoritmos • Diseño y desarrollo de chips de matrices de ADN • Diseño y desarrollo de tecnologías chIp-chip de ADN • Aprendizaje automático y redes neuronales • Redes de excelencia y /o investigación • Establecimiento de instituciones y programas de I+D • Formación: Enseñanza virtual, distribuida y presencial • Demanda empresarial y profesional • Diseño de bases de datos • Diseño y desarrollo de sistemas de gestión de datos • Representación del conocimiento • Visualización de datos • Diseño de sistemas de gestión del conocimiento integrados • Diseño de sistemas de portales web e Intranet • Diseño y desarrollo de herramientas específicas para la adquisición de datos • Diseño y desarrollo de herramientas específicas para la con- versión de datos • Diseño y desarrollo de herramientas específicas para mediciones • Modelado abstracto de datos • Análisis estadístico • Minería de datos • Regulación y protección de los datos personales (individuos humanos) • Seguridad de los datos científicos y técnicos • Cifrado de los datos para almacenamiento y transmisión Problemas relativos específicamente al Dogma Central Problemas relativos a la Simulación de Procesos Biológicos Problemas relativos a al Desarrollo de Nuevas Tecnologías y Organización Problemas relativos a la Formación Problemas relativos a los Datos en General Tabla 1. Categorías de problemas en Bioinformática. Parte B Especial: Auditoría Informática 33 1: EMBL: The European Molecular Biology Laboratory, http://www.embl.org. 2: DDBL: The DNA Data Bank of Japan 3: Usadas para el diseño de compiladores de lenguajes de programación. Según la forma del recorrido son “LL”, a izquierdas; “RR” a dere- chas. Ambas son independientes del contexto a diferencia de las gramáticas de los lenguajes naturales. 4: Usadas para el reconocimiento y síntesis del habla en el tratamiento del lenguaje natural. 5: OO: Paradigma de la Orientación a Objetos en lenguajes de programación e Ingeniería del Software. 6: UML: Unified Modeling Language. Lenguaje para el modelado de sistemas de software orientados a objetos, pero que también sirve para el modelado de sistemas genómicos. 7: Sistemas de Gestión del Conocimiento, ontologías, etc. << Categoría Subcategoría Área de Aplicación Tabla 2. Categorías de problemas en Bioinformática Problemas sobre Nuevas tecnologías Problemas sobre Organización y Gestión Problemas sobre almacenamiento y gestión de datos Problemas sobre gestión del conocimiento biológico Problemas sobre adquisición e intercambio de datos Problemas sobre análisis e interpretación de datos Problemas sobre seguri- dad y protección de datos • Adaptación y diseño de algoritmos • Diseño y desarrollo de chips de matrices de ADN • Diseño y desarrollo de tecnologías chIp-chip de ADN • Aprendizaje automático y redes neuronales • Redes de excelencia y /o investigación • Establecimiento de instituciones y programas de I+D • Diseño de bases de datos • Diseño y desarrollo de sistemas de gestión de datos • Representación del conocimiento • Visualización de datos • Diseño de sistemasde gestión del conocimiento inte- grados • Diseño de sistemas de portales web e Intranet • Diseño y desarrollo de herramientas específicas para la adquisición de datos • Diseño y desarrollo de herramientas específicas para la conversión de datos • Diseño y desarrollo de herramientas específicas para mediciones • Modelado abstracto de datos • Análisis estadísticos • Minería de datos • Regulación y protección de los datos personales (indivi- duos humanos) • Seguridad de los datos científicos y técnicos • Cifrado de los datos para almacenamiento y transmisión Problemas relativos a al Desarrollo de Nuevas Tecnologías y Organización Problemas relativos a los Datos en General 1. Backofen R., Gilbert D. “Bioinformatics and Constraints”. Constraints, 6; 2001: 141-156. 2. Cass S., Riezenmann M.J. “Improving Security, Preserving Privacy”. IEEE Spectrum, Jan.; 2002: 44-49. 3. Crick, F. H. C. “On protein synthesis”. Sympo- sium of the Society of Experimental Biology, 12; 1958: 138-167. 4. Horak C.E., Mahajan M.C., Luscombe N.M., Gerstein M., Weissman S.M. “GATA-1 binding sites mapped in the _-globin locus by using mammalian chIp-chip analysis”. Proc. Nat. Acad. Sci., 99(5); 2002: 2924-2929. 5. Jones R.L. "The Internet and Healthcare Information Systems: How Safe Will Patient Data Be?". IS Audit & Control Journal, I; 1998: 25-30. 6. Kloppenburg Jr. J., “Biopiracy, Witchery, and the Fables of Ecoliberalism”. Peace Review, 12(4); 2000: 509-516. 7. Lemieux B., Aharoni A., Schena M. Especial: Auditoría Informática 34 “Overview of DNA chip technology”. Molecular Breeding, 4; 1998: 277-289. 8. Roberts R. “Bioinformatics Analysis of Gene Banks Provides a Treasure Trove for the Functional Genomist”. J. Mol. Cell. Cardiol.; 32; 2000: 1917-1919. 9. Sackman H. Biomedical Information Technology. Global Social Responsibilities for the Democratic Age. Academic Press, San Diego, CA (USA), 1997. 10. Stephanopoulos G. “Bioinformatics and Metabolic Engineering” (Foreword). Metabo- lic Engineering 2; 2000: 157-158. 11. Van Bemmel J.H., Musen M.A.(eds.) Hadbook of Medical Informatics. Springer- Verlag, Heidelbeg, 1997. 12. Zhou J., Palumbo A.V. “Sequence to Function: The 7th conference on Small Genomes” (Guest editorial). Genética, 108; 2000: vii-ix. AGRADECIMIENTOS Este trabajo ha sido financiado en parte por la red temática de investigación cooperativa en el área de Biomedicina, denominada G03/160 “INBIOMED. Plataforma de almacenamiento, inte- gración y análisis de datos clínicos, genéticos, epi- demiológicos e imágenes orientada a la investi- gación sobre patologías”. Su coordinador es el Dr. Fernando Martín, del Instituto de Salud Carlos III. Además, las primeras versiones de este docu- mento se desarrollaron mientras el autor se encontraba disfrutando de una beca de movili- dad del profesorado financiada por el Ministerio de Educación y Ciencia de España, con el código PR2003-0063. Institución Recursos Dirección URL Tabla 3. Instituciones que ofrecen recursos bioinformáticos e información en Internet Datos y herramientas software. Enlaces a otros portales. Publicaciones (33) European Bioinformatics Institute Datos de secuencias Datos y herramientas software. Enlaces a otros portales Datos y herramientas software. Enlaces a otros portales Información sobre bio-proyectos. Enlaces a otros portales Datos y herramientas software. Enlaces a otros portales Estandarización de software orientado a objeto. Enlaces a otros portales Intercambio y gestión de datos yconocimiento para las ciencias de la vida Datos y herramientas software. Enlaces a otros portales Bio-Proyectos comerciales http://www.ncbi.nlm.nih.gov http://www.ensembl.org/genome/central/ http://www.celera.com http://compbio.ornl.gov/tools/index.shtml http://open-bio.org http://bioinformatics.org/about http://www.omg.org Life Siciences Research: http://www.omg.org/homepages/lsr/ http://i3c.open-bio.org/ http://www.ncbi.nlm.nih.gov http://www.ncbi.nlm.nih.gov National Center for Biotechnology Information (NCBI) European Bioinformatics Institute Celera Oak Ridge National Laboratory (ONRL) The Open Bioinformatics Foundation Bioinformatics.org Object Management Group (OMG) Interoperable Informatics Infrastructure Consortium (I3C) Biotechnology Industry Organization (BIO) National Center for Biotechnology Information
Compartir