Logo Studenta

IS43_29

¡Estudia con miles de materiales!

Vista previa del material en texto

Especial: Auditoría Informática
29
1. INTRODUCCIÓN
El Proyecto del Genoma Humano (HUGE en
inglés) ha exigido tal cantidad de esfuerzos cien-
tíficos y tecnológicos que sus resultados directos
no han sido más que una parte de todas las apor-
taciones a la comunidad científica y a la sociedad
en general1. Una de las consecuencias ha sido el
surgimiento de nuevas disciplinas y de nuevos
planteamientos interdisciplinares para científicos
que antes solamente trabajaban en un campo
extremadamente restringido10. También ha pro-
vocado nuevos problemas sociales y éticos, en el
manejo de la información genética de los indivi-
duos, cuyos efectos ya están apareciendo6,9.
Una de las nuevas disciplinas surgidas al ampa-
ro del HUGE es la Bioinformática, que también se
denomina Biología Computacional, aunque todo
el mundo va adoptando el primer término de
forma tácita. En esta disciplina se maneja infor-
mación fundamentalmente de origen biológico,
pero también de otras fuentes. En el caso de la
investigación sobre humanos, parte de esas fuen-
tes son de origen administrativo, familiar, clínico,
etc. Esto tiene relación con los aspectos de priva-
cidad y protección de la información personal, o
con el uso adecuado y autorizado de la informa-
ción según para qué fines2. Así, la Bioinformática
ha provocado también efectos colaterales en la
Bioética, ya que ésta ha tenido que ampliar su
campo de acción y amparar la protección de la
información genética cuando es de origen
humano9.
La rápida y espectacular evolución de la
Bioinformática ha dejado atrás los enfoques
metodológicos, técnicos y tecnológicos que la
Auditoría de Sistemas de Información venía apli-
cando a la Informática vista como Tecnología de
la Información (TI). Esta nueva disciplina, en su
vertiente informática, presenta un porcentaje
muy alto de ciencia y menor de tecnología, hasta
el punto que se podría hablar, en un sentido más
restrictivo, de Ciencia y Tecnología de la
Información Biológica (CTIB). Dadas estas circuns-
tancias, se puede deducir que no existen actual-
mente, o son muy incipientes, enfoques y normas
relativos al control y análisis de la aplicación efi-
ciente, metodológicamente correcta y ética de la
Bioinformática, y también de las normas, proce-
dimientos, técnicas y guías que contribuyan a la
construcción de mecanismos de control de la
práctica bioinformática2.
Por tanto, el objetivo de este trabajo es hacer
una breve introducción a la Bioinformática, su
La disciplina de Bioinformática: 
definición y caracterización
Autor:
Coltell, Óscar 
RESUMEN
Los recientes y espectaculares avances de la
Medicina en el campo de la Genómica no son más
que el preludio de lo que está por venir. El Proyecto del
Genoma Humano (HUGE en inglés) ha establecido
definitivamente la integración de disciplinas muy dis-
tintas, la Biología Genética y Molecular y las Ciencias
de la Computación, dando lugar a la Bioinformática.
Los resultados del HUGE han provocado que se anali-
cen las implicaciones éticas sobre quién, cómo, dónde,
para qué y por qué utilizar la información genómica
de los individuos con el soporte de las Tecnologías de
la Información. Los experimentos genómicos generan
ingentes cantidades de datos genéticos que plantean
problemas de gestión y análisis. Así, la Bioinformática
tiene que ir ofreciendo soluciones a estos problemas
de tratamiento de la información genética, ambiental,
clínica, etc. Dichas soluciones bioinformáticas son real-
mente proyectos de ingeniería bioinformática que
deben desarrollarse bajo criterios formales y de calidad
del enfoque de ingeniería.
PALABRAS CLAVE
Bioinformática, Proyecto del Genoma Humano, soluciones bioinformáticas, proyectos de ingenie-
ría bioinformática.
Especial: Auditoría Informática
30
definición, los problemas que plantea y las fun-
ciones que la componen. Así, se podrá enten-
der el desarrollo empleado en los siguientes
artículos donde se explica un marco metodoló-
gico adaptado para la Auditoría Bioinformática,
teniendo en cuenta los aspectos científicos, tec-
nológicos y éticos de la disciplina.
2. DEFINICIÓN DE BIOINFORMÁTICA
Según Backofen y Gilbert1, la Bioinformática
es la resolución de problemas que provienen de
la biología mediante metodologías aportadas
por la ciencia de la computación. Estas meto-
dologías no deben circunscribirse a la mera
automatización de soluciones ya existentes en
el campo de la biología, sino deben dedicarse
a la revisión y adaptación de algoritmos y siste-
mas existentes en el campo de la ciencia de la
computación, e incluso diseñar nuevas aplica-
ciones.
Según Stephanopoulos10, la Bioinformática es
el enfoque y el conjunto de métodos cuya
misión es la extracción de conocimiento bioló-
gico a partir de la secuenciación, la expresión,
la proteómica y los datos distribuidos del traza-
do isotópico. Establece además, que el tema
principal de investigación es la mejora y actua-
lización del contenido de la información.
Una definición más completa, teniendo en
cuenta lo que se ha mencionado en la sección
anterior, es que la Bioinformática es una disci-
plina científica y tecnológica en la que inte-
raccionan en armonía los planteamientos
investigadores de la Biología Genética y
Molecular, con los enfoques metodológicos y
tecnológicos de la Ciencia de la Computación
y la Ingeniería Informática, para la obtención
y gestión del conocimiento biológico genómi-
co y proteómico.
3. LA INFORMÁTICA MÉDICA Y LA BIOINFORMÁTICA
En una primera aproximación, se podría afir-
mar que la Bioinformática no es Informática
Médica, dados los planteamientos clásicos de la
última. En la Informática Médica, existe una
clara separación entre el informático, que es el
diseñador, constructor, gestor, mantenedor y
solucionador de incidencias en los sistemas
informáticos sanitarios; frente al usuario, que es
el médico clínico, o el administrativo, o el ges-
tor, u otros profesionales de la sanidad, incluso
los pacientes. Esta disciplina es relativamente
genérica y extensa y está enfocada más hacia
los aspectos de desarrollo, innovación y produc-
ción 11,9.
En cambio, en la Bioinformática se da la con-
vergencia multidisciplinar, donde al menos un
científico biólogo y otro científico informático
colaboran estrechamente para alcanzar un
objetivo común, para lo cual necesitan un len-
guaje común y, además, aprender uno del otro
los respectivos conocimientos fundamentales.
Esta disciplina tiene un horizonte más estrecho
orientado fundamentalmente a la investigación
aplicada (a veces pura) relacionada principal-
mente con las siguientes áreas: biología mole-
cular, biología molecular y genética (genómi-
ca, proteómica, etc.), ciencias biomédicas (epi-
demiología genética y molecular y otras), cien-
cias de la computación, matemáticas, física y
estadística (Figura 1).
Sin embargo, la Informática Médica también
ha ido incorporando en los últimos años una
importante faceta investigadora (tratamiento
de imágenes, diseño de medicamentos, tera-
pias asistidas, etc.) Además, ha adoptado con
rapidez las tecnologías relacionadas con la
genómica y la proteómica con el objetivo de
potenciar la investigación clínica y epidemioló-
gica aplicadas5,8. Esto ha cambiado un poco las
posiciones de ambas disciplinas y se puede afir-
mar que existe un importante solapamiento,
que no subordinación, entre ambas. Hay que
recordar que la Bioinformática también se apli-
ca a la investigación biológica en otras especies
vivas (e incluso muertas, como la paleogenó-
mica).
Figura 1. La Bioinformática como convergencia multidisciplinar
Especial: Auditoría Informática
31
4. PRINCIPIOS Y ÁREAS DE INVESTIGACIÓN
Se han formulado algunos principios que
rigen la práctica de la Bioinformática o que vie-
nen heredados de algunas de las disciplinas
concurrentes: el Principio de Investigación en
Bioinformática y el Principio del Dogma Central
en Proteómica.
El Principio de Investigación en Bioin-
formática establece que la investigación en
Bioinformática debe enfocarse fundamental-
mente a la comprensióndel funcionamiento de
los organismos vivos con distintas aplicaciones1.
El Principio del Dogma Central en Proteómica
establece que el flujo de información en biolo-
gía, que permite que una secuencia de amino-
ácidos produzca la estructura y la función de
una proteína, está determinado esencialmente
por la transcripción del ADN vía ARN. (Bakofen
et al., 2001). El dogma central fue formulado
inicialmente por Crick3.
Estos dos principios, junto a otros menos rele-
vantes, delimitan las áreas fundamentales de
investigación en esta disciplina como las
siguientes: Secuenciación de ADN12, compara-
ción de secuencias de ácidos nucleicos10, expre-
sión de ácidos nucleicos, análisis e interpreta-
ción de datos genómicos8, etc.
Las áreas directamente derivadas (en segun-
do grado de relación), en las que se aplican
efectivamente los resultados de las investigacio-
nes bioinformáticas son las siguientes: Diseño
de fármacos, identificación de factores de ries-
go genéticos, terapia génica, modificación
genética de alimentos, modificación genética
de especies animales, etc1. Entre las áreas indi-
rectamente derivadas (en tercer grado de rela-
ción) se encuentran las que están, o planteadas
teóricamente, o con un grado de desarrollo
muy bajo, como las siguientes: Identificación
biométrica genética, Seguridad y protección de
datos genéticos, etc6.
5. ÁREAS DE APLICACIÓN
La Bioinformática tiene aplicación en
muchas áreas y, en un futuro próximo, dada la
tendencia actual, la lista de aplicaciones se
incrementará considerablemente. Pero es nece-
sario sistematizar la estructura de aplicaciones
mediante la definición de unas categorías prin-
cipales de problemas que agrupan cualquier
área que exista o que surja en un futuro. Estas
categorías son las siguientes1:
1. Problemas relativos específicamente al
Dogma Central: Esta categoría incluye pro-
blemas relacionados con un nivel de infor-
mación específico (análisis de secuencias,
estructuras o funciones) y los relacionados
con más de un nivel.
2. Problemas relativos a la Simulación de
Procesos Biológicos: Esta categoría incluye
problemas relacionados con la predicción del
comportamiento dinámico de un sistema
dinámico respecto de sus componentes.
3. Problemas relativos al Desarrollo de Nuevas
Tecnologías y Organización: Esta categoría
incluye problemas relacionados con el desa-
rrollo y/o adaptación de nuevas tecnologías
software, hardware y de instrumentación7,4,
más la implantación de instituciones y pro-
gramas que sienten las bases del apoyo a la
investigación.
4. Problemas relativos a la Formación: Esta cate-
goría incluye problemas relacionados con la
formación en Bioinformática y su relación
con la demanda empresarial y profesional.
5. Problemas relativos a los Datos en General:
Esta categoría incluye problemas relaciona-
dos con la adquisición, almacenamiento,
presentación y análisis de datos.
En la Tabla 1 se resumen las aplicaciones
más comunes de las categorías y se puede
apreciar la complejidad que comporta esta dis-
ciplina en cuanto a organización, metodología,
técnica, información, seguridad y calidad de los
sistemas.
5. CONCLUSIONES
La Bioinformática, que es una disciplina cien-
tífico-tecnológica multidisciplinar donde concu-
rren principalmente la Biología Molecular y
Genética y la Ciencia de la Computación y la
Ingeniería Informática, se ha encargado de ir
ofreciendo soluciones a los problemas de inves-
tigación en medicina y otras disciplinas de las
ciencias de la salud y biológicas que tratan
ingentes cantidades de datos. Dichas soluciones
bioinformáticas son muy diversas obedeciendo
a la diversidad de tipos de información que
maneja esta disciplina. Pero lo que no puede
perder de vista un bioinfomático es que debe
plantear el diseño, construcción e implantación
de cualquier solución bioinformática bajo los
mismos criterios formales y de calidad que se
aplican un los proyectos de ingeniería informá-
tica, puesto que se trata realmente, de proyec-
tos de ingeniería bioinformática.
BIBLIOGRAFÍA
Especial: Auditoría Informática
32
Categoría Subcategoría Área de Aplicación
Problemas sobre análisis
de secuencias
Problemas sobre análisis
de estructuras
Problemas sobre análisis
de funciones
Problemas sobre Nuevas
tecnologías
Problemas sobre
Organización y Gestión
Problemas sobre alma-
cenamiento y gestión de
datos
Problemas sobre gestión
del conocimiento bioló-
gico
Problemas sobre adquisi-
ción e intercambio de
datos
Problemas sobre análisis
e interpretación de
datos
Problemas sobre seguri-
dad y protección de
dato
• Correspondencia física: probandos y clones de ADN
• Comparación y Alineación de estructuras
• “Pattern Matching”
• Identificación de Patrones
• Árboles filogenéticos
• Predicción de estructuras
• Encaje de Proteínas y Enlace de Ligandos
• Rutas metabólicos
• Redes reguladoras
• Simulación de encaje de proteínas
• Simulación de rutas metabólicas
• Adaptación y diseño de algoritmos
• Diseño y desarrollo de chips de matrices de ADN
• Diseño y desarrollo de tecnologías chIp-chip de ADN
• Aprendizaje automático y redes neuronales
• Redes de excelencia y /o investigación
• Establecimiento de instituciones y programas de I+D
• Formación: Enseñanza virtual, distribuida y presencial
• Demanda empresarial y profesional
• Diseño de bases de datos
• Diseño y desarrollo de sistemas de gestión de datos
• Representación del conocimiento
• Visualización de datos
• Diseño de sistemas de gestión del conocimiento integrados
• Diseño de sistemas de portales web e Intranet
• Diseño y desarrollo de herramientas específicas para la
adquisición de datos
• Diseño y desarrollo de herramientas específicas para la con-
versión de datos
• Diseño y desarrollo de herramientas específicas para mediciones
• Modelado abstracto de datos
• Análisis estadístico
• Minería de datos
• Regulación y protección de los datos personales (individuos
humanos)
• Seguridad de los datos científicos y técnicos
• Cifrado de los datos para almacenamiento y transmisión
Problemas
relativos
específicamente al
Dogma Central
Problemas relativos
a la Simulación de
Procesos Biológicos
Problemas
relativos a al
Desarrollo de
Nuevas
Tecnologías y
Organización
Problemas
relativos a la
Formación
Problemas
relativos a los
Datos en General
Tabla 1. Categorías de problemas en Bioinformática. Parte B
Especial: Auditoría Informática
33
1: EMBL: The European Molecular Biology Laboratory, http://www.embl.org.
2: DDBL: The DNA Data Bank of Japan
3: Usadas para el diseño de compiladores de lenguajes de programación. Según la forma del recorrido son “LL”, a izquierdas; “RR” a dere-
chas. Ambas son independientes del contexto a diferencia de las gramáticas de los lenguajes naturales.
4: Usadas para el reconocimiento y síntesis del habla en el tratamiento del lenguaje natural.
5: OO: Paradigma de la Orientación a Objetos en lenguajes de programación e Ingeniería del Software.
6: UML: Unified Modeling Language. Lenguaje para el modelado de sistemas de software orientados a objetos, pero que también sirve para el
modelado de sistemas genómicos.
7: Sistemas de Gestión del Conocimiento, ontologías, etc.
<<
Categoría Subcategoría Área de Aplicación
Tabla 2. Categorías de problemas en Bioinformática
Problemas sobre Nuevas
tecnologías
Problemas sobre
Organización y Gestión
Problemas sobre
almacenamiento y
gestión de datos
Problemas sobre gestión
del conocimiento
biológico
Problemas sobre
adquisición e intercambio
de datos
Problemas sobre análisis
e interpretación de datos
Problemas sobre seguri-
dad y protección de
datos
• Adaptación y diseño de algoritmos
• Diseño y desarrollo de chips de matrices de ADN
• Diseño y desarrollo de tecnologías chIp-chip de ADN
• Aprendizaje automático y redes neuronales
• Redes de excelencia y /o investigación
• Establecimiento de instituciones y programas de I+D
• Diseño de bases de datos
• Diseño y desarrollo de sistemas de gestión de datos
• Representación del conocimiento
• Visualización de datos
• Diseño de sistemasde gestión del conocimiento inte-
grados
• Diseño de sistemas de portales web e Intranet
• Diseño y desarrollo de herramientas específicas para la
adquisición de datos
• Diseño y desarrollo de herramientas específicas para la
conversión de datos
• Diseño y desarrollo de herramientas específicas para
mediciones
• Modelado abstracto de datos
• Análisis estadísticos
• Minería de datos
• Regulación y protección de los datos personales (indivi-
duos humanos)
• Seguridad de los datos científicos y técnicos
• Cifrado de los datos para almacenamiento y transmisión
Problemas relativos
a al Desarrollo de
Nuevas Tecnologías
y Organización
Problemas relativos
a los Datos en
General
1. Backofen R., Gilbert D. “Bioinformatics and
Constraints”. Constraints, 6; 2001: 141-156.
2. Cass S., Riezenmann M.J. “Improving Security,
Preserving Privacy”. IEEE Spectrum, Jan.; 2002:
44-49.
3. Crick, F. H. C. “On protein synthesis”. Sympo-
sium of the Society of Experimental Biology,
12; 1958: 138-167.
4. Horak C.E., Mahajan M.C., Luscombe N.M.,
Gerstein M., Weissman S.M. “GATA-1 binding
sites mapped in the _-globin locus by using
mammalian chIp-chip analysis”. Proc. Nat.
Acad. Sci., 99(5); 2002: 2924-2929.
5. Jones R.L. "The Internet and Healthcare
Information Systems: How Safe Will Patient
Data Be?". IS Audit & Control Journal, I; 1998:
25-30.
6. Kloppenburg Jr. J., “Biopiracy, Witchery, and
the Fables of Ecoliberalism”. Peace Review,
12(4); 2000: 509-516.
7. Lemieux B., Aharoni A., Schena M.
Especial: Auditoría Informática
34
“Overview of DNA chip technology”. Molecular
Breeding, 4; 1998: 277-289.
8. Roberts R. “Bioinformatics Analysis of Gene
Banks Provides a Treasure Trove for the
Functional Genomist”. J. Mol. Cell. Cardiol.; 32;
2000: 1917-1919.
9. Sackman H. Biomedical Information
Technology. Global Social Responsibilities for
the Democratic Age. Academic Press, San
Diego, CA (USA), 1997.
10. Stephanopoulos G. “Bioinformatics and
Metabolic Engineering” (Foreword). Metabo-
lic Engineering 2; 2000: 157-158.
11. Van Bemmel J.H., Musen M.A.(eds.)
Hadbook of Medical Informatics. Springer-
Verlag, Heidelbeg, 1997.
12. Zhou J., Palumbo A.V. “Sequence to
Function: The 7th conference on Small
Genomes” (Guest editorial). Genética, 108;
2000: vii-ix.
AGRADECIMIENTOS
Este trabajo ha sido financiado en parte por la
red temática de investigación cooperativa en el
área de Biomedicina, denominada G03/160
“INBIOMED. Plataforma de almacenamiento, inte-
gración y análisis de datos clínicos, genéticos, epi-
demiológicos e imágenes orientada a la investi-
gación sobre patologías”. Su coordinador es el Dr.
Fernando Martín, del Instituto de Salud Carlos III.
Además, las primeras versiones de este docu-
mento se desarrollaron mientras el autor se
encontraba disfrutando de una beca de movili-
dad del profesorado financiada por el Ministerio
de Educación y Ciencia de España, con el código
PR2003-0063.
Institución Recursos Dirección URL
Tabla 3. Instituciones que ofrecen recursos bioinformáticos e información en Internet
Datos y herramientas software.
Enlaces a otros portales.
Publicaciones (33)
European Bioinformatics Institute
Datos de secuencias
Datos y herramientas software.
Enlaces a otros portales
Datos y herramientas software.
Enlaces a otros portales
Información sobre bio-proyectos.
Enlaces a otros portales
Datos y herramientas software.
Enlaces a otros portales
Estandarización de software
orientado a objeto. Enlaces a
otros portales
Intercambio y gestión de datos
yconocimiento para las ciencias
de la vida
Datos y herramientas software.
Enlaces a otros portales
Bio-Proyectos comerciales
http://www.ncbi.nlm.nih.gov
http://www.ensembl.org/genome/central/
http://www.celera.com
http://compbio.ornl.gov/tools/index.shtml
http://open-bio.org
http://bioinformatics.org/about
http://www.omg.org
Life Siciences Research: 
http://www.omg.org/homepages/lsr/
http://i3c.open-bio.org/
http://www.ncbi.nlm.nih.gov
http://www.ncbi.nlm.nih.gov
National Center for
Biotechnology
Information (NCBI)
European
Bioinformatics
Institute
Celera
Oak Ridge National
Laboratory (ONRL)
The Open
Bioinformatics
Foundation
Bioinformatics.org
Object Management
Group (OMG)
Interoperable
Informatics
Infrastructure
Consortium (I3C)
Biotechnology
Industry
Organization (BIO)
National Center for
Biotechnology
Information

Continuar navegando

Materiales relacionados

30 pag.
aci02604

SIN SIGLA

User badge image

Vanina Gisele Beguiristain

6 pag.
art13

SIN SIGLA

User badge image

nesibago2

7 pag.
40280313

SIN SIGLA

User badge image

nesibago2

7 pag.
Bioinformática médica

Abaco - Chiclayo

User badge image

Javier Saavedra Quintana