Logo Studenta

Estudio-de-modelado-molecular-y-quimioinformatica-de-moduladores-de-blancos-terapeuticos-epigeneticos

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO
PROGRAMA DE MAESTRÍA Y DOCTORADO EN CIENCIAS QUÍMICAS
ESTUDIO DE MODELADO MOLECULAR Y
QUIMIOINFORMÁTICA DE MODULADORES
DE BLANCOS TERAPÉUTICOS
EPIGENÉTICOS
PROYECTO DE INVESTIGACIÓN
PARA OPTAR POR EL GRADO DE
MAESTRO EN CIENCIAS
PRESENTA
Químico Farmacéutico Industrial FERNANDO DANIEL PRIETO MARTÍNEZ
Dr. José Luis Medina Franco
Departamento de Farmacia, Facultad de
Química; UNAM
Ciudad Universitaria, CD. MX. Diciembre 2016
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
El presente trabajo se realizó en el DIFACQUIM perteneciente al Departamento de
Farmacia de la Facultad de Química, UNAM. El proyecto fue posible gracias a los
siguientes apoyos:
 Beca CONACyT (No. de becario 576637/ CVU 660465)
 Programa de Apoyo a la Investigación y al Posgrado (PAIP 5000-9163), Facultad
de Química, UNAM
Los productos académicos de este proyecto son:
 Cartel de avances, presentado en las Jornadas de Investigación de la Facultad de
Química, UNAM
 Cartel de avances, presentado en el 1° Congreso estudiantil de Ciencia sin
fronteras en la Escuela Superior de Medicina, IPN.
 Publicación en una revista de impacto (RSC Advances) bajo el título “A chemical
space odyssey of inhibitors of histone deacetylases and bromodomains”. RSC
Adv.,2016,6, 56225. DOI: 10.1039/c6ra07224k
 Presentación de resultados en la UGM de MOE, en Montreal Canadá
El jurado asignado a este trabajo está comprendido por:
 Dr. Luis Demetrio Miranda Gutiérrez Instituto de Química, UNAM
 Dr. Fernando Cortés Guzmán Instituto de Química, UNAM
 Dr. José Correa Basurto Escuela Superior de Medicina, IPN
 Dr. Alfonso Sebastián Lira Rocha Facultad de Química, UNAM
 Dra. Laura Domínguez Dueñas Facultad de Química, UNAM
AGRADECIMIENTOS
A la Universidad Nacional Autónoma de México por permitirme realizar mi posgrado, en esta máxima
casa de estudios.
de MOE en Montreal, donde se presentaron avances del presente proyecto.
Al Consejo Nacional de Ciencia y Tecnología, por la beca otorgada durante el desarrollo de mis
estudios de maestría.
Al Instituto de Investigaciones Biomédicas, a través del Programa de Nuevas Alternativas para el
Tratamiento de Enfermedades Infecciosas (NUATEI), por el apoyo para la obtención de licencias de
software usado en el presente trabajo.
Al Dr. José Luis Medina Franco, por todo su apoyo, consejo y sobre todo por el empeño que infundió en
mi durante la realización del proyecto.
A mis sinodales, por sus contribuciones, comentarios y sugerencias para el enriquecimiento y mejora
del presente informe.
A mis padres Anita y Fernando, porque todo lo que soy hoy, es por su esfuerzo y dedicación.
A Tatiana, por todo su apoyo, confianza y comprensión durante ésta etapa y las que están por venir.
Al candidato a Dr. en C. Eli Fernández de Gortari, por su ayuda y consejos durante las primeras etapas
del proyecto.
A mis compañeros de DIFACQUIM, por la convivencia y todos esos momentos e intercambios en el
cubículo, nuestra segunda casa.
Al Programa de Maestría y Doctorado en Ciencias Químicas, por el apoyo otorgado para asistir al UGM
INDICE
Resumen………………………………………………………………………………………………………..2
Introducción……………………………………………………………………………………………………2
Antecedentes…………………………………………………………………………………………………..3
Hipótesis………………………………………………………………………………………………………..5
Objetivos………………………………………………………………………………………………………..5
Métodos…………………………………………………………………………………………………………6
Resultados y discusión……………………………………………………………………………………..11
Conclusiones………………………………………………………………………………………………….23
Perspectivas…………………………………………………………………………………………………..23
Referencias……………………………………………………………………………………………………23
Anexo (Publicación original)……………………………………………………………………………….26
INDICE DE TABLAS Y FIGURAS
Tabla 1. Número de ligandos co-cristalizados encontrados en PDB con actividad inhibitoria de
BETs……………………………………………………………………………………………………………….10
Figura 1. Quimiotipos con mayor frecuencia en las bases BRDi y HDACi…………………………...16
Figura 2. Curvas de recobro de núcleos base, para las colecciones con información
epigenéticamente relevante y la colección GRAS………………………………………………………...17
Figura 3. Comparativo de núcleos base asociados a la inhibición de BRDs y posibles
quimiotipos similares por representación bidimensional……………………………………………….19
Figura 4. Ejemplos de alineamiento flexible………………………………………………………………..20
Figura 5. Validación del acoplamiento molecular………………………………………………………....21
Figura 6. Estructuras químicas de los hits identificados por el protocolo de cribado virtual, como
inhibidores potenciales de BRD4………………………………………………………………………….....21
Figura 7. Histograma de interacciones representativas, recuperadas por PLIFs usando los
diferentes algoritmos de acoplamiento……………………………………………………………………..22
Lista de Abreviaturas
ADN: Ácido desoxirribonucleico
BET: Proteína con bromodominio extraterminal
BRD: Bromodominio
DIFAC: Diseño de fármacos asistido por computadora
DNMT: DNA-5-metil-transferasa
ECCFGP: Huellas digitales moleculares por conectividad extendida
EQ: Espacio químico
ESQUER: Espacio químico epigenéticamente relevante
FGP: Huella digital molecular (fingerprint)
GRAS: Compuestos generalmente reconocidos como seguros
HDACs: Histona-desacetilasas
MACCS: Molecular Access System
MOE: Molecular Operating Enviroment
PCA: Análisis de componentes principales (por sus siglas en inglés)
2
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
RESUMEN1
La epigenética comprende una serie de mecanismos independientes de ADN que involucran a una gran
variedad de enzimas. Estas enzimas, por su naturaleza “editora”, son directamente responsables del ciclo
expresión/supresión de los genes. Diversos trabajos han reportado hasta ahora a una gran cantidad de
inhibidores de éstas dianas. No obstante, hasta ahora el perfil de dichos compuestos no se ha discutido en un
contexto quimioinformático. En esta investigación se presenta una muestra del espacio químico
epigenéticamente relevante (ESQUER) y su posible relación con fármacos aprobados por la FDA y aditivos
alimentarios. Mediante técnicas de análisis por componentes principales se obtuvo una representación visual
aproximada de dicho espacio que también fue analizado utilizando métodos quimionformáticos. Se
encontraron relaciones fisicoquímicas y estructurales importantes entre inhibidores epigenéticos y fármacos
aprobados/GRAS. Los resultados pemitieron sugerir estudios posteriores para el reposicionamiento o
caracterización nutracéutica de dichos compuestos.
Una vez caracterizado el espacio químico de inhibidores epigenéticos conocidos se desarrolló un protocolo de
cribado virtual para sugerir nuevos inhibidores potenciales. El cribado virtual se enfocó únicamente a
bromodominios, específicamente a la isoforma BRD4. Se utilizaron búsquedas por similitud molecular y
alineamientos flexibles para identificar inhibidores potenciales. Para determinar las posibles interacciones
ligando-proteína a nivel molecular de los compuestos identificadas en el paso anterior, se empleó el
acoplamiento molecular automatizado usando cuatroprogramas: MOE, Autodock 4, Autodock Vina e ICM. A
pesar de las diferencias notables en evaluación y algoritmos de cada programa se identificaron “hits
consenso”. Los resultados obtenidos del cribado virtual son prometedores porque las estructuras de los
compuestos identificados difieren significativamente de los inhibidores actuales. Como principales
perspectivas de este trabajo de investigación destacan: identificar un modelo farmacofórico para inhibidores
de bromodominios y la evaluación biológica de los compuestos propuestos.
1. Introducción
La epigenética involucra cambios químico-estructurales reversibles; catalizados por enzimas, que son previos
a la edición del ADN 1. Las histonas son octámeros proteicos que empaquetan el ADN, de manera que su
almacenamiento y transporte no interfiera con los procesos celulares. Las cadenas laterales son los puntos
de modificación por una serie de enzimas que adicionan grupos funcionales como metilo, acetato o fosfato
sobre ciertos residuos de aminoácido, p.ej. lisina. Estas modificaciones actúan como una etiqueta de
instrucciones que determina el destino de una histona incluyendo su carga genética. Aspectos importantes de
estas modificaciones es que son heredables y que responden a estímulos del ambiente. A mediados del siglo
pasado se observó cierta correlación entre los patrones de modificación y la expresión de oncogenes. Ahora
se sabe que esta relación se extiende a otros padecimientos crónico-degenerativos como esquizofrenia,
enfermedad de Alzheimer, síndrome metabólico, diabetes mellitus, padecimientos cardiovasculares, etc.2,3
3
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
El presente trabajo comprendió el análisis quimioinformático de compuestos reportados en bases de datos
públicas como inhibidores de bromodominios (BRDs), ADN-5-metiltransferasas (DNMT) e histonas
desacetilasas (HDACs). Dicho análisis involucró la proyección del espacio químico y métodos por similitud
molecular. El comparativo se realizó contra las siguientes colecciones de compuestos como referencia:
fármacos en fase clínica (Clinic), inhibidores enzimáticos diversos (General), fármacos aprobados (FDA) y
aditivos alimentarios (GRAS). Después de la caracterización del ESQUER se realizó una búsqueda de
moléculas de similitud estructural, considerable a la de moléculas activas, con el fin de proponer nuevos
inhibidores ya sea por reposicionamiento de fármacos, valor nutracéutico o diseño de moléculas sonda para
bromodominios. Con tal fin se desarrolló un protocolo de cribado virtual, partiendo de similitud molecular, para
el posterior refinamiento por alineamiento en tres dimensiones y acoplamiento molecular.
2. Antecedentes
2.1. Epigenética
Conrad Waddington describió por primera vez el concepto de epigenética en 1940. Él estudiaba la derivación
de genotipo a fenotipo, de ahí los mecanismos “superiores” al ADN 4. En los eucariotas el material genético se
agrupa como 146 pares de bases en un cromosoma; el cual, a su vez, es rodeado por el nucleosoma que
forma parte del octámero de histonas 5. Las cadenas laterales de la histona son reconocidas por las enzimas
epigéneticas de las cuales se pueden distinguir tres grupos: escribas, supresoras y lectoras.
Los escribas adicionan grupos químicos que son reconocidos por otras enzimas. La modificación se da sobre
residuos de aminoácido (lisina o arginina) 6. Las supresoras son antagonistas a los escribas ya que identifican
a los grupos adicionados o presentes en la histona y los eliminan. Este proceso de edición forma patrones
particulares que regulan el ciclo “expresión-supresión”. Las lectoras “interpretan” los patrones de modificación
en las “colas” de la histona. Este paso es crucial pues el dictamen emitido por las lectoras determinará el
destino del ADN contenido por la histona.
Aunado a lo anterior, se ha investigado el rol de la salud materna durante la gestación y la epigenética
asociada a este proceso. Por ejemplo, se ha visto que la nutrición y exposición a radiación UV son patrones
determinantes en la salud y memoria epigenética 7.
2.2 Enzimas epigenéticas más relevantes
El interés por la investigación epigenética ha crecido exponencialmente. Una de las primeras evidencias que
relacionó enzimas epigenéticas y neoplasia fue la conservación de patrones hipermetilados de ADN en líneas
celulares de cáncer. En la misma forma se observó que una hiperexpresión de histona-acetil transferasas
conduce a la mutación de genes y cambio en la expresión de oncogenes. Ante estos hallazgos la
investigación se enfocó en las enzimas DNMT e histona acetiltransferasas (HAT). El desarrollo de nuevo
conocimiento permitió elucidar el papel de otras enzimas como HDACs y BRDs, cruciales en el proceso de
4
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
modulación epigenética. A continuación, se describen los aspectos más relevantes sobre estas familias de
enzimas.
2.2.1. ADN-5-metil-transferasas (DNMTs)
El ADN está constituido por pares de bases púricas y pirimídicas que interactúan por medio de puentes de
hidrógeno. Debido a la naturaleza química de esta interacción, el par base-base es característico. El par
citosina-guanina que forman islas CpG inducen una modificación epigenética 8. Específicamente, la
metilación, es considerada como una de las modificaciones más estables 9, ocurre en la citosina (sobre el
átomo C5). La ADN-metil-transferasa (DNMT) es la enzima encargada de esta función. Actualmente se
distinguen dos familias: DNMT1 encargada principalmente de metilación de “mantenimiento” (asegurando la
subsistencia del patrón de metilación) y DNMT3(A y B) encargadas de la metilación de novo 10.
2.2.2. Histona-descetilasas (HDACs)
Mientras que las histonas poseen en general una carga parcial positiva, el ADN posee carga negativa. Así, la
interacción electrostática entre ambas permite la compactación del nucleosoma. La adición de un grupo
electronegativo neutraliza esta interacción de cargas, por ello el ADN se encontrará más disponible para su
transcripción. Se infiere entonces, que la remoción de este grupo se relaciona con la supresión génica.
Las enzimas encargadas de ésta labor remueven grupos acilo de lisinas. Esta familia de enzimas se pueden
clasificar en cinco grupos (I, IIa, IIb, III y IV) cuyo mecanismo de acción se puede dividir a su vez, en dos
variantes: catálisis por iones zinc 2+ y catálisis NAD dependiente 5. De las casi 18 isoformas que componen
esta familia, más del 50% está relacionada con alguna forma de cáncer. Entre ellas destacan cáncer
prostático, gástrico-entérico, mama, pulmón y colon 11. A pesar de lo anterior, actualmente sólo existen dos
inhibidores aprobados para uso clínico en el tratamiento de linfoma por células T 12.
Entre los inhibidores de HDACs descritos destacan los derivados de ácido hidroxámico. Tras diferentes
estudios de estructura actividad cualitativa y cuantitativa (SAR y QSAR, respectivamente y por sus siglas en
inglés) se sabe que son esenciales tres características para explicar la inhibición: un grupo electronegativo
que se coordina con el zinc, una cadena “puente” de entre 6 y 8 átomos de carbono que une a un grupo que
favorezca la inhibición por impedimento estérico 13.
2.2.3. Bromodominios (BRDs)
Los bromodominios son enzimas lectoras. Su función característica es el reconocimiento de grupos acetilo;
específicamente, aquellos ubicados sobre residuos de lisina 14. Si bien su función puede parecer sencilla, al
día de hoy se han caracterizadocerca de 30 bromodominios. Éstos a su vez pueden denominarse por su
5
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
ubicación o proteína asociada. Este estudio se enfocó a la familia BET (por sus siglas en inglés) que se
refiere a los bromodominios de dominio extraterminal 2. El interés en estas dianas se debe al reciente
desarrollo farmacológico y conocimiento parcial de su estructura 15, así como su relación a padecimientos
crónico-degenerativos 14.
El desarrollo de la investigación sobre estas dianas comenzó de forma fortuita en 2012, Filippakopoulos y
colaboradores 16 analizaron de manera sistemática la interacción de los BETs y núcleos benzodiazepínicos.
Gracias a estas investigaciones fue posible una caracterización completa de estos bromodominios con el
desarrollo de potentes inhibidores como JQ1 e IBET (GSK525762A). En particular en la literatura la
modulación de los BETs presenta la siguiente prioridad BRD4>BRD2>BRD3. Recientemente ha surgido el
interés por otras familias de bromodominios como CREBP y BAZ2(A y B) de las cuales aún no se conoce
claramente su función 17. Es por esto que es importante identificar moléculas con alta afinidad y pocos efectos
adversos que permitan un estudio similar al descrito para la familia BET 14.
De manera análoga a las enzimas epigenéticas discutidas anteriormente los bromodominios se asociaron con
cáncer, particularmente con cáncer prostático 18. Se sabe que los distintos bromodominios son cruciales en
procesos celulares diversos. Además se han asociado con problemas de inflamación y diabetes 2.
3. Hipótesis
Si estudios anteriores identificaron fármacos aprobados como BRDi, entonces, existe una región de
intersección en el espacio químico que puede extenderse a HDACi. Como las propiedades fisicoquímicas
(PFQ) están ligadas a la estructura, dicha intersección permitirá identificar estructuras bioisosteras a nivel de
estas dianas epigenéticas. Finalmente, ante las nuevas investigaciones sobre el efecto de la dieta y
alimentación en el epigenoma, existe una relación entre aditivos alimentarios e inhibidores epigenéticos. En
resumen; la presente quimiografía, pondrá en contexto al ESQUER ofreciendo una herramienta para el diseño
de fármacos, polifármacos y nutracéuticos.
4. Objetivos
General
Identificar las posibles relaciones estructurales entre los inhibidores a nivel epigenético, con la posibilidad de
describir de manera empírica la naturaleza farmacofórica epigenética relevante.
Particulares
1. Determinar la complejidad asociada a los inhibidores actuales con el fin de mejorar su selectividad.
2. Identificar estructuras afines a BRD e HDACs, a fin de proponer inhibidores duales.
3. Proponer inhibidores potenciales de la isoforma BRD4 con núcleos base distintos a los actuales.
6
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
5. Métodos
Las colecciones de compuestos epigenéticos y de referencia se obtuvieron de bases de datos moleculares
públicas. Las bases de datos curadas se analizaron y compararon usando representaciones moleculares
complementarias: seis propiedades fisicoquímicas, tres huellas digitales moleculares y núcleos base. Los
detalles del análisis cuantitativo y descriptivo se presentan en las siguientes secciones.
5.1. Bases de datos y curado de información
Las estructuras químicas y actividad biológica de inhibidores de HDACs (1, 2, 3, 8 y SIRT1) y BRDs (2, 3, 4)
se descargaron de ChEMBL (www.ebi.ac.uk/chembl/) y Binding Database (BDB, www.bindingdb.org/). Los
inhibidores analizados en esta investigación (BRDi y HDACi) se han asociado a distintas variedades de
cáncer p.ej. colon, próstata, gástrico y cérvico-uterino 11.
Los inhibidores de BRDs se han asociado con algunas líneas celulares de cáncer 19. Las estructuras
recuperadas fueron obtenidas en formato molecular simplificado a una línea (SMILES, por sus siglas en
inglés) y convertidas a estructuras tridimensionales usando el programa MOE. El curado de datos, paso
fundamental en cualquier estudio quimionformático 20, se realizó mediante la función “Wash” implementada en
MOE. Usando esta función las estructuras se prepararon mediante la desconexión de iones metálicos y
neutralización de estados protonados. Posteriormente se realizó una optimización de la geometría con el fin
de trabajar con el confórmero más estable mediante un algoritmo estocástico. La estereoquímica indicada en
la cadena SMILES original fue conservada durante el proceso. Finalmente, las bases obtenidas se
inspeccionaron en forma visual.
5.1.2. Bases de datos de referencia
Las bases en estudio se compararon con una base de inhibidores de DNMT1 analizada previamente
utilizando un protocolo similar 21. Otras colecciones de compuestos de referencia fueron: aditivos y
saborizantes de la lista GRAS de FEMA (GRAS 25) previamente curada (‘GRAS’), fármacos aprobados por la
FDA recuperados de DrugBank (‘FDA’), compuestos en fase clínica reportados en el ‘Therapeutic Target
Database’ (TTD), (‘Clinic’); una colección comercial de inhibidores epigenéticos diversos, distribuida por
Selleckchem (‘Epi-bloq’); y una colección de inhibidores enzimáticos en general, igualmente distribuida por
Selleckchem (‘General’). Estas bases de referencia (con excepción de GRAS) fueron utilizadas previamente
por Fernández-de Gortari y colaboradores 21.
El razonamiento tras el uso de estas colecciones es el siguiente: el posible reposicionamiento o uso
alternativo de fármacos (FDA y Clinic), identificación de posibles moléculas sonda (General), validación de
diversidad y características “epigenéticas” (Epi-bloq.) y la relación nutracéutica (GRAS).
7
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
5.2. Representación molecular
Dado que el espacio químico (EQ) depende fuertemente de la representación de estructuras, se utilizaron
diversos criterios (utilizados previamente por este y otros grupos de investigación 21–23). Entre estos criterios
se emplearon propiedades fisicoquímicas relevantes desde el punto de vista farmacéutico, huellas digitales
moleculares y núcleos estructurales base. Además, se analizó la complejidad de las estructuras químicas
usando métricas bien definidas y establecidas 24.
5.2.1. Propiedades fisicoquímicas
Se calcularon en MOE seis propiedades: coeficiente de partición octanol/agua (SLogP), número de enlaces
rotables (RTB), aceptores de puente de hidrógeno (HBA), donadores de puente de hidrógeno (HBD), área
topológica superficial (TPSA) y peso molecular (MW). Estas propiedades se utilizan con frecuencia en la
búsqueda de nuevos fármacos y son la base de reglas empíricas de “carácter de fármaco” (drug-likeness) 21.
La distribución de las propiedades fue visualizada en gráficos “boxplot” mediante R Studio y se analizaron
mediante el paquete PMCMR para estadística descriptiva. La visualización se realizó mediante un cálculo de
componentes principales para expresar el EQ en función de los eigenvectores del espacio original. El análisis
de componentes principales (PCA) se realizó con MOE y la gráfica fue generada en Datawarrior 25. Para la
comparación estadística se realizó una prueba de homosedacidad para las distribuciones. Esto se hizo
mediante una prueba de Shapiro-Wilks seguida de una prueba ANOVA de Kruskal-Nemenyi en R Studio. Elcriterio de aceptación para la hipótesis nula fue un valor p < 0.05, estableciendo que no existe diferencia
estadísticamente significativa entre los grupos de datos comparados.
5.2.2. Huellas digitales moleculares
La similitud intra-colección fue evaluada para BRDi y HDACi, así como de las colecciones de referencia para
una comparación adecuada de la diversidad de las colecciones. Para ello se calcularon tres huellas digitales
con MOE: MACCS keys, Gráfico farmacofórico triangular (GpiDAPH3) y Distancia Tipo (TGD). MACCS está
basado en diccionario, esto quiere decir que compara la estructura contra una “lista de fragmentos
predefinida”. GpiDAPH3 identifica tres puntos farmacofóricos y asocia un triángulo que sirve como punto de
comparación. TGD también se basa en puntos farmacofóricos, pero la comparación es la distancia
comprendida entre dos puntos dentro de la molécula.
La similitud molecular entre huellas moleculares se calculó con el coeficiente de Tanimoto:
T (a, b) = ca + b − c
Donde a y b indican el número de fragmentos del i-esimio y j-esimo compuestos y c representa el número de
fragmentos compartidos entre i y j.
8
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
Posteriormente, se construyó la matriz de similitud (NxN) comparando todos los pares de compuestos (N) y
se extrajeron los N(N-1)/2 elementos de la diagonal. Con esto se construyó un gráfico de distribución
acumulada contra similitud el cual se generó mediante el módulo matplotlib en Python 26.
5.2.3. Núcleos base
Los núcleos base o sistemas cíclicos son subestructuras que se generaron al eliminar los vértices o cadenas
laterales. Esto se hizo con el programa Índices Moleculares Equivalentes (Molecular Equivalence Indices,
MEQI). MEQI se ha utilizado intensivamente en el análisis de bases de datos muy diversas y grandes 27–29.
Esto núcleos base constituyen parte del quimiotipo, metodología desarrollada y discutida por Johnson y Xu.
Para cada quimiotipo único se generó un código alfanumérico de cinco caracteres. Los sistemas cíclicos
resultantes representan clases; es decir, no es posible que una molécula pertenezca a más de un quimiotipo.
En este trabajo se analizaron los núcleos base de BRDi y HDACi, así como una comparación directa para los
núcleos más frecuentes.
5.2.3.1. Diversidad de los núcleos base
Se evaluó mediante las curvas de recobro de quimiotipos (CRQ) 24. El objetivo de estos gráficos fue comparar
la fracción de núcleos base que contiene una fracción particular de compuestos de la base de datos. Para
generar dicho gráfico la lista de quimiotipos se ordena por frecuencias. La curva fue caracterizada por el área
bajo la curva (ABC) y por el valor de la fracción de núcleos base que comprende el 50% de los compuestos
de la base estudiada (F50). Colecciones de compuestos con alta diversidad de núcleos base tiene curvas que
se acercan a la diagonal. La máxima diversidad se tiene cuando cada compuesto de la base de datos tiene un
núcleo base diferente. En este caso la curva CRQ es una diagonal con ABC = 0.5.
5.2.3.2. Enriquecimiento de quimiotipos
Dado que es relativamente común que un quimiotipo frecuente sea común a compuestos activos e inactivos
se realizó un gráfico de enriquecimiento. Primero se calculó la fracción de compuestos activos en toda la
base de datos, Act(C), con la ecuación:
Act(C) = [C*] / [C]
Donde [C] es el número total de compuestos, [C*] es el total de compuestos considerados como activos. Para
el presente trabajo se definió como activo aquel compuesto con una CI50 menor a 1µM.
La fracción de compuestos activos contenidos en el quimiotipo λ, Act(Cλ), se obtuvo con la expresión:
Act(Cλ) = [Cλ*] / [Cλ]
donde [Cλ] y [Cλ*] son el número total de compuestos y activos, respectivamente, para el quimiotipo λ.
El factor de enriquecimiento (EF) para un quimiotipo λ se calculó con la expresión:
9
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
EF(Cλ) = Act(Cλ) / Act(C)
EF (Cλ) representa la proporción de compuestos activos relativos a un quimiotipo respecto al total de activos
en la base de datos. De tal manera que cuanto mayor sea EF, el núcleo base correspondiente resulta más
atractivo para estudio. Esto ayuda a hacer una mejor distinción de quimiotipos frecuentes pues suele ocurrir
que núcleos frecuentes tienen poco enriquecimiento.
5.2.4. Complejidad molecular
La complejidad molecular suele ser la puerta a nuevas regiones del EQ. Previamente señalado por Lovering y
colaboradores, se ha visto que los fármacos con mayor éxito son en general más estructuralmente complejos
30. Adicionalmente, se ha observado que un incremento en la complejidad va acompañado por mayor
selectividad, hablando específicamente del número de carbonos saturados. Otras métricas propuestas para
evaluar la complejidad es el peso molecular 24. Para este análisis se retomaron dos métricas bien definidas y
reportadas, buscando caracterizar de manera apropiada la posible complejidad de las bases en estudio. El
grado de saturación se define por la fracción de carbonos sp3 (Fsp3), que se obtiene del cociente (# de
carbonos con hibridación sp3/ # total de carbonos en la molécula). Por lo que a mayor valor de Fsp3 se espera
que una estructura sea “menos plana”. La complejidad estereoquímica se definió a partir de la proporción de
carbonos quirales F-quiral = (# de átomos de carbono quirales/ # total de átomos de carbono). Las fracciones
fueron calculadas en MOE y Maya Chem Tools (www.mayachemtools.org). La distribución de estos
descriptores se analizó con box plots y estadística descriptiva obtenida con R Studio y el paquete PMCMR.
5.3. Cribado virtual
La búsqueda de inhibidores potenciales de BRD4 se realizó por similitud molecular usando fingerprints
(representación en dos dimensiones -2D) y alineamientos flexibles (representación tridimiensional -3D).
5.3.1. Similitud en 2D
Se construyeron matrices de similitud para las bases de datos antes mencionadas, esto se hizo mediante los
scripts de Mayachem Tools. Las representaciones utilizadas fueron MACCS keys (FGP por diccionario de
fragmentos) y ECFP4 (FGP topológico). Las comparaciones se calcularon con el coeficiente de Tanimoto,
usando como límite, similitudes mayores a 0.6 y 0.2, respectivamente. Los compuestos recuperados se
sometieron a una prueba de similitud en 3D.
5.3.2. Alineamiento flexible (similitud tridimensional)
Para realizar un filtrado de compuestos “candidatos” se buscó que su estructura permitiera adoptar una
conformación similar a inhibidores de BRD4 conocidos. Para ello se obtuvieron de Protein Data Bank
(http://www.rcsb.org) los PDB asociados a BRDs con diversos inhibidores co-cristalizados (Tabla 1). Se
extrajeron los ligandos del PBD y se utilizó el módulo FlexAlign en MOE, con el campo de fuerza MMFF94x.
10
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
Dejando fijas las coordenadas del confórmero co-cristalizado se realizó una superposición buscando un
alineamiento de grupos farmacofóricos representativos. El algoritmo iterativo busca el menor RMSD posible
entre pares de átomos y asigna un puntaje total (S): cuanto menor sea el número expresado el alineamiento
es mejor. MOE utiliza una aproximación por densidades de probabilidad: se calculan dos distribuciones
Gausianas y seestima el traslape entre ambas densidades de probabilidad. Para refinar el cálculo se pueden
considerar las propiedades ácido-base, aromaticidad, hidrofobicidad, carga y volumen 31.
5.3.3. Acoplamiento molecular (docking)
Como etapa final de la evaluación in silico, se implementaron protocolos de acoplamiento usando a BRD4
como proteína de referencia (PBD ID: 3P5O, usada previamente en otros estudios 14,18,32). La estructura se
inspeccionó en el editor de secuencias de MOE para verificar errores de secuencia y/o átomos.
Tabla 1. Número de ligandos co-cristalizados encontrados en PDB con actividad inhibitoria de BETs
PDB ID BRD
4J1P 2
5BT5
3S92 3
3P5O 4
4CFL
4YH4
Posteriormente, se preparó la macromolécula mediante el módulo LigX el cual realiza una minimización
energética, relaja la cadena de la proteína, elimina moléculas de disolventes comunes y solo conserva
aquellas moléculas de agua a 4 Ǻ del sitio activo. En el caso de Autodock 4 y Autodock Vina la estructura se
preparó con un paso adicional, usando PyRx v.0.8 para cribado virtual 33.
Se utilizaron los algoritmos implementados por MOE, ICM (Molsoft), Autodock 4 y Autodock Vina. Para cada
programa se realizó la validación correspondiente. Dicho proceso consistió en simular la unión al ligando co-
cristalizado, probando si el algoritmo puede reproducir el confórmero activo o uno muy cercano en RMSD.
Una vez validado el protocolo, se procedió al acoplamiento de las moléculas identificadas en los pasos
anteriores.
Todos los programas se usaron con el módulo para cribado virtual para una búsqueda poco exhaustiva,
preferentemente para evaluar los compuestos en condiciones similares. Una vez terminadas las corridas se
eligieron los compuestos de acuerdo a la función de evaluación en cada programa: como criterio heurístico el
puntaje debía ser cercano al del ligando co-cristalizado. Así, aquellos recuperados en consenso por cuando
menos tres programas se consideraron “hits”.
5.3.4. Análisis de los confórmeros
A fin de realizar una evaluación sistemática de los modos de unión, los confórmeros acoplados se
almacenaron en una base de datos. Posteriormente, usando MOE se calculó un FGP de interacciones
11
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
farmacofóricas proteína-ligando (PLIF, por sus siglas en inglés). El PLIF resume todas las interacciones
presentes para los diferentes ligandos contra una proteína (3P5O). Para reconocer inhibidores potenciales se
buscaron las interacciones más frecuentes con BRD4 14.
6. Resultados y discusión
Se analizaron en total 2000 y 207 compuestos únicos (eliminando duplicados), conocidos como inhibidores de
HDACs y BRDs, respectivamente. Es importante aclarar que los compuestos analizados no son selectivos a
isoformas específicas de HDACs o BRDs. Esto se hizo con el fin de elucidar de manera general la distribución
y cobertura del espacio químico.
Se estableció un límite heurístico para clasificar la actividad biológica (CI50): En el proyecto se definió a un
compuesto como “activo” si su CI50 era menor o igual a 1 µM. Este criterio recuperó un alto porcentaje de
activos contra HDACs (79.5%), mientras que en BRDs solo el 46.85% de los compuestos puede considerarse
como activo. Estos valores corroboran un desarrollo y optimización más intensivos en HDACi.
6.1. Propiedades fisicoquímicas
La Figura A-2 (ver anexo) muestra a los boxplots con la distribución de propiedades. La estadística descriptiva
y otros análisis estadísticos pueden encontrarse en el Anexo. Con respecto a los átomos donadores de
puente de hidrógeno tanto en BRDi como en HDACi se mostraron distribuciones similares, que además son
comparables a la colección de inhibidores (‘General’) y Epi-bloqueadores de origen comercial (‘Epi-bloq’) (ya
que la mediana es 4). En general, DNMT mostró un mayor número de HBA, mientras que los fármacos
aprobados y en fase clínica mostraron valores bajos de HBA. Para los valores de HBD se observó un
comportamiento similar: HDACi y DNMT tienen valores más altos (valor de 3 para la mediana). Comparados
nuevamente con ‘General’ y ‘Epi-bloq’ (valor de la mediana en 2); mientras que BRDi, FDA y Clinic se ubican
más abajo con un valor de 1. Dicha tendencia se observó, para los valores de TPSA, medida asociada con la
polaridad de la molécula.
En cuanto al SLogP tomado como medida de hidrofobicidad, BRDi tuvo los valores más altos en este
parámetro. Para HDACi los valores son comparables con ‘General’ y pueden considerarse como los
segundos más altos. Para evaluar la flexibilidad molecular se utilizó RTB. Como se puede notar la distribución
de esta propiedad fue muy semejante entre colecciones, en este caso HDACi muestra los valores más altos.
Esto puede atribuirse a una mayor presencia de compuestos peptídicos reportados como HDACi. Para el
peso molecular se observó un comportamiento muy similar (con la excepción de GRAS), confirmando que los
grupos de datos son comparables en este sentido.
Una prueba estadística de Kruskal-Nemenyi (ver Anexo) reveló que, en general, BRDi es semejante a
‘General’ como ‘Epi-bloq’. Esto sugiere que los compuestos probados contra BRD probablemente proceden
de bibliotecas comerciales. HDACi mostró un comportamiento similar, teniendo un parecido significativo con
12
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
‘General’ y ‘Epi-bloq’, además de contar con propiedades semejantes a las de DNMTi (particularmente en
términos de HBD, TPSA y MW).
Mediante un análisis estadístico se buscó demostrar si existe diferencia entre compuestos ‘activos’, (definidos
en este proyecto si CI50< 1 µM) tanto para HDACi como BRDi. Los resultados mostraron que, en cuanto a
PFQ, no existe una diferencia estadísticamente significativa entre compuestos activos o inactivos.
6.1.1. Representación visual del espacio de propiedades
La Figura A-3 muestra representaciones en 2D y 3D del ESQUER, compuesto por BRDi, HDACi y DNMTi. La
posición relativa se usó para comparar estos grupos de datos con las colecciones de referencia. Como se
mencionó en la sección de Métodos, dicho espacio está en función de seis PFQ. Para claridad visual refiérase
al Anexo (Figura S1), donde se muestran por separado BRDi, HDACi y GRAS en las mismas coordenadas de
la Figura A-3.
Además, BRDi y HDACi cubren regiones similares a DNMTi, FDA y otras colecciones de referencia. En
particular, BRDi cubre un espacio menor seguida por ‘Epi-bloq’ (Figura S1) ambas son cercanas en el
ESQUER. Esto puede relacionarse tanto al número de compuestos (207 y 113, respectivamente) como al tipo
de estructuras en ambas bases. Las pruebas de Nemenyi (Tabla S1) corroboraron una similitud
estadísticamente significativa entre BRDi y ‘Epi-bloq’. Compuestos evaluados contra HDACs tuvieron una
distribución espacial más amplia. Los puntos fuera de escala pueden relacionarse con péptidos, ya que en
general estos son más flexibles y polares que las moléculas pequeñas usadas en el diseño y desarrollo de
fármacos. Aunado a lo anterior, estos péptidos según su naturaleza, pueden o no ser de alto MW.
Los primeros dos componentes principales (CP) recuperaron 82.2% de la varianza, mientras que los primeros
tres recobraron 90.3%. HBA y HBD tienen la mayor contribución a CP1 mientras que SLogP tiene la mayor
contribución a CP2. Nótese que estas propiedades están asociadas a la polaridad.
El análisis de GRAS mostró un comportamiento notable. Esto se debe a que GRAS comparte regiones del
ESQUER, aunque con mayor dispersión (FigurasA-3 y S1). Muchos de los puntos fuera de escala son
cercanos a HDACi; esto puede atribuirse a que ciertos aditivos alimenticios derivan de azúcares o péptidos.
Otro hallazgo interesante fue que GRAS tuvo una distribución similar de SLogP respecto a ‘Epi-bloq’. En otros
trabajos se ha discutido la importancia del log P como propiedad determinante en compuestos bioactivos.
Esto puede relacionarse a la posible asociación entre los químicos alimenticios y epigenética.
Por otro lado, si bien las PFQ y la representación del ESQUER son un punto de partida crucial, estas
herramientas no permiten evaluar o discernir la naturaleza química de los compuestos. Los aspectos
estructurales de los epi-compuestos se discuten en la siguiente sección.
13
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
6.2. Huellas moleculares estructurales
Las huellas moleculares (fingerprints) permiten una comparación de conectividades interatómicas de
estructuras químicas. Como se describió en la sección anterior se usaron tres representaciones diferentes:
MACCS keys, GpiDAPH3 y TGD. Estos descriptores se han usado previamente en trabajos de
caracterización quimioinformática, así como la diversidad molecular para el caso de DNMT1 21. De esta
manera fue posible hacer una evaluación cuantitativa de la similitud inter- e intra-colecciones.
6.2.1. Similitud intra-bibliotecas
El valor de similitud proviene de la comparación entre pares, mediante el coeficiente de Tanimoto a partir de
las huellas digitales moleculares (fingerprints, FGP) mencionados. La Figura A-4 presenta la distribución de
los valores de similitud usando funciones de distribución acumulada (CDFs). La estadística descriptiva de
estas curvas puede encontrarse en el Anexo (Tabla S5). En general, los valores de similitud obtenidos por
GpiDAPH3 y TGD para las bases estudiadas, difirieron notablemente de los valores en MACCS. De tal suerte
que el orden decreciente de similitud fue: TGD> MACCS > GpiDAPH3 (Tabla S5). El orden relativo de los
valores de similitud fue consistente por lo encontrado por otros grupos de investigación [28] [29]. De acuerdo
a MACCS keys, BRDi posee una similitud intra-colección bastante alta seguida de HDACi, p.ej. los valores de
la mediana son 0.463 y 0.423 respectivamente. Esto indica que ambas colecciones poseen una diversidad
estructural baja respecto a otras, colecciones. Las colecciones más diversas fueron GRAS y FDA (con valores
de 0.261 y 0.308, respectivamente). La diversidad estructural para fármacos aprobados se ha comentado
previamente por López-Vallejo et al. 34 y es de esperarse dada la gran cantidad de dianas y mecanismos
farmacológicos. Por esta razón es interesante que ‘Clinic’ sea menos diverso que FDA, pero igualmente
diverso que ‘General’. Esta tendencia se mantuvo para TGD y GpiDAPH3, es interesante que para este último
FGP BRDi y FDA son de similitud cercana.
Como se puede observar, la forma de representar un compuesto repercute mucho en la evaluación de la
diversidad estructural y biológica; p.ej., considere HDACi, para GpiDAPH3 es una colección poco diversa
mientras que por MACCS es una de los más diversas con una similitud comparable a ‘Clinic’.
Nótese que no existe una relación general entre el tamaño de las bases de datos y la diversidad estructural. A
partir de esto podría anticiparse que cuanto más pequeño es un grupo, mayor será la similitud intra-colección.
Bajo este razonamiento puede asociarse la baja diversidad en BRDi al número de compuestos (207). Sin
embargo, se observa que ‘Epi-bloq’, es más diverso y cuenta con menos compuestos (113). Esto puede
deberse a que ‘Epi-bloq’ a pesar de ser una colección enfocada, recopila inhibidores de dianas muy diversas.
Bajo esta premisa, considere la baja diversidad en HDACi contrastada contra FDA, ‘Clinic’ y ‘Epi-bloq’ siendo
que HDACi es la colección más grande de ellas (2000, 1490, 837 y 113, respectivamente).
En resumen, se concluyó que BRDi es una colección “limitada” teniendo en cuenta una representación por
huellas digitales. Esto se ve reflejado en la cantidad de derivados específicos a ciertos núcleos base, como
benzodiazepinas 17. Por ello, se enfatiza la necesidad de buscar nuevos inhibidores para estas dianas,
14
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
especialmente al ver que sus inhibidores conocidos cubren un área muy limitada del espacio químico. Por
otro lado, HDACi tiene mayor diversidad química. Esto es de esperarse ya que diferentes quimiotipos se han
estudiado como HDACi. A pesar de ello los derivados de ácido hidroxámico destacan como inhibidores de
HDAC. Esta familia de compuestos tienen variaciones estructurales pero mantienen sus propiedades
farmacofóricas 36. Esta observación fue capturada con la representación por GpiDAPH3 que indica poca
diversidad en HDACi. En contraste, MACCS (una representación más “sensible” a cambios estructurales)
mostró una colección con estructuras significativamente distintas. Para GRAS se observó una diversidad
significativa, la cual se mantiene en las diferentes representaciones. En base a estos resultados se concluyó
que resulta más conveniente usar más de una representación estructural para determinar de mejor manera la
diversidad de una colección [32] [33].
6.2.2. Similitud inter-bibliotecas
Esta parte del estudio hace referencia a la posible intersección dentro del ESQUER. Aquí se comparó la
similitud molecular de dos familias de compuestos (BRDi y HDACi) contra las bases de datos moleculares de
referencia. Las representaciones se construyeron con base en la similitud máxima entre cada inhibidor y los
compuestos en colecciones de referencia utilizando CDFs. Para el análisis sólo se consideraron MACCS y
TGD. GpiDAPH3 no fue considerada pues una gran cantidad de compuestos se evalúan con “similitud cero”.
La Figura A-5 muestra los gráficos de CDFs comparando con MACCS keys y TGD, respectivamente. En ella
se muestran cinco colecciones de compuestos con BRDi, HDACis y DNMTi (empleados como referencia). Los
comparativos para las demás colecciones de referencia pueden encontrarse en el Anexo (Figura S2).
Los valores bajos de CDF, tanto para MACCS como TGD indicaron que en general, las estructuras dentro de
los grupos epigenéticos (BRDi, HDACis y DNMTi) son muy diferentes a las contenidas en las referencias. Un
resultado notable fue la obtención de valores de similitud de la unidad, esto sería si el mismo compuesto fuera
común a diferentes colecciones (de acuerdo a esa representación molecular específica). Tras una inspección
visual se encontró que, si bien los compuestos no son idénticos, comparten características farmacofóricas. Un
ejemplo notable son los derivados de bisfenilo con ácido hidroxámico. De hecho, recientemente se ha
publicado un inhibidor dual BRD/HDAC con el grupo hidroximato 38. Otro grupo común entre ambas bases es
la fenilsulfonamida. Tanto las CDFs como estadísticos mostraron que FDA y ‘Clinic’ fueron más similares a
BRDi, HDACis y DNMTi que dichos grupos entre sí. Este resultado dio soporte a la observación que los
inhibidores de BRDs, HDACs y DNMT son, en general, significativamente diferentes.
De acuerdo a MACCS keys el orden relativo de similitud de GRAS respecto a los grupos epigenéticos es:
DNMTi>HDACis>BRDi. Dicho de otra forma, si se hiciera una búsqueda por similitud en GRAS, las moléculas
serían más semejantes a DNMTi. Sin embargo, si consideramos TGD el orden relativo es:
BRDi>HDACis>DNMTi. Por lo que, de manera análoga a la sección anteriorse destaca el hecho de usar más
de una representación molecular. Una discusión más profunda sobre los comparativos de todas las
colecciones va más allá del alcance del presente trabajo, pues el enfoque es sobre compuestos epigenéticos.
15
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
6.3. Contenido de núcleos base
La Figura 1 muestra los quimiotipos más recurrentes (como se definió en la sección de Métodos) para las
colecciones BRDi y HDACis. Aquellos con una frecuencia superior a 10 (BRDi) y 20 (HDACis) son los que se
muestran (la diferencia es debido al tamaño de la colección). El anillo de benceno (código RYLFV) no se
incluye en la figura (vide infra). Los núcleos base más frecuentes para DNMTi pueden encontrarse en el
trabajo de Fernández-de Gortari et al 21. El análisis de núcleos base está organizado en tres partes:
contenido, diversidad y enriquecimiento (distribución de actividad).
6.3.1 Quimiotipos (núcleos base)
Para BRDi el quimiotipo más frecuente (código 1AWRP) se presentó 14 veces (6.8%) seguido por el
quimiotipo 49ZJ3 con 12 (5.8%) compuestos. Como se observa en la Figura 1, muchos de los núcleos
frecuentes tienen de 3 a 4 anillos. En contraste, el quimiotipo más frecuente para HDACis tiene sólo un anillo
aromático (41 compuestos, 2%). Lo interesante es que este núcleo es el bencimidazol, presente como
subestructura de 1AWRP. La elevada prevalencia del anillo de bencimidazol en compuestos con actividad
biológica está bien documentada [29] [35]. Estos hallazgos dan apoyo a la propuesta de diseñar “llaves
maestras” usando al bencimidazol como punto de partida.
No fue de sorprender que el anillo de benceno (RYLFV) tuviera una prevalencia alta dentro de HDACis con
una frecuencia de 127 (6.35%). Este anillo está presente con alta frecuencia en otras colecciones 35. Lo que
fue inesperado fue la ausencia de este anillo como núcleo base principal en BRDi (aunque está presente
como subestructura). Una tendencia similar se obtuvo para el quimiotipo “00000’’ (compuestos acíclicos) cuya
prevalencia fue similar a la del benceno 35. Pero igualmente ausente en BRDi como núcleo base.
Otro resultado notable es que tanto para HDACis como BRDi los quimiotipos recuperados poseen una
relación estructura-actividad continua. Esto se refiere a núcleos base que no son propensos a tener
acantilados de actividad (activity cliffs). Sin embargo el sistema DM3VV puede resultar controversial debido a
que posee un grupo tipo PAINs (del inglés Pan Assay Interference compounds), los cuales se caracterizan
por causar falsos positivos en pruebas biológicas 40.
6.3.2. Diversidad de núcleos base
Las curvas de recobro de quimiotipos (CRQ) para las diferentes colecciones se muestran en la Figura 2. En
forma similar a los gráficos anteriores la estadística descriptiva se muestra en el anexo (Tabla S8). Para
generar las gráficas CRQ se comparó la fracción de cada quimiotipo respecto a la fracción de compuestos
con dicho núcleo en la base de datos.
Considere entonces una colección "íntegramente diversa"; es decir, cada compuesto posee quimiotipo
distinto. Entonces la CRQ será una línea recta y diagonal, dado que x e y son equivalentes el área bajo la
curva (ABC) viene de la integral:
16
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
Figura 1. Quimiotipos con mayor frecuencia en las bases BRDi y HDACi. Se considera como alta frecuencia 10 y 15 estructuras
presentes, respectivamente. La inclusión del anillo de benceno fue omitida. Se muestran los identificadores alfanuméricos de MEQI,
así como el porcentaje de estructuras con dicho núcleo base.
= 2 ∴ = 0.5
De la expresión anterior se desprende que la diversidad puede ser como máximo 0.5. Por lo tanto: ∈[0.5 , 1], siendo uno el valor máximo de la similitud (la base posee un quimiotipo único). Dicho esto, al analizar
la Figura 2 se estableció que el orden relativo de diversidad de núcleos base fue DNMTi > BRDi > HDACis >
GRAS. Resulta notable que, de acuerdo al ABC, BRDi y HDACis (ABC = 0.74 y 0.76, respectivamente)
poseen una diversidad comparable a inhibidores de los receptores andrógino, de estrógeno, glucocorticoide y
angiotensina 41.
La diversidad de quimiotipos para DNMTi es similar a la de inhibidores de la proteína acarreadora acetil-enolil
reductasa 41. El mismo orden relativo en diversidad se mantuvo para la F50. Para GRAS el 50% de los
compuestos se encuentra en 0.4% de los quimiotipos: En contraste para DNMTi la mitad de los compuestos
se distribuyen en el 22% de los núcleos base. HDACis tuvo la menor diversidad de núcleos base lo cual se
asocia con la alta presencia de inhibidores relacionados (hidroximatos) disminuyen el número de quimiotipos
diferentes.
17
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
Un punto que podría resultar contradictorio es que el orden relativo de diversidad cambia notablemente si se
consideran FGP o núcleos base. Es decir, la diversidad molecular depende del criterio para representar a las
estructuras. No obstante, hay que considerar que un FGP considera la naturaleza misma del compuesto
incluyendo cadenas laterales y/o complejidad.
Un claro ejemplo de esto es la colección GRAS: de acuerdo a MACCS keys su diversidad es alta, mientras
que la CRQ nos habla de una diversidad de quimiotipos escasa, si lo comparamos a otros grupos. Esto es de
resaltar pues hasta ahora no se había reportado dicha diversidad para GRAS.
Figura 2. Curvas de recobro de núcleos base para las colecciones con información epigenéticamente relevante y la colección GRAS.
6.3.3. Distribución de actividad (enriquecimiento de quimiotipos)
Una vez caracterizado el contenido y diversidad de núcleos base dentro de BRDi y HDACi, se exploró si algún
núcleo base posee una mayor proporción de compuestos activos. Este parámetro se denomina factor de
enriquecimiento (EF). Los gráficos de enriquecimiento, así como la estadística involucrada se presentan en el
anexo (Figura S3 y Tabla S8). Tanto para BRDi y HDACis el enriquecimiento resultó muy por debajo de la
unidad. Esto quiere decir que en esta colección de compuestos no hay núcleos base particularmente
‘enriquecidos’ por compuestos activos. La Figura 1 (vide supra) muestra los quimiotipos con mayor
enriquecimiento y frecuencia para BRDi (1AWRP, DM3VV, 49ZJ3 y G7NQD) y HDACis (BT7BR).
6.4. Complejidad molecular
Se ha comentado que una colección diversa permite explorar “regiones oscuras” dentro del espacio químico.
Ante un concepto abstracto podría pensarse que encontrar regiones “vírgenes” en el universo de moléculas
es sencillo. La dificultad surge al sondear dicho espacio en busca de áreas con relevancia terapéutica.
18
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
Recientemente se han desarrollado metodologías que permiten aventurarse exitosamente en el océano
químico. Una estrategia importante está enfocada en la complejidad molecular. Hasta donde sabemos este es
el primer estudio sobre inhibidores epigenéticos donde se describe su complejidad. De manera análoga a
análisis anteriores los resultadosde complejidad se presentan como una distribución usando boxplots (Figura
A-8). Representando la fracción de carbonos sp3 (A-8A) y fracción de carbonos quirales (A-8B). En el primer
caso, la fracción de C-sp3 puede relacionarse con la “linearidad” de una molécula (cadenas laterales). Por
tanto, no es de sorprender que GRAS destacara en este aspecto al ser principalmente moléculas de cadena
larga. Este resultado estuvo de acuerdo con la alta prevalencia del quimiotipo 00000 (vide supra). En cuanto a
las demás colecciones se observó una tendencia decreciente en el orden: FDA > Clinic > General > Epi-bloq.
Este resultado sugiere la misma tendencia señalada por Lovering y cols. 30 (vide supra).
Precisamente, se observó que Epi-bloq es menos tridimensional y al considerar los grupos de datos contra
dianas epigenéticas específicas (BRDi, HDACis, DNMTi) se observó una disminución notable en F-sp3. Esto
puede atribuirse a la naturaleza nucleósidica (DNMTi), cíclica (BRDi) y aromática (HDACis) de los
compuestos. En contraste, la fracción de carbonos quirales mostró tendencias interesantes. Si bien, la
tendencia en general es la similar, para este caso es FDA el punto de partida seguido por GRAS y Clinic,
nuevamente se observó una relación subyacente entre la complejidad y la selectividad de un compuesto.
Este último punto se ha comentado previamente, en un estudio realizado por Clemons et al., 42 donde se
estableció que un arreglo tridimensional es más adecuado para explorar el reconocimiento ligando-proteína.
Esto podría parecer obvio, considerando la naturaleza disimétrica de los receptores y algunos ligandos; “un
medio quiral distingue lo quiral” 43. No obstante, es preciso recordar que muchos ligandos endógenos poseen
una simplicidad notable y en muchos casos son reconocidos por una plétora de receptores. Aunado a esto
estudios CoMFA/CoMSIA y modelos farmacofóricos se han empleado satisfactoriamente al describir
moléculas en términos simples 36. Por esta razón es prematuro considerar que la selectividad y complejidad
están fuertemente relacionadas, si bien; es cierto que la complejidad ha resuelto problemas biofarmacéuticos
y de formulación, en un contexto de diseño de fármacos hay muchas preguntas sin respuesta 44.
6.5. Cribado virtual
A partir de las colecciones antes mencionadas se realizó un protocolo de cribado virtual para identificar
inhibidores potenciales de BRD4. Como primer paso se eligieron compuestos por similitud bidimensional.
Debido a que este tipo de representación recupera moléculas que tienen grupos o conectividades similares,
se utilizó un segundo criterio de similitud. En este caso se obtuvo el parecido 3D, es decir, se compararon los
compuestos contra una serie de ligandos co-cristalizados. Esto se hizo para determinar si una molécula que
no es propiamente similar en conectividad molecular puede acoplarse al sitio activo de BRD4.
19
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
6.6. Similitud por FGP (2D)
Como se observa en la Figura A-5, se estableció la existencia de compuestos similares a BRDi en las
colecciones de referencia. A partir de la construcción de matrices de similitud fue posible determinar que
compuestos son más similares en forma representativa. Como se detalló en la sección de Métodos se usaron
dos tipos de representaciones; MACCS keys la cual recupera fragmentos, y la huella digital molecular
Extended Connectivity Fingerprint a 4 enlaces (ECFP4). Este FGP hace referencia a la conectividad
extendida de una molécula, por ésta razón pertenece a la categoría de representación topológica. En forma
breve, este fingerprint construye las moléculas mediante vectores o "caminos": éstos parten de un átomo
central determinado por un algoritmo (de Morgan) hasta un vértice de conectividad (normalmente 3 o 4
enlaces desde el átomo central). Se puede intuir entonces, que la representación topológica es más sensible
a los cambios estructurales. Por tanto, es de esperar que los valores de similitud sean bajos (respecto a los
valores por MACCS keys).
De ahí que los valores mínimos de selección sean distintos para cada fingerprint. Además, ECFP4 es una
representación común en protocolos de cribado virtual por su alto desempeño 45. Por otra parte, al usar la
conectividad se garantiza que las estructuras difieran significativamente de los núcleos base, pero
manteniendo patrones farmacofóricos semejantes. La Figura 3 presenta algunos núcleos base, estudiados
como BRDi y aquellos recobrados por similitud.
Figura 3. Comparativo de núcleos base asociados a la inhibición de BRDs y posibles quimiotipos similares por representación
bidimensional.
20
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
6.7. Alineamiento flexible (similitud 3D)
La similitud no sólo se limita a que un par de moléculas contengan fragmentos o grupos en común. A nivel
farmacodinámico la similitud puede entenderse en términos de mecanismo de acción (bioisoterismo). Por esta
razón se realizó la búsqueda por alineamiento flexible la cual compara estructuras en términos de forma y
volumen (Figura 4). Se evaluaron cerca de 5000 estructuras en busca de similitud. De ellas más de 300
presentaron similitud bidimensional (MACCS > 0.6/ ECFP > 0.2). Para el alineamiento flexible, el número de
compuestos con similitud significativa (tomando de línea base el valor promedio de S, -100 aprox.) fue: 70
estructuras de FDA, 20 productos naturales, 44 compuestos GRAS y 5 derivados de bencimidazoles.
De las estructuras encontradas destacan los núcleos flavonoides y los esteroides. Los flavonoides son
productos naturales presentes en casi todas las especies vegetales 46. Se han utilizado de manera
satisfactoria como agentes antiinflamatorios 47, antidepresivos 46, sedantes 48 e incluso se han usado para
tratar la demencia senil 49,50. Por otra parte, los esteroides son compuestos que fungen como hormonas
modulando una plétora de procesos fisiológicos 51. La función más conocida es la regulación de caracteres y
conductas sexuales 52; no obstante, también se han asociado al insomnio 53 y a varios tipos de cáncer 54. Es
importante destacar este último punto, pues la posibilidad de que los esteroides actúen sobre los
bromodominios sugiere una relación con la existencia de la isoforma BRDT (bromodomain específico
testicular por sus siglas en inglés).
Figura 4. Ejemplos de alineamiento flexible. En verde se muestra la referencia. A) Núcleo flavonoide. B) Núcleo esteroide.
6.8. Acoplamiento molecular (docking)
Después de identificar núcleos base o estructuras similares, estas se sometieron a acoplamiento molecular.
Para ello se utilizó como referencia la estructura BRD4 (PDB ID: 3P5O), usando el ligando co-cristalizado
para comparaciones posteriores (vide infra).
El docking permite hacer estimaciones para determinar si una molécula puede interactuar con una proteína
dada. Para ello utiliza algoritmos que tienen distintas maneras de evaluar el modo de unión y determinar un
mejor confórmero. Por esta razón es recomendable usar más de un programa de docking a fin de hacer una
mejor predicción. A esto se le llama consensus scoring 55.
Como se mencionó en la sección de Métodos se usaron los programas Autodock, Autodock Vina, MOE e ICM
para elegir inhibidores potenciales. El primer paso para determinar si un programa es apto para realizar
predicciones, es hacer la validación. Esto se realiza al acoplar nuevamente el ligando co-cristalizado,
21
1. Por cuestiones de espacio, se han omitido figurasy tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
determinando mediante RMSD la diferencia entre confórmeros 56. Los resultados de la validación se muestran
en la Figura 5.
Una vez determinada una “línea base”, se usa el valor de energía del confórmero co-cristalizado como criterio
de selección de compuestos. Para efectuar el consenso, la energía de unión debía ser cercana a la línea
base en 3 de 4 algoritmos. La Figura 6 presenta los hits computacionales.
6.8.1. Análisis de confórmeros
Actualmente, se sabe poco sobre la función de los bromodominios. Recientemente se han caracterizado
puntos críticos en el modo de unión, entre ellas la presencia de aguas estructurales e interacciones por
puente de hidrógeno 18. Como parte de la validación se observó si se conservan dichas interacciones.
Figura 5. Validación del acoplamiento molecular. Se muestran los modos de unión (poses) con menor RMSD respecto a la referencia
(verde), para los cuatro algoritmos utilizados.
Los hits consenso se evaluaron en forma semejante buscando estos modos de unión. Esto se conoce como
evaluación de PLIF. El histograma de las interacciones más recurrentes se muestra en la Figura 7.
Figura 6. Estructuras químicas de los hits identificados por el protocolo de cribado virtual como inhibidores potenciales de BRD4.
tacrolimus
amentoflavona
marcfortine A
metiltestosterona finasteride
22
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
El mecanismo de reconocimiento y unión es el siguiente: el grupo acilo es reconocido mediante un puente de
hidrógeno con el residuo Asp140 fungiendo como “ancla” del ligando. Posteriormente se establece un
segundo puente de hidrógeno mediado por las aguas estructurales del sitio que interactúan con Trp81.
También se reconoce la interacción con Leu92 y Leu94 que orientan redes aromáticas principalmente 14. Se
observó que para los distintos acoplamientos interactúan en forma distinta con el BRD4, no obstante, las
interacciones recuperadas por acoplamiento incluyen a Trp81 y Leu92 con frecuencia significativa (Figura 6).
Las diferencias observadas pueden relacionarse a las distintas aproximaciones y algoritmo de búsqueda en
los acoplamientos. En cuanto a Asp140, la naturaleza polar de la interacción dificulta su recuperación. En
general los algoritmos de docking identificaron de manera diferente a los hidrógenos polares asignando
torsiones y cargas variables.
Figura 7. Histograma de interacciones representativas, representadas por PLIFs usando los diferentes algoritmos de acoplamiento.
Para más información refiérase al texto principal.
Además, al estar vinculada por puente de hidrogeno a moléculas de agua es difícil reproducir la interacción
pues muchos programas de docking no están optimizados para manejar estos sistemas 57. Por tanto, la
validación encontró adecuadamente la conformación probable del ligando. Sin embargo, hasta el momento
con los algoritmos clásicos de docking resultará complicado reproducir el modo de unión por la presencia de
aguas estructurales dentro del sitio activo. No obstante, fue posible recuperar muchas de las interacciones en
un hit, particularmente usando MOE.
Los compuestos que resultaron más prometedores tanto por su conformación como modo de unión fueron el
amentoflavona (flavonoide) y la finasterida (esteroide sintético) (Figura 6). Los flavonoides son compuestos
con varios grupos polares, por lo cual no es extraño que interactúen por puentes de hidrógeno. No obstante,
existen varios estudios sobre flavonoides como agentes terapéuticos, entre ellos sobre el receptor GABA 58.
Se ha observado que los flavonoides semisintéticos son excelentes moduladores del receptor. Más aún, de
acuerdo a los trabajos de Fernández y cols 59, los grupos que son cruciales a esta acción no son
precisamente polares si no electronegativos (Br, Cl, NO2).
En cuanto a los esteroides, su mecanismo fisiológico está íntimamente relacionado con su capacidad de
traslocar receptores. Es mediante este proceso nuclear que da inicio la síntesis de proteínas y otras señales
23
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
mediadas por hormonas. Finasterida es un fármaco derivado de estereoides cuya indicación terapéutica es
inhibidor de la 5-α-reductasa 60. No obstante, en un inicio este fármaco se utilizó como terapia de cáncer
prostático 61. Esto sugiere la posibilidad de interacción con bromodominios (específicamente BRDT).
7. Conclusiones
 Se desarrolló una quimiografía del ESQUER la cual mostró relaciones significativas a nivel
fisicoquímico y estructural entre fármacos e inhibidores a BRDs y HDACs. Esta herramienta
permitirá el mejor entendimiento de las relaciones farmacofóricas para estas dianas, facilitando
el diseño de nuevos inhibidores y/o polifármacos.
 Las similitudes subyacentes entre compuestos epigenéticos con GRAS confirmaron que la dieta
impacta de manera significativa en el epigenoma. Se espera que la caracterización de
compuestos GRAS podrá facilitar la aplicación nutracéutica con fines de prevención.
 Se identificaron compuestos con potencial acción inhibitoria a BRD4, cuyos quimiotipos difieren
significativamente de los reportados actualmente en la literatura.
 La presencia de núcleos esteroides; como BRDi potenciales, sugiere una posible modulación de
la isoforma BRDT. Esta información podrá contribuir en el diseño del primer inhibidor específico
a esta diana.
8. Perspectivas
La epigenética continúa desarrollándose a un paso notable. No obstante, aún hay muchas preguntas que
requieren respuesta. La clave para comprender y modular estos sistemas enzimáticos es dar el contexto
apropiado al conocimiento actual. Este primer paso ha mostrado relaciones alentadoras sobre el ESQUER. El
siguiente paso será profundizar en el estudio sobre las estructuras base aquí identificadas con el fin de
elucidar el SAR asociado a BRDs y proponer nuevas estructuras privilegiadas.
Finalmente, los bromodominios son dianas epigenéticas diversas y relevantes, pero aún falta mucho por
saber. Por tanto es importante realizar esfuerzos en la búsqueda e identificación de moléculas sonda. Con
esto sería posible realizar estudios más precisos que permitan elucidar la fisiología de los bromodominios.
9. Referencias
1. D.C. Dolinoy. Epigenetics and Carcinogenesis.
Compr. Toxicol. 14, 293–309 (2010).
2. Wang, C. & Filippakopoulos, P. Beating the
odds : BETs in disease. Trends Biochem. Sci.
(2015).
3. Coletta, D. K. Genetic and Epigenetics of Type 2
Diabetes. Pathobiology of Human Disease
(2014).
4. Casadesús, J. & Noyer-Weidner, M. Epigenetics.
Brenner’s Encycl. Genet. 2, 500–503 (2013).
5. Lu, D. Epigenetic modification enzymes: catalytic
mechanisms and inhibitors. Acta Pharm. Sin. B 3,
141–149 (2013).
6. Wilting, R. H. & Dannenberg, J.-H. Epigenetic
mechanisms in tumorigenesis, tumor cell
heterogeneity and drug resistance. Drug Resist.
Updat. 15, 21–38 (2012).
7. Laker, R. C., Wlodek, M. E., Connelly, J. J. &
Yan, Z. Epigenetic origins of metabolic disease:
The impact of the maternal condition to the
24
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.offspring epigenome and later health
consequences. Food Sci. Hum. Wellness 2, 1–11
(2013).
8. Majumder, S. & Advani, A. The epigenetic
regulation of podocyte function in diabetes. J.
Diabetes Complications (2015).
9. Liu, Y., Liu, K., Qin, S., Xu, C. & Min, J.
Epigenetic targets and drug discovery: Part 1:
Histone methylation. Pharmacol. Ther. (2014).
10. Yoo, J., Kim, J. H., Robertson, K. D. & Medina-
Franco, J. L. Molecular modeling of inhibitors of
human DNa methyltransferase with a crystal
structure: Discovery of a novel dnmt1 inhibitor.
Advances in Protein Chemistry and Structural
Biology 87, (2012).
11. Robert, C. & Rassool, F. V. in Histone
Deacetylase Inhibitors as Cancer Therapeutics
(2012).
12. Cherblanc, F. L., Davidson, R. W. M., Di Fruscia,
P., Srimongkolpithak, N. & Fuchter, M. J.
Perspectives on natural product epigenetic
modulators in chemical biology and medicine.
Nat. Prod. Rep. (2013).
13. Chen, Y. D., Jiang, Y. J., Zhou, J. W., Yu, Q. Sen
& You, Q. D. Identification of ligand features
essential for HDACs inhibitors by pharmacophore
modeling. J. Mol. Graph. Model. (2008).
14. Ferri, E., Petosa, C. & Mckenna, C. E.
Bromodomains : Structure , function and
pharmacology of inhibition. Biochem. Pharmacol.
(2015).
15. Duffy, B. C. et al. Bioorganic & Medicinal
Chemistry Letters Discovery of a new chemical
series of BRD4 ( 1 ) inhibitors using protein-
ligand docking and structure-guided design.
Bioorg. Med. Chem. Lett. (2015).
16. Filippakopoulos, P. et al. Bioorganic & Medicinal
Chemistry Benzodiazepines and
benzotriazepines as protein interaction inhibitors
targeting bromodomains of the BET family.
Bioorg. Med. Chem. (2012).
17. Galdeano, C. & Ciulli, A. Selectivity on-target of
bromodomain chemical probes by structure-
guided medicinal chemistry and chemical biology.
Future Med. Chem. (2016).
18. Zhang, G., Smith, S. G. & Zhou, M.-M. Discovery
of Chemical Inhibitors of Human Bromodomains.
Chem. Rev. (2015).
19. Crawford, T. D. et al. Diving into the Water:
Inducible Binding Conformations for BRD4,
TAF1(2), BRD9, and CECR2 Bromodomains. J.
Med. Chem. (2016).
20. Fourches, D., Muratov, E. & Tropsha, A. Curation
of chemogenomics data. Nat. Chem. Biol. (2015).
21. Gortari, E. F. & Medina-Franco, J. L. Epigenetic
relevant chemical space: a chemoinformatic
characterization of inhibitors of DNA
methyltransferases. RSC Adv. (2015).
22. Prieto-Martinez, F. D., Gortari, E. F., Mendez-
Lucio, O. & Medina-Franco, J. L. A chemical
space odyssey of inhibitors of histone
deacetylases and bromodomains. RSC Adv.
(2016).
23. Lovering, F. Escape from Flatland 2: complexity
and promiscuity. Medchemcomm (2013).
24. Medina-Franco, J. L., Martínez-Mayorga, K.,
Peppard, T. L. & Del Rio, A. Chemoinformatic
analysis of GRAS (Generally Recognized as
Safe) flavor chemicals and natural products.
PLoS One (2012).
25. Sander, T., Freyss, J., Kor, M. Von & Rufener, C.
DataWarrior: An Open-Source Program For
Chemistry Aware Data Visualization And
Analysis. (2015).
26. Droettboom, M. et al. matplotlib: matplotlib
v1.5.1. doi:10.5281/zenodo.44579
27. Xu, Y. J. & Johnson, M. Algorithm for Naming
Molecular Equivalence Classes Represented by
Labeled Pseudographs. J. Chem. Inf. Comput.
Sci. (2001).
28. Medina-Franco, J. L., Petit, J. & Maggiora, G. M.
Hierarchical strategy for identifying active
chemotype classes in compound databases.
Chem. Biol. Drug Des. (2006).
29. Yongye, A. B. & Medina-Franco, J. L. Toward an
Efficient Approach to Identify Molecular Scaffolds
Possessing Selective or Promiscuous
Compounds. Chem. Biol. Drug Des. (2013).
30. Lovering, F., Bikker, J. & Humblet, C. Escape
from Flatland: Increasing Saturation as an
Approach to Improving Clinical Success. J. Med.
Chem. (2009).
31. Molecular Operating Environment (MOE). (2016).
32. Smith, S. G., Sanchez, R. & Zhou, M. Review
Privileged Diazepine Compounds and Their
Emergence as Bromodomain Inhibitors. Chem.
Biol. (2014).
33. Cha, S. Comprehensive Survey on Distance /
Similarity Measures between Probability Density
Functions. Int. J. Math. Model. Methods Appl.
Sci. (2007).
34. López-Vallejo, F., Giulianotti, M. A., Houghten, R.
A. & Medina-Franco, J. L. Expanding the
medicinally relevant chemical space with
compound libraries. Drug Discov. Today. (2012).
35. Singh, N. et al. Chemoinformatic analysis of
combinatorial libraries, drugs, natural products,
and molecular libraries Small Molecule
Repository. J. Chem. Inf. Model. (2009).
36. Chen, Y. et al. 3D-QSAR studies of HDACs
inhibitors using pharmacophore-based alignment.
Eur. J. Med. Chem. (2009).
37. Saldívar-González, F., Prieto-Martínez, F. D. &
Medina-Franco, J. L. Descubrimiento y desarrollo
de fármacos: un enfoque computacional. Educ.
Química. (2016).
38. Atkinson, S. J. et al. The structure based design
25
1. Por cuestiones de espacio, se han omitido figuras y tablas. Por favor refiérase al artículo anexo a este escrito, las referencias se harán mediante A-X,
siendo X el número correspondiente a la figura del artículo original y SX referencias al material suplementario de dicho artículo.
of dual HDAC/BET inhibitors as novel epigenetic
probes. Med. Chem. Commun. (2014).
39. Langdon, S. R., Blagg, J. & Brown, N. Scaffold
Diversity in Medicinal Chemistry Space. J. Chem.
Inf. Model. (2014).
40. Baell, J. & Walters, M. a. Chemical con artists foil
drug discovery. Nature (2014).
41. Medina-Franco, J., Martínez-Mayorga, K.,
Bender, A. & Scior, T. Scaffold Diversity Analysis
of Compound Data Sets Using an Entropy-Based
Measure. QSAR Comb. Sci. (2009).
42. Clemons, P. A. et al. Small molecules of different
origins have distinct distributions of structural
complexity that correlate with protein-binding
profiles. Proc. Natl. Acad. Sci. (2010).
43. Anslyn, E. V. & Dougherty, D. A. Modern physical
organic chemistry. (2006).
44. Méndez-Lucio, O. & Medina-Franco, J. L. The
many roles of molecular complexity in drug
discovery. Drug Discov. Today (2016).
45. Da, C. & Kireev, D. Structural Protein–Ligand
Interaction Fingerprints (SPLIF) for Structure-
Based Virtual Screening: Method and Benchmark
Study. J. Chem. Inf. Model. (2014).
46. Guan, L.-P. & Liu, B.-Y. Antidepressant-like
effects and mechanisms of flavonoids and related
analogues. Eur. J. Med. Chem. (2016).
47. Catarino, M. D., Talhi, O., Rabahi, A., Silva, A. M.
S. & Cardoso, S. M. The Antiinflammatory
Potential of Flavonoids: Mechanistic Aspects.
Studies in Natural Products Chemistry. (2016).
48. Marder, M. & Paladini, A. C. GABA(A)-receptor
ligands of flavonoid structure. Curr. Top. Med.
Chem. (2002).
49. Perry, N. S. L., Bollen, C., Perry, E. K. & Ballard,
C. Salvia for dementia therapy: review of
pharmacological activity and pilot tolerability
clinical trial. Pharmacol. Biochem. Behav. (2003).
50. Hwang, S.-L., Shih, P.-H. & Yen, G.-C. in Diet
and Nutrition in Dementia and Cognitive Decline
(2015).
51. Auchus, R. J. in Knobil and Neill’s Physiology of
Reproduction. (2015).
52. Ogino, Y., Sato, T. & Iguchi, T. in Handbook of
Hormones. (2016).
53. Llanas, A. C., Hachul, H., Bittencourt, L. R. a &
Tufik, S. Physical therapy reduces insomnia
symptoms in postmenopausal women. Maturitas
(2008).
54. Handa, R. J., Larco, D. O. & Wu, T. J. in
Reference Module in Biomedical Sciences
(2014).
55. Houston, D. R. & Walkinshaw, M. D. Consensus
docking: Improving the reliability of docking in a
virtual screening context. J. Chem. Inf. Model.
(2013).
56. Tuccinardi, T., Poli, G., Romboli, V., Giordano, A.
& Martinelli, A. Extensive Consensus Docking
Evaluation for Ligand Pose Prediction and Virtual
Screening Studies. J. Chem. Inf. Model. (2014).
57. Forli, S. & Olson, A. J. A Force Field with
Discrete Displaceable Waters and Desolvation
Entropy for Hydrated Ligand Docking. J. Med.
Chem. (2012).
58. Ghamali, M. et al. Combining DFT and QSAR
computation to predict the interaction of
flavonoids with the GABA (A) receptor using
electronic and topological descriptors. J. Taibah
Univ. Sci. (2016).
59. Fernández, S.

Continuar navegando