Logo Studenta

QSAR-Pesticidas-KNN

¡Estudia con miles de materiales!

Vista previa del material en texto

Estudio cuantitativo de la relación estructura-actividad de pesticidas 
empleando el algoritmo de clasificación K-NN 
Fernando Cárdenas 
1 2 *
, Piercosimo Tripaldi 
1
, David Matamoros 
3
 y Cristian Rojas 
4
 
1
 Laboratorio UDALAB, Facultad de Ciencia y Tecnología, Universidad del Azuay. Av. 24 de Mayo 7-77 y Hernán Malo, 
 Apartado postal 01.01.981. Cuenca-Ecuador 
2 
Escuela de Ing. Ambiental, Universidad Politécnica Salesiana. Calle Vieja 12-30 y Elia Liut, Cuenca-Ecuador. 
3
 Facultad de Ciencias Naturales y Matemáticas, Escuela Superior Politécnica del Litoral. Km. 30.5 vía Perimetral, 
Guayaquil-Ecuador. 
4
 Instituto de Investigaciones Fisicoquímicas Teóricas y Aplicadas (INIFTA), Universidad Nacional de la Plata. Diagonal 
113 y calle 64, C.C. 16, Suc. 4 (1900), La Plata-Argentina. 
* 
Correspondencia:
 
lcardenas@ups.edu.ec 
 
 
 
 
 
Resumen 
 
En el presente trabajo se empleó el análisis QSAR (Relación Cuantitativa Estructura-Actividad) en moléculas de pesticidas 
combinado con el método de clasificación K-NN (K-nearest neighbors) para establecer un modelo discreto para la actividad EC50. 
La base de datos se obtuvo de PPDB (Pesticide Properties Data Base), la cual contenía 192 moléculas organizadas por su 
estructura química (organoclorados, organofosforados, carbamatos, piretroides) y la toxicidad de Daphnia magna valorada 
mediante la EC50. Los valores de toxicidad fueron discretizados en tres clases asignados según su toxicidad: clase 1 moléculas de 
baja toxicidad, clase 2 moléculas de toxicidad intermedia y los de clase 3 moléculas altamente tóxicas. Dragon 6 calculó 1216 
descriptores moleculares. Mediante el uso de algoritmos genéticos (GAs) se seleccionaron 8 descriptores que permitieron 
establecer el modelo de clasificación K-NN, el cual mostró una taza de no error (NER) del 72%. El algoritmo resultó ser más 
sensible para las moléculas que tienen mayor toxicidad al tener una taza de no error de clase del 75%. Y las clases que resultan 
menos sensibles son la clase 1 y 2 con una taza de no error de clase del 69% y 66%, respectivamente. Resultando un modelo con 
capacidad predictiva discreta aceptable. 
 
Palabras clave: QSAR, Pesticidas, K-NN, Algoritmos Genéticos, NER. 
 
 Introducción 
 
El uso de pesticidas es muy importante para el 
mantenimiento de los sistemas agrícolas. En la 
actualidad; no solo han contribuido al aumento de la 
producción, sino que además han sido fundamentales en 
avances de salud pública como la supresión y control de 
vectores [1]. 
 
A pesar de que estas moléculas cuando se aplican, tienen 
organismos objetivo como su destino final, el 99% de los 
pesticidas que se utilizan van al aire, agua y suelo es 
decir, sólo el 1% llega a su destino final. Este hallazgo es 
inquietante debido a que la población mundial crece, lo 
que significa que el uso de pesticidas aumentará para 
satisfacer las necesidades mundiales de alimentos; debido 
a esto los componentes ambientales se mantendrán bajo 
una intensa amenaza de estas moléculas [10]. 
 
Para determinar la toxicidad de los pesticidas se han 
realizado y estudiado diversos ensayos en animales, la 
ventaja fundamental de estas pruebas es su realización en 
condiciones rigurosas y controladas de laboratorio; esto 
permite establecer de manera cuantitativa la relación 
entre la exposición (dosis) y su efecto (respuesta),pruebas 
que se realizan principalmente en aves, mamíferos e 
invertebrados, entre ello se tiene el efecto toxicológico 
sobre Daphnia magna expresada en Concentración 
Efectiva 50 (EC50) [4]. 
 
mailto:lcardenas@ups.edu.ec
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
Dentro de las desventajas de realizar estas pruebas es la 
detección de los efectos en dosis bajas a las cuales son 
sometidos los animales; esto requiere del uso de un 
número elevado de ejemplares lo que convierte al 
proceso poco viable económicamente [10]. 
 
Además que el costo de las pruebas toxicológicas en 
animales es prohibitivo, es decir que este costo es 
asignado al precio final de los productos químicos. En un 
estudio de la Comisión Europea se estima que las pruebas 
toxicológicas de alrededor de 30.000 sustancias 
existentes se traducen en un costo total de 2 billones de 
euros en el mercado hasta el año 2013 [16]. Asimismo se 
ha estimado que para realizar estas pruebas es necesario 
utilizar más de 12 millones de vertebrados [10]. 
 
Por lo tanto las limitaciones de los ensayos de toxicidad 
son: restricciones económicas, consideraciones éticas y la 
presión pública para reducir las pruebas toxicológicas en 
animales [16]. Debido a las limitaciones de los ensayos 
de toxicidad se han desarrollado nuevos métodos que 
permiten reducir el número de animales utilizados en 
laboratorio, ahorrar tiempo y reducir el costo de los 
ensayos toxicológicos [15]. 
 
Dentro de estos métodos están los modelos matemáticos 
de predicción, de los cuales el más difundido es el 
método QSAR (Relación Cuantitativa Estructura 
Actividad) [11]. QSAR es un tipo de estrategia que es 
aplicada sobre todo para resolver problemas en química, 
farmacología, ciencias ambientales y toxicología [15]. 
 
QSAR se apoya principalmente en técnicas estadísticas 
multivariantes y quimiométricas, acopladas con la 
información química que se encuentra codificada para 
cada estructura, y se conocen como descriptores 
moleculares; es decir, buscan un modelo matemático 
cuantitativo que relacione la estructura molecular y una 
actividad definida en las moléculas. Esta metodología se 
fundamenta en que los complejos fenómenos 
bioquímicas que afectan a la toxicidad pueden ser 
descritos en términos matemáticos y químicos [16]. 
 
El objetivo general de estos estudios es comprender la 
mecánica de la acción toxicológica de las moléculas en 
los organismos, para sugerir la síntesis de nuevos 
compuestos con una actividad biológica definida [11]. 
 
Un aspecto clave para el desarrollo de la metodología 
QSAR son los descriptores moleculares ya que se 
establece una correlación directa entre ellos y la actividad 
biológica [5]. Un descriptor molecular es el resultado 
final de un procedimiento lógico y matemático que 
transforma la información química codificada dentro de 
una representación a una representación numérica útil 
[5]. 
 
Por otro lado, la Quimiometría constituye la ciencia que 
utiliza la matemática, la estadística y la lógica formal 
para diseñar y seleccionar procedimientos experimentales 
que permitan obtener información y construir 
conocimiento mediante el análisis de los datos químicos 
[13]. 
 
Con los avances de la informática se han podido 
desarrollar técnicas que permiten utilizar toda la 
información disponible en las bases de datos; 
minimizando el tiempo y el costo del análisis y 
maximizando la calidad de la respuesta. Por esta razón, 
estos análisis dan un mejor entendimiento de la 
problemática del fenómeno estudiado obteniendo toda la 
información posible de los datos, usando técnicas como 
modelos de regresión, modelos de clasificación, 
algoritmos genéticos, redes neuronales, entre otros [13]. 
 
Los métodos de clasificación [13] son técnicas 
estadísticas multivariantes que tienen como objetivo 
principal la construcción de modelos sobre la base de un 
cierto número de variables independientes (descriptores). 
Es decir, busca relacionar las variables independientes 
con una respuesta cualitativa (clase asignada), la cual 
debe ser definida previamente [13]. 
 
La definición de las clases se da mediante los siguientes 
criterios [13]: 
1. Las clases son definidas por vía teórica. 
2. Las clases son definidas por una variable categórica. 
3. Las clases se buscan mediante el método de clúster 
análisis. 
4. Las clases son definidas mediante la categorización de 
una variable cuantitativa. 
 
Para asignar unnuevo objeto al modelo los métodos de 
clasificación se basan en la mínima distancia que se 
encuentra entre el objeto y el centroide más cercano del 
espacio de clase en donde el nuevo objeto será 
clasificado [13]. 
 
 
Figura 1: Esquema de la representación de las distancias de un 
objeto a los diferentes centroides de clases 
 
Existe una vasta gama de métodos de clasificación los 
cuales permiten realizar la modelación de los datos; entre 
estas técnicas tenemos los métodos de clasificación de 
A
B
C
A
A
A
A
A
A A
A
B
B
B
B
B
B
B
B
B
C
C
C
CCCX
X Objeto a clasificar
Centroide
Espacio de Clase
difusos (fuzzy classification methods) y los métodos de 
clasificación de árbol (classification tree methods). 
 
Dentro de los métodos difusos se encuentra el método K-
NN [13], el cual corresponde a un método de 
clasificación no paramétrico, que para realizar la 
clasificación se basa sobre el concepto de analogía. El 
método se fundamenta en la elección de una distancia y 
en la selección oportuna de los K objetos más cercanos a 
la molécula en estudio. Luego se enumera cuántos de 
estos K objetos caen en cada clase y la molécula es 
atribuida a la clase más numerosa; esta evaluación se 
extiende a todos los objetos hasta determinar a qué clase 
corresponde cada uno de ellos [13]. 
 
 
Figura 2: Comparación de un objeto según los K vecinos 
más cercanos 
 
El algoritmo K-NN tiene las siguientes etapas [13]: 
1. Escalado de los datos 
2. Selección de la distancia a utilizar 
3. Elección del número K útil para la clasificación 
4. Cálculo de la matriz de las distancias 
5. Para cada objeto se consideran K objetos más cercanos 
6. El objeto se asigna a la clase más representativa en 
función de los K vecinos más cercanos. 
 
En la práctica es necesario probar diversos valores de K 
que oscilan entre 2 y 10 hasta obtener el valor óptimo, es 
decir en donde se comete el menor error de clasificación 
en los datos del training set. K-NN es un método que 
tiene gran simplicidad, una amplia aplicabilidad y su 
rendimiento en la respuesta obtenida es muy satisfactorio 
[7]. Debido a la dimensionalidad de las bases de datos es 
necesario realizar una selección previa de las variables 
más importantes para construir el modelo. Los 
Algoritmos Genéticos (GAs) [14] son una importante 
herramienta quimiométrica aplicada en problemas de 
optimización de datos a gran escala. 
 
Los GAs son modelos adaptativos que pueden usarse 
para resolver problemas de búsqueda y optimización de 
sistemas complejos. Se basan en el proceso genético 
evolutivo de los organismos vivos; en donde se simula el 
proceso de selección natural y supervivencia de los 
organismos en donde los más aptos sobreviven. De esta 
manera se obtiene un conjunto óptimo de variables 
necesarias para la construcción del modelo [14]. 
GAs consisten en un ciclo interactivo de creación de 
conjuntos (cromosomas) de variables originales que 
generan poblaciones viables las cuales son las más 
óptimas para la construcción del modelo predictor [14]. 
Estos conjuntos creados buscan el mayor NER (Non-
error rate), son retenidos los mejores y sobre esta 
población se produce el apareamiento y las mutaciones 
de los cromosomas para generar nuevos conjuntos 
predictores; se retienen siempre los mejores y se repite el 
ciclo interactivamente hasta alcanzar la máxima calidad 
de NER [13]. 
 
Con la ayuda de las técnicas señaladas, el objetivo 
principal se enfocó en determinar un modelo que 
relacione la estructura molecular y la toxicidad de 
diversos pesticidas utilizando un modelo de clasificación 
K-NN, lo que permitirá predecir la clase de actividad que 
tendría una nueva sustancia antes de ser sintetizada. 
 
En términos generales significa ahorrar tiempo, recursos 
económicos y reducir la presión sobre los animales de 
laboratorio. Además el modelo es una herramienta de 
evaluación que permitirá encontrar la toxicidad de un 
nuevo pesticida mediante su estructura molecular. 
 
Metodología 
 
Obtención de los Datos 
Se seleccionaron 192 moléculas de pesticidas en relación 
a su estructura química. Dentro de los cuales se 
encuentran los Carbamatos, Piretroides Organoclorados y 
Organofosforados. Los datos fueron obtenidos de PPDB 
(Pesticide Properties Data Base) de la Universidad 
Hertfordshire [17]. De esta base de datos se obtuvieron el 
gráfico molecular del pesticida y la EC50 de Daphnia 
magna. 
 
Digitalización y Optimización de las Moléculas 
Para la digitalización de las estructuras moleculares se 
utilizó el programa HyperChem 6.03, versión de 
evaluación [9] para la optimización de las estructuras se 
utilizó el método "Mechanical Mechanics Force Fields" 
(MM+), con el algoritmo Polak-Ribiere (Conjugate 
Gradient), con RMS gradient de 0.1 Kcal/(Å mol). 
 
Cálculo de los Descriptores Moleculares 
Utilizando el software Dragon versión 6 [12], se 
calcularon 4880 descriptores moleculares [14], los que 
incluyen descriptores de todos los tipos, tales como: 
Constitutional Descriptors, Topological Descriptors, 
Geometrical Descriptors, Charge Descriptors, WHIM and 
GETAWAY Descriptors, 3D-MoRSE, Molecular walk 
counts, 2D-Autocorrelations, Aromaticity Indices, 
Randic Molecular Profiles, Radial Distribution functions, 
Functional Groups, Atom-Centred Fragments, Empirical 
and Properties. Se eliminaron los descriptores constantes 
o casi constantes (desviación estándar <0.00001), así 
también, los que presentan valores faltantes y los que 
están correlacionados por más del 95% [14], resultando 
12
4
3
5
K=5
para estudio un total de 1126 descriptores moleculares 
disponibles. 
 
Normalización de los Datos 
La base de datos contiene 192 moléculas caracterizadas 
por 1126 descriptores moleculares lo que determinó el 
tamaño de la matriz en 216.192 datos. Se normalizó el 
valor de la toxicidad de Daphnia magna (EC50) debido a 
la variabilidad de los datos; ya que valores extremos 
pueden afectar la calidad final del modelo. Para 
normalizar la EC50 de Daphnia magna se realizó el 
siguiente cálculo: 
 
Asignación de las clases 
Para el presente trabajo se categorizó la EC50 que es una 
variable de tipo cuantitativa. Los valores obtenidos de la 
normalización se dividieron en tres clases, los de la clase 
1 que tienen una toxicidad baja (0-33% de los datos), la 
clase 2 poseen una toxicidad intermedia (34%-66% de los 
datos) y finalmente la clase 3 con una toxicidad alta 
(67%-100% de los datos). 
 
Tabla 1: Valores establecidos como frontera de clases 
 
 
Selección de variables por Algoritmos Genéticos 
La construcción del modelo se realizó en el programa 
MATLAB 7.0. En el software se utilizaron los Toolbox 
de los Algoritmos Genéticos diseñados por el Milano 
Chemometrics and QSAR de la Universidad Milano 
Biccoca (Italia). Estos Toolbox son programados en 
relación a los parámetros necesarios para obtener el 
mejor modelo de clasificación. Los parámetros de 
programación se muestran en la siguiente tabla: 
 
Tabla 2: Parámetros de programación para el Algoritmo 
Genético 
 
 
 
Luego de la modelización se analizan los parámetros de 
validación de la clasificación, si el NER% es satisfactorio 
se presentan los resultados en caso contrario se 
reformulan los parámetros y se realiza nuevamente la 
modelización hasta obtener el modelo de clasificación 
deseado. Para la presente investigación los parámetros 
presentados en el cuadro son aquellos que nos 
permitieron obtener el mejor modelo con un NER% 
satisfactorio. 
 
Resultados y Discusión 
 
Una vez aplicado el algoritmo genético para la selección 
de las variables óptimas y la clasificación con el método 
K-NN se obtuvieron los siguientes resultados. La calidad 
del modelo encontrado y validado en predicción se indica 
en la siguiente figura: 
 
 
Figura 3: Relación entre el número de descriptoresconsiderados 
en la clasificación K-NN y en NER cross-validado 
 
El gráfico muestra la calidad en predicción del modelo 
expresado en NER-cross-validado al 20% de las 
moléculas (5 grupos de cancelación), este parámetro se 
incrementa hasta alcanzar su máximo nivel con 8 
variables seleccionadas de las 1126. La dimensionalidad 
de los datos es reducida por la aplicación de los 
algoritmos genéticos de 1126 descriptores moleculares 
solo a 8 describen de mejor manera la estructura 
molecular y la toxicidad. El uso de los algoritmos 
genéticos tiene su mayor aplicación en la búsqueda de las 
mejores variables que optimicen los modelos de 
clasificación y regresión [5]. 
 
Los Algoritmos Genéticos seleccionaron 8 descriptores 
moleculares óptimos los cuales permiten la construcción 
del modelo y según el código de DRAGON son los 
siguientes: 
1) B05 [C-P] indica la presencia o ausencia de un enlace 
C - P a una distancia topológica de 5. 
2) B02 [C-N] indica la presencia o ausencia de un enlace 
C - N a una distancia topológica de 2. 
3) MATS5i indica que existe una autocorrelación 
calculada según Moran pesando los potenciales de 
ionización de los átomos a una distancia de 5 enlaces. 
4) E2p es un descriptor de direccionalidad de la molécula 
perteneciente al grupo WHIM. 
5) CATS2D_02_DA es un descriptor básico que indica la 
existencia de un par donador-aceptador a una distancia de 
2 enlaces. 
Método KNN 
Escalado Autoscaling 
Grupos de cross-validación 5 
Tipo de cross-validación Ventanas venecianas 
Número de cromosomas 30 
Probabilidad de mutación 0.01 
Probabilidad de cruce 0.5 
Repeticiones 100 
Número de evaluaciones 250 
 
100 200 300 400 500 600 700 800 900 1000
0.4
0.45
0.5
0.55
0.6
0.65
0.7
0.75
final stepwise selection
number of included variables
N
E
R
 c
v
6) CATS2D_04_LL es un descriptor básico que indica la 
existencia de un par lipofílico-lipofílico cada 4 enlaces en 
la molécula. 
7) CATS2D_05_LL es un descriptor básico que indica la 
existencia de un par lipofílico-lipofílico cada 5 enlace en 
la molécula. 
8) F09 (O-F) indica la frecuencia de un enlace O - F a 
una distancia topológica de 9. 
 
La matriz de confusión permitió determinar el NER% en 
relación a los objetos que están mal clasificados. La 
matriz se presenta a continuación: 
 
Tabla 3: Matriz de confusión del método K-NN obtenido 
 
 
 En la clase 1 (baja actividad) el método presenta 
un No Error Rate del 69%. 
 En la clase 2 (media actividad) el método 
presenta un Error Rate del 66%. 
 En la clase 3 (actividad alta) el método presenta 
un Error Rate del 75%. 
Los resultados muestran que el algoritmo es más sensible 
para aquellas moléculas que tienen una toxicidad elevada 
(mayor actividad biológica), correspondientes a las 
moléculas que se encuentran en la clase 3. En tanto que el 
algoritmo resulta menos sensible a las moléculas de clase 
2 y 1, con toxicidad media y baja respectivamente. En la 
figura 4 se observa que las variables 6 y 7 son las que 
separan y diferencian las tres clases de toxicidad. 
 
 
Figura 4: Perfil de los centroides de las clases asignadas 
 
En la clase 3, aquellas moléculas que tienen mayor 
actividad, las variables 6 (CATS2D_04_LL) y 7 
(CATS2D_05_LL) son las que tienen valores 
intermedios, lo cual nos indica la presencia de una 
actividad lipofílica media. En la clase 2, las de mediana 
actividad, sus variables tienen valores altos de lipofílidad, 
mientras que en la clase 1 presentan valores bajos. Esto 
indica que para mostrar una mayor toxicidad la molécula 
debe presentar una lipofílidad intermedia. Esta actividad 
lipofílica indica que los pesticidas son afines a las 
moléculas grasas. A nivel celular los pesticidas afectan a 
todos los sistemas de membranas que están presentes en 
la célula, debido a que la molécula estructural de las 
membranas son los fosfolípidos [14]. 
 
El modelo encontrado y validado presenta una buena 
capacidad predictiva (NERcv=0,72) a pesar de tener 
estructuras químicas de diverso origen. En un estudio 
similar [14] se estableció un modelo con un menor 
NER=0.71 y con un número mucho menor de moléculas 
(25). Por lo tanto el modelo encontrado en predicción 
posee una mejor capacidad predictiva, respecto a los 
resultados publicados por Ferreira. 
 
Los métodos de clasificación son apropiados para 
modelar varias respuestas en los métodos QSAR, como 
por ejemplo: compuestos activos/no activos o 
compuestos de toxicidad baja, mediana y alta como es el 
caso de nuestro estudio [8]. K-NN al ser un método de 
clasificación permite agrupar los diferentes tipos de 
pesticidas, ya que los modelos continuos solo describen 
de manera parcial la relación entre la estructura 
molecular de los pesticidas y su respectiva toxicidad [1]. 
 
Los modelos continuos son más utilizados y estudiados 
debido a que su predicción devuelve un valor de 
toxicidad (modelo cuantitativo), en tanto que los modelos 
discretos muestran el valor de una clase de toxicidad 
(modelo cualitativo) [1]. 
 
La estructura molecular de los pesticidas relacionados 
con su toxicidad en términos generales se muestra en la 
siguiente figura. 
 
 
Figura 5: Relación entre la estructura molecular y la toxicidad 
de los pesticidas según su clase 
 
Al existir mayor cantidad de estructuras cíclicas y 
heterocíclicas aumenta la toxicidad de un compuesto 
[16]. En este estudio los pesticidas clasificados en la 
clase 1 tienen la característica de ser moléculas de cadena 
lineal, mientras que las moléculas de la clase 2 tienen una 
estructura cíclica aromática (benceno) como su 
 
Clase Asignada 
 
Clase 1’ Clase 2’ Clase 3’ 
 
Clase 1 44 13 5 
Clase Verdadera Clase 2 9 42 12 
 
Clase 3 3 13 49 
 
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8
centroide clase 1
centroide clase 2
centroide clase 3
característica principal y los compuestos de la clase 3 al 
igual que la clase 2 son estructuras cíclicas (benceno) y 
heterocíclicas en donde se encuentran más de dos anillos 
aromáticos o estructuras heterocíclicas que diferencian a 
la molécula. Las técnicas QSAR y Quimiométricas 
combinadas son un gran instrumento que permiten 
determinar la relación entre la estructura molecular y la 
toxicidad de la molécula [5]. 
 
Conclusiones 
 
1. Los Algoritmo Genéticos son muy útiles cuando 
se busca reducir la dimensionalidad de los datos, 
reteniendo únicamente descriptores que aportan 
información a los modelos de clasificación, en 
este caso particularmente para describir la 
toxicidad de las moléculas de pesticidas. 
 
2. El NER= 0,72 encontrado con el método de 
clasificación K-NN presenta una capacidad 
predictiva aceptable, tomando en consideración 
que el modelo fue construido con moléculas de 
diverso origen químico. 
 
3. El modelo encontrado resulta mucho más 
sensible para los objetos que están clasificados 
en la clase 3 al presentar un NER del 75%. 
 
4. El análisis de los centroides de las clases 
muestra que los descriptores moleculares que 
separan y definen a las clases son los 
descriptores CATS2D_04_LL y 
CATS2D_05_LL. 
 
5. Los centroides de las clases indican que las 
moléculas más activas son aquellas que 
presentan una lipofílidad intermedia, indicando 
que la actividad lipofílica de los pesticidas 
afecta principalmente a los sistemas de 
membranas celulares. 
 
6. Los modelos discretos describen de mejor 
manera la estructura y la respectiva toxicidad de 
las moléculas cuyo origen químico es variado, y 
en donde los modelos continuos como los de 
regresión fracasarían en el intento de modelar la 
relación cuantitativa estructura-propiedad. 
 
7. Las técnicas QSAR y Quimiométricas 
combinadas son un gran instrumento de análisis, 
que permiten realizar investigaciones enfocadas 
a las ciencias ambientales y sobre todo 
relacionadas con la contaminación 
antropogénica, puestoque permite reducir los 
ensayos in-vitro y las consecuencias que de ellos 
se derivan; así también como optimizar tiempo y 
costos. 
 
Bibliografía 
 
[1] Benfenati, E., Quantitative Structure-Activity 
Relationships (QSAR) for Pesticide Regulatory Purposes, 
Laboratory of Environmental Chemistry and Toxicology, 
Istituto di Richerche Farmacologiche “Mario Negri”, 
Elsevier, 2007. pp. 19-144. 
 
[2] Calva, L., Plaguicidas Organoclorados y sus efectos. 
Laboratorio de Ecosistemas Costeros, Departamento de 
Hidrología, UNAM, 2008. pp. 30-70. 
 
[3] Cardamone, L., Chemistry, Toxicology and QSAR, 
Politécnico de Milano, Istituto di Ricerche 
Farmacologiche “Mario Negri”. Chem. Inf. Model. 2010, 
45, pp. 1565-1554. 
 
[4] Castillo, G., Ensayos toxicológicos y métodos de 
evaluación de calidad de aguas. Estandarización, 
intercalibración, resultados y aplicaciones, Instituto 
Mexicano de Tecnología del Agua, Centro Internacional 
de Investigaciones para el Desarrollo, 2005, pp. 100-150. 
 
[5] Consonni, V., “Molecular descriptors and 
chemometrics: a powerful combined tool for 
pharmaceutical, toxicological and environmental 
problems”, Milano Chemometrics and QSAR Research 
Group, Departament of Environmental Sciences, 
University of Milano-Bicocca, 2009, pp. 89-93. 
 
[5] Ferreira, L., Multivariate QSAR., J. Braz. Chem. 
Soc., Vol. 13, No. 6, 2005. pp. 742-753. 
 
[6] Frank, I., Todeschini R., The Data Analysis 
Handbook. Elsevier Science. 2006. pp. 334-350. 
 
[7] Gemperline, P., Practical guide to Chemometrics, 
Second Edition, Taylor & Francis, 2007, pp. 50-100. 
 
[8] Gramatica, P., Uni Applicazione delle metodologie 
QSAR a probleatiche ambientali di inquinanti organici. 
QSAR and Environmental Chemistry Research. 
Università degli Studi di Bologna - Dottorato in Chimica. 
2009. pp. 10-30. 
 
[9] Hyperchem 6.0 (Hypercube). Disponible online: 
http://www.hyper.com/ 
 
[10] Mazzatorta, P., “QSAR Model for Predicting 
Pesticide Aquatic Toxicity”, Istituto di Ricerche 
Farmacologiche “Mario Negri”. Chem. Inf. Model. 2010, 
45, pp. 1554-1564. 
 
[11] Repetto, A., Métodos Alternativos a la 
experimentación animal en la Evaluación de la 
Seguridad, Instituto Nacional de Toxicología y Ciencias 
Forenses, Jornadas de Toxicología Ambiental, 2004, pp. 
26-64. 
 
[12] Talete srl, DRAGON (Software for Molecular 
Descriptor Calculation) Version 6.0 - 2013 - 
http://www.talete.mi.it/ 
 
[13] Todeschini, R., Introducción a la Quimiométrica, 
Edises, Universidad Milano Bicocca, 2003, pp. 80-220. 
 
[14] Todeschini, R.; Consoni, V. Handbook of Molecular 
Descriptors Wiley VCH: 2000. 
 
[15] Toropov, A., “QSAR models for Daphnia toxicity of 
pesticides based on combinations of topological 
parameters of molecular structures”, Bioorganic & 
Medicinal Chemistry 14, Science-Direct 2010, pp. 2559–
2588. 
 
[16] Zvinavashe, H., “Quantitative structure-activity 
relationship modeling of the toxicity of 
organothiophosphate pesticides to Daphnia magna and 
Cyprinus carpio”, Chemosphere. Elsevier. Chemosphere 
55, 2009, pp. 1831–1838. 
 
[17] PPDB (Pesticide Properties Data Base) 
http://sitem.herts.ac.uk/aeru/footprint/es/index/.htm

Continuar navegando