Logo Studenta

Actividad Final Nancy (1)

¡Este material tiene más páginas!

Vista previa del material en texto

FASE 5
EJERCICIO FINAL
NANCY ELENA SALGADO
MARIA MAGDALENA PESTANA
KEDRYS JOHANA ALVAREZ
300046_47
TUTOR
LUIS ALBERTO CÁCERES
ESTADÍSTICA DESCRIPTIVA
UNIVERSIDAD NACIONAL ABIERTA A DISTANCIA UNAD
ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y MEDIO AMBIENTE
CEAD VALLEDUPAR
2021
Introducción
La presente actividad busca consolidad todos los temas y conceptos abordados a lo largo del semestre iniciando por las medidas de tendencia central y diagramas de dispersión, para esto se hace necesario nuevamente hacer uso del programa R el cual será cargado con el script Fase 5 final, debido a que este ya cuenta con la información necesaria para generar las tablas y diagramas hacer el análisis de las medidas de tendencia central y medidas de dispersión por medio de diagramas de frecuencias y diagramas de torta entre otros
Finalmente, para desarrollar toda la guía incluidas las preguntas orientadoras se seleccionaron las variables agrícolas discretas y continuas del cuadro de excel.
Estas según el archivo de preguntas orientadoras hacen referencia a la cantidad de ácaros en un cultivo de fresas en la sabana de Bogotá (discreta) y PH del suelo para el cultivo de papa(continua)
A partir de estos datos se busca identificar la cantidad de ácaros que hay en un cultivo de fresas y el nivel de ph en el suelo para determinar si este es o no óptimo para el cultivo de papa.
	Agri_discreta
	Agri_continua
	1
	4,54
	7
	4,68
	10
	4,76
	10
	4,75
	2
	4,78
	5
	5,08
La imagen anterior contiene parte de información de las variables a analizar
La siguiente información corresponde a la variable cuantitativa discreta ÁCAROS EN UN CULTIVO DE FRESAS la cual se tomó del anexo 1 Final.csv
Lo primero que se muestra es la ejecución del script el cual arroja como resultado la información contenida en el documento final.txt
Tablas de frecuencias de R
La información se pasará a excel para darle un mejor formato quedando de la siguiente forma
	TABLA DE FRECUENCIAS VARIABLE AGRONOMÍA DISCRETA
	DATO
	Frecuencia Absoluta
	Frecuencia Absoluta acumulada
	Frecuencia relativa
	Frecuencia relativa acumulad
	
	
	
	
	
	0
	7
	7
	0.07
	0.07
	1
	15
	22
	0.15
	0.22
	2
	12
	34
	0.12
	0.34
	3
	7
	41
	0.07
	0.41
	4
	3
	44
	0.03
	0.44
	5
	7
	51
	0.07
	0.51
	6
	9
	60
	0.09
	0.6
	7
	15
	75
	0.15
	0.75
	8
	7
	82
	0.07
	0.82
	9
	5
	87
	0.05
	0.87
	10
	13
	100
	0.13
	1
	Total
	100
	100
	 
	1
	
	
	
	
	
	Limites
	
	
	
	Máximo
	10
	
	
	
	Mínimo
	0
	
	
	
Grafico Variable Discreta
Frecuencia Absoluta
De la imagen anterior se puede observar que el número de ácaros que se presentan en el cultivo van desde 0 hasta 10 unidades por hoja, las frecuencias absolutas de cada dato van desde 3 hasta 15, donde únicamente se presenta una frecuencia de 3 para 4 ácaros por hoja, mientras que la mayor frecuencia esta en 1 acaro por hoja con una frecuencia de 15 y 7 ácaros por hoja también con una frecuencia de 15. Es decir que la muestra presenta una distribución bimodal 
Seguido de este número se observa que se encontraron 10 ácaros por hoja 13 veces
Frecuencias Relativas
De la gráfica anterior de frecuencias relativas se observa que el 14% de la información indica que hay 1 acaro por hoja y al ser una distribución multimodal también el 14% de la información indica que hay 7 ácaros por hoja, si a esto le añadimos las frecuencias relativas de 2 ácaros por hoja que tiene una frecuencia de 12% y 10 ácaros por hoja que tiene una frecuencia relativa de 13% podemos inferir que entre estos cuatro intervalos o mediciones se encuentra concentrada la mayoría de la información debido a que estos datos representan el 53% del total de la muestra que se está analizando
Frecuencia Relativa Acumulada
Finalmente, en el diagrama de frecuencias relativas acumuladas se observa que el 50% de la información está contenida entre los intervalos 0 a 5, es decir que el 50% de las hojas contendrá entre 0 y 5 ácaros por hoja.
Por otro lado, el primero dato que se está analizando 0, solo representa el 7% del total de la información, razón por la cual no es muy común que una hoja no presente ácaros si este dato se eliminara de la toma es probable que se disminuya la dispersión de los datos en una pequeña proporción
Finalmente, el 100% de la información está incluida en los intervalos que van desde 0 ácaros por hoja hasta los 10 ácaros por hoja.
Distribución normal 
Una distribución normal es aquella en la cual los datos se encuentran distribuidos de manera simétrica a ambos lados de la media en este tipo de distribución la media y la moda son valores casi iguales.
Para nuestro ejercicio los datos que se están analizando no presentan este comportamiento por lo que se puede decir con certeza que la distribución no se asemeja en nada a una distribución normal.
Por ejemplo, en nuestra distribución se observan 2 valores que son mínimos el de 4 ácaros por hoja y el de 9 ácaros por hoja y múltiples valores altos por lo cual si se hiciera un polígono de frecuencias se observa que el comportamiento de la gráfica presentara múltiples altibajos 
Variable cuantitativa Continua
Ph del suelo para determinar si es o no optimo el terreno para la siembra de papa
Para el desarrollo del numeral correspondiente a la variable continua se hace necesario instalar el paquete como se muestra a continuación.
Una vez instalada la librería se ejecuta el script obteniendo los siguientes datos respecto a sus medidas de tendencia central y medidas de dispersión 
Al igual que en el punto anterior se presenta la información organizada en la siguiente tabla:
	VARIABLE CONTINUA PH del suelo
	 Media Aritmética
	4,795
	Varianza
	0,4283
	Mínimo
	4.24
	 Máximo
	5.61
	Rango
	4.24 - 5.61
	 Mediana
	4,715
	Número de datos
	100
	 Cuantil Q1
	25%
	4.42
	Cuantil Q2 que es la misma mediana
	 
	50%
	4,715
	 Cuantil Q3
	75%
	5.11
Se observa en las medidas de tendencia central que el ph promedio es de 4,795 y los valores mínimos y máximos son un ph de 4.24 y un ph de 5.61 se puede decir que la media es representativa al conjunto de datos que se está analizando.
Por otro lado, la variable que se está analizando contiene un poco dispersión entre sus datos respecto a la media debido a que esta varianza es de tan solo 0,42
Finalmente, respecto a sus cuartiles se observa que el 25% de la información corresponde a valores entre 4,24 y 4,42
Mientras que el 75% de la información es inferior al 5,11 es decir que cada uno de los cuartiles contiene poca variación en sus datos.
	Nombre de la variable elegida
	Ph de suelo
	clases
	Valor mínimo
	4.24
	4.198
	Valor Máximo
	5,61
	5.66
	Mediana
	4.715
	 
	Media
	4.795
	 
	Varianza
	0,18
	 
Tabla de frecuencias
La siguiente tabla contiene una tabla de frecuencias para datos agrupados en donde se identifican 8 clases, cada una con su frecuencia relativa y su frecuencia absoluta
	TABLA DE FRECUENCIAS VARIABLE AGRONOMÍA CONTINUA
	CLASE
	Frecuencia
	Frecuencia Absoluta acumulada
	Frecuencia relativa
	Frecuencia relativa acumulad
	Frecuencia % relativa
	Frecuencia %
	
	
	
	
	
	
	
	[4.198,4.381)
	22
	22
	0.22
	0.22
	22%
	22%
	 [4.381,4.565)
	16
	38
	0.16
	0.38
	16%
	38%
	[4.565,4.748
	14
	52
	0.14
	0.52
	14%
	52%
	 [4.748,4.932
	12
	64
	0.12
	0.64
	12%
	64%
	 [4.932,5.115)
	12
	76
	0.12
	0.76
	12%
	76%
	 [5.115,5.299)
	0
	76
	0
	0.76
	0%
	76%
	 [5.299,5.483
	18
	94
	0.18
	0.94
	18%
	94%
	 [5.483,5.666)
	6
	100
	0.06
	1
	6%
	100%
	Total
	100
	100
	 
	1
	100%
	 
Diagrama de Frecuencias
El anterior diagrama de frecuencias contiene las 8 clases que se crearon, es curioso observar que la clase que tiene un rango de 5,12-5,30, no contiene ningún dato
Por otro lado, el ultimo intervalo es el que contiene la menor frecuencia de todas ya que de 100 datos que se están analizando solo contiene 6, si estos datos se eliminaran de la muestra al calcular de nuevo las clases y la varianza estas disminuirán obteniendo una distribución de las clases mucho más uniforme que la actual
 además, se observa que la mayor frecuenciaestá contenida en el primer intervalo la cual contiene un ph de 4,20 hasta 4,38 con una frecuencia de 22 datos
Finalmente, la distribución de las frecuencias no es uniforme, pero como se indicó anteriormente si se elimina la última clase se obtendrá sin duda alguna una distribución de frecuencias mucho más uniforme que la actual.
Polígono de frecuencias
A partir del histograma de frecuencias obtenido anteriormente se pudo obtener el polígono de frecuencias el cual como es bien sabido por nosotros ubica cada una de las frecuencias en el centro de la clase.
Se observa que las frecuencias disminuyen hasta el intervalo 6 vuelven a aumentar hasta el intervalo 7 y finalmente decae de una manera muy abrupta esto obedece a que el ultimo intervalo contiene la menor frecuencia de todos los intervalos
Finalmente se observa que el ph más común que se encontró en el suelo que se está analizando es que esta entre 4.20 y 4.38 debido a que su frecuencia es de 22, otra frecuencia muy alta se presenta en el intervalo que va desde 5.30 hasta 5.48 con una frecuencia de 18. Es decir que estos dos valores serían los valores más altos de ph que se encontraron en el suelo
Histograma frecuencias relativas
Del histograma de frecuencias para datos agrupados se observa que el 76% de la información está contenida en las primeras 5 clases, es decir entre un ph de 4,20 hasta 5,12 en estas 5 clases se observa una distribución muy uniforme por lo que se puede inferir que los datos no presentar mucha dispersión hasta este punto, pero el ultimo intervalo que comprende los valores de ph de 5,48 hasta 5,67 no cuentan con una gran frecuencia ya que estos solo representan el 6% de la muestra. 
Por otro lado, podemos observar que la mediana se ubica en el intervalo que tiene un ph entre 4,56 y 4,75 es decir que el 50% de la muestra que se analiza contiene un ph entre 4,20 y 4,75
Calculo de la mediana
Como se indicó en el análisis anterior la mediana está ubicada en el intervalo número 3, esta se encuentra a la derecha de la marca de clase debido a que la gráfica presenta un leve desplazamiento hacia la derecha en la clase 3
Calculo de la media y la mediana
Igual que en el paso anterior se obtuvo una gráfica en la cual se identifica la mediana en el tercer intervalo y un poco a la derecha de la marca de clase, ahora con este nuevo grafico se obtiene la media, la cual también se encuentra localizada en el mismo intervalo con la única diferencia que esta se ubica casi al final del intervalo, es decir que la media es de aproximadamente 4,8 aunque el dato exacto es de 4,795.
Después de realizar el análisis de la información se puede decir que la media si es representativa ya que este valor se ubica muy próximo a la mediana, es decir que efectivamente los datos no presentan mucha dispersión, con estos datos que se analizan se pueden tomar cualquier tipo de decisiones y su incertidumbre o varianza será mínima ya que los datos en la actualidad presentan una variación de 0,42 respecto a la media.
Cuestionario
Variable Discreta Ácaros
1. En estudios previos se ha determinado que un número promedio mayor a 4 ácaros por hoja es el umbral económico que afecta tanto la calidad como el rendimiento del cultivo: de acuerdo a los resultados ¿Tomaría o no la decisión de aplicar alguna medida de control?
Analizados los datos referentes al número de ácaros por hoja se puede inferir que más de la mitad de la muestra tiene entre 6 y 10 ácaros por hoja, es decir que el cultivo tiene problemas de ácaros, debido a que el umbral económico es de 4 y únicamente el 40% de la muestra tiene menos de 4 ácaros es por esto que se deben tomar medidas de control debido a que los ácaros pueden reducir el rendimiento de la planta lo que se traduce en frutos más pequeños y si no se toman medidas correctivas a tiempo esto puede desencadenarse en una colonia de ácaros.
Respecto a las medidas de control estas pueden ser de tipo químico o biológico según la gravedad.
Como grupo recomendaríamos primero eliminar cultivos anteriores, malas hierbas, tratamientos a los focos de ácaros y si esto no funciona preparar nuevo suelo lo cual incluye un riego por goteo, probablemente una fumigación la cual acabara con toda la plaga, posterior a esto se puede arar el suelo y volver a sembrar lo cual garantiza que la plaga se halla eliminado, el problema puede ser que el viento mueve las plagas de una plana a otra por lo que si la plaga se encuentra en otro cultivo cercano, en época de fuertes vientos puede volver a aparecer.
1.2 Teniendo en cuenta que los consumidores reclaman alimentos libres de agroquímicos que estrategia de control utilizaría para regular la población de ácaros en el cultivo.
Según los datos analizados se puede observar que el número de ácaros que tiene el cultivo está muy alto respecto a la cantidad mínima que debería presentarse en un cultivo, es por esta razón que se recomienda tomar acciones para eliminar la plaga.
Respecto a la eliminación de la plaga sin el uso de químicos existen diversos métodos para eliminar la plaga entre los más efectivos podría ser el uso de tabaco como decocción vegetal de control.
Además, se puede hacer uso de otro tipo de acaro para eliminar el que afecta el cultivo, por ejemplo, la familia de los ácaros fitoseidos o científicamente llamados (Phytoseidos persimilis) los cuales no afectan el cultivo de las fresas.
Por último, se pueden utilizar extractos o residuos de determinadas plantas las cuales debido a sus propiedades insecticidas o fungicidas pueden eliminar la plaga sin afectar el cultivo, por ejemplo, la cebolla y el ajo son dos elementos que combaten efectivamente los ácaros.
1.3 Considera que la variable analizada se ajusta a la distribución normal
Una distribución normal es aquella en la cual los datos se encuentran distribuidos de manera simétrica a ambos lados de la media en este tipo de distribución la media y la moda son valores casi iguales.
Para nuestro ejercicio los datos que se están analizando no presentan este comportamiento por lo que se puede decir con certeza que la distribución no se asemeja en nada a una distribución normal.
Por ejemplo, en nuestra distribución se observan 2 valores que son mínimos el de 4 ácaros por hoja y el de 9 ácaros por hoja y múltiples valores altos por lo cual si se hiciera un polígono de frecuencias se observa que el comportamiento de la gráfica presentara múltiples altibajos
Variable Continua
Se desea sembrar papa en un terreno al que previamente se le realizó un análisis físico químico del suelo en 100 muestras recogidas al azar en donde una de las variables fue el PH
1. De acuerdo con el Ph óptimo de la siembra de papa ¿Considera que el suelo analizado es adecuado para el cultivo?
Aunque en la proactiva en múltiples sitios se cultiva la papa cuando el suelo tiene un ph de 4,5 esto no es algo que se debería hacer, y esto porque el ph óptimo para el cultivo de la papa debe estar entre 5,5 y 7 y esto obedece a que en este rango se encuentra el terreno con una salinidad baja y además se encuentran los nutrientes necesarios para que se produzca una papa de excelente calidad, teniendo clara esta información y comparando con los resultados obtenidos se puede asegurar que el terreno no es el más óptimo para el cultivo de la papa, allí se puede cultivar pero se hace necesario aplicar técnicas para subir el ph un poco, debido a que únicamente el 6% de la muestra analizada tiene un PH superior a 5,4 el restante 94% se ubica por debajo del 5.4 razón por la cual podemos decir que el ph no es el adecuado.
2. Que enmiendas recomendaría para que el suelo analizado sea apto para el cultivo de papa.
Como los suelos salinos provocan trastornos en el desarrollo de los tubérculos se hace necesario encalar el terreno, el encalado de los suelos ayuda en el mejoramiento de los nutrientes del suelo debido a que esto reduce la acides y ayuda a la generación de nutrientes como calcio y magnesio, además otras de las bondades del encalado es la generación de fosforo, potasio y molibdeno, todo estose puede traducir en el aumento en la calidad de la cosecha.
El encalado busca que las tierras mejoren la asimilación de los nutrientes, que el terreno sea más fértil lo que aumenta la probabilidad de tener una buena cosecha
3. Probabilidad de ocurrencia de un valor
Para el desarrollo del punto se hace necesario cambiar el valor en el script por uno que este en los rangos de datos y el sistema automáticamente retornara la probabilidad de ocurrencia, por ejemplo
Básicamente los cálculos se hacen de acuerdo a la frecuencia que se obtuvo de cada dato en el diagrama de frecuencias relativas como muestra la imagen de la derecha
4. Cuál es la probabilidad de encontrar una muestra en el suelo con PH menor a 5.2
La probabilidad es del 83%, esto soporta lo que se menciona anteriormente el terreno no es apto para el cultivo de papa, como el promedio del PH es de 4.795 se deben aplicar técnicas para lograr aumentar el ph en un 1 mínimo.
5. Probabilidad de obtener un PH superior al 5.4
En las condiciones actuales la probabilidad es tan solo del 9% 
Conclusiones
Del desarrollo de la actividad anterior se puede concluir que la estadística y el análisis descriptivo juegan un papel importante en todos los campos o situaciones de la vida, por ejemplo para nuestro ejemplo se realizó un análisis de datos respecto al Ph del suelo y el número de ácaros por hoja, por medio de los diagramas de frecuencias histogramas y algunas medidas de tendencia central y dispersión se pudo establecer si era rentable o no el proyecto de las fresas al igual de si era rentable económicamente cultivar papa en el terreno que contaba con un PH bajo.
Por otro lado, para el desarrollo de la actividad se hizo uso de la herramienta o programa R, este permitió el análisis de la información de manera gráfica, debido a que se había generado un script previamente el cual estaba programado para generar las gráficas de frecuencias relativas y acumuladas con los cuales se pudo establecer el comportamiento de la muestra sus medidas de tendencia central y los % de cada uno de los valores analizados.
Bibliografía
Bencardino, C. M. (2011). Estadística y Muestreo. Bogotá: Ecoe Ediciones.
C, M. (2011). Distribuciones de frecuencia. Bogota: Ecoe Ediciones. Obtenido de Estadística y muestreo: http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=739
RStudio. (27 de 04 de 2021). Descarga R Studio. Obtenido de https://www.rstudio.com/products/rstudio/download/
Saber Programas. (19 de 02 de 2020). Excel - Crear histograma y polígono de frecuencias en Excel. Tutorial en español HD. Obtenido de https://www.youtube.com/watch?v=uZ3Q6Nth7-E&t=225s
Anexos
R version 4.0.5 (2021-03-31) -- "Shake and Throw"
Copyright (C) 2021 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R es un software libre y viene sin GARANTIA ALGUNA.
Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.
Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.
Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
[Previously saved workspace restored]
> 
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_951 - ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
> 
> # Cuando el volumen de información es alto, se pueden importar de una hoja de cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo "Final.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica descriptiva"
> 
> 
> # VARIABLE CUANTITATIVA DISCRETA
> 
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de los comandos
> 
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron los archivos "Script Fase 5 - Final.txt" y "Final.csv"
[1] "C:/Users/Ivan Velandia/Desktop/Estadistica Descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y R mostrará un mensaje de error al intentar abrirla
> 
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
Error in file(file, "rt") : no se puede abrir la conexión
Además: Warning message:
In file(file, "rt") :
 no fue posible abrir el archivo 'Final.csv': No such file or directory
> 
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_951 - ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
> 
> # Cuando el volumen de información es alto, se pueden importar de una hoja de cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo "Final.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica descriptiva"
> 
> 
> # VARIABLE CUANTITATIVA DISCRETA
> 
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de los comandos
> 
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron los archivos "Script Fase 5 - Final.txt" y "Final.csv"
[1] "C:/Users/Ivan Velandia/Desktop/Estadistica Descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y R mostrará un mensaje de error al intentar abrirla
> 
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
> attach(PROBA)
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
> 
> # Si el programa logró leer la hoja de cálculo Final.csv, con el siguiente comando le debe aparecer:
> 
> View(PROBA) 
> # Ciérrela y continúe ejecutando el código
> 
> # El grupo debe escoger entre los tres tipos de variables discretas existentes: 
> # Para los estudiantes de zootecnia, la variable "Zoo_discreta", que es el número de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "Agri_discreta", que es el número de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "Amb_discreta", que corresponde al número de hogares que reciclan en 100 barrios
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para escoger una sola variable con la que van a trabajar
> 
> CONTEO=Agri_discreta # En esta linea reemplaze la palabra "Zoo_discreta" por la variable seleccionada por el grupo 
> 
> # Si el grupo seleccionó "Agri_discreta" entonces la línea previa deberá quedar así: CONTEO=Agri_discreta
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún error
> 
> min(CONTEO)
[1] 0
> max(CONTEO)
[1] 10
> table(CONTEO) # Tabla de frecuencias absolutas
CONTEO
 0 1 2 3 4 5 6 7 8 9 10 
 7 15 12 7 3 7 9 15 7 5 13 
> fabs=table(CONTEO) # Tabla de frecuencias absolutas
> fabs
CONTEO
 0 1 2 3 4 5 6 7 8 9 10 
 7 15 12 7 3 7 9 15 7 5 13 
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
 0 1 2 3 4 5 6 7 8 9 10 
 7 22 34 41 44 51 60 75 82 87 100 
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
 0 1 2 3 4 5 6 7 8 910 
0.07 0.15 0.12 0.07 0.03 0.07 0.09 0.15 0.07 0.05 0.13 
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
 0 1 2 3 4 5 6 7 8 9 10 
0.07 0.22 0.34 0.41 0.44 0.51 0.60 0.75 0.82 0.87 1.00 
> frelacum
 0 1 2 3 4 5 6 7 8 9 10 
0.07 0.22 0.34 0.41 0.44 0.51 0.60 0.75 0.82 0.87 1.00 
> 
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 951 - FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias relativas acumuladas
> 
> 
> # VARIABLE CUANTITATIVA CONTINUA
> 
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
The following objects are masked from PROBA (pos = 4):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
> attach(PROBA)
The following objects are masked from PROBA (pos = 3):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
The following objects are masked from PROBA (pos = 4):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
The following objects are masked from PROBA (pos = 5):
 Agri_continua, Agri_discreta, Amb_continua, Amb_discreta, Zoo_continua,
 Zoo_discreta
> 
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "0-cloud [https]" y después: "fdth". hacer clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo de la Consola R
> 
> utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y después: "fdth" 
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/fdth_1.2-5.zip'
Content type 'application/zip' length 293110 bytes (286 KB)
downloaded 286 KB
package ‘fdth’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in
 C:\Users\Ivan Velandia\AppData\Local\Temp\RtmpAhQvy8\downloaded_packages
> 
> library(fdth) # si se muestra en rojo en la Consola R, indica que se instaló correctamente
Attaching package: ‘fdth’
The following objects are masked from ‘package:stats’:
 sd, var
> 
> # El grupo debe escoger entre los tres tipos de variables continuas existentes: 
> # Para los estudiantes de zootecnia, la variable "Zoo_continua", que es el peso de conejos.
> # Para los estudiantes de agronomía, la variable "Agri_continua", que es el potencial de hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "Amb_continua", que corresponde al material particulado de 2.5 
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para escoger una sola variable con la que van a trabajar
> 
> VARIABLECONTINUA=Agri_continua # En esta linea reemplaze la palabra "Zoo_continua" por la variable seleccionada por el grupo 
> 
> # Si el grupo seleccionó "Agri_continua" entonces la línea previa deberá quedar así: VARIABLECONTINUA=Agri_continua
> 
> summary(VARIABLECONTINUA)
 Min. 1st Qu. Median Mean 3rd Qu. Max. 
 4.240 4.420 4.715 4.795 5.110 5.610 
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 4.24
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 5.61
> median(VARIABLECONTINUA)
[1] 4.715
> VARIANZA=var(VARIABLECONTINUA) 
> VARIANZA
[1] 0.1834877
> sd(VARIABLECONTINUA)
[1] 0.4283547
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 0.4283547
> length(VARIABLECONTINUA)
[1] 100
> 
> # TABLA DE FRECUENCIAS
> 
> dist <- fdt(VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f), frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia acumulada (cf) y frecuencia acumulada en porcentaje (cf(%)) 
 Class limits f rf rf(%) cf cf(%)
 [4.198,4.381) 22 0.22 22 22 22
 [4.381,4.565) 16 0.16 16 38 38
 [4.565,4.748) 14 0.14 14 52 52
 [4.748,4.932) 12 0.12 12 64 64
 [4.932,5.115) 12 0.12 12 76 76
 [5.115,5.299) 0 0.00 0 76 76
 [5.299,5.483) 18 0.18 18 94 94
 [5.483,5.666) 6 0.06 6 100 100
> 
> # GRÁFICOS DE VARIABLES CONTINUAS
> 
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable continua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> 
> # GRÁFICOS DE VARIABLES CONTINUAS
> 
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable continua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 951 - POLIGONO FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable conitnua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
> 
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece el nombre del código), para que no pierda el orden que lleva en la ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) : 
> # plot.new has not been called yet
> 
> 
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia (%)",xlab="Variable continua",main="PERIODO 951 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50% 
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> 
> 
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia (%)",xlab="Variable continua",main="PERIODO 951 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50% 
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
> 
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una probabilidad del 50% de que los datos sean iguales o inferiores a esta.
> 
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF 
Call: ecdf(VARIABLECONTINUA)
 x[1:42] = 4.24, 4.25, 4.26, ..., 5.58, 5.61
> minimos
[1] 4.24
> maximos
[1] 5.61
> 
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece el nombre del código), para que no pierda el orden quelleva en la ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le aparecerá un error.
> 
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 951 - DISTRIBUCIÓN EMPÍRICA") 
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50% de la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de color rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 4.715
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de color azul indica la media de la variable
> mean(VARIABLECONTINUA) # valor de la media en la variable elegida
[1] 4.7954
> # ¿es igual o distinto el valor de la media y la mediana en la variable elegida?
> # ¿cómo se puede interpretar esta similitud o diferencia?
> 
> # CÁLCULO DE PROBABILIDADES
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> # CÁLCULO DE PROBABILIDADES
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 4.795
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 0.18
> sigma=sqrt(varianza)
>> valor=5.20 
> pnorm(valor,media,sigma) 
[1] 0.8301085
> 
> # Indique en su informe el resultado de la probabilidad obtenida
> # Presente todos los resultados solicitados en el informe de acuerdo a la guía de la Fase 5
> > # Preparado por:
> 
> # Luis Alberto Cáceres
> # Director de Curso
> # Director de Curso
>> valor=4.26 
> pnorm(valor,media,sigma) 
[1] 0.1036531
> 
> # Dentro del rango de valores de la variable elegida, indique aquel del que quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de datos en el que se encuentra la variable que eligió:
> valor=4.95 
> pnorm(valor,media,sigma) 
[1] 0.6425706
> 
> valor=5.20
> pnorm(valor,media,sigma) 
[1] 0.8301085
> 
> valor=4.26
> pnorm(valor,media,sigma) 
[1] 0.1036531
> 
> valor=5.4
> pnorm(valor,media,sigma) 
[1] 0.9230656
>
012345678910
PERIODO 951 - FRECUENCIAS RELATIVAS - DISCRETA
Frecuencias relativas
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
012345678910
PERIODO 951 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA
Frecuencias relativas
0.0
0.2
0.4
0.6
0.8
1.0
PERIODO 951 - HISTOGRAMA FRECUENCIAS ABSOLUTAS
Intervalo de la variable continua
Frequency
0
5
10
15
20
25
4.204.384.564.754.935.125.305.485.67
0
5
10
15
20
25
PERIODO 951 - POLIGONO FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA
Class limits
Frequency
4.204.384.564.754.935.125.305.485.67
PERIODO 951 - HISTOGRAMA FRECUENCIAS RELATIVAS
Intervalo variable conitnua
Frequency
0.00
0.05
0.10
0.15
0.20
0.25
4.204.384.564.754.935.125.305.485.67
0
20
40
60
80
100
PERIODO 951 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)
Variable continua
Frecuencia (%)
4.204.384.564.754.935.125.305.485.67
0
20
40
60
80
100
PERIODO 951 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)
Variable continua
Frecuencia (%)
4.204.384.564.754.935.125.305.485.67
4.24.44.64.85.05.25.45.6
0.0
0.2
0.4
0.6
0.8
1.0
PERIODO 951 - DISTRIBUCIÓN EMPÍRICA
VARIABLE CONTINUA
Distribución empirica
012345678910
PERIODO 951 - FRECUENCIAS ABSOLUTAS - DISCRETA
Frecuencias absolutas
0
2
4
6
8
10
12
14

Otros materiales

Materiales relacionados