Logo Studenta

PARCIAL PRIMER CORTE - Juan David Bareño

Esta es una vista previa del archivo. Inicie sesión para ver el archivo original

##### PARCIAL JUAN DAVID BAREÑO####
install.packages("tidyverse")
library(tidyverse)
library(data.table)
library(readxl)
library(lubridate)
setwd("/Users/juanbareno/Library/Mobile Documents/com~apple~CloudDocs/Universidad/6th Semestre/Informática para Economistas/1er Corte /Parcial Primer Corte/data")
dir()
#Cargar Datos ----
calidad <- read_excel("Analisis de Calidad.xlsx")
glimpse(calidad)
view(calidad)
divipola <- read_excel("DIVIPOLA.xlsx")
glimpse(divipola)
view(divipola)
Preciosinternos <- read_excel("PreciosInternos.xlsx")
glimpse(Preciosinternos)
view(Preciosinternos)
productos <- read_excel("Productos.xlsx")
glimpse(productos)
view(productos)
entradas <- fread("Entradas.csv")
glimpse(entradas)
view(entradas)
proveedores <- fread("Proveedores.csv")
glimpse(proveedores)
view(proveedores)
#union de datos----
data <- entradas %>% 
 inner_join(divipola, by = c("CodProcedencia" = "CodDane")) %>% 
 inner_join(proveedores, by="CodProveedor", "CodProcedencia" = "CodUbicacion") %>%
 inner_join(productos, by= c("CodCategoria", "CodProducto")) %>% 
 inner_join(calidad, by="IdEntrada") %>% 
 mutate(periodo = format(Fecha_Entrada, "%Y"))
glimpse(data)
view(data) 
 
## PUNTO 1.Existen periodos de tiempo con mayor número de kilos de café en entradas? ----
pt1 <- entradas %>% 
 mutate(Años = format(Fecha_Entrada, "%Y"))
pt1 %>%
 group_by(Años) %>%
 summarise(Kilos = sum(Kilos))%>%
 arrange(desc(Kilos))
 #R//: Teniendo en cuenta la informacion filtrada en años, podemos llegar a la
 #conclucion de que en el año 2018 fue cuando hubo un mayor numero de kilos de 
 #cafe fueron producidos con 17.666.747 kg
## PUNTO 2.Si la materia prima tiene un porcentaje de humedad mayor al 12 porciento,---- 
#esta no debía haber entrado a la trilladora. Existe algún patrón para el no cumplimiento de esta norma?
pt2.1 <- data %>%
 filter(Humedad>12)%>%
 select(IdEntrada,CodCategoria,Categoria)%>%
 distinct()%>%
 group_by(Categoria) %>%
 summarise(Contar = n())
pt2.1
 ###O
pt2.2 <- calidad %>%
 filter(Humedad > 12)%>%
 inner_join(entradas, by=c("IdEntrada"="IdEntrada"))%>%
 inner_join(productos, by=c("CodCategoria"="CodCategoria"))%>%
 select(IdEntrada,CodCategoria,Categoria)%>%
 distinct()%>%
 group_by(Categoria) %>%
 summarise(Contar = n())
pt2.2
 #*** R//: 7566 fueron las materias primas que no debieron haber entrado a la trilladora
 #*** de estos 1044 corresponden a la categoria de Diferenciados y 6528 a la categoria de Pergamino Seco
 #*** teneindo en cuenta un total de 14.778 datos analisados
## PUNTO 3.El factor de rendimiento mide la calidad del café en entrada, si el factor ----
#es bajo el proveedor se premia con una bonificación sobre el precio. Qué proveedores
#entregan café de mejor calidad y por ende que han sido bonificados frecuentemente?
pt3 <- datos %>% 
 group_by(TipoProveedor) %>% 
 summarise(Factorrendimiento = mean(FactorRendimiento)) %>% 
 arrange(Factorrendimiento)
 #R//: pordemos evidenciar que el productor es quien tiene el menor promedio en 
 #factor de rendimeinto con un 97.6 frente a los 100 de comerciante, lo que nos 
 #indica que el comerciante entraga mejor calidad de cafe, y el productor es quien
 #ha sido bonificado frecuentemente
## PUNTO 4.Se está considerando abrir un punto de compra en la zona. En qué municipio considera----
#que se debe abrir teniendo en cuenta que la sucursal vigente está en Popayán ?
pt4.1 <- entradas %>%
 inner_join(divipola, by = c("CodProcedencia" = "CodDane")) %>% 
 group_by(Nom_Mun) %>%
 summarise(Kilos = sum(Kilos))%>%
 arrange(desc(Kilos))
pt4.1
 ###O 
pt4.2 <- data %>%
 group_by(Nom_Mun) %>%
 summarise(Kilos = sum(Kilos))%>%
 arrange(desc(Kilos))
pt4.2
 #*** R//: El municipio donde se recomienda hacer la apetura del punto de compra en la zona
 #*** deberia ser "La Union" por la cantidad de kilos en cafe que vende y posee
 #*** con un total de 33513200 kg en el municipio, el que le sigue es "Paez" con 11212321kg.
 #*** se puede considerar la apertura aun asi teniendo en cuenta que la distancias entre
 #*** la union y popayan sean muy cortas, lo consideramos por la cantidad de kilos.
## PUNTO 5.El equipo de campo hace visitas a los proveedores periódicamente, se quiere priorizar ----
#los municipios de donde no se ha comprado café ultimamente. Que municipios recomienda priorizar?
pt5.1 <- entradas %>%
 inner_join(divipola, by = c("CodProcedencia" = "CodDane")) %>% 
 inner_join(proveedores, by = ("CodProveedor")) %>% 
 group_by(Nom_Mun) %>%
 summarise(Kilos = sum(Kilos))%>%
 arrange(Kilos)
pt5.1
 ##### O
pt5.2 <- data %>%
 group_by(Nom_Mun) %>%
 summarise(Kilos = sum(Kilos))%>%
 arrange(Kilos)
pt5.2
 #*** R//:los municipios que se recomienda priorizar son: Santacruz (614kg) y Santa Rosa (1581kg) #
 #*** ya que son los municipios que tienen menos ventas de quilos de cafe teniendo en cuanta la sumatoria #
 #*** de sus kilos, por eso se recomienda hacer visitas con mas frecuencia #
## NOTA ----
 #*** TENER EN CUENTA QUE EN LOS PIRMERO PUNTOS DE PUNTO 2 - 4 - 5 (2.1 - 4.1 - 5.1 ) CORRESPONDIENTEMENTE, #
 #*** HAGO LA UNION EN LOS MISMO #
 #*** PERO EN LOS SEGUNDOS PUNTOS DE LOS MISMOS, (2.2 - 4.2 - 5.2) CORRESPONDIENTEMENTE, ULTILIZO LA UNION #
 #*** GENERAL HECHA EN LA PRIMERAS LINEAS DE CODIGO. #

Continuar navegando