Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
MINERIA DE DATOS 1. ¿Qué es big data y data mining? Data mining se trata de encontrar relaciones dentro de la información que tienes, por lo general tienes una base de datos de tal tamaño y demás y tratas de extraer información de esa base de datos; de cierta manera a grandes rasgos se puede decir que estas filtrando información. Y el big data como comercialmente lo manejan las empresas es tener un servicio en el que tienes una base de datos muy grande y es escalable los procedimientos que se emplean para consultas, insertar nuevos datos, además te aseguran velocidad en transferir estos datos . 2. ¿Cómo se relacionan? Data mining a final de cuentas es inteligencia artificial, y este es el gran panorama. Es un concepto muy poderoso dependiendo de su uso y el tipo de información que se utiliza hace que tome un nombre diferente, si el análisis de los datos es para toma de decisiones dentro de la empresa toma el nombre de Business Intelligence, si se quiere reducir la cantidad de datos para que computacionalmente no sea tan costoso se le llama big data. El usar el prefijo data comercialmente vende mucho, pero son las mismas técnicas que se han usado desde los 70’s, pero en las actualidad es más accesible porque la mayoría de las personas tenemos acceso a internet. 3. ¿Como se usa esto en las empresas? Todas las empresas puede usar Data mining, pero dependiendo el enfoque es la técnica que se va a usar, si la intención es analizar factores internos se puede usar Business Intelligence, si la empresa se dedica al campo de la genética se usaría Data Science, etc. Y estas técnicas no están reservadas solo para empresas grandes ya que en la actualidad cualquier empresa de cualquier tamaño puede acceder a ellas de maneras diferentes. Se debe hacer un trabajo en conjunto, ya que a partir de una problemática se debe extraer información específica y la persona dentro de la empresa debe ser capaz de decidir qué tipo de datos se van a extraer para trabajar con ellos, ya que entre más información de análise se vuelve más costoso. 4. ¿Qué ley o legislación regula esto? No existe una ley como tal por que se habla de información. Hay un carácter social que habla de la confidencialidad de la información y al aceptar compartir la información se vuelve propiedad de con quien tú decides compartirla. Sin embargo el uso que se le da a la información depende de quien la tenga y hay que cuidar mucho esa parte. 5. ¿En función a que varia el costo? Hay paquetes dependiendo de las necesidades de consulta y los proveedores de los servicios, pueden ser desde 100 dls al mes o mucho más. 6. ¿Qué opina sobre el caso de Mark Zuckerberg CEO de Facebook y de Sundar Pichai CEO de Google? El manejo de información es algo muy subjetivo que podríamos pasar mil años discutiendo y nadie va a tener la respuesta, como usuarios sabemos que la información está en línea y si por ejemplo nuestro vecino sabe algo de hacking la puede obtener, en realidad estamos expuestos, y si las personas tienen acceso a su información es porque ellos la subieron y en su mayoría no es información tan relevante. En cambio sería algo más riesgoso si la base de datos del INE por ejemplo fuera pública, o las bases de datos de los bancos. En el caso de Google los algoritmos tienen su fundamento en Machine Learning y esos algoritmos aprenden por sí solos, y si tu usas Google ayudas a que el algoritmo aprenda respecto a la entrada de información. 7. ¿Qué avances o tendencias tecnológicas hay para el manejo de información empresarial? Hay varias herramientas unas de ellas son Zack y SPSS que presentan la información de una base de datos como un excel y permite reducir la información, categorizarla, organizarla, y usar algoritmos para analizar la información, sin embargo estas herramientas pueden llegar a costar hasta $ 400,000.00 pesos la licencia, pero Phyton tiene muchas librerías que hacen lo mismo pero debes tener conocimientos de programación para usar estas librerías y estos algoritmos. 8. ¿De qué manera se puede minimizar la crítica sobre el manejo de información y su buen uso? Es algo muy difícil porque esto depende mucho de la ética y educación que ha recibido cada persona. Cada quien debe ser consciente de sus acciones y de las consecuencias de las mismas. Y es cuestión de criterio. 9. ¿Qué recomendaciones tiene para el manejo de información y su interpretación? Aunque muchas personas piensan que excel es una herramienta bastante rudimentaria, es una opción muy accesible y popular, además permite que con sus macros se pueda programar y adaptarse a las necesidades de cada problemática. Las herramientas que se mencionan anteriormente son muy prácticas y no hay necesidad de programar sin embargo no están al alcance de todos. También se puede hacer uso de sistemas hechos a la medida de las necesidades de la empresa pero el costo varia mucho de cada problemática. 10. ¿Existen opciones comerciales accesibles para empresas pequeñas o emprendedores para data mining? Si exiten, dos de ellas son Microsoft Azure y Google Cloud que son proveedores de estas técnicas de inteligencia artificial y ofrecen diferentes precios dependiendo de lo que ofrece cada paquete y el uso de la información ya que si es para algo comercial tiene un precio, si es para investigación u objetivos académicos tiene otro precio.
Compartir