Logo Studenta

Bigdata y Data mining

¡Estudia con miles de materiales!

Vista previa del material en texto

MINERIA DE DATOS
1. ¿Qué es big data y data mining?
Data mining se trata de encontrar relaciones dentro de la información que tienes, por
lo general tienes una base de datos de tal tamaño y demás y tratas de extraer
información de esa base de datos; de cierta manera a grandes rasgos se puede
decir que estas filtrando información. Y el big data como comercialmente lo manejan
las empresas es tener un servicio en el que tienes una base de datos muy grande y
es escalable los procedimientos que se emplean para consultas, insertar nuevos
datos, además te aseguran velocidad en transferir estos datos .
2. ¿Cómo se relacionan?
Data mining a final de cuentas es inteligencia artificial, y este es el gran panorama.
Es un concepto muy poderoso dependiendo de su uso y el tipo de información que
se utiliza hace que tome un nombre diferente, si el análisis de los datos es para toma
de decisiones dentro de la empresa toma el nombre de Business Intelligence, si se
quiere reducir la cantidad de datos para que computacionalmente no sea tan costoso
se le llama big data. El usar el prefijo data comercialmente vende mucho, pero son
las mismas técnicas que se han usado desde los 70’s, pero en las actualidad es más
accesible porque la mayoría de las personas tenemos acceso a internet.
3. ¿Como se usa esto en las empresas?
Todas las empresas puede usar Data mining, pero dependiendo el enfoque es la
técnica que se va a usar, si la intención es analizar factores internos se puede usar
Business Intelligence, si la empresa se dedica al campo de la genética se usaría
Data Science, etc. Y estas técnicas no están reservadas solo para empresas
grandes ya que en la actualidad cualquier empresa de cualquier tamaño puede
acceder a ellas de maneras diferentes.
Se debe hacer un trabajo en conjunto, ya que a partir de una problemática se debe
extraer información específica y la persona dentro de la empresa debe ser capaz de
decidir qué tipo de datos se van a extraer para trabajar con ellos, ya que entre más
información de análise se vuelve más costoso.
4. ¿Qué ley o legislación regula esto?
No existe una ley como tal por que se habla de información. Hay un carácter social
que habla de la confidencialidad de la información y al aceptar compartir la
información se vuelve propiedad de con quien tú decides compartirla. Sin embargo el
uso que se le da a la información depende de quien la tenga y hay que cuidar
mucho esa parte.
5. ¿En función a que varia el costo?
Hay paquetes dependiendo de las necesidades de consulta y los proveedores de los
servicios, pueden ser desde 100 dls al mes o mucho más.
6. ¿Qué opina sobre el caso de Mark Zuckerberg CEO de Facebook y de Sundar Pichai
CEO de Google?
El manejo de información es algo muy subjetivo que podríamos pasar mil años
discutiendo y nadie va a tener la respuesta, como usuarios sabemos que la
información está en línea y si por ejemplo nuestro vecino sabe algo de hacking la
puede obtener, en realidad estamos expuestos, y si las personas tienen acceso a su
información es porque ellos la subieron y en su mayoría no es información tan
relevante. En cambio sería algo más riesgoso si la base de datos del INE por
ejemplo fuera pública, o las bases de datos de los bancos. En el caso de Google los
algoritmos tienen su fundamento en Machine Learning y esos algoritmos aprenden
por sí solos, y si tu usas Google ayudas a que el algoritmo aprenda respecto a la
entrada de información.
7. ¿Qué avances o tendencias tecnológicas hay para el manejo de información
empresarial?
Hay varias herramientas unas de ellas son Zack y SPSS que presentan la
información de una base de datos como un excel y permite reducir la información,
categorizarla, organizarla, y usar algoritmos para analizar la información, sin
embargo estas herramientas pueden llegar a costar hasta $ 400,000.00 pesos la
licencia, pero Phyton tiene muchas librerías que hacen lo mismo pero debes tener
conocimientos de programación para usar estas librerías y estos algoritmos.
8. ¿De qué manera se puede minimizar la crítica sobre el manejo de información y su
buen uso?
Es algo muy difícil porque esto depende mucho de la ética y educación que ha
recibido cada persona. Cada quien debe ser consciente de sus acciones y de las
consecuencias de las mismas. Y es cuestión de criterio.
9. ¿Qué recomendaciones tiene para el manejo de información y su interpretación?
Aunque muchas personas piensan que excel es una herramienta bastante
rudimentaria, es una opción muy accesible y popular, además permite que con sus
macros se pueda programar y adaptarse a las necesidades de cada problemática.
Las herramientas que se mencionan anteriormente son muy prácticas y no hay
necesidad de programar sin embargo no están al alcance de todos. También se
puede hacer uso de sistemas hechos a la medida de las necesidades de la empresa
pero el costo varia mucho de cada problemática.
10. ¿Existen opciones comerciales accesibles para empresas pequeñas o
emprendedores para data mining?
Si exiten, dos de ellas son Microsoft Azure y Google Cloud que son proveedores de
estas técnicas de inteligencia artificial y ofrecen diferentes precios dependiendo de lo
que ofrece cada paquete y el uso de la información ya que si es para algo comercial
tiene un precio, si es para investigación u objetivos académicos tiene otro precio.

Continuar navegando