Logo Studenta

IFM - Big Data

¡Este material tiene más páginas!

Vista previa del material en texto

Conociendo los beneficios de la relación de Big Data y Cloud 
Computing 
 
 
 
 
 
Juan Pablo Martínez Beltrán 
 
 
Universidad Libre 
Facultad de Ingeniería 
Ingeniería de Sistemas 
 
 
 
 
 
 
Bogota D.C. 
 
 
 
Septiembre 2017 
 
 
Conociendo los beneficios de la relación de Big Data y Cloud 
Computing 
 
 
 
 
 
Resumen 
 
 
La presente monografía pretende expresar las ventajas de la relación entre las 
herramientas Big Data y Cloud Computing como facilitadores en el proceso de 
administración de datos. 
El avance de las tecnologías de la información pretende generar mejoras en los 
procesos de una organización y para ello es esencial que la gestión y análisis de 
datos masivos, evite el uso de herramientas convencionales. 
Big Data ha permitido que los datos sean fáciles de entender sin importar su origen 
estructurado o no estructurado, haciendo uso de la minería de datos y estadística. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Introducción 
 
 
 
La administración de información masiva y su disponibilidad son aspectos 
fundamentales que debe tener en cuenta una organización, por lo tanto, es 
necesario definir conceptos como Big data y Cloud Computing. Además, de 
establecer la planeación para lograr implementar de manera adecuada estas 
tecnologías. 
El propósito fundamental del presente documento es identificar la relación y los 
beneficios que existen en la utilización de Cloud Computing y Big Data en una 
organización, resaltando los atributos de cada una de ellas. 
A continuación, se destacan importantes conceptos a tener en cuenta para 
determinar la relación que los asocia. 
 
 
 
 
 
 
 
 
 
 
Que es Big data 
 
Es la tendencia en el avance de la tecnología que ha abierto las puertas hacia un 
nuevo enfoque de entendimiento y toma de decisiones, es utilizada para describir 
cantidades de datos (estructurados, no estructurados y semi estructurados) y 
cargarlos a una base de datos relacional para su análisis. La finalidad del Big data 
es obtener resultados en tiempo real 
La importancia de tener un conjunto de datos Big Data es el análisis de datos para 
obtener un resultado predictivo a través de estadística inferencial y minería de datos. 
En la actualidad existen diversas herramientas como Hados, avro, Cassandra, 
chukwa, Flume, Hbase y Hive, que permiten el manejo y la implementación de Big 
Data. 
Ventajas de Big data 
 
Diariamente, se generan grandes volúmenes de información no estructurada pero 
que debe estar disponible en cualquier momento. Para ello el Big Data proporciona 
distintos métodos como filtrados de datos, análisis semántico y clasificación de 
datos, para realizar la gestión de estos datos y convertirlos en datos estructurados. 
Además, se puede hablar de que cada vez existen más medios de información. 
Actualmente la información la obtenemos de periódicos digitales, Twitter, Facebook 
u otros medios sociales a nuestro alcance, generando más fuentes de datos. 
Big data ha llegado precisamente para cubrir las deficiencias que dejan las 
herramientas analíticas convencionales y permite cantidad de nuevas 
oportunidades. 
 
 
 
Herramientas 
 
Hoy en día para hablar de Big data es necesario mencionar algunas plataformas de 
las Hadoop, Cassandra, chukwa, Flume, Hbase y Hive para gestionar proyectos 
de Big data, permiten el procesamiento en paralelo de grandes cantidades de 
datos (estructurados y desestructurados) a través de clústeres de servidores. 
Hadoop, además, ofrece la posibilidad de crecer de manera escalable y llegar a 
trabajar con miles de nodos y un volumen de datos del orden de peta bytes. 
A continuación, describiré una serie de requerimientos recomendables en cualquier 
proyecto de Big data: 
• Capacidad de almacenamiento y procesamiento: Big data necesita una 
gran cantidad de almacenamiento y capacidad de computación 
(CPU). Hadoop funciona, separando los datos capturados en pequeños 
bloques y distribuyéndolos entre varios servidores, lo que permite el 
procesamiento de grandes volúmenes de datos con un mejor rendimiento y 
latencias mínimas, con la posibilidad de análisis en tiempo real. 
• Escalabilidad: Un proyecto de Big data se caracteriza por tener una serie de 
picos de demanda con grandes necesidades en cuanto a almacenamiento y 
procesamiento de datos, seguidos de periodos de poca actividad en los 
servidores. Sería deseable, por tanto, poder incrementar o disminuir la 
infraestructura tecnológica según las necesidades de cada momento. 
• Control de costo: Abordar cualquier proyecto de este tipo mediante la 
adquisición de un modelo en propiedad de toda la infraestructura necesaria 
implica una inversión inicial, lo que provocaría que muchas compañías 
desistieran de utilizar Big Data. 
 
 
Tendencias 
 
Las smart cities, Smart grids, la industria 4.0, las redes sociales, las tecnologías 
cognitivas, el wifi óptico, los sistemas ciber-físicos, la tecnología móvil, las redes 5G 
y las nuevas formas de pago (como las tarjetas contactless y las aplicaciones 
móviles que permiten realizar pagos) son herramientas que hacen uso del Big Data. 
 
Big Data, el Cloud Computing y el Internet de las Cosas marcan las principales 
tendencias en el sector de las TIC. Así se desprende del informe “Tendencias en el 
Mercado de la Ciberseguridad” publicado por el Instituto Nacional de 
Ciberseguridad. 
 
En cuanto al internet de las cosas, es un paradigma en el que los objetos cotidianos 
estarán conectados a Internet. 
 
A medida que se produzca el despegue del “Internet de las cosas” y los dispositivos 
portátiles, se producirán cada vez más datos generados por máquinas de los que 
podrán aprovecharse las organizaciones. 
 
 
 
 
 
 
 
 
 
 
 
https://www.incibe.es/sites/default/files/estudios/tendencias_en_el_mercado_de_la_ciberseguridad.pdf
https://www.incibe.es/sites/default/files/estudios/tendencias_en_el_mercado_de_la_ciberseguridad.pdf
¿Qué es Cloud Computing? 
 
En la actualidad el Cloud Computing es un servicio reconocido en todo el mundo, 
por lo que brinda la oportunidad de tener un gran almacenamiento, sin necesidad 
de tener una infraestructura amplia, ajustándose a los requerimientos de cada 
cliente. 
Cloud Computing es la mejor alternativa de almacenamiento para Big Data, porque 
ofrece alta disponibilidad de la información en tiempo real y soporta el cargue 
masivo de datos. 
Esta información es guardada en data centers que actualmente existen y cuyas 
empresas grandes como IBM, Microsoft, Apple, Amazon, entre otros; almacenan 
una gran cantidad datos diarios que son generados por los usuarios. 
“Inicialmente beneficia financieramente a la empresa, le permite controlarse a través 
de presupuestos flexibles, utilizar modelos de economía de escala y destinar 
recursos financieros a diferentes inversiones, sin tener que recurrir a procesos de 
descapitalización o financiamientos con un costo del dinero que en ocasiones es 
bastante alto. Por otro lado, impacta en el modelo de compensación salarial, hoy 
por hoy, podemos pensar de manera más tangible, en esquemas de pago basados 
cien por ciento en resultados (para ciertos niveles de la organización), y no por 
cumplir horarios frente a una computadora, invariablemente esto obligará a los 
funcionarios de la empresa a ser más productivos e impactar en la efectividad de la 
empresa.” 
(“Cloud Computing: definición y como impacta a una organización”,2015) 
Ventajas de Cloud 
 
Una ventaja del uso del Cloud Computing es que no debe ser una preocupación la 
disposición, desarrollo, operación y mantenimiento de una infraestructura de 
almacenamiento propia, compuesta por software y hardware, esta tarea la realiza el 
proveedor del servicio. Además del almacenamiento de datos, con el Cloud 
Computing se pueden disponer de otras herramientas como aplicaciones y redes 
internas para la empresa. 
La necesidadde las empresas de sacar valor a los datos ha hecho aumentar las 
necesidades de tecnologías Cloud o de computación en la nube. Entre estas 
tecnologías nos encontramos con la computación elástica, un sistema de 
computación similar al uso eficiente de electricidad. El servicio se da o no, 
dependiendo de la demanda de uso de un determinado recurso. El sistema de 
computación elástico permite adaptar el uso de los recursos computacionales 
dependiendo del aluvión de datos, su tamaño, tipo, velocidad de estos, para dar una 
respuesta más efectiva. 
 
Seguridad en Cloud 
 
En cuanto a ubicación y nivel de seguridad, las empresas de servicios en la nube 
cuentan con varios servicios: Público, Privado dedicado o compartido e Híbrido. 
En el servicio nube pública se tiene acceso general a servicios y recursos de 
computación Cloud mediante una conexión pública a través de Internet. 
 
La nube privada, es donde los servicios y recursos de computación en la nube están 
en una red privada, con acceso restringido a usuarios de la organización. Los 
sistemas de seguridad son más altos, debido al tipo de sensibilidad de los datos que 
se almacenan, siendo necesario mantener la confidencialidad, la privacidad y la 
integridad de los datos. 
 
La nube híbrida, es el nivel que combina las características de los servicios Cloud 
públicos y privados. Estos servicios se utilizan cuando existen datos Cloud privados 
que se ofertan en Cloud públicos o cuando existe una colaboración de distintos 
proveedores de servicios en la nube. Estos servicios ofrecen ahorro, seguridad, 
flexibilidad y escalabilidad. 
 
Ventajas de la relación 
 
“La alianza entre Big Data y el Cloud facilita métodos de análisis nuevos e 
integrados, cuyos resultados están incluidos directamente en decisiones 
empresariales y aún pueden generar nuevos procesos de negocio”. 
(“El big data requiere aportación tecnológica”, 2013) 
 Big data y Cloud Computing son herramientas que han permitido innovar y han 
cambiado los modelos de negocio y funcionamiento de las tecnologías, además de 
mejorar el manejo de la información. 
En el siguiente grafico se pueden observar las características que diferentes 
sectores con la implementación del Big Data y Cloud Computing. 
 
Tabares Hernandez. 2014. Resumen de aplicaciones de Big Data. Imagen 1. Tomado de Big Data Analytics 
De acuerdo con lo que se establece en el cuadro, la implementación del Big data 
optimiza los diferentes procesos en un sector determinado, además se puede 
identificar que se puede aplicar a cualquier situación sin alguna restricción, también 
muestra el impacto que puede generar en la realización de alguna actividad 
científica, en temas de mercadeo y el sector salud. 
 
En la imagen 2 se observan las ventajas y beneficios de cada herramienta y los 
resultados que se obtienen al implementar estás dos tecnologías, mostrando como 
se pueden relacionar, adicionalmente el uso de Cloud con Big Data proporciona un 
complemento adecuado para que los resultados sean precisos ante la necesidad de 
cada organización. 
 
SAS Colombia on SAS Latín América. 2014. "Big Data y la nube: Un matrimonio bien avenido". Imagen 2 
 
El camino que marca la imagen se puede entender que son las características que 
genera en la relación de estas dos tecnologías y como, paso a paso se realiza la 
implementación. También se exponen aspectos para tener en cuenta durante la 
planeación estratégica de ambas herramientas en una organización. 
El Big Data brinda Veracidad, Velocidad, Valor y Volumen, conceptos conocidos 
como las 4 V. Con esto las organizaciones obtienen como ventaja eficiencias 
operativas, reducción de costos en infraestructura y mayor transformación de las 
tecnologías. 
En el Cloud Computing ofrecen implementación a sistemas CRM y ERP, además 
de ofrecer infraestructura como servidores, bases de datos y seguridad, permitiendo 
agilidad y escalabilidad en sus procesos. 
 
Modalidades de Cloud para Big Data 
 
La modalidad infraestructura facilita el uso de servidores a bajo nivel controlando el 
sistema operativo, el uso de memoria, tecnología de almacenamiento en disco. 
 
Con la modalidad de entorno pre configurado, el proveedor ofrece el servicio Cloud 
con los lenguajes de programación necesarios (Java, Python, Ruby, entre otros) y 
con esto alguna de la herramientas que se utilicen se encargara de recoger y 
analizar los datos. 
 
La última modalidad es la de software como servicio Cloud, que te proporciona un 
entorno para trabajar directamente con Big Data. Se realiza el procesamiento y 
análisis de los datos de manera transparente, almacenando la información 
generada. 
 
 
 
 
Seguridad y privacidad Big data 
 
Algo que preocupa a los usuarios del Big Data es su privacidad, por lo que 
desconocen la ubicación de los dispositivos que almacenan su información. 
Mientras la mayor preocupación por parte de las organizaciones es que sus datos 
estén mal gestionados, generando complejidad en el análisis de su información. 
Las compañías deben garantizar una administración adecuada a los datos, para ello 
se debe contar con la autorización de los usuarios para su uso. 
 
t-Systems, 2013. “Big data y el Cloud para recursos”. Imagen 3. Tomado de T – Systems 
 
En la imagen 3 se puede identificar los pasos que se deben desarrollar para un 
proyecto con Big Data y Cloud Computing. Además, se basa en seguridad y 
privacidad para brindar una satisfacción al cliente final. También se es necesario 
establecer estrategias para su implementación. 
 
 
 
 
 
 
 
 
 
 
 
Conclusiones 
 
 
 
 
 
Durante más de 10 años el uso de estas tecnologías ha permitido conocer la 
relación que existe entre Big Data y el Cloud Computing, además, de lograr 
establecer las características y los beneficios que se obtienen realizando la 
implementación de las dos herramientas. 
Identificar el impacto que puede generar para una organización el uso de Cloud 
Computing para el almacenamiento de la información, relacionado con la 
administración de los datos que permite Big Data, brindara un objetivo para el 
manejo correcto para lograr la optimización de los recursos y de los procesos 
establecido para una entidad. 
Estas tecnologías han permitido que la información pueda ser de utilidad y genere 
ventajas económicas y competitivas en una organización. 
 
 
 
Bibliografía 
 
• Maté Jiménez, C. (2014). Big data. Un nuevo paradigma de análisis de datos. 
 
• Torres, J. (2012). Del cloud computing al big data. Visión introductoria para 
jóvenes emprendedores. 
 
 
• i Viñals, J. T. (2012). Del cloud computing al big data. universitat oberta de 
catalunya, Barcelona. 
 
• Purcell, B. M. (2014). Big data using cloud computing. Journal of Technology 
Research, 5, 1. 
 
 
• Purohit, P., Apoorva, D. R., & Lathashree, P. V. (2017). Big Data in Cloud 
Computing. International Journal of Advance Research, Ideas and 
Innovations in Technology, 3(3), 1312-1318. 
 
• Tanque, M., & Foxwell, H. J. (2017). Big Data and Cloud 
Computing. Exploring the Convergence of Big Data and the Internet of 
Things, 1. 
 
Webgrafía 
 
• Incibe. 2016. Tendencias en el Mercado de la Ciberseguridad. Audea. 
http://www.audea.com/es/big-data-cloud-computing-internet-las-cosas-
principales-tendencias-sector-las-tic/. 
 
• Lidia Montes. 2016. 'Cloud Computing' y 'Big data' para el turismo. El Mundo. 
http://www.elmundo.es/economia/2016/04/20/57174807e5fdea8d5c8c0696.
html 
 
• BBVA. 2015. BBVA Api Market. https://bbvaopen4u.com/es/actualidad/la-
union-hace-la-fuerza-big-data-mas-cloud-computing 
 
• Ahmed Banafa. 2015. Cloud Computing, Big Data y movilidad en 2015. 
OpenMind. https://www.bbvaopenmind.com/cloud-computing-big-data-y-
movilidad-tendencias-tecnologicas-en-2015/ 
• Carlos Santana. 2013. Cloud Computing para empresas, las ventajas de la 
nube. http://blog.acsendo.com/cloud-computing-para-empresas-las-ventajas-de-la-nube/ 
 
• T Systems. 2013. BIG DATA Y CLOUD – UNA ALIANZA PERFECTA. T 
Systems. https://www.t-systems.com/es/es/soluciones/cloud/topics/big-
data/big-data-109832. 
 
• Julian Garcia Barbosa. 2013. Cloud computing, el mejor camino para acceder 
al big data. Telefonica. https://aunclicdelastic.blogthinkbig.com/cloud-
computing-mejor-camino-para-acceder-al-big-data/ 
 
 
• IIC. 2016. Big Data y la nube: los servicios Cloud. Instituto de Ingeniería del 
Conocimiento. España. http://www.iic.uam.es/innovacion/big-data-la-nube-
servicios-cloud/

Continuar navegando

Materiales relacionados

45 pag.
SiS4tro - Adalberto Garza

User badge image

Desafío México Veintitrés

18 pag.
Historia_BaseDeDatos - Adalberto Garza

User badge image

Desafío México Veintitrés

2 pag.
1 4 Arquitecturas basadas en servicios

IPN

User badge image

Antony A García Pérez