Logo Studenta

Resumo Informática Básica - Faculdade de Bogotá 28

¡Estudia con miles de materiales!

Vista previa del material en texto

Resumen 14: Ciencia de datos 
 
La ciencia de datos es un campo interdisciplinario que combina conocimientos de programación, estadística y 
experiencia en la materia para extraer información útil de grandes volúmenes de datos. 
Proceso de ciencia de datos: 
 
1. Recopilación de datos: esto implica obtener datos relevantes de diversas fuentes, como 
bases de datos, sensores y la web. 
2. Limpieza y preparación: los datos a menudo requieren limpieza y formateo para ser 
útiles. 
 
3. Análisis exploratorio: implica la creación de visualizaciones y estadísticas descriptivas para 
comprender los datos. 
 
4. Modelado de datos: La creación de modelos estadísticos o de aprendizaje automático para hacer predicciones 
o descubrir patrones. 
5. Comunicación de Resultados: Los resultados se comunican de una manera clara y visualmente atractiva para 
ayudar en la toma de decisiones. 
Herramientas de ciencia de datos: las herramientas populares incluyen Python (con bibliotecas como Pandas y 
Scikit­Learn), R, SQL y Jupyter Notebooks. 
Aplicaciones de la ciencia de datos: la ciencia de datos se aplica en sectores como los negocios, la investigación 
académica, la atención médica, las finanzas y la gobernanza.

Continuar navegando