Roadmap 2024 – Data Engineering en Español

Aug 24, 2020 | Educational

Un repositorio más con conceptos básicos, desafíos técnicos y recursos sobre ingeniería de datos en español

¿Te gustaría aportar al repositorio? Visita la guía de contribución

Nota: la siguiente ruta de aprendizaje está diseñada a criterio personal con la idea de facilitar el estudio de aquellos interesados en la ingeniería de datos con material libre, gratuito y en español que encontré en internet. No es una guía definitiva ni un curso, es una lista de recursos que puede ser mejorada con el tiempo con contribuciones de la comunidad.

Libros de ingeniería de datos en inglés

Roadmap illustration

Programación

Comenzamos con la comprensión de los conceptos fundamentales de programación y lógica. Esta sección puede ser desarrollada simultáneamente con el aprendizaje del lenguaje de programación que elijan.

Lenguaje de programación

Recomiendo iniciar con Python debido a su curva de aprendizaje amigable y su prevalencia en la industria actual. No obstante, es importante destacar que el procesamiento de datos también puede realizarse con R, Java, Scala, Julia, entre otros.

Control de versiones con Git

El aprendizaje sobre el control de versiones no solo es valioso al trabajar en equipos, sino que también nos proporciona la capacidad de rastrear, comprender y gestionar los cambios realizados en nuestro proyecto y así mantener un desarrollo eficiente y colaborativo.

Más herramientas

Bases de datos

Fundamentos

En esta instancia toca aprender sobre las bases de datos. La elección del gestor de bases de datos a utilizar queda a tu criterio, aunque personalmente recomiendo PostgreSQL para datos estructurados y MongoDB para datos no estructurados. Sin embargo, existen muchas otras opciones: MySQL, SQLite y demás.

SQL

También aprenderás SQL, un lenguaje de consulta para gestionar y manipular las bases de datos relacionales.

Diseño

Ahora seguimos con conceptos más avanzados que nos servirán para diseñar bases de datos, datalake, datawarehouses, esquemas, etcétera.

Big Data

Lo siguiente es entender algunos conceptos de Big Data. Además, resulta interesante adquirir conocimientos básicos sobre inteligencia artificial, inteligencia de negocios y análisis de datos sin la necesidad de profundizar demasiado.

Fundamentos

Analítica (opcional)

Inteligencia artificial (opcional)

Inteligencia de negocios (opcional)

Procesamiento de Datos

En esta sección está el corazón de la ingeniería de datos. Veremos qué son los data pipelines, qué es un ETL, orquestadores, y más. Además, dejo una lista de conceptos clave que voy a ir actualizando con sus recursos respectivos a futuro, si te interesa aprenderlos en detalle, podés buscar en los libros subidos en el repositorio.

ETL y Data Pipelines

Bases de datos avanzados

  • Modelo relacional
  • Modelo dimensional
  • Facts y dimensiones
  • Datalake, Datamart, Datawarehouse y Dataqube
  • Diseño por columnas y basada por filas
  • Esquemas star y snowflake
  • Esquemas on read y on write

Orquestadores

Arquitecturas

Testing

Cloud

Es útil tener conocimientos de cloud computing. Llegado a este punto, te recomendaría considerar la preparación de certificaciones oficiales. Aunque estos exámenes suelen tener un costo, puedes encontrar recursos de preparación gratuitos y oficiales de los proveedores más conocidos en la industria.

Fundamentos de la nube

Certificaciones oficiales

Búsqueda Laboral

Finalmente, te dejo algunas lecturas y videos que ofrecen consejos y experiencias relacionadas con la búsqueda laboral en el ámbito de sistemas. Más adelante, se agregarán desafíos técnicos y otros recursos vinculados al tema.

Consejos

Desafíos técnicos

Conclusión

En este vasto viaje hacia la maestría en ingeniería de datos, recuerda que cada paso cuenta. Aprovecha estos recursos, aprende de ellos y no dudes en contribuir al repo. Sé el arquitecto de tu futuro en la tecnología.

Solución de Problemas

Si te enfrentas a cualquier dificultad mientras navegas por este repositorio o al usar los recursos proporcionados, aquí van algunas ideas prácticas:

  • Consulta la sección de comentarios en cada curso o video; a menudo, otros usuarios pueden haber tenido y resuelto problemas similares.
  • Revisa tu conexión a internet; la mayoría de los recursos son en línea y necesitan una buena conexión.
  • Usa foros como Stack Overflow para hacer preguntas específicas, siempre proporcionando detalles sobre tu problema.
  • Si el repositorio parece desactualizado, busca versiones más recientes o alternativas en otras plataformas.

Para más insights, actualizaciones, o para colaborar en proyectos de desarrollo de IA, mantente conectado con fxis.ai.

At fxis.ai, creemos que tales avances son cruciales para el futuro de la IA, ya que permiten soluciones más completas y efectivas. Nuestro equipo está continuamente explorando nuevas metodologías para superar los límites en inteligencia artificial, asegurando que nuestros clientes se beneficien de las últimas innovaciones tecnológicas.

Stay Informed with the Newest F(x) Insights and Blogs

Tech News and Blog Highlights, Straight to Your Inbox