bootcamp
Bootcamp Data Science & Big Data para el mundo real
¿Sabrías definir la diferencia entre Big Data y Data Science?
¿Tienes claro qué problemas resuelven y para qué se usan los algoritmos de DS en el mundo empresarial?
¿Sabes cuáles son los principales frameworks que emplean los científicos de datos *top* de manera profesional ahora mismo?
¿Cuánto cobra un científico de datos junior en promedio? ¿Y un senior? ¿Cuántos años necesito para convertirme en senior?
Descubre la respuesta a ésta y otras preguntas aquí
La ciencia de datos, Data Science, y el Big Data son disciplinas en plena explosión laboral. La industria demanda cada vez más y más perfiles técnicos formados en esta disciplina, y el resultado de la falta de los mismos es una burbuja laboral que ha inflado los salarios de dichos perfiles. Las empresas muchas veces son incapaces de retener a aquellos que son realmente buenos debido a la incesante guerra de sueldos y, si bien se predice una estabilización de esta situación según aparezcan nuevos titulados de las carreras que han comenzado a ofertar las instituciones públicas y privadas, serán aquellos que para entonces hayan alcanzado una cierta veteranía en la materia los que lideren los departamentos de IA en las empresas.
Es debido a la especial coyuntura que demuestra el mercado alrededor de esta disciplina que Academia Universo ha conseguido convencer a un profesor fuertemente ligado al estado del arte de esta industria para ofrecer un crash course que te permitirá, partiendo de cero, alcanzar un conocimiento suficiente para comenzar como Junior (y mejor que la mayoría de Juniors) en cualquier empresa en tan sólo cuatro meses de clases intensivas. Los horarios han sido planteados de manera que sean compatibles con una jornada laboral completa, de forma que cualquiera con interés pueda asistir.
Sobre el profesor
Carlos De Las Heras Peña
Carlos De Las Heras Peña es un científico de Datos Senior con amplia experiencia en el mundo del machine learning y el Big Data.
Ingeniero Aeronáutico titulado, nunca ejerció como tal sino que rápidamente entró en el mundo del análisis de datos a gran escala. Sus varios años de experiencia en consultoría le han permitido participar en proyectos en sectores como la banca, el mundo farmacéutico, el sector de la energía y en online advertising. Además, ha tenido la oportunidad de trabajar como profesor y más tarde como coordinador académico de la mayor transformación empresarial a nivel mundial de un banco hacia disciplinas relacionadas con el Big Data en países como EEUU, Perú, Turquía y España.
Actualmente trabaja en la Gran Vía en una start-up premiada y reconocida mundialmente focalizada en el mercado del video online.
Bootcamp en Guadalajara
¿Dónde?
El curso se impartirá en Academia Universo, ubicado en Guadalajara:
Cuesta de Hita, 19. Teléfono de contacto: 640 19 08 75
Horario
Viernes de 18:00 a 22:00
Sábados de 9:00 a 15:00
Requisitos
Únicamente será necesario que vengas con tu portátil a clase. 8 GB de ram y 50 GB de espacio libre en el disco.
¿Qué conocimientos previos se necesitan para poder acceder al curso?
El curso asumirá que sabes usar un ordenador y tienes cierta soltura con ello.
No necesitas conocimientos específicos de ningún lenguaje de programación, pero si nunca has programado te recomiendo que contactes con la academia para que podamos asesorarte personalizadamente acerca de recursos a los que puedes acudir para obtener una serie de intuiciones básicas que te ayudarán tremendamente a sobrellevar el curso sin morir en el intento (llamémoslo pensamiento de programador). Es muy aconsejable tener un mínimo de soltura con conceptos matemáticos y estadísticos básicos, aunque en caso de no poseerlos el único efecto será un incremento de la dificultad del curso, ya que es autocontenido.
Especificaciones técnicas
El curso se imparte en Linux. Habrá gente que se preguntará por qué. La respuesta es tan sencilla como que muchas de las herramientas que se utilizan de forma profesional en el mundo de la ciencia de datos y del Big data tienen una configuración mucho más difícil en Windows. MacOS se parece mucho más a Linux, por lo que será aceptado. Durante el transcurso del primer día de curso nos dedicaremos a instalar, con ayuda del profesor, el sistema Linux en los ordenadores de todos los alumnos. También aprenderemos a manejarnos lo suficiente como para dar el curso. Creednos, es ahora o cuando empecéis a trabajar.
Si eres realmente old school podrás traerte un cuaderno y lápiz, pero el árbol que hay a la entrada tiene la rama muy larga y no respondemos por su conducta.
¿Por qué hacer este curso?
Estás ante un curso que demandará de ti una gran dedicación para superarlo con éxito y asimilar sus conceptos. Queremos ser sinceros y advertir que la ciencia de datos no es una disciplina sencilla, ya que demanda conocimientos de muchas áreas diferentes. Sin embargo, podemos asegurarte que es más importante el compromiso con el curso que el conocimiento previo para que puedas salir de aquí convertido en un profesional perfectamente cualificado para el mundo empresarial actual.
Comparado con otros cursos y másters, los apartados de Machine Learning pueden parecer menos avanzados, esto se debe a tres motivos:
El objetivo de este curso es que lo entiendas
No queremos llenarnos la boca de términos sofisticados. El único objetivo de este curso es que lo entiendas y aprendas lo máximo posible.
Está orientado a la aplicación del Machine learning en el mundo laboral real
Esto significa que disminuimos el contenido puramente teórico al mínimo y maximizamos el contenido práctico. Muchos máster arrastran una gran herencia matemática y teórica, reflejo de los profesores que la imparten, habitualmente doctorandos con poca experiencia en el mundo laboral y por tanto con un mayor interés en aspectos con escasa aplicación a día de hoy.
Es un curso pensado para partir de cero
Este no es el curso más avanzado del mundo. Es un curso pensado para partir de cero. Por lo tanto sí, es posible que ciertas partes del temario sean menos avanzadas comparadas con ese otro master que tienes en mente.
Syllabus
A lo largo del curso descubriremos:
Instalación de linux e inicio del curso
Inicio del curso.
1. Proyectos basados en ciencia de datos
1. ¿En qué consiste un proyecto de ciencia de datos? Diferencia entre vender humo y aportar valor.
2. Explicación del boom actual y por qué ha llegado para quedarse.
3. ¿Cuál es la posición “política” del científico de datos en la empresa y por qué debería preocuparme?
1. Introducción a la programación con Python
2. Versionado de proyectos a través de Git
3. Creación de procesos ETL en Pandas
4. Apificación de procesos. Cómo crear código estructurado y mantenible.
3. Workshop: Tu primer proyecto de Data Science
Workshop: Tu primer proyecto de Data Science
1. Visualización de datos en Python
2. Exploración y limpieza de datos orientada a la ciencia de datos
3. Introducción a Machine learning: metodología de los ciclos entrenamiento-predicción-validación
5. Workshop: Compitiendo en Kaggle
Workshop: Compitiendo en Kaggle
6. Machine Learning Fundamentals
1. Introducción a Machine learning II: Predicción supervisada, no supervisada, semi-supervisada. Bias vs variance.
2. Modelos regresores
3. Modelos clasificadores
4. Modelos de clustering
5. Introducción al Deep learning: teoría y práctica
6. Tratamiento avanzado de variables numéricas. Tratamiento avanzado de variables categóricas. Entropía y teoría de la información.
7. Uso avanzado del stack de sklearn en python.
7. Workshop: Compitiendo en Kaggle II
Workshop: Compitiendo en Kaggle II
1. Teoría de la computación distribuida
2. Plataformas actuales de computación en la nube: AWS, Microsoft Azure, Google Cloud, Databricks… Cómo se trabaja en Big data a día de hoy
3. Introducción a PySpark y su entorno
4. PySpark SQL
5. Exploración y visualización de datos en PySpark
6. PySpark ML
Creación de un producto analítico completo de aplicación real desde su concepción hasta su planificación, testeo y puesta en producción.