Conviértase en Rafael Nadal del aprendizaje automático

Hace un año, era un novato en el mundo del Machine Learning. Solía ??sentirme abrumado por pequeñas decisiones, como elegir el idioma para codificar, elegir los cursos en línea correctos o elegir los algoritmos correctos.

Por lo tanto, he planeado facilitarles a las personas ingresar en Machine Learning.

Asumiré que muchos de nosotros estamos comenzando de cero en nuestro viaje de Machine Learning. Descubramos cómo los profesionales actuales en el campo llegaron a su destino y cómo podemos emularlos en nuestro viaje.

Ilustraré cómo puedes aprender Ciencia de Datos trazando un paralelo entre cómo aprendió Rafael Nadal a jugar tenis y cómo puedes aprender Machine Learning.

Comprométete – Etapa 1

Rafael Nadal a los 3 años

Nadal tenía talento deportivo a su alrededor en su familia. Inspirado por ellos, comenzó su viaje de tenis a la edad de 3 años.

Para cualquiera que inicie en Machine Learning, es importante rodearse de personas que también están aprendiendo, enseñando y practicando Machine Learning.

Aprender las cuerdas no es fácil si lo haces solo. Por lo tanto, comprométase a aprender Aprendizaje Automático, y encuentre comunidades de ciencia de datos para ayudar a que su ingreso sea menos doloroso.

Aprenda el Ecosistema – Etapa 2

Rafael Nadal practica tenis

Rafael Nadal aprendió no solo las reglas del tenis, sino también el "ecosistema" circundante.

Aprendió sobre los diferentes tipos de raquetas, pelotas, superficies de la cancha. Aprendió sobre el puntaje en el tenis. Se inscribió para un entrenamiento de tenis.

Descubre el ecosistema de Aprendizaje automático

Data Science es un campo que ha adoptado e hizo pleno uso de las plataformas de código abierto. Si bien el análisis de datos puede realizarse en varios idiomas, el uso de las herramientas adecuadas puede hacer o deshacer proyectos.

Las bibliotecas de Data Science están floreciendo en los ecosistemas Python y R. Vea aquí una infografía sobre Python vs R para el análisis de datos.

Cualquiera que sea el idioma que elija, Jupyter Notebook y RStudio hacen que nuestra vida sea mucho más fácil. Nos permiten visualizar datos mientras lo manipulamos. Siga este enlace para leer más sobre las características de Jupyter Notebook.

Kaggle, Analytics Vidhya, MachineLearningMastery y KD Nuggets son algunas de las comunidades activas donde los científicos de datos de todo el mundo enriquecen el aprendizaje mutuo.

Machine Learning ha sido democratizado por cursos en línea o MOOC de Coursera , EdX y otros, donde aprendemos de profesores increíbles en universidades de clase mundial. Aquí hay una lista de los mejores MOOC en ciencia de datos disponibles en este momento.

Cemente la Fundación – Etapa 3

Rafael Nadal durante un partido

Rafael Nadal aprendió los tiros básicos

El entrenador de Nadal le enseñó golpes de derecha y de revés. Esta es la base principal del tenis. Rafael podría jugar el partido de manera competente con estos tiros básicos.

Aprende a manipular datos

Los científicos de datos, según las entrevistas y las estimaciones de los expertos, pasan del 50% al 80% de su tiempo inmersos en el trabajo mundano de recopilar y preparar datos digitales ingobernables, antes de que puedan ser explorados en busca de nuggets útiles. – Steve Lohr del New York Times

'Data Crunching' es el alma de todo el flujo de trabajo de Machine Learning. Para ayudar con este proceso, la biblioteca Pandas en Python o DataFrames de R te permite manipular y realizar análisis. Proporcionan estructuras de datos para datos relacionales o etiquetados.

La ciencia de los datos es más que la construcción de modelos de aprendizaje automático. También se trata de explicar los modelos y usarlos para impulsar decisiones basadas en datos. En el camino del análisis a los resultados basados ??en datos, la visualización de datos juega un papel muy importante al presentar los datos de una manera poderosa y creíble.

Matplotlib la biblioteca en Python o ggplot en R ofrecen soporte gráfico completo en 2D con una gran flexibilidad para crear visualizaciones de datos de alta calidad.

Estas son algunas de las bibliotecas en las que pasará la mayor parte de su tiempo cuando realice el análisis.

Ecosistema de Python desde los bloques fundamentales hasta los bloques de mayor nivel

Practica día tras día – Etapa 4

Rafael Nadal, cuando se le preguntó cuánto entrenó:

"Entreno cuatro horas al día, 210 días al año. Si a eso le agregamos, juego alrededor de 80 partidos por año, cada uno con una duración promedio de dos horas. Eso es 1000 horas jugando al tenis por año, y eso sin contar los días de entrenamiento durante los torneos ".

Aprenda los algoritmos de aprendizaje automático y practíquelos

Una vez establecida la base, puede implementar los algoritmos de Aprendizaje automático para predecir y hacer todas las cosas interesantes.

La biblioteca Scikit-learn en Python o el caret , las bibliotecas e1071 en R proporcionan una gama de algoritmos de aprendizaje supervisados ??y no supervisados ??a través de una interfaz consistente.

Estos le permiten implementar un algoritmo sin preocuparse por el funcionamiento interno o los detalles esenciales.

Aplique estos algoritmos de aprendizaje automático en los casos de uso que encuentre a su alrededor. Esto podría ser en tu trabajo o puedes practicar en competiciones de Kaggle . En estos, los científicos de datos de todo el mundo compiten en la creación de modelos para resolver problemas.

Simultáneamente, comprende el funcionamiento interno de un algoritmo tras otro. Comenzando con 'Hello World!' de Machine Learning, Regresión lineal luego pasar a Regresión logística , Árboles de decisión para admitir Vector Machines . Esto requerirá que repase sus estadísticas y álgebra lineal.

El fundador de Coursera, Andrew Ng, un pionero en AI, ha desarrollado un curso de Machine Learning que le brinda un buen punto de partida para comprender el funcionamiento interno de los algoritmos de Machine Learning.

Aprende las habilidades avanzadas- Etapa 5

Rafael Nadal aprendió a jugar tiros avanzados

Nadal, mientras se concentraba en la jugada fundamental, también se presentó a los tiros avanzados. Las tomas que solo los profesionales que juegan tenis día tras día son capaces de llevar a cabo.

Aprender algoritmos complejos de Machine Learning y arquitecturas de Deep Learning

Si bien el aprendizaje automático como un campo se estableció hace mucho tiempo, la popularidad y la atención recientes de los medios se debe principalmente a las aplicaciones de Aprendizaje automático en campos de inteligencia artificial como Visión artificial, Reconocimiento de voz, Procesamiento de lenguaje. Muchos de estos han sido iniciados por los gigantes tecnológicos como Google, Facebook y Microsoft.

Estos avances recientes se pueden atribuir al progreso realizado en el cálculo barato, la disponibilidad de datos a gran escala y el desarrollo de nuevas arquitecturas de Deep Learning.

Para trabajar en Deep Learning, deberá aprender a procesar datos no estructurados, ya sea texto libre, imágenes o sonidos.

Aprenderá a usar plataformas como TensorFlow o Torch , que nos permite aplicar Deep Learning sin preocuparse por los requisitos de hardware de bajo nivel. Aprenderás el aprendizaje de refuerzo, que ha hecho posible las modernas maravillas de IA como AlphaGo Zero .

¡Da el primer paso para aprender Machine Learning ahora!

  1. Instale Anaconda y use Jupyter para escribir Python

Repase algunos tutoriales de Python y conozca sus estructuras de datos y sintaxis fundamentales.

2. Rodéense de Data Science. Crear cuenta en:

? Kaggle y compra los núcleos escritos por los mejores científicos de datos. Kaggle lo ayuda a lubricar y establecer un flujo de trabajo estándar para cumplir con cualquier problema de Data Science

? Analytics Vidhya : este sitio web es un lugar clave para muchos científicos de datos. Este sitio se jacta de tener 4 millones de visitantes únicos por mes y tiene una comunidad muy activa.

? Verifique el canal pyData de YouTube . pyData es una conferencia organizada por la comunidad de código abierto para educar a los analistas con los últimos avances en Data Science. Esto te da

? Use podcasts para aprender sobre las últimas herramientas y tecnología en AI.
Podcasts es una gran manera de pasar tiempo en sus tareas diarias, ya sea para trotar, para organizar su armario o mientras viaja diariamente. Si es nuevo en los podcasts, descargue la aplicación adicta a Podcast en su teléfono.

Aprendizaje automático – Ingeniería de software diaria | Cada semana, Jeff entrevista a las personas desde el corazón de Data Science. Le da un vistazo muy temprano a lo que está sucediendo en Silicon Valley, lo que le ayuda a conocer nuevas técnicas y tecnologías. Le da muchas ideas nuevas para implementar en su trabajo. No puedo recomendar esto lo suficiente.

? Medio

Siga algunas de las publicaciones de Machine Learning aquí en Medium:

? Vaya a Coursera y Edx , y consulte los diversos cursos de Machine Learning disponibles.

Terminaré esta publicación con esta cita de Robin Sharma:

Todos los profesionales fueron una vez aficionados.

Todos los expertos fueron una vez un principiante.

So Dream Big.

Y comienza ahora

Comente a continuación para decirnos por qué planea comenzar su viaje de Aprendizaje automático y cómo planea hacerlo.

Y para todos los profesionales de Machine Learning, denos los matices de lo que funciona y lo que no. Comente a continuación cómo comenzó su viaje de aprendizaje automático y qué es lo que agilizó y dificultó su proceso de aprendizaje.