Logotipo de Zephyrnet

10 repositorios de GitHub para dominar el aprendizaje automático – KDnuggets

Fecha:

Diez repositorios de GitHub para dominar el aprendizaje automático
Imagen generada con DALLE-3
 

Dominar el aprendizaje automático (ML) puede parecer abrumador, pero con los recursos adecuados puede ser mucho más manejable. GitHub, la plataforma de alojamiento de código ampliamente utilizada, alberga numerosos repositorios valiosos que pueden beneficiar a estudiantes y profesionales de todos los niveles. En este artículo, revisamos 10 repositorios de GitHub esenciales que brindan una variedad de recursos, desde tutoriales para principiantes hasta herramientas avanzadas de aprendizaje automático.

Repositorio: microsoft/ML-para-principiantes

Este completo programa de 12 semanas ofrece 26 lecciones y 52 pruebas, lo que lo convierte en un punto de partida ideal para los recién llegados. Sirve como punto de partida para quienes no tienen experiencia previa con el aprendizaje automático y busca desarrollar competencias básicas utilizando Scikit-learn y Python.

Cada lección incluye materiales complementarios que incluyen exámenes previos y posteriores, instrucciones escritas, soluciones, tareas y otros recursos para complementar las actividades prácticas.

Repositorio: Dair-ai/ML-YouTube-Cursos

Este repositorio de GitHub sirve como un índice seleccionado de cursos de aprendizaje automático de calidad alojados en YouTube. Al recopilar enlaces a varios tutoriales, conferencias y series educativas de ML en una ubicación centralizada de proveedores como Clatech, Stanford y MIT, el repositorio facilita que los estudiantes interesados ​​encuentren contenido de ML basado en video que satisfaga sus necesidades. 

Es el único repositorio que necesitas si estás intentando aprender cosas de forma gratuita y en tu propio tiempo.

Repositorio: mml-book/mml-book.github.io

Las matemáticas son la columna vertebral del aprendizaje automático y este repositorio sirve como página web complementaria del libro "Matemáticas para el aprendizaje automático". El libro motiva a los lectores a aprender conceptos matemáticos necesarios para el aprendizaje automático. Los autores pretenden proporcionar las habilidades matemáticas necesarias para comprender las técnicas avanzadas de aprendizaje automático, en lugar de cubrir las técnicas en sí.

Cubre álgebra lineal, geometría analítica, descomposición de matrices, cálculo vectorial, probabilidad, distribución, optimización continua, regresión lineal, PCA, modelos de mezcla gaussiana y SVM.

Repositorio: janishar/mit-libro-de-aprendizaje-profundo-pdf

El libro de texto Deep Learning es un recurso integral destinado a ayudar a estudiantes y profesionales a ingresar al campo del aprendizaje automático, específicamente al aprendizaje profundo. Publicado en 2016, el libro proporciona una base teórica y práctica sobre las técnicas de aprendizaje automático que han impulsado los avances recientes en inteligencia artificial. 

La versión en línea del MIT Deep Learning Book ya está completa y seguirá estando disponible gratuitamente en línea, lo que representa una valiosa contribución a la democratización de la educación en IA. 

El libro cubre una amplia gama de temas en profundidad, incluidas redes de retroalimentación profunda, regularización, algoritmos de optimización, redes convolucionales, modelado de secuencias y metodología práctica.

Repositorio: DataTalksClub/zoomcamp de aprendizaje automático

Machine Learning ZoomCamp es un bootcamp en línea gratuito de cuatro meses que proporciona una introducción completa a la ingeniería del aprendizaje automático. Ideal para quienes se toman en serio el avance de sus carreras, este programa guía a los estudiantes a través de la creación de proyectos de aprendizaje automático del mundo real, cubriendo conceptos fundamentales como regresión, clasificación, métricas de evaluación, implementación de modelos, árboles de decisión, redes neuronales, Kubernetes y TensorFlow Serving.

A lo largo del curso, los participantes adquirirán experiencia práctica en áreas como aprendizaje profundo, implementación de modelos sin servidor y técnicas de conjunto. El plan de estudios culmina con dos proyectos finales que permiten a los estudiantes demostrar sus habilidades recién desarrolladas. 

Repositorio: ujjwalkarn/Tutoriales de aprendizaje automático

Este repositorio es una colección de tutoriales, artículos y otros recursos sobre aprendizaje automático y aprendizaje profundo. Cubre una amplia gama de temas como Quora, blogs, entrevistas, concursos de Kaggle, hojas de trucos, marcos de aprendizaje profundo, procesamiento del lenguaje natural, visión por computadora, varios algoritmos de aprendizaje automático y técnicas de ensamblaje. 

El recurso está diseñado para proporcionar conocimientos tanto teóricos como prácticos con ejemplos de código y descripciones de casos de uso. Es una herramienta de aprendizaje integral que ofrece un enfoque multifacético para exponerse al panorama del aprendizaje automático.

Repositorio: josephmisiti/awesome-machine-learning

Awesome Machine Learning es una lista seleccionada de increíbles marcos, bibliotecas y software de aprendizaje automático que es perfecta para aquellos que buscan explorar diferentes herramientas y tecnologías en el campo. Cubre herramientas en una variedad de lenguajes de programación, desde C++ hasta Go, que se dividen en varias categorías de aprendizaje automático, que incluyen visión por computadora, aprendizaje por refuerzo, redes neuronales y aprendizaje automático de propósito general.

Awesome Machine Learning es un recurso integral para profesionales y entusiastas del aprendizaje automático, que cubre todo, desde el procesamiento y modelado de datos hasta la implementación y producción de modelos. La plataforma facilita la comparación sencilla de diferentes opciones para ayudar a los usuarios a encontrar la que mejor se adapte a sus proyectos y objetivos específicos. Además, el repositorio se mantiene actualizado con el mejor y más reciente software de aprendizaje automático en varios lenguajes de programación, gracias a las contribuciones de la comunidad.

Repositorio: afshinea/stanford-cs-229-aprendizaje-automático

Este repositorio proporciona referencias condensadas y actualizaciones sobre conceptos de aprendizaje automático cubiertos en el curso CS 229 de Stanford. Su objetivo es consolidar todas las nociones importantes en hojas de trucos VIP que abarquen temas importantes como el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje profundo. El repositorio también contiene actualizaciones VIP que resaltan los requisitos previos en probabilidades, estadística, álgebra y cálculo. Además, hay una hoja de trucos súper VIP que recopila todos estos conceptos en una referencia definitiva que los alumnos pueden tener a mano.

Al reunir estos puntos clave, definiciones y conceptos técnicos, el objetivo es ayudar a los estudiantes a comprender a fondo los temas de aprendizaje automático en CS 229. Las hojas de trucos permiten resumir los conceptos vitales de las conferencias y los materiales de los libros de texto en referencias condensadas para entrevistas técnicas.

Repositorio: khangich/entrevista-aprendizaje-máquina

Proporciona una guía de estudio completa y recursos para prepararse para entrevistas de ingeniería de aprendizaje automático y ciencia de datos en las principales empresas de tecnología como Facebook, Amazon, Apple, Google, Microsoft, etc.

Temas clave cubiertos:

  • Preguntas de LeetCode categorizadas por tipo (SQL, programación, estadísticas).
  • Fundamentos de ML como regresión logística, KMeans, redes neuronales.
  • Conceptos de aprendizaje profundo desde funciones de activación hasta RNN.
  • Diseño de sistemas de ML, incluidos documentos sobre deuda técnica y reglas de ML.
  • Artículos de ML clásicos para leer.
  • Desafíos de producción de ML como escalar en Uber y DL en producción
  • Preguntas comunes de entrevistas sobre diseño de sistemas de ML, por ejemplo, recomendación de vídeos/transmisiones, detección de fraude.
  • Ejemplos de soluciones y arquitecturas para YouTube, recomendaciones de Instagram.

La guía consolida materiales de los mejores expertos como Andrew Ng e incluye preguntas de entrevistas reales realizadas en las principales empresas. Su objetivo es proporcionar el plan de estudio para realizar entrevistas de ML en varias grandes empresas de tecnología.

Repositorio: EthicalML/awesome-production-machine-learning

Este repositorio proporciona una lista seleccionada de bibliotecas de código abierto para ayudar a implementar, monitorear, versionar, escalar y proteger modelos de aprendizaje automático en entornos de producción. Cubre varios aspectos del aprendizaje automático de producción, incluidos:

  1. Explicando las predicciones y el modelo
  2. ML para preservar la privacidad
  3.  Versiones de modelos y datos
  4. Orquestación de entrenamiento modelo
  5. Servicio y monitoreo de modelos
  6. AutoML
  7. Data Pipeline
  8. Etiquetado de datos
  9. Manejo de Metadatos
  10. Distribución de Cómputo
  11. Serialización de modelos
  12. Computación optimizada
  13. Procesamiento de flujo de datos
  14. Detección de valores atípicos y anomalías
  15. Tienda de características
  16. Robustez adversaria
  17. Optimización del almacenamiento de datos
  18. Cuaderno de ciencia de datos
  19. Búsqueda neuronal
  20. Y más.

Ya sea que sea un principiante o un practicante de ML experimentado, estos repositorios de GitHub brindan una gran cantidad de conocimientos y recursos para profundizar su comprensión y habilidades en el aprendizaje automático. Desde matemáticas fundamentales hasta técnicas avanzadas y aplicaciones prácticas, estos repositorios son herramientas esenciales para cualquiera que se tome en serio el dominio del aprendizaje automático.
 
 

Abid Ali Awan (@ 1abidaliawan) es un profesional científico de datos certificado al que le encanta crear modelos de aprendizaje automático. Actualmente, se está enfocando en la creación de contenido y escribiendo blogs técnicos sobre aprendizaje automático y tecnologías de ciencia de datos. Abid tiene una Maestría en Gestión de Tecnología y una licenciatura en Ingeniería de Telecomunicaciones. Su visión es construir un producto de IA utilizando una red neuronal gráfica para estudiantes que luchan contra enfermedades mentales.

punto_img

Información más reciente

punto_img