לוגו זפירנט

7 שלבים לשליטה ב-MLOPs - KDnuggets

תאריך:

7 שלבים לשליטה ב-MLOPs
תמונה מאת המחבר
 

חברות רבות רוצות היום לשלב בינה מלאכותית בזרימת העבודה שלהן, במיוחד על ידי כוונון עדין של דגמי שפות גדולים ופריסה לייצור. בשל הביקוש הזה, הנדסת MLOps הפכה חשובה יותר ויותר. במקום להעסיק רק מדעני נתונים או מהנדסי למידת מכונה, חברות מחפשות אנשים שיכולים לבצע אוטומציה ולייעל את תהליך ההכשרה, ההערכה, ניהול הגרסאות, הפריסה והניטור של מודלים בענן.

במדריך זה למתחילים, נתמקד בשבעת השלבים החיוניים לשליטה בהנדסת MLOps, כולל הגדרת הסביבה, מעקב אחר ניסויים וגרסאות, תזמור, אינטגרציה מתמשכת/משלוח רציף (CI/CD), הגשה ופריסה של מודלים וניטור מודלים. . בשלב האחרון, נבנה צינור למידה אוטומטית מלא מקצה לקצה באמצעות כלים שונים של MLOps.

על מנת להכשיר ולהעריך מודלים של למידת מכונה, תחילה יהיה עליך להגדיר גם סביבת מקומית וגם סביבת ענן. זה כרוך במכולה של צינורות, מודלים ומסגרות של למידת מכונה באמצעות Docker. לאחר מכן, תלמד להשתמש ב-Kubernetes כדי להפוך את הפריסה, קנה המידה והניהול של היישומים המכילים האלה לאוטומטיים. 

בסוף השלב הראשון, תכירו פלטפורמת ענן לבחירתכם (כגון AWS, Google Cloud או Azure) ותלמדו כיצד להשתמש ב- Terraform לתשתית כקוד כדי להפוך את ההגדרה של תשתית הענן שלכם לאוטומטית. 

הערה: חיוני שתהיה לך הבנה בסיסית של Docker, Git והיכרות עם כלי שורת הפקודה. עם זאת, אם יש לך רקע בהנדסת תוכנה, ייתכן שתוכל לדלג על חלק זה.

תלמדו להשתמש ב-MLflow למעקב אחר ניסויי למידת מכונה, ב-DVC לגירסאות מודלים ונתונים, וב-Git לניהול גרסאות קוד. ניתן להשתמש ב-MLflow לרישום פרמטרים, קבצי פלט, ניהול מודלים ושרת. 

שיטות עבודה אלו חיוניות לשמירה על זרימת עבודה ML מתועדת היטב, ניתנת לביקורת וניתנת להרחבה, ובסופו של דבר תורמים להצלחתם ויעילותם של פרויקטי ML.

בדוק 7 הכלים הטובים ביותר למעקב אחר ניסויי למידת מכונה ובחר אחד שעובד הכי טוב עבור זרימת העבודה שלך. 

בשלב השלישי, תלמד להשתמש בכלי תזמור כגון Apache Airflow או Prefect כדי לבצע אוטומציה ולתזמן את זרימות העבודה של ML. זרימת העבודה כוללת עיבוד מוקדם של נתונים, הדרכת מודלים, הערכה ועוד, מה שמבטיח צנרת חלקה ויעילה מהנתונים לפריסה.

כלים אלה הופכים כל שלב בזרימת ה-ML להיות מודולרי וניתן לשימוש חוזר בפרויקטים שונים כדי לחסוך זמן ולהפחית שגיאות.

למד על 5 חלופות זרימת אוויר לתזמור נתונים שהם ידידותיים למשתמש ומגיעים עם תכונות מודרניות. כמו כן, בדוק את מושלם עבור תהליכי עבודה של למידת מכונה מדריך לבנייה וביצוע של צינור ה-ML הראשון שלך. 

שלב פרקטיקות של אינטגרציה מתמשכת ופריסה מתמשכת (CI/CD) בזרימות העבודה שלך ב-ML. כלים כמו Jenkins, GitLab CI ו-GitHub Actions יכולים להפוך את הבדיקות והפריסה של מודלים של ML לאוטומטיים, ולהבטיח שהשינויים יופעלו בצורה יעילה ובטוחה. תלמד לשלב בדיקות אוטומטיות של הנתונים, המודל והקוד שלך כדי לתפוס בעיות מוקדם ולשמור על סטנדרטים איכותיים.

למד כיצד להפוך הדרכה, הערכה, ניהול גרסאות ופריסה לאוטומטית של מודלים באמצעות פעולות GitHub על ידי ביצוע הפעולות מדריך למתחילים ל-CI/CD ללמידת מכונה.

הגשת מודלים היא היבט קריטי בשימוש יעיל במודלים של למידת מכונה בסביבות ייצור. על ידי שימוש במסגרות לשרת מודלים כגון BentoML, Kubeflow, Ray Serve או TFServing, אתה יכול לפרוס ביעילות את המודלים שלך כשירותי מיקרו, מה שהופך אותם לנגישים וניתנים להרחבה על פני יישומים ושירותים מרובים. מסגרות אלו מספקות דרך חלקה לבדיקת מסקנות מודל מקומית ומציעות לך תכונות לפריסה מאובטחת ויעילה של מודלים בייצור.

למד על 7 כלי הפריסה וההגשה המובילים של מודלים המשמשות חברות מובילות כדי לפשט ולהפוך את תהליך פריסת המודל לאוטומטי. 

בשלב השישי, תלמד כיצד ליישם ניטור כדי לעקוב אחר ביצועי המודל שלך ולזהות כל שינוי בנתונים שלך לאורך זמן. אתה יכול להשתמש בכלים כמו Evidently, Fiddler, או אפילו לכתוב קוד מותאם אישית לניטור והתראה בזמן אמת. על ידי שימוש במסגרת ניטור, אתה יכול לבנות צינור למידת מכונה אוטומטית לחלוטין שבה כל ירידה משמעותית בביצועי המודל תפעיל את צינור ה-CI/CD. זה יביא לאימון מחדש של המודל על מערך הנתונים האחרון ובסופו של דבר פריסת המודל העדכני ביותר לייצור.

אם ברצונך ללמוד על הכלים החשובים המשמשים לבנייה, תחזוקה וביצוע של זרימת העבודה של ML מקצה לקצה, עליך לבדוק את הרשימה של 25 הכלים המובילים של MLOps שאתה צריך לדעת בשנת 2024.

בשלב האחרון של קורס זה, תהיה לך הזדמנות לבנות פרויקט למידת מכונה מקצה לקצה תוך שימוש בכל מה שלמדת עד כה. פרויקט זה יכלול את השלבים הבאים:

  1. בחר מערך נתונים שמעניין אותך.
  2. אמן מודל במערך הנתונים שנבחר ועקוב אחר הניסויים שלך.
  3. צור צינור אימון מודל והפוך אותו לאוטומטי באמצעות GitHub Actions.
  4. פרוס את המודל באצווה, בשירות אינטרנט או בסטרימינג.
  5. עקוב אחר הביצועים של המודל שלך ופעל לפי שיטות עבודה מומלצות.

סמן את הדף בסימניות: 10 מאגרי GitHub לשליטה ב-MLOps. השתמש בו כדי ללמוד על הכלים העדכניים ביותר, המדריכים, הדרכות, הפרויקטים והקורסים החינמיים כדי ללמוד הכל על MLOps.

אתה יכול להירשם ל- הנדסת MLOps קורס המכסה את כל שבעת השלבים בפירוט ועוזר לך לצבור את הניסיון הדרוש כדי לאמן, לעקוב, לפרוס ולנטר מודלים של למידת מכונה בייצור. 

במדריך זה, למדנו על שבעת השלבים הדרושים כדי להפוך למהנדס MLOps מומחה. למדנו על הכלים, המושגים והתהליכים הנדרשים למהנדסים כדי להפוך אוטומציה ולייעל את תהליך ההכשרה, ההערכה, הגירסה, הפריסה והניטור של מודלים בענן.
 
 

עביד עלי אוואן (@1abidaliawan) הוא איש מקצוע מוסמך של מדען נתונים שאוהב לבנות מודלים של למידת מכונה. נכון לעכשיו, הוא מתמקד ביצירת תוכן וכתיבת בלוגים טכניים על למידת מכונה וטכנולוגיות מדעי נתונים. עביד הוא בעל תואר שני בניהול טכנולוגיה ותואר ראשון בהנדסת טלקומוניקציה. החזון שלו הוא לבנות מוצר בינה מלאכותית באמצעות רשת עצבית גרפית עבור תלמידים הנאבקים במחלות נפש.

ספוט_ימג

המודיעין האחרון

ספוט_ימג