Логотип Зефирнет

Прогнозирование типов сбоев машин с помощью машинного обучения без кода с помощью Amazon SageMaker Canvas

Дата:

Прогнозирование распространенных типов отказов машин имеет решающее значение в обрабатывающей промышленности. Имея набор характеристик продукта, который связан с данным типом сбоя, вы можете разработать модель, которая может предсказать тип сбоя, когда вы вводите эти атрибуты в модель машинного обучения (ML). Машинное обучение может помочь в получении информации, но до сих пор вам требовались эксперты по машинному обучению для создания моделей для прогнозирования типов отказов оборудования, отсутствие которых могло задержать любые корректирующие действия, необходимые бизнесу для повышения эффективности или улучшения.

В этом посте мы покажем вам, как бизнес-аналитики могут построить модель машинного обучения для прогнозирования типов отказов с помощью Холст Amazon SageMaker. Canvas предоставляет вам визуальный интерфейс «укажи и щелкни», который позволяет создавать модели и генерировать точные прогнозы машинного обучения самостоятельно — без необходимости какого-либо опыта машинного обучения или написания единой строки кода.

Обзор решения

Предположим, вы бизнес-аналитик, работающий в группе технического обслуживания крупной производственной организации. Ваша группа технического обслуживания попросила вас помочь в прогнозировании распространенных отказов. Они предоставили вам исторический набор данных, содержащий характеристики, связанные с данным типом сбоя, и хотели бы, чтобы вы предсказали, какой сбой произойдет в будущем. Типы сбоев включают в себя отсутствие сбоев, перенапряжение и сбои питания. Схема данных указана в следующей таблице.

Имя столбца Тип данных Описание
UID INT Уникальный идентификатор в диапазоне от 1 до 10,000 XNUMX
идантификационный номер продукта STRING Состоящий из буквы — L, M или H для низкого, среднего или высокого — в качестве вариантов качества продукта и серийного номера для конкретного варианта.
напишите STRING Начальная буква, связанная с productID, состоящая только из L, M или H
температура воздуха [К] ДЕСЯТИЧНЫЙ Температура воздуха указана в кельвинах
температура процесса [К] ДЕСЯТИЧНЫЙ Точно контролируемые температуры для обеспечения качества данного типа продукта, указанного в кельвинах
скорость вращения [об/мин] ДЕСЯТИЧНЫЙ Скорость вращения объекта, вращающегося вокруг оси, — это количество оборотов объекта, деленное на время, выраженное в оборотах в минуту.
крутящий момент [Нм] ДЕСЯТИЧНЫЙ Сила вращения машины по радиусу, выраженная в ньютон-метрах
износ инструмента [мин] INT Износ инструмента, выраженный в минутах
тип отказа (цель) STRING Без сбоев, сбоев питания или сбоев из-за перенапряжения

После определения типа сбоя предприятия могут предпринять любые корректирующие действия. Для этого вы используете имеющиеся у вас данные в файле CSV, который содержит определенные характеристики продукта, указанные в таблице. Вы используете Canvas для выполнения следующих шагов:

  1. Импортируйте набор данных обслуживания.
  2. Обучите и создайте прогнозную модель обслуживания машины.
  3. Проанализируйте результаты модели.
  4. Протестируйте прогнозы по модели.

Предпосылки

Облачный администратор с Аккаунт AWS с соответствующими разрешениями требуется для выполнения следующих предварительных условий:

  1. Развернуть Создатель мудреца Амазонки домен Инструкции см. Подключение к домену Amazon SageMaker.
  2. Запустите Холст. Инструкции см. Настройка и управление Amazon SageMaker Canvas (для ИТ-администраторов).
  3. Настройте политики общего доступа к ресурсам из разных источников (CORS) для Canvas. Инструкции см. Предоставьте своим пользователям возможность загружать локальные файлы.

Импорт набора данных

Сначала скачайте набор данных технического обслуживания и просмотрите файл, чтобы убедиться, что все данные есть.

Canvas предоставляет несколько примеров наборов данных в вашем приложении, которые помогут вам начать работу. Чтобы узнать больше о предоставленных SageMaker примерах наборов данных, с которыми вы можете поэкспериментировать, см. Используйте образцы наборов данных. Если вы используете образец набора данных (canvas-sample-maintenance.csv), доступный в Canvas, вам не нужно импортировать набор данных обслуживания.

Вы можете импортировать данные из разных источников данных в Canvas. Если вы планируете использовать собственный набор данных, выполните действия, описанные в Импорт данных в Amazon SageMaker Canvas.

Для этого поста мы используем полный набор данных технического обслуживания, который мы скачали.

  1. Войдите в Консоль управления AWS, используя учетную запись с соответствующими разрешениями для доступа к Canvas.
  2. Войдите в консоль Canvas.
  3. Выберите Импортировать.
  4. Выберите Загрузите И выберите maintenance_dataset.csv .
  5. Выберите Даты импорта чтобы загрузить его на Canvas.

Импорт набора данных

Процесс импорта занимает примерно 10 секунд (это может варьироваться в зависимости от размера набора данных). Когда это будет завершено, вы увидите, что набор данных находится в Ready Статус.

После подтверждения того, что импортированный набор данных ready, вы можете создать свою модель.

Построить и обучить модель

Чтобы создать и обучить модель, выполните следующие шаги:

  1. Выберите Новая модельи укажите имя для вашей модели.
  2. Выберите Создавай.
  3. Выберите maintenance_dataset.csv набор данных и выбрать Выбрать набор данных.
    В представлении модели вы можете увидеть четыре вкладки, соответствующие четырем шагам создания модели и ее использования для создания прогнозов: Выберите, строить, Анализироватькачества прогнозировать.
  4. На Выберите Вкладка, выберите maintenance_dataset.csv набор данных, который вы загрузили ранее, и выберите Выбрать набор данных.
    Этот набор данных включает 9 столбцов и 10,000 XNUMX строк. Canvas автоматически переходит к этапу сборки.
  5. На этой вкладке выберите целевой столбец, в нашем случае Тип отказа.Команда техобслуживания сообщила вам, что в этом столбце указаны типы сбоев, которые обычно наблюдаются на основе исторических данных с их существующих машин. Это то, что вы хотите научить свою модель прогнозировать. Canvas автоматически определяет, что это 3 категория проблема (также известная как многоклассовая классификация). Если обнаружен неправильный тип модели, вы можете изменить его вручную с помощью Изменить тип опцию.
    Следует отметить, что этот набор данных сильно несбалансирован по отношению к классу No Failure, что можно увидеть, просмотрев столбец с именем Тип отказа. Хотя Canvas и лежащие в его основе возможности AutoML могут частично справляться с дисбалансом наборов данных, это может привести к некоторым перекосам в производительности. В качестве дополнительного следующего шага см. Сбалансируйте свои данные для машинного обучения с помощью Amazon SageMaker Data Wrangler. Следуя инструкциям по общей ссылке, вы можете запустить Студия Amazon SageMaker приложение из консоли SageMaker и импортировать этот набор данных в Обработчик данных Amazon SageMaker и используйте преобразование данных Balance, затем верните сбалансированный набор данных обратно в Canvas и продолжите следующие шаги. В этом посте мы продолжаем работу с несбалансированным набором данных, чтобы показать, что Canvas также может обрабатывать несбалансированные наборы данных.
    В нижней половине страницы вы можете просмотреть некоторые статистические данные набора данных, включая отсутствующие и несоответствующие значения, уникальные значения, а также средние и медианные значения. Вы также можете удалить некоторые столбцы, если не хотите использовать их для прогноза, просто сняв с них выделение.
    После того, как вы изучили этот раздел, пришло время обучить модель! Перед построением полной модели рекомендуется получить общее представление о производительности модели, обучив быструю модель. Быстрая модель обучает меньше комбинаций моделей и гиперпараметров, чтобы отдать предпочтение скорости, а не точности, особенно в тех случаях, когда вы хотите доказать ценность обучения модели машинного обучения для вашего варианта использования. Обратите внимание, что опция быстрой сборки недоступна для моделей размером более 50,000 XNUMX строк.
  6. Выберите Быстрая сборка.

идет сборка модели

Теперь вы ждете от 2 до 15 минут. После этого Canvas автоматически перемещается в Анализировать вкладку, чтобы показать вам результаты быстрой тренировки. Анализ, проведенный с использованием быстрых оценок сборки, показал, что ваша модель способна предсказать правильный тип отказа (результат) в 99.2% случаев. Вы можете столкнуться с немного другими значениями. Это ожидаемо.

Давайте сосредоточимся на первой вкладке, Обзор. Это вкладка, которая показывает вам Воздействие столбцаили предполагаемая важность каждого столбца при прогнозировании целевого столбца. В этом примере столбцы Крутящий момент [Нм] и Скорость вращения [об/мин] оказывают наибольшее влияние на прогнозирование типа отказа.

Анализ - Обзор

Оцените производительность модели

Когда вы переезжаете в Счет часть вашего анализа, вы можете увидеть график, представляющий распределение наших прогнозируемых значений по отношению к фактическим значениям. Обратите внимание, что большинство сбоев относятся к категории «Нет сбоев». Чтобы узнать больше о том, как Canvas использует базовые линии SHAP для обеспечения объяснимости ML, см. Оценка производительности вашей модели в Amazon SageMaker Canvas, так же как Базовые принципы SHAP для объяснимости.
оценить показатели модели

Canvas разбивает исходный набор данных на наборы для обучения и проверки перед обучением. Оценка является результатом того, что Canvas запускает проверочный набор для модели. Это интерактивный интерфейс, в котором вы можете выбрать тип отказа. Если вы выберете Отказ от перенапряжения на графике вы можете видеть, что модель идентифицирует эти 84% времени. Этого достаточно, чтобы принять меры — возможно, оператор или инженер проверит ситуацию. Ты можешь выбрать Сбой питания на графике, чтобы увидеть соответствующую оценку для дальнейшей интерпретации и действий.

Вас могут интересовать типы отказов и то, насколько хорошо модель предсказывает типы отказов на основе ряда входных данных. Чтобы подробнее ознакомиться с результатами, выберите Расширенные метрики. Это отображает матрицу, которая позволяет более внимательно изучить результаты. В ML это называется матрица путаницы.

расширенные показатели

Эта матрица по умолчанию относится к доминирующему классу, No Failure. На Класс меню, вы можете выбрать просмотр расширенных показателей двух других типов сбоев: сбоя из-за перенапряжения и сбоя питания.

В ML точность модели определяется как количество правильных прогнозов, деленное на общее количество прогнозов. Синие прямоугольники представляют правильные прогнозы, сделанные моделью на основе подмножества тестовых данных, где был известен результат. Здесь нас интересует, какой процент времени модель предсказывала определенный тип отказа машины (скажем, Без сбоев), когда на самом деле это тип отказа (Без сбоев). В ML для измерения используется коэффициент TP / (TP + FN). Это называется вспоминать. В случае по умолчанию, без сбоев, было 1,923 правильных прогноза из 1,926 общих записей, что дало 99% результатов. вспоминать. В качестве альтернативы, в классе отказа от перенапряжения было 32 из 38, что дает 84% вспоминать. Наконец, в классе «Сбой питания» было 16 из 19, что дает 84% вспоминать.

Теперь у вас есть два варианта:

  1. Вы можете использовать эту модель для запуска некоторых прогнозов, выбрав прогнозировать.
  2. Вы можете создать новую версию этой модели для обучения с Стандартная сборка вариант. Это займет гораздо больше времени — около 1–2 часов, — но обеспечит более надежную модель, поскольку она проходит через полный анализ AutoML данных, алгоритмов и итераций настройки.

Поскольку вы пытаетесь предсказать сбои, а модель правильно предсказывает сбои в 84 % случаев, вы можете уверенно использовать модель для выявления возможных сбоев. Итак, вы можете перейти к варианту 1. Если вы не уверены, вы можете попросить специалиста по обработке и анализу данных просмотреть результаты моделирования Canvas и предложить возможные улучшения с помощью варианта 2.

Генерация прогнозов

Теперь, когда модель обучена, вы можете начать генерировать прогнозы.

  1. Выберите прогнозировать в нижней части Анализировать страницу или выберите прогнозировать меню.
  2. Выберите Выбрать набор данных, и выберите maintenance_dataset.csv .
  3. Выберите Генерация прогнозов.

Canvas использует этот набор данных для создания наших прогнозов. Хотя обычно рекомендуется не использовать один и тот же набор данных как для обучения, так и для тестирования, в этом случае вы можете использовать один и тот же набор данных для простоты. В качестве альтернативы вы можете удалить некоторые записи из исходного набора данных, который вы используете для обучения, и использовать эти записи в файле CSV, а затем передать его для пакетного прогнозирования, чтобы не использовать тот же набор данных для тестирования после обучения.

пакетное предсказание
Через несколько секунд прогноз завершен. Canvas возвращает прогноз для каждой строки данных и вероятность того, что прогноз окажется правильным. Ты можешь выбрать предварительный просмотр для просмотра прогнозов или выберите Скачать чтобы загрузить файл CSV, содержащий полный вывод.

скачать предсказание
Вы также можете выбрать прогнозирование значений по одному, выбрав Один прогноз вместо Пакетный прогноз. Canvas показывает вам представление, в котором вы можете указать значения для каждой функции вручную и сгенерировать прогноз. Это идеально подходит для таких ситуаций, как сценарии «что, если», например: как износ инструмента влияет на тип отказа? Что делать, если температура процесса повышается или понижается? Что делать, если скорость вращения изменится?

одно предсказание

Стандартная сборка

Ассоциация Стандартная сборка Опция выбирает точность выше скорости. Если вы хотите поделиться артефактами модели с вашим специалистом по данным и инженерами по машинному обучению, вы можете создать стандартную сборку дальше.

  1. Выберите Добавить версию
    Стандартная сборка - добавить версию
  2. Выберите новую версию и выберите Стандартная сборка.выбрать стандартную сборку
  3. После того как вы создадите стандартную сборку, вы можете поделиться моделью с исследователями данных и инженерами по машинному обучению для дальнейшей оценки и итерации.

Поделиться моделью

Убирать

Чтобы избежать будущих плата за сеанс, выйдите из Canvas.
Выход из Canvas

Заключение

В этом посте мы показали, как бизнес-аналитик может создать модель прогнозирования типа отказа машины с помощью Canvas, используя данные обслуживания. Canvas позволяет бизнес-аналитикам, таким как инженеры по надежности, создавать точные модели машинного обучения и генерировать прогнозы с помощью визуального интерфейса без кода и щелчка. Аналитики могут вывести это на новый уровень, поделившись своими моделями с коллегами по обработке данных. Специалисты по обработке и анализу данных могут просматривать модель Canvas в Studio, где они могут изучать сделанный Canvas выбор, проверять результаты модели и даже запускать модель в производство несколькими щелчками мыши. Это может ускорить создание ценности на основе машинного обучения и помочь быстрее масштабировать улучшенные результаты.

Чтобы узнать больше об использовании Canvas, см. Создавайте, делитесь, развертывайте: как бизнес-аналитики и специалисты по обработке и анализу данных сокращают время выхода на рынок с помощью машинного обучения без кода и Amazon SageMaker Canvas. Дополнительные сведения о создании моделей машинного обучения с помощью решения без кода см. Представляем Amazon SageMaker Canvas — визуальную возможность машинного обучения без кода для бизнес-аналитиков.


Об авторах

Раджакумар Сампаткумар является главным техническим менеджером по работе с клиентами в AWS, предоставляя клиентам рекомендации по согласованию бизнес-технологий и поддерживая переосмысление их моделей облачных операций и процессов. Он увлечен облачными технологиями и машинным обучением. Радж также является специалистом по машинному обучению и работает с клиентами AWS над проектированием, развертыванием и управлением их рабочими нагрузками и архитектурами AWS.

Тванн Аткинс является старшим архитектором решений для Amazon Web Services. Он отвечает за работу с клиентами из сельского хозяйства, розничной торговли и производства для выявления бизнес-проблем и работает в обратном направлении, чтобы найти жизнеспособные и масштабируемые технические решения. Twann уже более 10 лет помогает клиентам планировать и переносить критически важные рабочие нагрузки, в последнее время уделяя особое внимание демократизации аналитики, искусственного интеллекта и машинного обучения для клиентов и строителей завтрашнего дня.

Омкар Мукадам — специалист по архитектуре решений Edge в Amazon Web Services. В настоящее время он занимается решениями, которые позволяют коммерческим клиентам эффективно проектировать, создавать и масштабировать предложения сервисов AWS Edge, которые включают, помимо прочего, семейство AWS Snow.

Spot_img

Последняя разведка

Spot_img

Чат с нами

Всем привет! Могу я чем-нибудь помочь?