Трансформация машинного обучения: качество данных и операционные потребности

Машинное обучение вызывает смешанные реакции. С одной стороны, некоторые считают машинное обучение новой сверхдержавой компании, которая «широкие корпоративные технологии, использование огромных объемов данных и алгоритмов для прогнозирования ». В то же время машинное обучение считалось раздутая причуда и панацея, не доставил. Хотя и то, и другое может быть правдой, компаниям необходимо учитывать машинное обучение для автоматизации бизнеса.

По оценкам IDC, мировые «расходы на системы когнитивного и искусственного интеллекта (ИИ) достигнут 19.1 миллиарда долларов в 2020 году, что на 54.2 процента больше суммы, потраченной в 2017 году». Кроме того, «к 2021 году более 40% инициатив по цифровой трансформации будут использовать услуги искусственного интеллекта». Даже страны планируют расширить возможности искусственного интеллекта (ИИ) и машинного обучения. Австралия посвятит «$ 29.9 миллионов в финансировании более четырех лет проектов, в которых используются эти технологии ». Игнорирование технологий машинного обучения из-за их преувеличения обходится дорого, включая потерю инноваций, а затем и бизнес.

Как же тогда компании могут эффективно использовать машинное обучение? Голливуд дает некоторые первоначальные идеи Военные игры, выпущенный в 1983 году. В фильме профессор Стивен Фалькен создает Joshua, ИИ с машинным обучением, чтобы помочь ВВС США улучшить свои военные стратегии. Сюжет сгущается, когда подросток взламывает систему, чтобы сыграть в Global Thermal Nuclear War, только для того, чтобы узнать, что игра может начать настоящую ядерную войну. Военные игры предоставляет основу для оценки успешных и неудачных вариантов использования машинного обучения.

Начните с малого с машинного обучения (военно-воздушные силы прыгнули вперед, заставив Джошуа управлять ядерными ракетами и попытаться выиграть ядерную войну)
Компьютерам нужно качество наборы данных (В исходном наборе данных Джошуа были дыры, чтобы компьютер мог учиться. Когда профессор Фалькен представляет Джошуа игру в крестики-нолики, ИИ видит тщетность ядерной войны и останавливает обратный отсчет).
Наконец, программа машинного обучения должна соответствовать контексту. (У Джошуа не было возможности принимать решения о запуске ракет, и, к счастью, он мог научиться не запускать ракеты, поскольку ядерная война - это беспроигрышный вариант).

Начните с малого с помощью машины
Learning

Сет Деланд заявляет, что лица, принимающие решения должен иметь технологическое понимание технологий машинного обучения. Современные технологии машинного обучения превосходны в поиске закономерностей и выявлении идей с помощью дискретных шага. Проекты, в которых эта сила используется наилучшим образом, оказываются успешными.

Например, Сенегальский проект стерилизация самцов мух цеце гамма-лучами позволила остановить распространение сонной болезни. «Благодаря машинному обучению популяция мух сократилась на 98 процентов, что привело к падению сонной болезни». Конкретный освещение характеристики отличают самцов от самок мух. На основе конкретного набора изображений алгоритмы научились быстро сортировать огромное количество самцов мух, что упростило стерилизацию самцов мухи цеце.

Поскольку в проекте цеце использовались сильные стороны технологий искусственного интеллекта для достижения конкретной и дискретной цели, а именно определения пола мух, подход машинного обучения оказался успешным, особенно потому, что классификация мух цеце отнимает много времени и трудозатрат.

С другой стороны, может быть легко создать проект машинного обучения с широкой целью, но не всем, что необходимо для того, чтобы технология работала. Терри Мун, информационный архитектор в McCormick, провел технико-экономическое обоснование об использовании машинного обучения для повышения качества еды.

Через год после начала проекта Маккормик заморозил набор данных проекта, признав, что машинное обучение было слишком дорогостоящим и трудоемким для обслуживания. Мун переключил передачу и подумал, как обращаться с огромным разнообразием данных.

После попытки разработать некоторые API-интерфейсы для решения проблемы данных Маккормика, Мун искал поставщика с платформой, которая могла бы помочь. Она связалась с Рави Шанкаром и использовала платформу Denodo для соединения данных Маккормика вместе - в режиме реального времени в одной точке - с большей доступностью. Решив эту проблему, McCormick продолжила свои проекты машинного обучения.

По состоянию на март 2018, Маккормик был приверженцем технологий машинного обучения и расширил эту технологию в течение следующих трех лет. Исходя из своего опыта, Мун советует компаниям не торопиться с виртуализация данных реализации, решая такие вопросы, как, например, какие политики должны быть установлены для подключения к одному набору исходных систем, а не к другому.

Машинное обучение обязательно
Добиться успеха в качестве данных

Машинное обучение требует точного и полные данные и должны иметь качественные данные. Как сообщает Парамита Гош, «требуется много ручных усилий, чтобы очистить и обработать эти данные, а также добавить к ним некоторую бизнес-аналитику». Для тех, у кого под рукой есть качественные наборы данных из прошлых проектов, программ или имеющихся приложений, это может быть более легким местом для начала применения машинного обучения.

Например, Р.Р. Доннелли (теперь RRD), компания из списка Fortune 500, добавила подразделение логистики чтобы выяснить, как лучше всего отправлять печатные материалы. Сотрудники RRD и университеты написали алгоритмы, которые анализировали уже надежную и доступную географическую информацию, информацию о дорожном движении и погоде с мобильных телефонов водителей. Эти программы изучили и обновили свое программирование, рекомендуя на лету изменять маршруты доставки. Мобильные данные GPS предоставляет достоверную информацию по установленным стандартам.

Упоминание результатов что чистые продажи выросли на 3.7%, отчасти за счет логистики. Урок: если у вас есть легкий доступ к стандартному набору надежных данных, подумайте об использовании его в первую очередь для проекта машинного обучения.

Игнорирование качества данных, передаваемых в алгоритмы, приведет к провалу проекта машинного обучения, особенно чат-ботов. Джеймс Миккенс объясняет, это красноречиво в 27^th Симпозиум по безопасности Usenix. Он использует пример Тэя, чат-бота, созданного Microsoft, чтобы общаться и учиться у людей в Интернете. В однажды, Тай перешел от ободряющих сообщений в Твиттере к восхвалению Гитлера и изверганию расистских и женоненавистнических комментариев. Тай был удален на следующий день, а Microsoft извинился.

Facebook также были проблемы с чат-ботами Алисой и Бобом, которые разработали свой собственный язык для общения с самими собой и упускали из виду смысл общения с людьми. Устройство Amazon Echo, Alexa, попыталось заказать кукольные домики для некоторых калифорнийцев после того, как оно ошибочно приняло утренние новости показать комментарий как команду. Бизнес позорится без Добра Качество данных который направляет машину к ее цели, особенно когда машина обучается через чат-ботов.

Алгоритмы машинного обучения специфичны для
Кейсы

Алгоритм машинного обучения может быть успешным в одной области, но потерпеть неудачу в другой. В 10 алгоритмов машинного обучения, которые вы должны знать, процесс принятия решений зависит от программы. Кроме того, один стиль машинного обучения, который не работает в одном параметре, может быть успешным в другом.

Watson из IBM чрезвычайно преуспел в оказании помощи KPMG LLP в уплате налогов для отделов корпоративных исследований и разработок. Watson учится с помощью обработки естественного языка, которая использует Скрытые марковские модели систем или HMM. HMM устанавливает слова как состояния и вычисляет вероятность переходов в языке, что очень полезно для юридического языка. После обучения Уотсон получил правильный налоговый режим. три раза из четырех.

Это позволяет корпорациям лучше использовать федеральные исследование и разработка налоговая скидка, что приводит к повышению качества документации для IRS и экономии рабочего времени. Watson смогла не отставать от множества различий в нормативных актах, законах и судебных делах, чтобы обеспечить хорошие налоговые результаты для этого стимула в области НИОКР.

Это отличалось от его работы над широким проектом по борьбе с раком. Проект IBM Watson Health бесполезен в диагностика и лечение рака. В феврале 2018 года онкологический центр доктора медицины Андерсона в Хьюстоне потерял 39 миллионов долларов из-за проекта машинного обучения, бюджет которого составлял 2.4 миллиона долларов.

Нереалистичные ожидания того, что Ватсон, который адаптируется, внося небольшие изменения в алгоритмы машинного обучения, может объяснить, как вариации генов влияют на рак, способствовали провалу проекта. Если бы проект ограничивался способностями Ватсона к обучению, скажем, выявлением конкретного рака с использованием наборов данных из наборов изображений опухолей, тогда проект мог бы привести к большему успеху.

Заключение

Примеры использования машинного обучения показывают нам, что технология лучше всего работает с конкретными целями, хорошими наборами данных и пониманием сильных и слабых сторон алгоритма. Для достижения других целей машинному обучению необходимы дальнейшие технологические инновации. Доктор Пьер-Ив Аудейер, исследователь искусственного интеллекта из Inria, французского национального института компьютерных наук в Париже, предполагает, что машины нужно любопытство учить. Учитывая, что некоторые бизнес-цели выходят за рамки текущих достижений в области машинного обучения, компаниям необходимо быть в курсе технологий и вариантов использования, прежде чем применять машинное обучение.

Изображение используется по лицензии от Shutterstock.com

PlatoAi. Web3 в новом свете. Расширенный анализ данных.
Щелкните здесь, чтобы получить доступ.

Источник: https://www.dataversity.net/machine-learning-transformed-data-quality-and-operational-necessities/

Генеративный анализ данных

Преобразование машинного обучения: качество данных и операционные потребности

Начните с малого с помощью машины
Learning

Машинное обучение обязательно
Добиться успеха в качестве данных

Алгоритмы машинного обучения специфичны для
Кейсы

Заключение

Достигайте большего с меньшими усилиями с помощью Slack AI

7 шагов к освоению MLOP – KDnuggets

Последняя разведка

Карты Google будут иметь сводные данные на базе искусственного интеллекта для упрощения навигации по зарядным станциям.

15+ самых маленьких LLM, которые можно запустить на локальных устройствах

Введение в программирование на Python для науки о данных

Амстердамский аэропорт Схипхол сообщает о рекордном количестве пассажиров и увеличении полетной активности в марте 2024 года

AEGEAN расширяет возможности дальнемагистральных перевозок за счет специализированного парка Airbus A321neo

Получите сертификат университетского уровня практически бесплатно – KDnuggets

Чат с нами

Преобразование машинного обучения: качество данных и операционные потребности

Начните с малого с помощью машины Learning

Машинное обучение обязательно Добиться успеха в качестве данных

Алгоритмы машинного обучения специфичны для Кейсы

Заключение

Последняя разведка

Чат с нами

Начните с малого с помощью машины
Learning

Машинное обучение обязательно
Добиться успеха в качестве данных

Алгоритмы машинного обучения специфичны для
Кейсы