Логотип Зефирнет

Обзор веб-самородков Data Science, 14 января: наборы данных Kaggle и отладка Python

Дата:

Обзор веб-самородков Data Science, 14 января: наборы данных Kaggle и отладка Python


 

Добро пожаловать в наш первый еженедельный обзор самородков науки о данных со всего Интернета. В нашем первоначальном списке есть статьи на темы от наборов данных Kaggle до YOLO, развертывания в машинном обучении и не только.

Наслаждайтесь некоторыми из наших любимых статей недели, которых не было на KDnuggets.

 
10 наборов данных от Kaggle, на которых стоит попрактиковаться, чтобы улучшить свои навыки работы с данными

Давайте начнем прямо с набора наборов данных Kaggle, чтобы получить их в свои руки. Эндрю Ломбарти составил список из 10 наборов данных, на которые стоит наточить зубы: от знаменитого набора «Титаник», отлично подходящего для начинающих, до опор компьютерного зрения, таких как MNIST и CIFAR. Возможно, вы уже знакомы с этими наборами данных, но с другой стороны, вы можете и не быть, и я готов поспорить, что в наборе есть один или два, с которыми вы либо никогда не играли, либо, по крайней мере, какое-то время. Перейдите к статье «Наука о данных» и посмотрите сами.

 
Инструменты отладки Python

В этой статье Мастерство машинного обучения, Адриан Тэм исследует pdb, встроенный отладчик Python, который, как он утверждает, может оказать большую помощь разработчикам, если мы просто знаем, как его использовать. Прочтите это руководство, чтобы сначала узнать, чем может помочь отладчик и как его использовать, а затем узнать больше о pdb и рассмотреть некоторые альтернативы.

 
Чем занимаются специалисты по данным?

На пути к науке о данных старший научный сотрудник Anaconda София Янг обсуждает фундаментальный вопрос: «Чем занимаются специалисты по данным?Она утверждает, что они приносят ценность, в первую очередь, специфичную для бизнеса, и принимают форму «показателей полярной звезды», таких как увеличение числа пользователей в месяц для бизнеса, в основе бизнес-модели которого лежит увеличение числа пользователей в месяц. Далее София делится пятью областями, которые, по ее мнению, больше всего ценят специалисты по данным в бизнесе.

 
Обзор YOLOv4 и YOLOv5

Любой, кто интересуется пониманием компьютерного зрения, захочет прочитать обзор YOLOv4 и YOLOv5 Адриана Пайонга. Прочитайте немного истории алгоритмов YOLO, узнайте о развитии между самыми последними версиями и узнайте об обнаружении фруктов в реальном времени с помощью YOLO. Хорошее техническое чтение для энтузиастов компьютерного зрения.

 
Двумерные тензоры в Pytorch

On Мастерство машинного обучения, Мухаммад Асад Икбал Хан пишет подробное руководство по двумерным тензорам PyTorch. Хан продолжает свою предыдущую статью об одномерных тензорах PyTorch, применяя многие из тех же операций к двумерным тензорам. Конкретные затронутые темы включают создание тензоров, изучение тензорных форм, нарезку и индексацию тензоров, а также применение многочисленных методов тензорной математики.

 
Секрет внедрения машинного обучения в производство

Инбаль Будовски-Тал анализирует, почему проекты, которые начинаются с таких обещаний, так бесплодны в производстве — если они даже сделай это к производству. Эти проекты не терпят неудачу без причины, но есть ли какой-то общий знаменатель? Budowski-Tal обрисовывает ловушки на пути к успешному развертыванию и предлагает, как их избежать.

Источник: https://www.kdnuggets.com/2022/01/weekly-web-nugget-roundup-0114.html.

Spot_img

Последняя разведка

Spot_img