Логотип Зефирнет

7 шагов к получению первой работы в области науки о данных – KDnuggets

Дата:

7 шагов к получению первой работы в области науки о данных
Изображение по автору
 

Вы хотите переключиться на карьеру в области науки о данных? Если да, то, скорее всего, вы уже записались на онлайн-курс, учебный лагерь или что-то в этом роде. Возможно, вы добавили в закладки план самостоятельного изучения данных, над которым планируете работать. Так чем же вам поможет еще одно руководство – это руководство?

Если вы решили продолжить карьеру в области науки о данных, вы должны стремиться к этому. Другого пути нет. Кроме того, получение работы в области науки о данных — это гораздо больше, чем просто изучение концепций науки о данных. И даже в процессе обучения концепции, инструменты, методы и библиотеки, которые вам необходимо изучить, могут оказаться ошеломляющими.

Эта статья не является кликбейтом; Итак, никаких высоких обещаний помочь вам получить работу по науке о данных за X дней. Скорее, мы обеспечиваем целостный подход к процессу поиска работы в области науки о данных. Которая включает в себя:

  • Изучение концепций науки о данных 
  • Работа над проектами, чтобы продемонстрировать свой технический опыт 
  • Рекламируйте себя как профессионала
  • Стратегическая подготовка к собеседованию 

Мы надеемся, что это руководство поможет вам на этом пути!

Чтобы освоить науку о данных, вам сначала следует разработать прочную основу в программировании и решении проблем. Я предлагаю изучить Python в качестве вашего первого языка. 

Благодаря простому синтаксису и нескольким замечательным учебным ресурсам вы сможете начать работу с Python за несколько часов. Затем вы можете потратить несколько недель на изучение следующих основ программирования на Python:

  • Встроенные структуры данных
  • Петли 
  • функции 
  • Классы и объекты 
  • Основы функционального программирования
  • Pythonic функции: понимания и генераторы

Если вам нужно краткое руководство по Python, выполните эта лекция по Python на курсе CS50 в Гарварде. Для более захватывающего обучения см. Введение в программирование на Python, также бесплатный курс Гарварда. 

Для практики вы можете поработать над проектами из приведенного выше курса Python, а также попрактиковаться в решении нескольких задач на Hackerrank

Кроме того, на этом этапе вам должно быть комфортно работа в командной строке. Также полезно научиться создавать и работать с виртуальные среды в Python.

Независимо от того, на какую роль в работе с данными вы претендуете, изучение и приобретение навыков SQL очень важно. Начать можно со следующих тем:

  • Базовые запросы SQL 
  • Условная фильтрация 
  • Играя 
  • Подзапросы 
  • Строковые функции SQL 

Как и в случае с Python, SQL также требует специальной практики, и есть несколько полезных правил. платформы для практики SQL. Если вы предпочитаете обучающее руководство, ознакомьтесь с Учебное пособие по SQL от Mode Analytics.

Теперь у вас есть основы Python, и вы можете развивать их, изучая парсинг веб-страниц с помощью Python. Потому что, как специалист по данным, вы должны уметь собирать данные. В частности, программный анализ веб-страниц и анализ ответов JSON от API.

Ознакомившись с базовыми методами HTTP, вы сможете улучшить свои навыки работы с Python, изучив:

На этом этапе вы можете попробовать написать простой проект парсинга веб-страниц. Пусть это будет простым, но понятным, чтобы вам было интересно. Допустим, вы хотите получить данные о своих покупках с Amazon, чтобы позже проанализировать их. Это всего лишь пример; вы можете работать над проектом, который вас интересует.

На этом этапе вашего пути изучения науки о данных вы должны быть знакомы как с Python, так и с SQL. Обладая этими базовыми навыками, вы теперь можете приступить к анализу и визуализации данных, чтобы лучше их понять:

  • Для анализа данных с помощью Python вы можете научиться использовать библиотеку pandas. Если вы ищете пошаговое руководство по обучению пандам, ознакомьтесь с 7 шагов к освоению обработки данных с помощью Pandas и Python.
  • Для визуализации данных вы можете научиться работать с библиотеками matplotlib и seaborn.

Это бесплатно Анализ данных с помощью Python Сертификационный курс от freeCodeCamp охватывает все основные библиотеки Python для обработки данных, которые вам необходимо знать. Вы также сможете написать несколько простых проектов.

И здесь у вас есть возможность создать проект: попробуйте собрать данные с помощью веб-скрапинга; проанализировать его с помощью панд; выучить библиотеку типа стримлит создать интерактивную панель мониторинга для представления результатов вашего анализа.

С помощью программирования и анализа данных вы можете создавать интересные проекты. Но также полезно изучить основы машинного обучения.

Даже если у вас нет времени более подробно изучать работу алгоритмов, сосредоточьтесь на:

  • получить общее представление о том, как работает алгоритм, и 
  • построение моделей с помощью scikit-learn

Эта ускоренный курс scikit-learn поможет вам ускорить создание моделей машинного обучения с помощью scikit-learn. Как только вы научитесь строить базовую модель с помощью scikit-learn, вам также следует сосредоточиться на следующем, что поможет вам создавать более качественные модели:

  • Предварительная обработка данных 
  • Функциональная инженерия 
  • Настройка гиперпараметра 

Теперь снова пришло время строить проекты. Вы можете начать с чего-то простого, например, с проекта прогнозирования дефолта по кредиту, и постепенно перейти к прогнозированию оттока сотрудников, анализу потребительской корзины и многому другому.

На предыдущих этапах мы говорили о создании проектов для закрепления обучения. Однако большинство начинающих профессионалов в области данных, как правило, больше сосредотачиваются на изучение и пропустить этот этап создания портфолио интересных проектов — применение часть.

Независимо от того, сколько вы учитесь (и знаете), если у вас нет проектов, демонстрирующих ваше мастерство, невозможно убедить рекрутеров в вашем опыте.

Из-за большого количества внешнего кода, необходимого для создания простой страницы для демонстрации проектов, большинство учащихся не создают портфолио. Вероятно, вы используете репозиторий GitHub с информативным файлом README для отслеживания изменений в коде вашего проекта. Однако, чтобы создать портфолио по науке о данных, демонстрирующее ваши проекты, вы можете просмотреть другие бесплатные платформы, такие как Kaggle и DataSciencePortfol.io..

Выбирайте свои проекты в зависимости от того, в какой области вы хотели бы получить роль в области науки о данных: здравоохранение, финансовые технологии, цепочка поставок и многое другое. Чтобы вы могли продемонстрировать как свой интерес, так и профессионализм. Альтернативно, вы можете попробовать создать несколько проектов, чтобы определить интересующую вас область.

Поиск в Интернете и демонстрация своего опыта полезны в процессе поиска работы, особенно на ранних этапах вашей карьеры. Вот почему нашим следующим шагом является создание сильного присутствия в Интернете.

С этой целью лучший путь — создать свой собственный личный веб-сайт с:

  • Информационная страница «О компании» и контактная информация.
  • Блог, в котором публикуются статьи и руководства, которые вы пишете. 
  • Страница проекта с подробной информацией о проектах, над которыми вы работали.  

Наличие личного сайта всегда предпочтительнее. Но, по крайней мере, у вас должен быть профиль LinkedIn и идентификатор Twitter (теперь X), когда вы находитесь в процессе поиска работы. 

В Твиттере добавьте соответствующий заголовок и осмысленно участвуйте в предоставлении технических и карьерных советов. В LinkedIn убедитесь, что ваш профиль является максимально полным и точным:

  • Обновите заголовок, чтобы он отражал ваш профессиональный опыт.
  • Заполните разделы «Опыт и образование» 
  • В разделе «Проекты» добавляйте свои проекты с кратким описанием. Также ссылки на проекты
  • Добавьте опубликованные статьи в свой профиль

Будьте активны при общении на этих платформах. Также периодически делитесь своими знаниями. Если вы пока не хотите начинать писать в своем блоге, попробуйте писать в социальных сетях, чтобы поработать над своими писательскими навыками. 

Вы можете написать сообщение в LinkedIn или статью о концепции науки о данных, которую вы только что изучили, или о проекте, над которым работаете. Или напишите в Твиттере о том, чему вы учитесь, об ошибках, которые вы совершаете на этом пути, и о том, чему вы научились на их основе. 

Обратите внимание, что этот шаг не полностью отделен от создания портфолио проектов. Помимо работы над своими техническими навыками и создания проектов (да, вашего портфолио), вы также хотите расширить свое присутствие в Интернете. Чтобы рекрутеры могли найти вас и предложить соответствующие возможности при поиске кандидатов.

Чтобы пройти собеседование по науке о данных, вам нужно поработать как над раундами кодирования, которые проверяют ваши навыки решения проблем, так и над основными техническими собеседованиями, на которых вы сможете продемонстрировать свое понимание науки о данных.

Я рекомендую пройти хотя бы вводный курс по структурам данных и алгоритмам, а затем решать задачи по Hackerrank и Литкод. Если у вас мало времени, вы можете решить ряд задач, например Слепой 75. Этот набор задач содержит вопросы по всем основным понятиям, таким как массивы, динамическое программирование, строки, графики и многое другое.

На всех собеседованиях по науке о данных у вас как минимум будет раунд SQL. Вы также можете практиковать SQL на Hackerrank и Leetcode. Кроме того, вы можете решить ранее заданные вопросы на собеседовании на таких платформах, как СтратаСкретч и ДатаЛемур.

Как только вы пройдете эти собеседования по программированию и перейдете к следующим раундам, вы сможете продемонстрировать свое мастерство в области науки о данных. Вы должны знать свои проекты очень подробно. Рассказывая о проектах, над которыми вы работали, вы также должны быть в состоянии объяснить:

  • Бизнес-проблема, которую вы пытались решить.
  • Почему вы подошли к этому именно так
  • Чем и почему этот подход хорош

Сосредоточьтесь на подготовке не только с точки зрения алгоритмов и концепций, но и с точки зрения понимания бизнес-целей и решения бизнес-задач.

И это окончание. В этом руководстве мы обсудили различные шаги на пути к получению вашей первой должности в области науки о данных. 

Мы также рассмотрели важность продвижения себя как профессионального и потенциального кандидата в дополнение к изучению концепций науки о данных. Для шагов, связанных с изучением концепций науки о данных, мы также рассмотрели полезные ресурсы.

Удачи в вашем путешествии по науке о данных!
 
 

Бала Прия С — разработчик и технический писатель из Индии. Ей нравится работать на стыке математики, программирования, науки о данных и создания контента. Сферы ее интересов и опыта включают DevOps, науку о данных и обработку естественного языка. Она любит читать, писать, программировать и пить кофе! В настоящее время она учится и делится своими знаниями с сообществом разработчиков, создавая учебные пособия, практические руководства, авторские статьи и многое другое.

Spot_img

Последняя разведка

Spot_img