Изображение по автору
Вы хотите переключиться на карьеру в области науки о данных? Если да, то, скорее всего, вы уже записались на онлайн-курс, учебный лагерь или что-то в этом роде. Возможно, вы добавили в закладки план самостоятельного изучения данных, над которым планируете работать. Так чем же вам поможет еще одно руководство – это руководство?
Если вы решили продолжить карьеру в области науки о данных, вы должны стремиться к этому. Другого пути нет. Кроме того, получение работы в области науки о данных — это гораздо больше, чем просто изучение концепций науки о данных. И даже в процессе обучения концепции, инструменты, методы и библиотеки, которые вам необходимо изучить, могут оказаться ошеломляющими.
Эта статья не является кликбейтом; Итак, никаких высоких обещаний помочь вам получить работу по науке о данных за X дней. Скорее, мы обеспечиваем целостный подход к процессу поиска работы в области науки о данных. Которая включает в себя:
- Изучение концепций науки о данных
- Работа над проектами, чтобы продемонстрировать свой технический опыт
- Рекламируйте себя как профессионала
- Стратегическая подготовка к собеседованию
Мы надеемся, что это руководство поможет вам на этом пути!
Чтобы освоить науку о данных, вам сначала следует разработать прочную основу в программировании и решении проблем. Я предлагаю изучить Python в качестве вашего первого языка.
Благодаря простому синтаксису и нескольким замечательным учебным ресурсам вы сможете начать работу с Python за несколько часов. Затем вы можете потратить несколько недель на изучение следующих основ программирования на Python:
- Встроенные структуры данных
- Петли
- функции
- Классы и объекты
- Основы функционального программирования
- Pythonic функции: понимания и генераторы
Если вам нужно краткое руководство по Python, выполните эта лекция по Python на курсе CS50 в Гарварде. Для более захватывающего обучения см. Введение в программирование на Python, также бесплатный курс Гарварда.
Для практики вы можете поработать над проектами из приведенного выше курса Python, а также попрактиковаться в решении нескольких задач на Hackerrank.
Кроме того, на этом этапе вам должно быть комфортно работа в командной строке. Также полезно научиться создавать и работать с виртуальные среды в Python.
Независимо от того, на какую роль в работе с данными вы претендуете, изучение и приобретение навыков SQL очень важно. Начать можно со следующих тем:
- Базовые запросы SQL
- Условная фильтрация
- Играя
- Подзапросы
- Строковые функции SQL
Как и в случае с Python, SQL также требует специальной практики, и есть несколько полезных правил. платформы для практики SQL. Если вы предпочитаете обучающее руководство, ознакомьтесь с Учебное пособие по SQL от Mode Analytics.
Теперь у вас есть основы Python, и вы можете развивать их, изучая парсинг веб-страниц с помощью Python. Потому что, как специалист по данным, вы должны уметь собирать данные. В частности, программный анализ веб-страниц и анализ ответов JSON от API.
Ознакомившись с базовыми методами HTTP, вы сможете улучшить свои навыки работы с Python, изучив:
- HTTP-запросы с Библиотека запросов
- Парсинг веб-страниц с помощью КрасивыйСуп библиотека Python; Изучение Scrapy также будет полезно
- Анализ ответов JSON от API с использованием встроенных функций модуль json
На этом этапе вы можете попробовать написать простой проект парсинга веб-страниц. Пусть это будет простым, но понятным, чтобы вам было интересно. Допустим, вы хотите получить данные о своих покупках с Amazon, чтобы позже проанализировать их. Это всего лишь пример; вы можете работать над проектом, который вас интересует.
На этом этапе вашего пути изучения науки о данных вы должны быть знакомы как с Python, так и с SQL. Обладая этими базовыми навыками, вы теперь можете приступить к анализу и визуализации данных, чтобы лучше их понять:
- Для анализа данных с помощью Python вы можете научиться использовать библиотеку pandas. Если вы ищете пошаговое руководство по обучению пандам, ознакомьтесь с 7 шагов к освоению обработки данных с помощью Pandas и Python.
- Для визуализации данных вы можете научиться работать с библиотеками matplotlib и seaborn.
Это бесплатно Анализ данных с помощью Python Сертификационный курс от freeCodeCamp охватывает все основные библиотеки Python для обработки данных, которые вам необходимо знать. Вы также сможете написать несколько простых проектов.
И здесь у вас есть возможность создать проект: попробуйте собрать данные с помощью веб-скрапинга; проанализировать его с помощью панд; выучить библиотеку типа стримлит создать интерактивную панель мониторинга для представления результатов вашего анализа.
С помощью программирования и анализа данных вы можете создавать интересные проекты. Но также полезно изучить основы машинного обучения.
Даже если у вас нет времени более подробно изучать работу алгоритмов, сосредоточьтесь на:
- получить общее представление о том, как работает алгоритм, и
- построение моделей с помощью scikit-learn
Эта ускоренный курс scikit-learn поможет вам ускорить создание моделей машинного обучения с помощью scikit-learn. Как только вы научитесь строить базовую модель с помощью scikit-learn, вам также следует сосредоточиться на следующем, что поможет вам создавать более качественные модели:
- Предварительная обработка данных
- Функциональная инженерия
- Настройка гиперпараметра
Теперь снова пришло время строить проекты. Вы можете начать с чего-то простого, например, с проекта прогнозирования дефолта по кредиту, и постепенно перейти к прогнозированию оттока сотрудников, анализу потребительской корзины и многому другому.
На предыдущих этапах мы говорили о создании проектов для закрепления обучения. Однако большинство начинающих профессионалов в области данных, как правило, больше сосредотачиваются на изучение и пропустить этот этап создания портфолио интересных проектов — применение часть.
Независимо от того, сколько вы учитесь (и знаете), если у вас нет проектов, демонстрирующих ваше мастерство, невозможно убедить рекрутеров в вашем опыте.
Из-за большого количества внешнего кода, необходимого для создания простой страницы для демонстрации проектов, большинство учащихся не создают портфолио. Вероятно, вы используете репозиторий GitHub с информативным файлом README для отслеживания изменений в коде вашего проекта. Однако, чтобы создать портфолио по науке о данных, демонстрирующее ваши проекты, вы можете просмотреть другие бесплатные платформы, такие как Kaggle и DataSciencePortfol.io..
Выбирайте свои проекты в зависимости от того, в какой области вы хотели бы получить роль в области науки о данных: здравоохранение, финансовые технологии, цепочка поставок и многое другое. Чтобы вы могли продемонстрировать как свой интерес, так и профессионализм. Альтернативно, вы можете попробовать создать несколько проектов, чтобы определить интересующую вас область.
Поиск в Интернете и демонстрация своего опыта полезны в процессе поиска работы, особенно на ранних этапах вашей карьеры. Вот почему нашим следующим шагом является создание сильного присутствия в Интернете.
С этой целью лучший путь — создать свой собственный личный веб-сайт с:
- Информационная страница «О компании» и контактная информация.
- Блог, в котором публикуются статьи и руководства, которые вы пишете.
- Страница проекта с подробной информацией о проектах, над которыми вы работали.
Наличие личного сайта всегда предпочтительнее. Но, по крайней мере, у вас должен быть профиль LinkedIn и идентификатор Twitter (теперь X), когда вы находитесь в процессе поиска работы.
В Твиттере добавьте соответствующий заголовок и осмысленно участвуйте в предоставлении технических и карьерных советов. В LinkedIn убедитесь, что ваш профиль является максимально полным и точным:
- Обновите заголовок, чтобы он отражал ваш профессиональный опыт.
- Заполните разделы «Опыт и образование»
- В разделе «Проекты» добавляйте свои проекты с кратким описанием. Также ссылки на проекты
- Добавьте опубликованные статьи в свой профиль
Будьте активны при общении на этих платформах. Также периодически делитесь своими знаниями. Если вы пока не хотите начинать писать в своем блоге, попробуйте писать в социальных сетях, чтобы поработать над своими писательскими навыками.
Вы можете написать сообщение в LinkedIn или статью о концепции науки о данных, которую вы только что изучили, или о проекте, над которым работаете. Или напишите в Твиттере о том, чему вы учитесь, об ошибках, которые вы совершаете на этом пути, и о том, чему вы научились на их основе.
Обратите внимание, что этот шаг не полностью отделен от создания портфолио проектов. Помимо работы над своими техническими навыками и создания проектов (да, вашего портфолио), вы также хотите расширить свое присутствие в Интернете. Чтобы рекрутеры могли найти вас и предложить соответствующие возможности при поиске кандидатов.
Чтобы пройти собеседование по науке о данных, вам нужно поработать как над раундами кодирования, которые проверяют ваши навыки решения проблем, так и над основными техническими собеседованиями, на которых вы сможете продемонстрировать свое понимание науки о данных.
Я рекомендую пройти хотя бы вводный курс по структурам данных и алгоритмам, а затем решать задачи по Hackerrank и Литкод. Если у вас мало времени, вы можете решить ряд задач, например Слепой 75. Этот набор задач содержит вопросы по всем основным понятиям, таким как массивы, динамическое программирование, строки, графики и многое другое.
На всех собеседованиях по науке о данных у вас как минимум будет раунд SQL. Вы также можете практиковать SQL на Hackerrank и Leetcode. Кроме того, вы можете решить ранее заданные вопросы на собеседовании на таких платформах, как СтратаСкретч и ДатаЛемур.
Как только вы пройдете эти собеседования по программированию и перейдете к следующим раундам, вы сможете продемонстрировать свое мастерство в области науки о данных. Вы должны знать свои проекты очень подробно. Рассказывая о проектах, над которыми вы работали, вы также должны быть в состоянии объяснить:
- Бизнес-проблема, которую вы пытались решить.
- Почему вы подошли к этому именно так
- Чем и почему этот подход хорош
Сосредоточьтесь на подготовке не только с точки зрения алгоритмов и концепций, но и с точки зрения понимания бизнес-целей и решения бизнес-задач.
И это окончание. В этом руководстве мы обсудили различные шаги на пути к получению вашей первой должности в области науки о данных.
Мы также рассмотрели важность продвижения себя как профессионального и потенциального кандидата в дополнение к изучению концепций науки о данных. Для шагов, связанных с изучением концепций науки о данных, мы также рассмотрели полезные ресурсы.
Удачи в вашем путешествии по науке о данных!
Бала Прия С — разработчик и технический писатель из Индии. Ей нравится работать на стыке математики, программирования, науки о данных и создания контента. Сферы ее интересов и опыта включают DevOps, науку о данных и обработку естественного языка. Она любит читать, писать, программировать и пить кофе! В настоящее время она учится и делится своими знаниями с сообществом разработчиков, создавая учебные пособия, практические руководства, авторские статьи и многое другое.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://www.kdnuggets.com/7-steps-to-landing-your-first-data-science-job?utm_source=rss&utm_medium=rss&utm_campaign=7-steps-to-landing-your-first-data-science-job