제퍼넷 로고

더 나은 데이터 과학자가되기 위해 수강해야하는 온라인 과정

시간

더 나은 데이터 과학자가되기 위해 수강해야하는 온라인 과정

이러한 엄선 된 과정은 오늘날 저자를 더 나은 데이터 과학자로 만드는 데 도움이되는 귀중한 온라인 리소스임이 입증되었습니다.


By 데이비드 아드리안 카뇨 네스, 데이터 과학자 및 기계 학습 엔지니어

게시물 이미지

옛날 옛적에 ...

 
저는 2015 년에 데이터 사이언스에서 시작했습니다. 이것은 의도 된 움직임이 아니라 고용주의 요구에 대한 답이었습니다. 저는 스페인 기업에 자동화 서비스를 제공하는 회사에서 일하고 있었는데 데이터를 활용하여 규칙을 쉽게 하드 코딩 할 수없는 복잡한 작업 자동화. 저는 최근 끔찍한 경제 위기에 처한 엔지니어로 졸업하고 통계 모델링 지식이 있었고 MATLAB 사용에 능숙했습니다.

2015 년에는 전문 데이터 과학 학위가 없었거나 부트 캠프 현장 (적어도 스페인에서)에 뛰어 들고 자연적으로 가장 가까운 연구는 다음 순서로 진행했습니다. 수학 (공립 교육 시스템에서 교사 / 교수가되는 데 중점을 둔 스페인) 또는 소프트웨어 엔지니어 (대부분은 그 당시 지루한 데이터 과학에 비해 앱 개발이나“X”의 새로운 Uber를 만드는 데 더 관심이 많았습니다).

이러한 맥락에서 대부분의 데이터 과학 실무자들은 대부분 양적 학위 (다양한 분야의 많은 엔지니어, 경제학 및 유사한 학위의 사람들)의 최근 졸업생이었습니다. 이러한 맥락에서 저는 그 당시 저를 도왔고 장기적으로 저를 더 나은 데이터 과학자로 만들었던 (2020) 귀중한 온라인 리소스를 발견했습니다.

면책 조항 : 온라인 과정은 데이터 과학자가되지 않습니다

 
데이터 과학자가 되려면 다음과 같은 조합이 필요합니다.

  • 양적 학위 (엄격히 필수는 아니지만 도움이 됨).
  • 사용 된 도구 및 기술에 대한 실용적인 지식. 이것은 특별한 부트 캠프에서 얻을 수있는 것입니다. me 과 페드로 가르치다.
  • 실제 및 관련 프로젝트에 대한 실제 경험. 이것이이 목록에서 가장 중요한 점이며 가장 얻기 어려운 점입니다.
  • 우수한 전문가들에게 둘러싸여 있습니다. 예전 상사가 저에게 말하곤했듯이, 당신이 방에서 가장 똑똑한 사람이라면 걱정을 시작해야합니다.
  • 데이터 구조, 시스템 및 알고리즘이 내부에서 작동하는 방식에 대한 이론적 지식을 포함하여 데이터 과학이 작동하는 방식에 대한 좋은 이해.

이 마지막 글 머리 기호는이 게시물의 초점입니다. 여기서 소개 할 온라인 과정은 데이터 과학의 이론적 기초를 얻는 데 초점을 맞춘 과정입니다. 이러한 과정에는 몇 가지 공통 기능이 있습니다.

  • 인가 지원 통근하는 동안 한 시간 내에 완료 할 수있는 일반적인 DataCamp 나노 코스입니다. 시간을 투자해야하는 길고 어려운 과정입니다.
  • 가르친다 우수한 교수 최고의 대학에서.
  • 인가 매우 가치있는 부문, 기업, 채용 담당자 등

이러한 과정은 데이터 과학자가 될 수는 없지만 실제 프로젝트를 통해 기술을 연습하고 필요한 도구를 배우는 동안 이러한 과정은 장기적으로 데이터 과학자로서의 성공을위한 기반이 될 것입니다. 기계 학습 모델을 훈련시키고 코드를 작성하지만 실제로 무슨 일이 일어나고 왜 일어나는지 전혀 모르는 평범한 데이터 과학자들과 차별화됩니다.

이 게시물은 해당 과정에서 후원하지 않습니다.

 
이것은 명심해야 할 중요합니다. 데이터 과학 과정을 추천하는 다른 게시물 및 목록과는 반대로이 방법은 두 가지 이점이 있습니다.

  • 나는 여기에 나열된 각 과정을 수행했으며 그들을 추천하는 이유는 내 개인적인 경험을 바탕으로 가치가 있기 때문입니다. 내 말을 증명하기 위해 모든 과정에 해당 인증서를 첨부 할 것입니다.
  • 코스 작성자 중 누구도 여기에 내용을 분명히 나열하도록 저를 후원하지 않습니다.

과정들

 
시간순으로 시작하겠습니다 ...

1. Python을 사용한 컴퓨터 과학 및 프로그래밍 소개

그림

에릭 그림 슨

이것은 정말 훌륭하다 MIT의 Eric Grimson 교수의 과정입니다. MATLAB 경험이 있었기 때문에 데이터 과학자로서의 첫 번째 목표 중 하나는 Python을 배우는 것이 었습니다. 이 과정을 수강했을 때 내용은 Python 2 용으로 작성되었지만 최근 Python 3으로 업데이트되었습니다.

이 과정의 흥미로운 점은 일반적으로 많은 데이터 과학자가 따로 설정 한 컴퓨터 과학에 대한 중요한 개념을 소개한다는 것입니다. 예를 들면 다음과 같습니다.

  • 데이터 구조
  • 계산 복잡성 (Big O 표기법)
  • 객체 지향 프로그래밍
  • 알고리즘
  • 재귀

Python 지식이없는 숙련 된 데이터 과학자 인 경우이 과정이 이제 표준이므로이 과정을 수강하는 것이 좋습니다.

나의 수료증.

2. 계산적 사고 및 데이터 과학 소개

이것은 이전 과정의 두 번째 부분입니다. 그것은에 강한 초점이 있습니다 통계에 적용된 프로그래밍. 많은 코딩을 기대할 수 있습니다. 시뮬레이션. 많은 재미.

나의 수료증.

3. 분석 에지

 
이것은 Dimitris Bertsimas 교수의 좋은 과정입니다. 혼합에 중점을 둡니다. 기계 학습 및 최적화 알고리즘 일부와 심상 사용 ggplot. 코스 내용은 다음과 같습니다.

  • 선형 모델
  • 의사 결정 트리
  • 랜덤 포레스트
  • 클러스터링 (k- 평균)
  • 선형 프로그래밍
  • 일부 NLP (요즘 약간 구식)

모든 콘텐츠는 R 언어로 진행됩니다.

나의 수료증.

4. 머신 러닝

그림

앤드류 응 |

이 과정에는 소개가 필요하지 않습니다. 이것은 아마도 머신 러닝에 관한 가장 유명한 과정 지난 몇 년간 ML에 대한 과대 광고에 큰 기여를했습니다.

이 과정은 스탠포드 대학의 유명한 교수이자 AI 옹호자 Andrew Ng. 코스는 우수한 다음을 포함하여 가장 인기있는 기계 학습 알고리즘을 설명하는 데 중점을 둡니다. 수학 기초.

이것은 현장에서 가장 가치있는 과정 중 하나입니다.

2016 년에이 과정은 MATLAB / Octave로 진행되었습니다. 최근에 그들이 MATLAB에서 Python으로 업데이트하는 작업을하고 있다고 읽었지만이 업데이트는 아직 출시되지 않았습니다.

나의 수료증.

5. 데이터에서 배우기

 
이 흥미있는 Caltech의 Yaser S. Abu-Mostafa 교수의 과정은 통계적 학습은 why 가능하고 방법 편향-분산 절충, 과적 합, 정규화, 검증, 일반화 이론 등과 같은 심층적 인 측면을 다루면서 올바른 방법으로 수행합니다.

기계 학습의 기초를 이론적이고 엄격한 방식으로 설명하며 수학적 배경이없는 사람들에게는 권장되지 않습니다.

그 내용은 시조를 기반으로 :

그림

데이터에서 배우기 (책)

나의 수료증.

6. 딥 러닝 전문화

그림

딥러닝.ai

이것은 유명한 Andrew Ng 교수와 그의 새로운 교육 벤처의 딥 러닝 전문화, 딥러닝.ai, 그리고 오늘날 현장에서 가장 가치있는 인증서 중 하나입니다.

이것은  오늘날 가장 중요한 알고리즘 중 하나이자 비정형 데이터 (이미지, 사운드, 텍스트, 비디오 등)로 작업하는 데 가장 적합한 신경망에 초점을 맞춘 5 개 과정의 전문화.

그것은에서 간다 기초 과 math 첫 번째 과정에서 신경망 뒤에 초 매개 변수 조정프로젝트 계획 및 전략컨볼 루션 아키텍처 그리고 마지막으로, 시퀀스 모델 아키텍처.

이 과정은 실제 사용 사례가 많은 고도로 구조화되고 엄격하며 기초적이며 실용적입니다.

나의 수료증.

이것이 제가 추천하는 최고 품질의 코스입니다.

그럼에도 불구하고 내가이 분야에서 시작한 이래로 내가했던 유일한 과정은 아닙니다. 나는 항상 어떤 종류의 과정을 택하고 있습니다. 때로는 두 가지를 동시에합니다. 대부분은 데이터 과학에 관한 것이지만 도시 디자인, 에너지와 같은 다른 주제에 대한 지식을 넓힐 때도 있습니다. 관심이 있다면 다른 포스트에서이 주제를 다룰 것입니다.

내가 완료 한 과정의 전체 목록을 확인할 수 있습니다. 내 LinkedIn 프로필에서.

존경 할만한 언급

 
위 섹션에 포함될 자격이 없지만 언급 할 가치가있는 몇 가지 과정이 있습니다.

1. 딥 러닝 소개

 
이것은 모스크바 경제 고등 학교의 과정입니다. 매우 광범위하고 구조화되어 있지 않기 때문에 위에 나열되지 않았지만 광범위하다는 것도 장점 중 하나 일 수 있습니다.

당신이 찾고있는 경우 짧은 딥 러닝에 대한 소개는 그 뒤에있는 수학에 너무 많은주의를 기울이지 않고 많은 아키텍처를 다루며, deeplearning.ai의 전체 딥 러닝 전문화를 거치는 데 몇 달을 소비하고 싶지 않습니다. 이것이 여러분의 과정입니다.

마지막 프로젝트는 매우 흥미롭고 재미있는 이미지 캡션을 생성 할 수있는 애플리케이션을 구축하는 것입니다.

나의 수료증.

2. 데이터 과학 대회에서 우승하는 방법 : 최고 Kagglers로부터 배우기

 
이것은 다른 기계 학습 과정. 내 인생에서 머신 러닝에 대한 하나의 과정 만 수강 할 수 있고 하나를 선택해야한다면이 과정을 선택합니다.

이 과정은 당신이 알아야 할 거의 모든 것에 대한 개요로 구성됩니다. 효율적인 다음과 같은 중요한 주제를 다루는 데이터 과학자 :

  • 탐색 적 데이터 분석.
  • 실용적인 관점에서 볼 때 다양한 ML 알고리즘 (특정 작업에 대해 다른 하나를 선택해야하는시기 및 이유).
  • 평균 / 타겟 인코딩과 같은 기술.
  • 대회 우승자와 Kaggle Grandmasters가 설명하는 Kaggle 대회의 많은 실제 사례 Μαριος 옴므.

이 과정은 경쟁 데이터 과학 (Kaggle 대회)에 중점을두고 있습니다. 실제 산업 기계 학습 프로젝트와 다릅니다. 최고 점수를 얻는 것이 중요 할뿐만 아니라 (추론 속도, 유지 관리, 견고성 등) 기계 학습 모델을 개선하기위한 아이디어를 얻을 수 있습니다.

나의 수료증.

3. 의학 전문화를위한 AI


Pie & AI (AI for Medicine 런칭 이벤트)

이 최근 전문화 by 딥러닝.ai 인공 지능을 의료 분야에 적용하는 방법에 관한 것입니다.

COVID-19 발발의 현재 상황을 감안할 때 공공 및 민간의 노력이 이러한 공중 보건 위기에 대한 혁신적인 솔루션을 모색하고 있다는 것은 말할 필요도 없습니다.

헬스 케어에 적용된 AI는 오늘날 그린 필드로 간주되고 향후 XNUMX 년 동안 가장 유망한 분야 (데이터 과학자 관점에서) :

AI는 의사를 대체하지 않지만 AI를 사용하는 의사는 그렇지 않은 의사를 대체 할 것입니다. — Andrew Ng

지난 몇 년 동안 마케팅, 고객 관리, 에너지 등과 같은 부문에서 AI 솔루션이 상당히 개발되었지만 의료 부문은 다음과 같은 이유로 항상 뒤쳐져 왔습니다.

  • 데이터 프라이버시 및 윤리적 고려 사항과 관련된 관리 장벽.
  • 의사와 기술자 간의 의사 소통이 항상 쉬운 것은 아닌 상당히 전통적인 분야에 대한 관심 부족.
  • 알고리즘 성능은 매우 중요하므로 (사람의 삶이 위태로워 짐) AI 구현은 매우 신중하게 이루어져야합니다.

이 최근 유행병은 의료 데이터 사용에 대한 대중의 인식을 바꾸 었으며 정부와 여론은 의학 분야에서 AI의 가능성을 훨씬 더 탐구하고자합니다.

이 전문화는 다음과 같은 3 가지 과정으로 구성됩니다.

  • 의료 진단을위한 AI : 예를 들어 의료 이미지를 기반으로 질병을 식별하는 방법을 배웁니다.
  • 의료 예후를위한 AI : 환자의 미래 건강을 예측하는 방법을 배웁니다.
  • 의료용 AI : 인과 추론, 무작위 대조 시험, 모델 설명 가능성에 대해 알아 봅니다. 이것은 덜 흥미로운 전문화 과정이며, 상당히 새로운 과정 (2020 년 XNUMX 월)이므로 과제에 여전히 버그가 있습니다.

그 과정은 기술적 관점에서 그리 어렵지 않습니다.,하지만 설명에 초점을 맞추기 때문에이 전문화를 이수하려는 경우 데이터 과학자로서의 이전 경험이 있다는 것은 좋은 일입니다. 중요한 차이점 기존 AI와 의료 AI 사이. 다음과 같은 많은 차이점이 있습니다.

  • 의료에 대한 특정 성능 지표.
  • 의료 이미지 분할에 적합한 딥 러닝 아키텍처.
  • 생존 분석에 중점을 둡니다.

만약 너라면 데이터 과학자로 남고 싶다 일반 데이터 과학이 필수품이되는 경쟁이 치열한 환경에서 10 년 안에이 전문 분야를 수강해야합니다.

이 게시물을 읽어 주셔서 감사합니다.이 정보가 경력을 발전 시키거나 새로운 것을 배우는 데 도움이되기를 바랍니다.

PS : 덕분에 미리 암 카뇨 네스 이 게시물을 작성하는 동안 그녀의 피드백에 감사드립니다.

이 게시물은 원래 출판 내 안에 개인 웹 사이트 및 블로그.

 
바이오 : 데이비드 아드리안 카뇨 네스 (링크드인)는 데이터 과학자이자 기계 학습 엔지니어입니다. David는 회사와 기관이 데이터를 사용하여 복잡한 문제를 해결하는 데 XNUMX 년 이상의 경험을 가지고 있습니다.

실물. 허가를 받아 다시 게시했습니다.

관련 :

출처 : https://www.kdnuggets.com/2020/09/online-courses-better-data-scientist.html

spot_img

최신 인텔리전스

spot_img