Logo Zephyrnet

7 bước để có được công việc khoa học dữ liệu đầu tiên của bạn – KDnuggets

Ngày:

7 bước để có được công việc khoa học dữ liệu đầu tiên của bạn
Hình ảnh của Tác giả
 

Bạn đang muốn chuyển sang nghề khoa học dữ liệu? Nếu vậy, rất có thể bạn đã đăng ký một khóa học trực tuyến, chương trình đào tạo hoặc những thứ tương tự. Có lẽ bạn đã đánh dấu lộ trình tự học về khoa học dữ liệu mà bạn dự định thực hiện. Vậy một hướng dẫn khác—hướng dẫn này—sẽ giúp bạn như thế nào?

Nếu bạn đã quyết định theo đuổi sự nghiệp khoa học dữ liệu, bạn phải nỗ lực hướng tới nó. Không có cách nào khác. Ngoài ra, tìm được một công việc khoa học dữ liệu không chỉ đơn giản là học các khái niệm khoa học dữ liệu. Và ngay cả trong quá trình học tập, các khái niệm, công cụ, kỹ thuật và thư viện mà bạn cần học cũng có thể khiến bạn choáng ngợp.

Bài viết này không phải là một bài clickbait; vì vậy, không có lời hứa cao siêu nào sẽ giúp bạn đạt được công việc khoa học dữ liệu sau X ngày. Thay vào đó, chúng tôi cung cấp một cách tiếp cận toàn diện cho quá trình tìm kiếm việc làm trong lĩnh vực khoa học dữ liệu. Mà bao gồm:

  • Học các khái niệm khoa học dữ liệu 
  • Làm việc trên các dự án để thể hiện chuyên môn kỹ thuật của bạn 
  • Tiếp thị bản thân như một người chuyên nghiệp
  • Chuẩn bị chiến lược cho cuộc phỏng vấn 

Chúng tôi hy vọng hướng dẫn này sẽ giúp bạn trên đường đi!

Để thâm nhập vào khoa học dữ liệu, trước tiên bạn nên phát triển nền tảng vững chắc về lập trình và giải quyết vấn đề. Tôi khuyên bạn nên học Python làm ngôn ngữ đầu tiên của mình. 

Với cú pháp dễ làm theo và một số tài nguyên học tập tuyệt vời, bạn có thể bắt đầu và sử dụng Python sau vài giờ. Sau đó, bạn có thể dành vài tuần để tập trung vào các nguyên tắc lập trình cơ bản sau với Python:

  • Cấu trúc dữ liệu tích hợp
  • Loops 
  • Chức năng 
  • Lớp và đối tượng 
  • Cơ bản về lập trình hàm
  • Các tính năng của Pythonic: hiểu và tạo

Nếu bạn muốn có hướng dẫn bắt đầu nhanh về Python, hãy làm bài giảng Python này trong khóa học CS50 của Harvard. Để học tập phong phú hơn, hãy tham khảo Giới thiệu về Lập trình với Python, cũng là một khóa học miễn phí của Harvard. 

Để thực hành, bạn có thể thực hiện các dự án trong khóa học Python ở trên và cũng có thể thực hành giải quyết một số vấn đề trên Hackerrank

Ngoài ra, ở giai đoạn này, bạn nên thoải mái làm việc ở dòng lệnh. Việc học cách tạo và làm việc với môi trường ảo trong Python.

Bất kể bạn đang ứng tuyển vào vai trò dữ liệu nào, việc học và đạt được trình độ thành thạo về SQL là cực kỳ quan trọng. Bạn có thể bắt đầu với các chủ đề sau:

  • Truy vấn SQL cơ bản 
  • lọc có điều kiện 
  • Tham gia 
  • truy vấn con 
  • Hàm chuỗi SQL 

Giống như Python, SQL cũng yêu cầu thực hành chuyên sâu và có một số phương pháp hữu ích. nền tảng để thực hành SQL. Nếu bạn muốn có hướng dẫn để thực hiện, hãy xem Hướng dẫn SQL của Mode Analytics.

Bây giờ bạn đã có nền tảng Python nên bạn có thể xây dựng nền tảng đó bằng cách học tìm hiểu web bằng Python. Bởi vì là một chuyên gia dữ liệu, bạn nên cảm thấy thoải mái với việc thu thập dữ liệu. Cụ thể là quét web theo chương trình và phân tích cú pháp phản hồi JSON từ API.

Sau khi làm quen với các phương thức HTTP cơ bản, bạn có thể xây dựng các kỹ năng Python của mình bằng cách học:

  • Các yêu cầu HTTP với Thư viện yêu cầu
  • Quét web bằng ĐẹpSúp Thư viện Python; Học Scrapy cũng sẽ hữu ích
  • Phân tích cú pháp phản hồi JSON từ API bằng cách sử dụng chức năng được tích hợp sẵn mô-đun json

Tại thời điểm này, bạn có thể thử viết mã cho một dự án quét web đơn giản. Hãy giữ nó đơn giản nhưng dễ hiểu để bạn có hứng thú. Giả sử bạn muốn lấy dữ liệu mua sắm của mình từ Amazon để có thể phân tích dữ liệu đó sau. Đây chỉ là một ví dụ; bạn có thể làm việc trên một dự án mà bạn quan tâm.

Tại thời điểm này trong hành trình học về khoa học dữ liệu, bạn nên làm quen với cả Python và SQL. Với những kỹ năng nền tảng này, giờ đây bạn có thể tiến hành phân tích và trực quan hóa dữ liệu để hiểu rõ hơn về dữ liệu đó:

Miễn phí Phân tích dữ liệu với Python Khóa học cấp chứng chỉ từ freeCodeCamp bao gồm tất cả các thư viện khoa học dữ liệu Python cần thiết mà bạn cần biết. Bạn cũng sẽ có thể viết mã cho một số dự án đơn giản.

Ở đây một lần nữa, bạn có cơ hội xây dựng một dự án:cố gắng thu thập dữ liệu bằng cách quét web; phân tích nó bằng cách sử dụng gấu trúc; tìm hiểu một thư viện như Hợp lý hóa để tạo một bảng thông tin tương tác nhằm trình bày kết quả phân tích của bạn.

Với lập trình và phân tích dữ liệu, bạn có thể xây dựng các dự án thú vị. Nhưng việc tìm hiểu các nguyên tắc cơ bản về học máy cũng rất hữu ích.

Ngay cả khi bạn không có thời gian để tìm hiểu cách hoạt động của các thuật toán một cách chi tiết hơn, hãy tập trung vào:

  • đạt được một cái nhìn tổng quan cấp cao về cách thức hoạt động của thuật toán và 
  • xây dựng mô hình bằng scikit-learn

T khóa học cấp tốc scikit-learn sẽ giúp bạn bắt kịp tốc độ xây dựng các mô hình học máy bằng scikit-learn. Sau khi tìm hiểu cách xây dựng mô hình cơ sở bằng scikit-learn, bạn cũng nên tập trung vào những điều sau để giúp bạn xây dựng mô hình tốt hơn:

  • Tiền xử lý dữ liệu 
  • Kỹ thuật tính năng 
  • Điều chỉnh siêu tham số 

Bây giờ lại là lúc để xây dựng các dự án. Bạn có thể bắt đầu với những việc đơn giản như dự án dự đoán vỡ nợ và dần dần chuyển sang dự đoán tình trạng tiêu hao nhân viên, phân tích giỏ thị trường, v.v.

Ở các bước trước, chúng ta đã nói về việc xây dựng các dự án để củng cố việc học. Tuy nhiên, hầu hết các chuyên gia dữ liệu đầy tham vọng đều có xu hướng tập trung nhiều hơn vào học tập và bỏ qua bước xây dựng danh mục các dự án thú vị này— áp dụng phần.

Cho dù bạn có học (và biết) bao nhiêu đi nữa, nếu bạn không có dự án thể hiện trình độ của mình thì bạn sẽ không thể thuyết phục được nhà tuyển dụng về chuyên môn của mình.

Do cần phải viết mã giao diện người dùng để tạo một trang đơn giản để giới thiệu các dự án nên hầu hết người học không xây dựng danh mục đầu tư. Bạn có thể sử dụng kho lưu trữ GitHub—với tệp README đầy thông tin—để theo dõi các thay đổi đối với mã dự án của bạn. Tuy nhiên, để xây dựng danh mục khoa học dữ liệu giới thiệu các dự án của mình, bạn có thể xem các trang khác các nền tảng miễn phí như Kaggle và DataSciencePortfol.io.

Chọn các dự án của bạn tùy thuộc vào lĩnh vực bạn muốn đảm nhận vai trò khoa học dữ liệu: chăm sóc sức khỏe, FinTech, chuỗi cung ứng, v.v. Để bạn có thể chứng minh cả sự quan tâm và trình độ của mình. Ngoài ra, bạn có thể thử xây dựng một vài dự án để tìm ra miền mà bạn quan tâm.

Được tìm thấy trực tuyến và thể hiện kinh nghiệm của bạn đều hữu ích trong quá trình tìm kiếm việc làm, đặc biệt là trong giai đoạn đầu của sự nghiệp. Đó là lý do tại sao việc xây dựng sự hiện diện trực tuyến mạnh mẽ là bước tiếp theo của chúng tôi.

Để đạt được mục tiêu này, cách tốt nhất là xây dựng trang web cá nhân của riêng bạn với:

  • Trang “Giới thiệu” đầy thông tin và thông tin liên hệ
  • Một blog có các bài viết và hướng dẫn bạn viết 
  • Trang dự án có thông tin chi tiết về các dự án bạn đã thực hiện  

Có một trang web cá nhân luôn được ưu tiên. Nhưng ít nhất bạn nên có hồ sơ LinkedIn và địa chỉ Twitter (nay là X) khi bạn đang trong quá trình tìm kiếm việc làm. 

Trên Twitter, hãy thêm dòng tiêu đề phù hợp và tương tác một cách có ý nghĩa với những lời khuyên về kỹ thuật và nghề nghiệp được chia sẻ. Trên LinkedIn, hãy đảm bảo rằng hồ sơ của bạn đầy đủ và chính xác nhất có thể:

  • Cập nhật dòng tiêu đề để phản ánh kiến ​​thức chuyên môn của bạn
  • Điền vào phần kinh nghiệm và giáo dục 
  • Trong phần “Dự án”, hãy thêm dự án của bạn kèm theo mô tả ngắn gọn. Ngoài ra liên kết đến các dự án
  • Thêm bài viết đã xuất bản vào hồ sơ của bạn

Hãy chủ động khi kết nối mạng trên các nền tảng này. Đồng thời chia sẻ việc học của bạn theo định kỳ. Nếu bạn chưa muốn bắt đầu viết trên blog của riêng mình, hãy thử viết trên mạng xã hội để rèn luyện kỹ năng viết của mình. 

Bạn có thể viết một bài đăng trên LinkedIn hoặc một bài báo về khái niệm khoa học dữ liệu mà bạn vừa học hoặc một dự án bạn đang thực hiện. Hoặc tweet về những gì bạn đang học và những sai lầm bạn mắc phải cũng như những gì bạn học được từ chúng. 

Lưu ý rằng bước này không hoàn toàn tách biệt với việc xây dựng danh mục dự án của bạn. Ngoài việc rèn luyện các kỹ năng kỹ thuật và xây dựng các dự án (vâng, danh mục đầu tư của bạn), bạn cũng muốn xây dựng sự hiện diện trực tuyến của mình. Để nhà tuyển dụng có thể tìm thấy bạn và tiếp cận các cơ hội phù hợp khi họ đang tìm kiếm ứng viên.

Để thực hiện các cuộc phỏng vấn khoa học dữ liệu, bạn cần phải thực hiện cả hai vòng viết mã để kiểm tra kỹ năng giải quyết vấn đề của mình cũng như các cuộc phỏng vấn kỹ thuật cốt lõi, nơi bạn có thể thể hiện sự hiểu biết của mình về khoa học dữ liệu.

Tôi khuyên bạn nên tham gia ít nhất một khóa học giới thiệu về cấu trúc dữ liệu và thuật toán, sau đó giải quyết các vấn đề về HackerrankLeetcode. Nếu bạn không có nhiều thời gian, bạn có thể giải quyết một loạt vấn đề như Mù 75. Bộ vấn đề này chứa các câu hỏi về tất cả các khái niệm chính như mảng, lập trình động, chuỗi, đồ thị, v.v.

Trong tất cả các cuộc phỏng vấn về khoa học dữ liệu, ít nhất bạn sẽ có một vòng SQL. Bạn có thể thực hành SQL trên Hackerrank và Leetcode nữa. Ngoài ra, bạn có thể giải quyết các câu hỏi phỏng vấn đã hỏi trước đó trên các nền tảng như StrataScratchDữ liệuLemur.

Sau khi vượt qua các cuộc phỏng vấn viết mã này và tiến tới các vòng tiếp theo, bạn sẽ có thể chứng minh trình độ thông thạo của mình về khoa học dữ liệu. Bạn nên biết chi tiết các dự án của mình. Khi giải thích các dự án bạn đã thực hiện, bạn cũng có thể giải thích:

  • Vấn đề kinh doanh bạn đã cố gắng giải quyết
  • Tại sao bạn tiếp cận nó theo cách bạn đã làm
  • Làm thế nào và tại sao cách tiếp cận này là tốt

Tập trung vào việc chuẩn bị không chỉ từ góc độ thuật toán và khái niệm mà còn từ góc độ hiểu mục tiêu kinh doanh và giải quyết các vấn đề kinh doanh.

Và đó là một bọc. Trong hướng dẫn này, chúng tôi đã thảo luận về các bước khác nhau để đạt được vai trò khoa học dữ liệu đầu tiên của bạn. 

Chúng tôi cũng đã đề cập đến tầm quan trọng của việc tiếp thị bản thân với tư cách là một ứng viên chuyên nghiệp và có triển vọng bên cạnh việc học các khái niệm khoa học dữ liệu. Đối với các bước liên quan đến việc học các khái niệm khoa học dữ liệu, chúng tôi cũng đã xem xét các tài nguyên hữu ích.

Chúc may mắn trên hành trình khoa học dữ liệu của bạn!
 
 

Bala Priya C là một nhà phát triển và nhà văn kỹ thuật đến từ Ấn Độ. Cô ấy thích làm việc ở nơi giao thoa giữa toán học, lập trình, khoa học dữ liệu và sáng tạo nội dung. Các lĩnh vực chuyên môn và sở thích của cô bao gồm DevOps, khoa học dữ liệu và xử lý ngôn ngữ tự nhiên. Cô ấy thích đọc, viết, mã hóa và cà phê! Hiện tại, cô ấy đang nỗ lực học hỏi và chia sẻ kiến ​​thức của mình với cộng đồng nhà phát triển bằng cách viết các hướng dẫn, hướng dẫn cách thực hiện, các ý kiến, v.v.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img