Logo Zephyrnet

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024 – KDnuggets

Ngày:

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh của Tác giả
 

Tôi nhận được đợt thực tập phân tích dữ liệu đầu tiên vào năm 2020.

Kể từ đó, tôi đã chuyển sang vai trò toàn thời gian cấp cao, nhận được nhiều hợp đồng phân tích dữ liệu tự do và tư vấn cho các công ty ở nhiều nơi trên thế giới.

Trong thời gian này, tôi đã xem xét sơ yếu lý lịch cho các vị trí phân tích dữ liệu và thậm chí cả những ứng viên lọt vào danh sách tuyển dụng.

Và tôi nhận thấy một điều khiến những ứng viên nổi bật nhất khác với những người còn lại.

Các dự án.

Ngay cả khi bạn không có kinh nghiệm trong ngành dữ liệu và không có nền tảng kỹ thuật, bạn vẫn có thể nổi bật so với những người khác và được tuyển dụng chỉ dựa trên các dự án bạn trình bày trong sơ yếu lý lịch của mình.

Trong bài viết này, tôi sẽ chỉ cho bạn cách tạo các dự án giúp bạn nổi bật so với đối thủ cạnh tranh và có được công việc phân tích dữ liệu đầu tiên.

Nếu bạn đang đọc bài viết này, có thể bạn đã biết rằng việc hiển thị các dự án trong sơ yếu lý lịch của bạn là rất quan trọng.

Bạn thậm chí có thể đã xây dựng một vài dự án của riêng mình sau khi tham gia một khóa học trực tuyến hoặc chương trình đào tạo.

Tuy nhiên, nhiều dự án phân tích dữ liệu gây hại cho danh mục đầu tư của bạn nhiều hơn là có lợi. Những dự án này thực sự có thể làm giảm cơ hội nhận được việc làm của bạn và phải tránh bằng mọi giá.

Ví dụ: nếu bạn đã lấy Chứng chỉ phân tích dữ liệu phổ biến của Google trên Coursera, thì có thể bạn đã thực hiện dự án capstone đi kèm với chứng chỉ này.

 

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh từ Coursera
 

Tuy nhiên, hơn 2 triệu người khác đã đăng ký tham gia cùng một khóa học và có khả năng hoàn thành cùng một dự án cơ bản.

Rất có thể, các nhà tuyển dụng đã nhìn thấy những dự án này trong hồ sơ của hàng trăm ứng viên và sẽ không ấn tượng với nó.

Logic tương tự áp dụng cho bất kỳ dự án nào khác đã được tạo nhiều lần.

Tạo một dự án bằng cách sử dụng Chất hóa học, Iris, hoặc là Nhà ở Boston tập dữ liệu trên Kaggle có thể là một trải nghiệm học tập có giá trị nhưng không nên hiển thị trên danh mục đầu tư của bạn. 

Nếu bạn muốn có lợi thế cạnh tranh so với người khác, bạn cần phải nổi bật.

Đây là cách.

Một dự án nổi bật phải là duy nhất.

Chọn một dự án:

  • Giải quyết một vấn đề trong thế giới thực.
  • Không thể dễ dàng bị người khác sao chép.
  • Thật thú vị và kể một câu chuyện.

Phần lớn lời khuyên về các dự án phân tích dữ liệu trên Internet là không chính xác và không hữu ích.

Bạn sẽ được yêu cầu tạo các dự án chung chung như phân tích bộ dữ liệu Titanic—các dự án không mang lại giá trị thực sự nào cho sơ yếu lý lịch của bạn.

Thật không may, những người bảo bạn làm những việc này thậm chí còn không làm việc trong ngành dữ liệu, vì vậy bạn phải sáng suốt khi thực hiện lời khuyên này.

Trong bài viết này, tôi sẽ cho bạn xem ví dụ về những người thực sự đã tìm được việc làm trong lĩnh vực phân tích dữ liệu vì các dự án danh mục đầu tư của họ.

Bạn sẽ tìm hiểu về các loại dự án thực sự thu hút mọi người trong lĩnh vực này để bạn có thể xây dựng một dự án tương tự.

1. Bảng thông tin theo dõi xu hướng việc làm

Dự án đầu tiên là bảng điều khiển hiển thị xu hướng việc làm trong ngành dữ liệu.

Tôi tìm thấy dự án này trong một video được tạo bởi Luke Barousse, cựu nhà phân tích dữ liệu chính, người cũng chuyên sáng tạo nội dung.

Đây là ảnh chụp màn hình của bảng điều khiển này:

 

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh từ SkillQuery 
 

Trang tổng quan ở trên được gọi là SkillQuery và nó hiển thị các công nghệ và kỹ năng hàng đầu mà nhà tuyển dụng đang tìm kiếm trong ngành dữ liệu.

Ví dụ: bằng cách nhìn vào bảng điều khiển, chúng ta có thể biết rằng ngôn ngữ hàng đầu mà các nhà tuyển dụng đang tìm kiếm ở các nhà khoa học dữ liệu là Python, tiếp theo là SQL và R.

Lý do dự án này có giá trị như vậy là vì nó giải quyết được một vấn đề thực tế.

Mọi người tìm việc đều muốn biết những kỹ năng hàng đầu mà nhà tuyển dụng đang tìm kiếm trong lĩnh vực của họ để họ có thể chuẩn bị cho phù hợp.

SkillQuery giúp bạn thực hiện chính xác điều này, dưới dạng trang tổng quan tương tác mà bạn có thể sử dụng.

Người tạo ra dự án này đã thể hiện các kỹ năng phân tích dữ liệu quan trọng như Python, quét web và trực quan hóa dữ liệu.

Bạn có thể tìm thấy một liên kết đến dự án này Kho GitHub tại đây.

2. Phê duyệt thẻ tín dụng

Dự án này được tạo ra để dự đoán liệu một người có được chấp thuận mở thẻ tín dụng hay không. 

Tôi tìm thấy nó trong cùng một video do Luke Barousse tạo và người tạo ra dự án này cuối cùng đã nhận được vai trò nhà phân tích dữ liệu toàn thời gian.

Mô hình phê duyệt thẻ tín dụng được triển khai dưới dạng ứng dụng Streamlit:

 

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh từ Dự án GitHub của Semasuka
 

Bạn chỉ cần trả lời các câu hỏi được hiển thị trên trang tổng quan này và ứng dụng sẽ cho bạn biết liệu bạn có được chấp thuận thẻ tín dụng hay không.

Một lần nữa, đây là một dự án sáng tạo giải quyết vấn đề trong thế giới thực bằng bảng điều khiển thân thiện với người dùng, đó là lý do tại sao nó nổi bật với các nhà tuyển dụng.

Các kỹ năng được hiển thị trong dự án này bao gồm Python, trực quan hóa dữ liệu và lưu trữ đám mây.

3. Phân tích tình cảm trên mạng xã hội

Dự án này mà tôi đã tạo cách đây vài năm, liên quan đến việc tiến hành phân tích cảm tính về nội dung từ YouTube và Twitter.

Tôi luôn thích xem các video trên YouTube và đặc biệt bị thu hút bởi các kênh tạo video hướng dẫn trang điểm trên nền tảng này.

Vào thời điểm đó, một vụ bê bối lớn xuất hiện trên YouTube liên quan đến hai người có ảnh hưởng đến sắc đẹp mà tôi yêu thích—James Charles và Tati Westbrook.

Tôi quyết định phân tích vụ bê bối này bằng cách thu thập dữ liệu trên YouTube và Twitter.

Tôi đã xây dựng một mô hình phân tích tình cảm để đánh giá tình cảm của công chúng về mối thù và thậm chí tạo ra những hình ảnh trực quan để hiểu mọi người đang nói gì về những người có ảnh hưởng này.

Mặc dù dự án này không có ứng dụng kinh doanh trực tiếp nhưng nó rất thú vị vì tôi đã phân tích một chủ đề mà tôi đam mê.

Tôi cũng đã viết một bài đăng trên blog phác thảo những phát hiện của mình mà bạn có thể tìm thấy tại đây.

Các kỹ năng được thể hiện trong dự án này bao gồm quét web, sử dụng API, Python, trực quan hóa dữ liệu và học máy.

4. Phân khúc khách hàng bằng Python

Đây là một dự án khác do tôi tạo ra. 

Trong dự án này, tôi đã xây dựng mô hình phân cụm K-Means bằng Python bằng cách sử dụng tập dữ liệu trên Kaggle.

Tôi đã sử dụng các biến như giới tính, độ tuổi và thu nhập để tạo ra nhiều phân khúc khách hàng khác nhau tại trung tâm mua sắm:

 

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh từ Kaggle
 

Vì tập dữ liệu được sử dụng cho dự án này rất phổ biến nên tôi đã cố gắng phân biệt phân tích của mình với phần còn lại. 

Sau khi phát triển mô hình phân khúc, tôi tiến thêm một bước nữa bằng cách tạo hồ sơ người tiêu dùng cho từng phân khúc và đề ra các chiến lược tiếp thị mục tiêu.

Nhờ những bước bổ sung này mà tôi đã thực hiện, dự án của tôi đã được điều chỉnh cho phù hợp với lĩnh vực tiếp thị và phân tích khách hàng, giúp tăng cơ hội được tuyển dụng trong lĩnh vực này.

Tôi cũng đã tạo một hướng dẫn về dự án này, cung cấp một step-by-step hướng dẫn để xây dựng mô hình phân khúc khách hàng của riêng bạn bằng Python.

Các kỹ năng được thể hiện trong dự án này bao gồm Python, học máy không giám sát và phân tích dữ liệu.

5. Bảng điều khiển phân tích dữ liệu khóa học Udemy

Dự án cuối cùng trong danh sách này là một bảng điều khiển hiển thị thông tin chi tiết về các khóa học của Udemy:

 

5 dự án phân tích dữ liệu sẽ có việc làm vào năm 2024
Hình ảnh từ Trung bình
 

Tôi tìm thấy dự án này trong một bài báo trên Medium được viết bởi Zach Quinn, hiện là kỹ sư dữ liệu cấp cao tại Forbes.

Trở lại khi anh mới bắt đầu, Zach nói rằng bảng điều khiển này đã giúp anh nhận được lời mời làm việc về phân tích dữ liệu từ một công ty có uy tín.

Và thật dễ dàng để hiểu tại sao.

Zach không chỉ đơn thuần sử dụng SQL và Python để xử lý và phân tích dữ liệu. 

Anh ấy đã kết hợp các phương pháp hay nhất về giao tiếp dữ liệu vào trang tổng quan này, khiến nó trở nên hấp dẫn và hấp dẫn về mặt hình ảnh. 

Chỉ cần nhìn vào bảng điều khiển, bạn có thể hiểu rõ hơn về các khóa học của Udemy, sở thích của sinh viên và đối thủ cạnh tranh.

Trang tổng quan cũng thể hiện các số liệu quan trọng đối với doanh nghiệp, chẳng hạn như mức độ tương tác của khách hàng và xu hướng thị trường.

Trong số tất cả các dự án được liệt kê trong bài viết này, tôi thích dự án này nhất vì nó vượt xa các kỹ năng kỹ thuật và thể hiện sự lão luyện của nhà phân tích trong việc kể chuyện và trình bày dữ liệu.

Đây là liên kết tới bài viết của Zach, nơi anh ấy cung cấp mã và các bước thực hiện để tạo dự án này.

Tôi hy vọng rằng các dự án được mô tả trong bài viết này đã truyền cảm hứng cho bạn để tạo ra một dự án của riêng mình.

Nếu bạn không có bất kỳ ý tưởng dự án nào hoặc gặp trở ngại khi phát triển dự án của riêng mình, tôi khuyên bạn nên sử dụng các mô hình AI tổng quát để được hỗ trợ.

Ví dụ: ChatGPT có thể cung cấp nhiều ý tưởng dự án và thậm chí tạo ra các tập dữ liệu giả, cho phép bạn trau dồi kỹ năng phân tích của mình.

Tương tác với ChatGPT để phân tích dữ liệu sẽ cho phép bạn tìm hiểu các công nghệ mới nhanh hơn và trở nên hiệu quả hơn, giúp bạn nổi bật so với đối thủ cạnh tranh.

Nếu bạn muốn tìm hiểu thêm về cách sử dụng ChatGPT và AI tổng quát để phân tích dữ liệu, bạn có thể xem video hướng dẫn về chủ đề.  
 
 

Natasha Selvaraj là một nhà khoa học dữ liệu tự học với niềm đam mê viết lách. Natasha viết về mọi thứ liên quan đến khoa học dữ liệu, một bậc thầy thực sự về tất cả các chủ đề dữ liệu. Bạn có thể kết nối với cô ấy trên LinkedIn hoặc kiểm tra cô ấy Kênh YouTube.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img