Logo Zephyrnet

Xu hướng việc làm trong phân tích dữ liệu: Phần 2 – KDnuggets

Ngày:

Bởi Andrea De Mauro và Mahantesh Pattadkal

 
Khi chúng ta bắt đầu từ phần chúng ta đã dừng lại ở Phần 1 của loạt blog “Xu hướng công việc trong phân tích dữ liệu“, hành trình của chúng tôi qua thế giới xu hướng công việc phân tích dữ liệu và vai trò của Xử lý ngôn ngữ tự nhiên (NLP) vẫn tiếp tục.
 

Ở Phần 1, chúng tôi đã giới thiệu về “Xu hướng công việc phân tích dữ liệu” ứng dụng tập trung vào việc thu thập dữ liệu và áp dụng NLP để phân tích dữ liệu đó, được cung cấp bởi Nền tảng phân tích KNIME. Chúng tôi đã thảo luận về giai đoạn quét web được sử dụng để thu thập dữ liệu trực tiếp về thị trường việc làm phân tích dữ liệu, sau đó là quá trình làm sạch dữ liệu bằng kỹ thuật NLP. Sau đó, chúng tôi đã giới thiệu một mô hình chủ đề tiết lộ bảy kỹ năng đồng nhất trong các tin tuyển dụng. Những kỹ năng như vậy thể hiện năng lực và hoạt động mà các nhà tuyển dụng trong các ngành khác nhau tìm kiếm ở các chuyên gia phân tích dữ liệu.

Trong phần thứ hai của loạt blog, chúng tôi sẽ mô tả các bộ kỹ năng đã được xác định và đưa ra một số cân nhắc dựa trên dữ liệu về bối cảnh phát triển của nghề nghiệp chuyên môn trong Khoa học dữ liệu.

 
Để gắn nhãn cho các bộ kỹ năng, chúng tôi sử dụng các thuật ngữ và trọng số thường gặp nhất được xác định thông qua thuật toán LDA đã được áp dụng trước đây cho các tin tuyển dụng. Chúng tôi phân tích sâu hơn các mô tả công việc trong từng chủ đề để làm nổi bật các hoạt động chính, các kỹ năng thiết yếu và các ngành mà chúng thường được tìm thấy nhiều nhất. Hiểu những chủ đề này có thể giúp người tìm việc điều chỉnh các kỹ năng của họ cho phù hợp với nhu cầu thị trường và tăng cơ hội đảm bảo vị trí phù hợp trong lĩnh vực Phân tích dữ liệu. Trong các đoạn văn sau, bạn sẽ tìm thấy mô tả ngắn gọn về từng bộ kỹ năng.

Chủ đề 0: Nghiên cứu và phân tích dữ liệu

 
Bảng sau đây hiển thị năm thuật ngữ hàng đầu và trọng số của chúng cho chủ đề 0. Trọng số đề cập đến tầm quan trọng của thuật ngữ trong việc xác định chủ đề cụ thể đó. Xem xét các thuật ngữ này và các tài liệu được gắn nhãn là chủ đề 0, chúng tôi hiểu bộ kỹ năng này là “Nghiên cứu và phân tích dữ liệu”.

Hạn Trọng lượng máy
Nghiên cứu 4510
Chức vụ 4195
Thông tin 4112
cho sức khoẻ 3404
Đại Học 2118

Bảng 0: Trọng số thuật ngữ cho Chủ đề 0
 

Bộ kỹ năng này bao gồm các hoạt động như tiến hành nghiên cứu, phân tích dữ liệu và cung cấp những hiểu biết sâu sắc nhằm thúc đẩy việc ra quyết định trong các lĩnh vực khác nhau. Là nền tảng của phân tích dữ liệu, bộ kỹ năng này tạo điều kiện cho việc khai thác những hiểu biết có giá trị từ dữ liệu, xác định xu hướng và đưa ra quyết định sáng suốt.
Từ những gì chúng tôi thu thập được trong kho bài đăng công việc, các yêu cầu về năng lực cơ bản liên quan đến bộ kỹ năng này là:

  • Khả năng phân tích và giải quyết vấn đề mạnh mẽ
  • Chuyên môn về phần mềm thống kê (R, Python) 
  • Trải nghiệm với các công cụ trực quan hóa dữ liệu
  • Kỹ năng giao tiếp và tài liệu hiệu quả
  • Có nền tảng về lĩnh vực liên quan (toán học, thống kê hoặc khoa học dữ liệu)

Chủ đề 1: Quản trị và hỗ trợ khách hàng

Bằng cách xem xét các thuật ngữ và trọng số trong Bảng 1 cũng như các tài liệu liên quan đến Chủ đề 1, chúng tôi quyết định gắn nhãn nó là “Quản trị và Hỗ trợ Khách hàng”. Bộ kỹ năng này đòi hỏi phải quản lý các tương tác của khách hàng, cung cấp hỗ trợ hành chính và điều phối các quy trình hậu cần hoặc mua sắm.

Hạn Trọng lượng máy
HỖ TRỢ 2321
Quản lý 2307
Thông tin 2134
Chức vụ 2126
Khách hàng 1909

Bảng 1: Trọng số thuật ngữ cho Chủ đề 1
 

Theo chúng tôi, những năng lực cơ bản cần thiết để thành công trong những công việc đòi hỏi bộ kỹ năng này là:

  • Khả năng tổ chức và quản lý thời gian mạnh mẽ
  • Sự chú ý đến chi tiết
  • Thành thạo các phần mềm văn phòng và công cụ giao tiếp
  • Kỹ năng giao tiếp cá nhân và giải quyết vấn đề xuất sắc

Chủ đề 2: Tiếp thị và quản lý sản phẩm

Dựa trên các thuật ngữ được trình bày trong Bảng 2, chúng tôi hiểu đây là “ Tiếp thị và Quản lý Sản phẩm ” bộ kỹ năng.

Hạn Trọng lượng máy
Kinh doanh 8487
Đội 8021
Sản phẩm 6825
Khách hàng 3923
Marketing 3740

Bảng 2: Trọng số thuật ngữ cho Chủ đề 2
 

Bộ kỹ năng này xoay quanh việc phát triển các chiến lược tiếp thị, quản lý vòng đời sản phẩm và thúc đẩy tăng trưởng thị trường. Điều này rất quan trọng trong các công việc tập trung vào phân tích dữ liệu vì nó cho phép các chuyên gia sử dụng thông tin chi tiết dựa trên dữ liệu để đưa ra quyết định sáng suốt về xu hướng thị trường, sở thích của khách hàng và hiệu suất sản phẩm.

Các năng lực thiết yếu cần có trong bộ kỹ năng Tiếp thị và Quản lý Sản phẩm là:

  • Khả năng tư duy phân tích và chiến lược mạnh mẽ
  • Chuyên môn về nghiên cứu thị trường và thông tin cạnh tranh
  • Có kinh nghiệm sử dụng các công cụ và nền tảng tiếp thị
  • Kỹ năng giao tiếp và lãnh đạo xuất sắc
  • Có nền tảng về kinh doanh, tiếp thị hoặc lĩnh vực liên quan

Chủ đề 3: Quản lý kinh doanh, quản trị dữ liệu và tuân thủ

Dựa trên các thuật ngữ được trình bày trong Bảng 2, chúng tôi kết luận rằng nó đề cập đến “Quản lý kinh doanh, quản trị dữ liệu và tuân thủ ” bộ kỹ năng.

Bộ kỹ năng này bao gồm giám sát hoạt động kinh doanh, đảm bảo chất lượng và bảo mật dữ liệu cũng như quản lý rủi ro và các yêu cầu pháp lý. Trong các công việc chuyên sâu về phân tích dữ liệu, bộ kỹ năng này cho phép duy trì tính toàn vẹn của dữ liệu, giám sát tuân thủ, xác định rủi ro và tối ưu hóa quy trình kinh doanh bằng cách sử dụng thông tin chi tiết dựa trên dữ liệu.

Hạn Trọng lượng máy
Kinh doanh 14046
Quản lý 10531
Đội 5835
nghiên cứu 5672
Dự án 4309

Bảng 3: Trọng số thuật ngữ cho Chủ đề 3
 

Theo phát hiện của chúng tôi, các năng lực cần thiết trong bộ kỹ năng này là:

  • Khả năng tổ chức và lãnh đạo mạnh mẽ
  • Chuyên môn về quản lý dữ liệu, quản trị dữ liệu và đánh giá rủi ro
  • Kinh nghiệm với khung pháp lý và tiêu chuẩn ngành
  • Kỹ năng giao tiếp và giải quyết vấn đề hiệu quả
  • Có nền tảng về kinh doanh, tài chính hoặc lĩnh vực liên quan

Chủ đề 4: Kinh doanh thông minh và trực quan hóa dữ liệu

Nhìn vào các thuật ngữ chúng tôi tìm thấy trong Chủ đề 4, chúng tôi gọi nó là “Thông minh kinh doanh và trực quan hóa dữ liệu” bộ kỹ năng.

Bộ kỹ năng này bao gồm việc thiết kế các giải pháp BI hiện tại như bảng thông tin và báo cáo, tạo ra các hình ảnh trực quan sâu sắc và phân tích dữ liệu để đưa ra quyết định sáng suốt. Nó đóng vai trò then chốt trong các công việc tận dụng phân tích dữ liệu, chuyển đổi dữ liệu thô thành những hiểu biết sâu sắc có thể hành động nhằm thúc đẩy các quyết định chiến lược.

Hạn Trọng lượng máy
Kinh doanh 19372
nghiên cứu 7687
Điện bi 7359
Sự thông minh 7040
SQL  5836

Bảng 4: Trọng số thuật ngữ cho Chủ đề 4
 

Theo chúng tôi, các yêu cầu năng lực cơ bản trong BI và Trực quan hóa dữ liệu là:

  • Khả năng phân tích và giải quyết vấn đề mạnh mẽ
  • Chuyên môn về các công cụ BI (như Power BI, Tableau, SQL)
  • Có kinh nghiệm với các kỹ thuật trực quan hóa dữ liệu
  • Kỹ năng giao tiếp và kể chuyện hiệu quả

Chủ đề 5: Kho dữ liệu và cơ sở hạ tầng đám mây

Dựa trên các thuật ngữ được trình bày trong Bảng 5, chúng tôi hiểu đây là “Kho dữ liệu và cơ sở hạ tầng đám mây ” bộ kỹ năng.

Các bài đăng công việc yêu cầu bộ kỹ năng kỹ thuật dữ liệu lớn và đám mây thường được kết nối với các hoạt động như thiết kế và triển khai các giải pháp dựa trên đám mây, quản lý xử lý dữ liệu quy mô lớn và phát triển ứng dụng phần mềm. Nó rất quan trọng trong các công việc tập trung vào phân tích dữ liệu, cho phép xử lý và phân tích hiệu quả khối lượng dữ liệu lớn để có được những hiểu biết có giá trị.

Hạn Trọng lượng máy
Phát triển 4525
đám mây 3998
Kỹ Sư 3692
Phần mềm 3510
Thiết kế 3494

Bảng 5: Trọng số thuật ngữ cho Chủ đề 5
 

Theo ý kiến ​​của chúng tôi, các yêu cầu năng lực cơ bản liên quan đến bộ kỹ năng là 

  • Khả năng lập trình và giải quyết vấn đề mạnh mẽ
  • Chuyên môn về nền tảng đám mây (như AWS, Azure và Google Cloud)
  • Có kinh nghiệm với các công nghệ dữ liệu lớn (như cơ sở dữ liệu Hadoop, Spark và NoSQL)
  • Kiến thức về chính sách An toàn thông tin và các quy trình liên quan

Chủ đề 6: Học máy

Dựa trên các thuật ngữ được trình bày trong Bảng 6, chúng tôi hiểu đây là “Machine Learning ” bộ kỹ năng, xoay quanh việc thiết kế các mô hình AI, nghiên cứu các kỹ thuật ML tiên tiến và phát triển các giải pháp phần mềm thông minh. Trong các công việc chuyên sâu về phân tích dữ liệu, nó tạo cơ sở cho việc đào tạo mô hình AI và tối ưu hóa hiệu suất.

Hạn Trọng lượng máy
9782
Khoa học 8861
Nghiên cứu 4686
Máy tính 4209
Python 4053

Bảng 6: Trọng số thuật ngữ cho Chủ đề 6
 

Theo phát hiện của chúng tôi, các năng lực cơ bản cần có trong học máy ngày nay là

  • Khả năng lập trình và toán học mạnh mẽ
  • Chuyên môn về các framework machine learning (như TensorFlow, PyTorch)
  • Có kinh nghiệm với các kỹ thuật AI tiên tiến (như học sâu và xử lý ngôn ngữ tự nhiên)
  • Kỹ năng giao tiếp và hợp tác hiệu quả 

 
Trong phần này, trọng tâm của chúng tôi chuyển sang phân tích phức tạp về các mối liên hệ về bộ kỹ năng được tiết lộ thông qua mô hình hóa chủ đề trên ba hồ sơ chuyên môn riêng biệt: Kỹ sư dữ liệu, Nhà phân tích dữ liệu và Nhà khoa học dữ liệu. Để căn chỉnh các hồ sơ nghề nghiệp này với các tin tuyển dụng, chúng tôi đã tận dụng trình phân loại dựa trên quy tắc. Trình phân loại này quản lý để xác định chỉ định hồ sơ của danh sách công việc dựa trên các từ khóa được tìm thấy trong chức danh công việc. Ví dụ: một bài đăng có tiêu đề “Kiến trúc sư dữ liệu” sẽ được phân loại là vai trò Kỹ sư dữ liệu, trong khi một bài đăng có tiêu đề “Kỹ sư máy học” sẽ được xếp vào danh mục Nhà khoa học dữ liệu. 

Việc sử dụng mô hình chủ đề Phân bổ Dirichlet tiềm ẩn (LDA) cung cấp cho chúng tôi trọng số chủ đề cho mỗi tin tuyển dụng, bao gồm bảy bộ kỹ năng riêng biệt. Bằng cách tính trọng số trung bình của từng bộ kỹ năng trên tất cả các hồ sơ nghề nghiệp, chúng tôi đạt được trọng số trung bình của bộ kỹ năng cụ thể cho từng vai trò. Đáng chú ý, các trọng số này sau đó được chuẩn hóa và biểu thị dưới dạng phần trăm.

Như được minh họa trong Hình 1, chúng tôi trình bày một hình ảnh trực quan sâu sắc về sự tương tác giữa các chức danh chuyên môn và bộ kỹ năng tương ứng. Hình ảnh này gói gọn dự đoán chung của các nhà tuyển dụng về các kỹ năng thành thạo cơ bản quan trọng đối với Kỹ sư dữ liệu, Nhà phân tích dữ liệu và Nhà khoa học dữ liệu.

Đúng như dự đoán, vai trò Kỹ sư dữ liệu đặc biệt đòi hỏi phải thành thạo bộ kỹ năng “Kho dữ liệu & Cơ sở hạ tầng đám mây”. Hơn nữa, việc nắm bắt bổ sung về Trực quan hóa và Học máy là bắt buộc. Sự nhấn mạnh vào sự đa dạng kỹ năng này có thể là do dự đoán rằng Kỹ sư dữ liệu sẽ đóng vai trò không thể thiếu trong việc hỗ trợ cả Nhà phân tích dữ liệu và Nhà khoa học dữ liệu.

Ngược lại, chuyên môn tối cao dự kiến ​​dành cho các Nhà khoa học dữ liệu nằm ở “Học máy”, theo sau là sự thành thạo về các phương pháp “Nghiên cứu”. Đáng chú ý, bộ kỹ năng kết hợp bao gồm “Quản lý kinh doanh” và “Quản lý sản phẩm” cũng được xếp hạng cao về tầm quan trọng. Điều này gói gọn một loạt các năng lực phức tạp mà thị trường việc làm đang tìm kiếm đối với các Nhà khoa học dữ liệu đầy tham vọng.

Chuyển sự chú ý của chúng ta sang miền Nhà phân tích dữ liệu, một yêu cầu quan trọng sẽ xuất hiện về mức độ thành thạo “BI và Trực quan hóa”. Với vai trò của họ trong việc tạo báo cáo kinh doanh, điều khiển bảng thông tin và theo dõi hoạt động kinh doanh, điều này không có gì đáng ngạc nhiên. Nhu cầu song song về “Quản lý kinh doanh” như một kỹ năng quan trọng phụ phản ánh sự nhạy bén về chiến lược được mong đợi từ vai trò này. Hơn nữa, giống như vai trò Nhà khoa học dữ liệu, có yêu cầu song song về trình độ thành thạo “Quản lý sản phẩm” và “Nghiên cứu” trong phạm vi Nhà phân tích dữ liệu.

Tóm lại, cuộc khám phá này nhấn mạnh bối cảnh đa sắc thái của các điều kiện tiên quyết về bộ kỹ năng trên các vai trò Phân tích dữ liệu khác nhau. Nó miêu tả những kỳ vọng nhiều mặt của nhà tuyển dụng đối với những ứng viên có mong muốn vượt trội về năng lực Kỹ sư dữ liệu, Nhà phân tích dữ liệu và Nhà khoa học dữ liệu.

 

Hình 1: Sơ đồ Radar hiển thị mối liên kết giữa các hồ sơ chuyên môn được vẽ với các bộ kỹ năng được hiển thị theo các chiều.
Hình 1: Sơ đồ Radar hiển thị mối liên kết giữa các hồ sơ chuyên môn được vẽ với các bộ kỹ năng được hiển thị theo các chiều (bấm vào để phóng to).
 

 
Phân tích của chúng tôi về các tin tuyển dụng trong lĩnh vực Phân tích dữ liệu đang mở rộng nhằm mục đích phân loại công việc dựa trên các nhóm kỹ năng riêng biệt và làm rõ phạm vi khả năng đa dạng cần có trong mỗi danh mục. Với sự tăng trưởng theo cấp số nhân trong lĩnh vực này và tính chất quan trọng của các quyết định được đưa ra dựa trên dữ liệu, quá trình thu thập, lưu trữ và phân tích dữ liệu đã có những tiến bộ vượt bậc, dẫn đến nhu cầu vô độ đối với các chuyên gia có kỹ năng phân tích dữ liệu.

Thông qua việc phân loại các tin tuyển dụng thành bảy chủ đề kỹ năng đáng chú ý, chúng tôi làm sáng tỏ sự cần thiết của cả kỹ năng chuyên môn và kỹ năng đa diện trong lĩnh vực đang thay đổi nhanh chóng này. Các chủ đề trải dài từ phân tích dữ liệu và trí tuệ kinh doanh đến học máy và trí tuệ nhân tạo, nhấn mạnh nhu cầu ngày càng tăng đối với các cá nhân thành thạo trong việc khai thác dữ liệu, công nghệ và làm việc nhóm đa chức năng.

Mặc dù vậy, nghiên cứu này có một số hạn chế. Bản chất năng động của thị trường việc làm và sự xuất hiện của các công nghệ và phương pháp mới đòi hỏi phải cập nhật liên tục phân tích của chúng tôi so với chế độ xem “ảnh chụp nhanh” tĩnh như chúng tôi đã làm ở đây. Hơn nữa, cách tiếp cận của chúng tôi có thể không nắm bắt được mọi sắc thái của các vai trò và kỹ năng công việc đa dạng trong lĩnh vực Phân tích dữ liệu, do phụ thuộc vào các tin tuyển dụng có sẵn tại thời điểm nghiên cứu.

Tất cả công việc của chúng tôi đều có sẵn miễn phí tại Trung tâm cộng đồng KNIME Không gian công cộng – “Đơn xin việc năng lực”. Bạn có thể tải xuống và thử nghiệm các quy trình công việc để tự mình thử và khám phá cũng như mở rộng hoặc cải thiện. 

 
 

 
Nhìn về phía trước, chúng tôi thấy tiềm năng mở rộng đáng kể của nghiên cứu này. Điều này bao gồm việc phát triển các thành phần KNIME để triển khai phương pháp 'Loại bỏ cụm từ dừng', được mô tả trong Phần 1 và khung trực quan hóa tương tác giữa con người trong vòng lặp trong KNIME. Một khuôn khổ như vậy sẽ đơn giản hóa quá trình đánh giá của con người trong việc lựa chọn mô hình chủ đề mạch lạc nhất cho một kho tài liệu nhất định, nâng cao khả năng mở rộng quy mô công việc của chúng tôi. Chúng tôi cũng hình dung việc áp dụng các cơ chế hỗ trợ LLM để hỗ trợ và đơn giản hóa giai đoạn lập mô hình chủ đề: kịch bản này chắc chắn còn chỗ cho thử nghiệm và nghiên cứu thêm.

Các chuyên gia trong lĩnh vực Phân tích dữ liệu phải luôn cập nhật thông tin và thích ứng với các công nghệ mới nổi. Điều này đảm bảo rằng các kỹ năng của họ luôn phù hợp và có giá trị trong bối cảnh luôn thay đổi của việc ra quyết định dựa trên dữ liệu. Bằng cách nhận biết và trau dồi các kỹ năng liên quan đến các chủ đề đã xác định, người tìm việc có thể đạt được lợi thế cạnh tranh trong thị trường sôi động này. Để bảo vệ mức độ phù hợp của họ trong lĩnh vực này, các chuyên gia Phân tích dữ liệu phải luôn tò mò trong suốt sự nghiệp của mình và tiếp tục học hỏi liên tục.

 
 
Mahantesh Pattadkal có hơn 6 năm kinh nghiệm tư vấn các dự án và sản phẩm khoa học dữ liệu. Với bằng Thạc sĩ về Khoa học dữ liệu, chuyên môn của anh ấy tỏa sáng trong lĩnh vực Học sâu, Xử lý ngôn ngữ tự nhiên và Học máy có thể giải thích được. Ngoài ra, anh còn tích cực tham gia với Cộng đồng KNIME để cộng tác trong các dự án dựa trên khoa học dữ liệu.
 

Andrea De Mauro có hơn 15 năm kinh nghiệm xây dựng nhóm phân tích kinh doanh và khoa học dữ liệu tại các công ty đa quốc gia như P&G và Vodafone. Ngoài vai trò trong công ty, anh còn thích giảng dạy Phân tích tiếp thị và Học máy ứng dụng tại một số trường đại học ở Ý và Thụy Sĩ. Thông qua nghiên cứu và viết lách của mình, anh ấy đã khám phá tác động kinh doanh và xã hội của Dữ liệu và AI, tin chắc rằng kiến ​​thức phân tích rộng hơn sẽ giúp thế giới tốt đẹp hơn. Cuốn sách mới nhất của ông là 'Data Analytics Made Easy', do Packt xuất bản. Anh ấy xuất hiện trong danh sách 'Bốn mươi người dưới 2022' toàn cầu năm 40 của tạp chí CDO.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img