Logo Zephyrnet

Đừng trở thành một nhà khoa học dữ liệu được số hóa

Ngày:

Độc đáo và nổi bật (Ảnh by Thiên thần Ricardo Gomez on Unsplash)

Hàng hóa là hàng hóa cơ bản được sử dụng trong thương mại có thể hoán đổi với các hàng hóa khác cùng loại. Hàng hóa thường được sử dụng làm đầu vào trong quá trình sản xuất hàng hóa hoặc dịch vụ khác. […] Chất lượng của một loại hàng hóa nhất định có thể hơi khác nhau, nhưng về cơ bản là đồng nhất giữa các nhà sản xuất.

-Investopedia

 
Ngũ cốc là hàng hóa. Thịt bò là một loại hàng hóa. Khí đốt tự nhiên, dầu mỏ và vàng cũng là hàng hóa.

Bạn, với tư cách là một nhà khoa học dữ liệu, không được coi là một món hàng.

Các nhà khoa học dữ liệu có giống nhau không? Tất cả các chốt có hình dạng giống nhau có thể vừa với bất kỳ lỗ hổng nào mà một tổ chức có thể đang tìm cách lấp đầy không? Có phải họ chỉ đơn giản là những cơ thể ấm áp hoán đổi cho nhau?

Dĩ nhiên là không. Các nhà khoa học dữ liệu thực hiện các nhiệm vụ khác nhau trong nhiều môi trường khác nhau và sử dụng các bộ kỹ năng kỹ thuật và phi kỹ thuật rất khác nhau để có thể đáp ứng các yêu cầu trong vai trò của họ.

Ít nhất là nên là trường hợp. Tuy nhiên, dường như ngày càng có nhiều nhà khoa học dữ liệu xem bối cảnh khoa học dữ liệu như một danh sách các ô cần kiểm tra khi nói đến các kỹ năng, vì tất cả ý định và mục đích, tạo ra một đội quân gồm những cá nhân có kỹ năng tương tự cạnh tranh để thu hút sự chú ý của nhà tuyển dụng.

 
✔️ Kỹ năng lập trình Python cơ bản
✔️ Tổng quan về hệ sinh thái điện toán khoa học của Python
✔️ Một số hiểu biết về mạng lưới thần kinh và import tensorflow as tf
✔️ Khái niệm cơ bản về xử lý ngôn ngữ tự nhiên và nhập HuggingFace Transformers
✔️ Kiến thức làm việc về những điều cơ bản của thị giác máy tính
✔️ SQL, hoặc ít nhất là làm thế nào để SELECT * FROM Customers WHERE Country='Canada';
✔️ Kiến thức về MLOps là gì, cho dù bạn đã từng làm việc với nó hay chưa
 

Tuyệt vời, bây giờ bạn có bộ kỹ năng giống như những người khác.

Đó không phải là cách bạn nổi bật. Quan trọng hơn, đó không phải là cách bạn làm công việc của mình. Trong trường hợp này, nếu mỗi tổ chức cần cùng một thứ cho một nhà khoa học dữ liệu, họ sẽ chỉ cần lấy cái tiếp theo mà không cần quan tâm đến kỹ năng của một cá nhân nhất định.

Đừng hiểu lầm: tất cả chúng ta cần xây dựng một nền tảng vững chắc trên nền tảng đó để phát triển thương hiệu kỹ năng khoa học dữ liệu của riêng mình. Nhưng ngay cả khi bạn có mức độ hiểu biết từ trung cấp đến chuyên gia về các kỹ năng được liệt kê ở trên - điều này tự nó đã rất ấn tượng, chắc chắn rồi - bạn cũng không nổi bật so với những người khác trên giấy tờ.

Bạn đã học được những điều cơ bản. Bạn đã kiểm tra các hộp. Đã đến lúc xây dựng trên đó.

Các tổ chức và cá nhân phụ trách việc thuê các nhà khoa học dữ liệu thường không biết họ đang tìm kiếm điều gì… nhưng họ đang tìm kiếm một cái gì đó! Đã đến lúc các nhà khoa học dữ liệu phải nổi bật và làm như vậy sẽ yêu cầu sử dụng từ 's': chuyên môn hóa.

 
Tôi đoán rằng bạn đến với khoa học dữ liệu vì bạn có tính tò mò, là người có tư duy logic và muốn nghiên cứu các vấn đề thú vị. Không có đặc điểm nào trong số này gợi ý cho bạn rằng bạn nên có được bộ kỹ năng và kiến ​​thức chuyên môn giống như những người khác có! Mọi thứ về các đặc điểm bẩm sinh của một nhà khoa học dữ liệu đều gọi là “cá nhân” trong khi con đường chung để trở thành một nhà khoa học và các kỹ năng mà một nhà khoa học có được trên đường đi thì thầm là “sự phù hợp”.

Để giúp đảm bảo khả năng được tuyển dụng lâu dài, bạn cần nổi bật giữa đám đông, bạn cần tạo sự khác biệt cho mình và để làm được điều đó có nghĩa là bạn cần khẳng định cá tính của mình. Thời của nhà khoa học dữ liệu tổng quát đã qua, nếu chúng thực sự tồn tại ngay từ đầu.

Nâng cao kỹ năng. Tiêu điểm. chuyên môn hóa. Đây là những chìa khóa để kéo dài tuổi thọ trong trò chơi khoa học dữ liệu.

Kỳ lân không tồn tại. Thay vào đó, hãy nhắm đến việc trở thành một loài có nguy cơ tuyệt chủng.

Đúng vậy, một loài có nguy cơ tuyệt chủng. Nếu bạn có những kỹ năng, cả kỹ thuật và phi kỹ thuật, mà những người khác xung quanh bạn không có, thì bạn là loài có nguy cơ tuyệt chủng. Trong vương quốc động vật, điều này có thể không có lợi cho sự tồn tại lâu dài của một loài, nhưng với tư cách là một nhà khoa học dữ liệu có thể tuyển dụng thì chắc chắn là như vậy.

Vì vậy, làm thế nào bạn có thể trở thành một loài có nguy cơ tuyệt chủng? Phát triển một bộ kỹ năng chuyên biệt, kỹ thuật hoặc phi kỹ thuật, hoặc cả hai.

 
Có rất nhiều kỹ năng kỹ thuật có sẵn để thêm vào danh mục của bạn ngày nay, việc liệt kê bất kỳ kỹ năng nào cũng có vẻ nực cười. Nhưng để chứng minh rằng đây không phải là một quá trình khó khăn như bạn có thể tin, tôi sẽ làm như vậy.

Đầu tiên, chúng tôi muốn nghĩ về các kỹ năng kỹ thuật theo nghĩa thích hợp. Bạn (có lẽ) đã bao quát toàn cảnh các kỹ năng khoa học dữ liệu một cách rộng rãi và nông cạn; đã đến lúc xem xét nó qua lăng kính kép của độ sâu và độ hẹp.

Có 2 cách cơ bản mà tôi có thể nghĩ ra để tiếp cận việc đạt được các kỹ năng kỹ thuật “thích hợp”.

Mới và sáng bóng

 
Khi đạt được các kỹ năng cần thiết của whatzit kỹ thuật mới nhất, bạn cần phải cân bằng giữa việc quá sớm và quá muộn, đây có thể là một hành động gây xúc động mạnh. Không ai tìm kiếm một chuyên gia về một công cụ mới ra mắt ngày hôm qua, nhưng một khi mọi người đang sử dụng nó, kỹ năng của bạn không còn khiến bạn trở thành loài có nguy cơ tuyệt chủng nữa.

Một gợi ý sẽ là tìm kiếm các công cụ nguồn mở được phát triển gần đây vẫn chưa bắt kịp nhưng cho thấy sự hứa hẹn thực sự. Bắt đầu ở tầng trệt và thực hiện một số đóng góp sẽ là một cách tuyệt vời để tạo sự khác biệt cho bạn so với công cụ đó, đặc biệt là vào thời điểm quan trọng nhất.

Đã thử và kiểm tra (nhưng không chính thống)

 
Đây là đốt cháy chậm. Công cụ này đã xuất hiện được một thời gian, nhưng nó vẫn chưa đạt được thành công như mong đợi. Tôi nghĩ JAX là một ví dụ tuyệt vời về điều này. JAX đã xuất hiện được vài năm, nó ở cấp độ thấp hơn so với các công cụ tương tự khác, vì vậy nó có một số người theo dõi đang tìm kiếm lợi thế này và mức độ phổ biến của nó tiếp tục tăng lên. Thêm một số kiến ​​thức chuyên môn ở đây sẽ giúp bạn khác biệt với đám đông TensorFlow hoặc PyTorch, đặc biệt nếu bạn đã quen thuộc với tất cả những điều trên.

Thấy chưa, không nhất thiết là không biết những thứ khác, mà là biết chúng và một vài thứ khác.

 
Tôi nghĩ rằng 2 cách mà bạn có thể phân biệt khi nói đến các kỹ năng phi kỹ thuật là khá rõ ràng và chúng ta sẽ xem xét những cách này bên dưới.

Giao tiếp

 
Giao tiếp là chìa khóa trong khoa học dữ liệu. Không có gì mới để báo cáo ở đây. Tuy nhiên, những gì giao tiếp thực sự bao gồm những thay đổi. Bạn có thể tưởng tượng kỹ năng “truyền đạt ý tưởng hiệu quả với nhiều đồng nghiệp cùng lúc trong môi trường họp trực tuyến đồng bộ” sẽ ít được thèm muốn như thế nào cách đây 3 năm không?

Có thể để tạo sự khác biệt cho bản thân trong những ngày này, bạn có thể đưa ra thương hiệu chào mời mua hàng của riêng mình: dành thời gian phát triển các đồ tạo tác của bạn được sử dụng để truyền đạt kết quả của một dự án và câu chuyện bạn xây dựng xung quanh nó. Đây là điều luôn được nhấn mạnh đối với các nhà khoa học dữ liệu mới, nhưng thường thì công cụ hoặc kỹ thuật mới sáng bóng được ưu tiên hơn. Không có gì sai khi trở thành người trong nhóm mà những người khác tìm kiếm để bán kết quả và tầm nhìn của nhóm một cách hiệu quả cho các bên liên quan khác.

Chuyên môn tên miền

 
Đây là một trong những không có trí tuệ. Bạn muốn đưa kỹ năng học máy của mình vào ngành tài chính? Tốt hơn bạn nên tìm hiểu về ngành tài chính!

Điều này vượt ra ngoài lĩnh vực công nghiệp; có quá nhiều người tấn công quá trình xử lý ngôn ngữ tự nhiên từ khía cạnh kỹ thuật mà không có hiểu biết vững chắc về ngôn ngữ học, và điều đó cho thấy. Quan tâm đến việc tạo sự khác biệt cho bản thân trong NLP? Chọn một số văn bản ngôn ngữ. Điều tương tự cũng xảy ra với thị giác máy tính: nếu bạn không biết về sắc độ, phép nội suy, nhiễu Gaussian, v.v., hãy tự học. Nó sẽ chỉ giúp bạn đến được nơi bạn muốn phù hợp.

 
Hãy quên đi ý tưởng rằng tất cả các nhà khoa học dữ liệu cần biết X, Y và Z. Có rất nhiều chữ cái khác trong bảng chữ cái kỹ năng, vì vậy hãy học cho mình một chữ E, chữ J hoặc thậm chí là một chữ M nhỏ.

Và lúc nào cũng…

 

Đừng trở thành nhà khoa học dữ liệu hàng hóa
Hình ảnh của tác giả

 
 
Matthew Mayo (@ mattmayo13) là Nhà khoa học dữ liệu và là Tổng biên tập của KDnuggets, nguồn tài nguyên về Khoa học dữ liệu và Máy học trực tuyến. Sở thích của anh ấy là về xử lý ngôn ngữ tự nhiên, thiết kế và tối ưu hóa thuật toán, học không giám sát, mạng nơ-ron và các phương pháp tiếp cận tự động đối với học máy. Matthew có bằng Thạc sĩ về khoa học máy tính và bằng tốt nghiệp về khai thác dữ liệu. Có thể liên hệ với anh ấy tại editor1 tại kdnuggets [dot] com.
 

tại chỗ_img

Tin tức mới nhất

tại chỗ_img