제퍼넷 로고

취업에 도움이 되는 5가지 희귀한 데이터 과학 기술 – KDnuggets

시간

취업에 도움이 되는 5가지 희귀한 데이터 과학 기술
작성자 별 이미지
 

기계 학습 의사 결정 트리를 만드는 방법을 알고 계시다면 축하합니다. 동일한 수준의 코드 전문 지식 ChatGPT와 수천 명의 다른 데이터 과학자가 원하는 직업을 위해 경쟁합니다.

최근 채용 관리자들 사이에서 흥미로운 추세 중 하나는 원시 코딩 능력으로는 더 이상 성공하지 못한다는 것입니다. 채용되려면 언어, 프레임워크, StackOverflow 검색 방법을 아는 것보다 한 단계 더 나아가야 합니다. 데이터 거버넌스 및 윤리와 같이 회사의 CEO만이 걱정해야 한다고 생각하는 사항을 포함하여 훨씬 더 많은 개념적 이해와 오늘날의 데이터 과학 환경에 대한 이해가 필요합니다.

기술적인 것과 비기술적인 것이 많이 있습니다. 데이터 과학 기술 당신도 알아야 하지만 채용에 어려움을 겪고 있다면 이러한 덜 일반적인 데이터 과학 기술이 취업 문에 발을 들이는 티켓이 될 수 있습니다.

이전에는 데이터 과학자들이 어두운 지하 지하실에서 고립되어 모델을 제작하면서 작업했습니다. 모델은 예측이나 통찰력을 생성합니다. 이러한 예측은 이러한 예측을 생성한 모델을 이해하지 못한 채 조치를 취하는 최고 경영진에게 전달됩니다. (약간 과장했지만, 그렇게 많이는 아닙니다.)

오늘날 리더십은 데이터 과학자의 제품을 이해하는 데 훨씬 더 적극적인 역할을 수행합니다. 즉, 데이터 과학자로서 모델이 수행하는 작업을 수행하는 이유, 작동 방식, 특정 예측을 내놓은 이유를 설명할 수 있어야 합니다.

모델을 실행하는 실제 코드를 상사에게 보여줄 수 있지만 시각화를 통해 모델이 어떻게 작동하는지 보여줄 수 있는 것이 훨씬 더 유용합니다(읽기: 채용 가능). 예를 들어 통신 회사의 고객 이탈을 예측하는 ML 모델을 개발했다고 가정해 보겠습니다. 코드 줄의 스크린샷 대신 순서도나 의사결정 트리 다이어그램을 사용하여 모델이 고객을 분류하고 이탈 위험이 있는 고객을 식별하는 방법을 시각적으로 설명할 수 있습니다. 이는 모델의 논리를 투명하고 이해하기 쉽게 만듭니다.

코드를 설명하는 방법을 아는 것은 드문 기술이지만 확실히 개발할 가치가 있는 기술입니다. 아직 강좌가 없지만 Miro와 같은 무료 도구를 사용하여 의사결정 트리를 문서화하는 순서도를 만드는 것이 좋습니다. 더 나은 방법은 데이터 과학자가 아닌 친구나 가족에게 코드를 설명하는 것입니다. 누워있을수록 좋습니다.

취업에 도움이 되는 5가지 희귀한 데이터 과학 기술
작성자 별 이미지
 

많은 데이터 과학자들은 입력 데이터의 미묘한 차이보다는 모델 알고리즘에 더 집중하는 경향이 있습니다. 기능 엔지니어링은 기계 학습 모델의 성능을 향상시키기 위해 기능(입력 변수)을 선택, 수정 및 생성하는 프로세스입니다.

예를 들어 부동산 가격에 대한 예측 모델을 작업하는 경우 면적, 침실 수, 위치와 같은 기본 기능부터 시작할 수 있습니다. 그러나 기능 엔지니어링을 통해 더 미묘한 기능을 만들 수 있습니다. 가장 가까운 대중교통 역까지의 거리를 계산하거나 해당 건물의 연식을 나타내는 기능을 생성할 수 있습니다. 범죄율, 학교 등급, 편의 시설 근접성을 기반으로 한 "위치 바람직성 점수"와 같은 기존 기능을 결합하여 새로운 기능을 만들 수도 있습니다.

기술적인 노하우뿐만 아니라 깊은 도메인 지식과 창의성도 필요하기 때문에 보기 드문 기술입니다. 당신은 정말로해야합니다 얻을 데이터와 당면한 문제를 파악한 다음 데이터를 창의적으로 변환하여 모델링에 더욱 유용하게 만듭니다.

기능 엔지니어링은 Coursera, edX 또는 Udacity와 같은 플랫폼의 광범위한 기계 학습 과정의 일부로 다루는 경우가 많습니다. 하지만 저는 배우는 가장 좋은 방법은 직접 경험하는 것이라고 생각합니다. 실제 데이터로 작업하고 다양한 기능 엔지니어링 전략을 실험해 보세요.

다음은 가상의 질문입니다. 귀하가 의료 회사의 데이터 과학자라고 상상해 보십시오. 귀하는 특정 질병에 걸릴 위험이 있는 환자를 식별하기 위한 예측 모델을 개발하는 임무를 맡았습니다. 당신의 가장 큰 도전은 무엇입니까?

"ETL 파이프라인과 씨름 중"이라고 대답했다면 틀린 것입니다. 가장 큰 과제는 모델이 효과적일 뿐만 아니라 규정을 준수하고 윤리적이며 지속 가능하도록 만드는 것일 것입니다. 여기에는 모델에 대해 수집하는 모든 데이터가 위치에 따라 HIPAA 및 GDPR과 같은 규정을 준수하는지 확인하는 것이 포함됩니다. 해당 데이터를 사용하는 것이 합법적인 경우, 데이터를 익명화하는 방법, 환자에게 요구하는 동의 및 해당 동의를 얻는 방법을 알아야 합니다.

그리고 비전문가도 모델을 감사할 수 있도록 데이터 원본, 변환 및 모델 결정을 문서화할 수 있어야 합니다. 이러한 추적성은 규정 준수뿐만 아니라 향후 모델 감사 및 개선에도 필수적입니다.

데이터 거버넌스를 배울 수 있는 곳: 밀도가 높지만 훌륭한 리소스 중 하나는 글로벌 데이터 관리 커뮤니티.

 

취업에 도움이 되는 5가지 희귀한 데이터 과학 기술
이미지 출처 : 데이터데도

"저는 데이터 과학이 기본적으로 통계를 알고, 모델을 만들고, 추세를 찾을 수 있다는 것을 알고 있습니다. 하지만 저에게 묻는다면 실제 윤리적 딜레마는 생각할 수 없었습니다. 데이터 과학은 실제 사실을 유출할 뿐이라고 생각합니다." 말했다 Reddit 사용자 Carlos_tec17이 잘못되었습니다.

법적 준수 외에도 고려해야 할 윤리적 측면이 있습니다. 생성한 모델이 특정 그룹을 불평등하게 대우할 수 있는 편견을 실수로 도입하지 않도록 해야 합니다.

나는 다음의 예를 좋아한다 Amazon의 기존 채용 모델 윤리가 왜 중요한지 설명하기 위해. 익숙하지 않은 경우 Amazon 데이터 과학자는 이력서를 기반으로 잠재적 채용을 선택할 수 있는 모델을 만들어 채용 워크플로 속도를 높이려고 했습니다. 문제는 그들이 남성 중심적인 기존 이력서 기반을 기반으로 모델을 훈련했다는 것입니다. 그들의 새로운 모델은 남성 채용에 편향되어 있었습니다. 그것은 매우 비윤리적입니다.

우리는 데이터 과학의 "빠르게 움직이고 파괴하는" 단계를 훨씬 넘어섰습니다. 이제 데이터 과학자로서 귀하의 결정이 사람들에게 실질적인 영향을 미칠 것이라는 점을 알아야 합니다. 무지는 더 이상 변명이 아닙니다. 모델이 미칠 수 있는 모든 결과와 모델이 결정을 내리는 이유를 완전히 알고 있어야 합니다.

UMichigan에서는 도움이 되는 정보를 제공합니다. 코스 '데이터 과학 윤리'에 관한 것입니다. 나도 좋아했어 이 책은 데이터 과학과 같은 "숫자 기반" 과학에서도 윤리가 나타나는 이유와 방법을 설명합니다.

한 가지 비밀스러운 인생 꿀팁은 마케팅 방법을 더 잘 알수록 취업이 더 쉬워진다는 것입니다. 그리고 "시장"이란 "일을 섹시하게 만드는 방법을 아는 것"을 의미합니다. 마케팅 능력이 있으면 자신의 기술을 판매하는 이력서를 더 잘 작성할 수 있습니다. 당신은 면접관의 마음을 사로잡는 데 더 능숙할 것입니다. 특히 데이터 과학에서는 모델과 모델의 결과가 중요한 이유를 더 잘 설명할 수 있습니다.

모델이 필요하다는 사실을 다른 사람에게 납득시킬 수 없다면 모델이 얼마나 좋은지는 중요하지 않다는 점을 기억하십시오. 예를 들어 제조 공장의 장비 고장을 예측할 수 있는 모델을 개발했다고 가정해 보겠습니다. 이론적으로 귀하의 모델은 계획되지 않은 가동 중지 시간으로 인해 회사의 수백만 달러를 절약할 수 있습니다. 하지만 이 사실을 최고 경영진에게 전달할 수 없다면 모델은 컴퓨터에서 사용되지 않은 채 방치될 것입니다.

마케팅 기술을 사용하면 재정적 이점, 생산성 향상 가능성 및 모델 채택의 장기적인 이점을 강조하는 설득력 있는 프레젠테이션을 통해 모델의 용도와 필요성을 입증할 수 있습니다.

대부분의 데이터 과학자는 숫자를 다루는 사람이기 때문에 이는 데이터 과학 세계에서 매우 드문 기술입니다. 대부분의 데이터 과학자 지망생은 단순히 최선을 다하고 머리를 숙이는 것이 성공적인 고용 전략이라고 정말로 믿습니다. 불행하게도 당신을 고용하는 것은 컴퓨터가 아니라 사람입니다. 자신과 기술, 제품을 홍보할 수 있다는 것은 오늘날의 취업 시장에서 진정한 이점입니다.

마케팅 방법을 배우려면 몇 가지 초보자 무료 강좌를 추천합니다. 처럼 Coursera에서 제공하는 "디지털 세계에서의 마케팅"입니다. 특히 '디지털 세상에 맞는 제품 아이디어 제공' 섹션이 마음에 들었습니다. 데이터 과학에 특화된 마케팅 강좌는 없지만 마음에 들었습니다. 이 블로그 게시물 데이터 과학자로서 자신을 마케팅하는 방법을 안내합니다.

밖은 힘들어요. 있음에도 불구하고 예상 성장 노동통계국(Bureau of Labor Statistics)에 따르면, 데이터 과학자 채용에 있어 더 많은 초급 수준의 데이터 과학 지망자들이 일자리를 구하는 데 어려움을 겪고 있습니다. as 이들 레딧 게시물 설명하다. ChatGPT와의 경쟁이 벌어지고 해고 독수리들이 돌고 있습니다.

취업 시장에서 경쟁하고 두각을 나타내려면 기술적인 부분을 넘어서야 합니다. 데이터 거버넌스, 윤리, 모델 시각화, 기능 엔지니어링 및 마케팅 기술을 통해 채용 관리자를 위한 더욱 사려 깊고 강력하며 흥미로운 후보자가 될 수 있습니다.
 
 

네이트 로시디 데이터 과학자이자 제품 전략 분야의 전문가입니다. 그는 분석을 가르치는 겸임 교수이기도 하며, 스트라타스크래치, 데이터 사이언티스트가 상위 기업의 실제 인터뷰 질문을 통해 인터뷰를 준비하는 데 도움이 되는 플랫폼입니다. 그와 연결 트위터: StrataScratch or 링크드인.

spot_img

최신 인텔리전스

VC 카페

VC 카페

spot_img