Zephyrnet Logosu

İşe Girmenize Yardımcı Olabilecek 5 Nadir Veri Bilimi Becerisi – KDnuggets

Tarih:

İşe Girmenize Yardımcı Olabilecek 5 Nadir Veri Bilimi Becerisi
Yazara göre resim
 

Makine öğrenimi karar ağacının nasıl oluşturulacağını biliyorsanız tebrikler, gerekli bilgiye sahipsiniz aynı düzeyde kod uzmanlığı ChatGPT ve istediğiniz iş için yarışan diğer binlerce veri bilimci olarak.

Son zamanlarda işe alım yöneticileri arasında büyüleyici bir trend, ham kodlama yeteneğinin artık işe yaramıyor olmasıdır. İşe alınabilmek için dilleri, çerçeveleri ve StackOverflow'ta nasıl arama yapılacağını bilmenin bir adım ötesine geçmeniz gerekir. Veri yönetişimi ve etik gibi yalnızca bir şirketin CEO'sunun endişelenmesi gerektiğini düşündüğünüz şeyler de dahil olmak üzere, çok daha fazla kavramsal anlayışa ve günümüzün veri bilimi ortamını kavramaya ihtiyacınız var.

Teknik ve teknik olmayan pek çok şey var veri bilimi becerileri Bunu bilmeniz gerekir, ancak işe alınmakta zorlanıyorsanız, bu daha az yaygın olan veri bilimi becerileri, istihdam kapısına adım atmanın bileti olabilir.

Daha önce veri bilimcileri, modeller üretirken karanlık yer altı bodrumlarında izole bir şekilde çalışıyordu. Modeller tahminler veya içgörüler yaratacaktır; bunlar, bu tahminleri üreten modeli anlamadan bunlara göre hareket edecek üst düzey yöneticilere aktarılacaktı. (Biraz abartıyorum ama o kadar da değil.)

Günümüzde liderlik, veri bilimcilerin ürünlerinin anlaşılmasında çok daha aktif bir rol üstleniyor. Bu, bir veri bilimci olarak sizin, modellerin yaptıklarını neden yaptığını, nasıl çalıştıklarını ve neden bu özel tahmini ortaya çıkardıklarını açıklayabilmeniz gerektiği anlamına gelir.

Patronunuza modelinizi çalıştıran gerçek kodu gösterebilseniz de, onlara modelinizin görselleştirme yoluyla nasıl çalıştığını gösterebilmek çok daha faydalıdır (okunabilir: kullanılabilir). Örneğin, bir telekom şirketi için müşteri kaybını tahmin eden bir makine öğrenimi modeli geliştirdiğinizi hayal edin. Kod satırlarınızın ekran görüntüsü yerine, modelin müşterileri nasıl segmentlere ayırdığını ve kaybetme riski taşıyanları nasıl tanımladığını görsel olarak açıklamak için bir akış şeması veya karar ağacı diyagramı kullanabilirsiniz. Bu, modelin mantığını şeffaf hale getirir ve anlaşılmasını kolaylaştırır.

Kodun nasıl örnekleneceğini bilmek nadir görülen bir beceridir ancak kesinlikle geliştirilmeye değer bir beceridir. Henüz herhangi bir kurs yok, ancak karar ağacınızı belgeleyen bir akış şeması oluşturmak için Miro gibi ücretsiz bir aracı denemenizi öneririm. Daha da iyisi, kodunuzu veri bilimci olmayan bir arkadaşınıza veya aile üyenize açıklamaya çalışın. Ne kadar çok yatarsanız o kadar iyi.

İşe Girmenize Yardımcı Olabilecek 5 Nadir Veri Bilimi Becerisi
Yazara göre resim
 

Birçok veri bilimci, girdi verilerinin nüanslarından ziyade model algoritmalarına odaklanma eğilimindedir. Özellik mühendisliği, makine öğrenimi modellerinin performansını artırmak için özelliklerin (girdi değişkenleri) seçilmesi, değiştirilmesi ve oluşturulması sürecidir.

Örneğin, emlak fiyatlarına yönelik tahmine dayalı bir model üzerinde çalışıyorsanız metrekare, yatak odası sayısı ve konum gibi temel özelliklerle başlayabilirsiniz. Ancak özellik mühendisliği yoluyla daha incelikli özellikler oluşturabilirsiniz. En yakın toplu taşıma istasyonuna olan mesafeyi hesaplayabilir veya mülkün yaşını temsil eden bir özellik oluşturabilirsiniz. Hatta suç oranlarına, okul derecelendirmelerine ve olanaklara yakınlığa dayalı "konum tercih edilirlik puanı" gibi yeni özellikler oluşturmak için mevcut özellikleri birleştirebilirsiniz.

Bu nadir bir beceridir çünkü sadece teknik bilgi birikimini değil, aynı zamanda derin alan bilgisi ve yaratıcılığı da gerektirir. Gerçekten ihtiyacın var almak verilerinizi ve elinizdeki sorunu analiz edin ve ardından modelleme için daha kullanışlı hale getirmek üzere verileri yaratıcı bir şekilde dönüştürün.

Özellik mühendisliği genellikle Coursera, edX veya Udacity gibi platformlardaki daha geniş makine öğrenimi kurslarının bir parçası olarak ele alınır. Ancak öğrenmenin en iyi yolunun uygulamalı deneyim yoluyla olduğunu düşünüyorum. Gerçek dünya verileri üzerinde çalışın ve farklı özellik mühendisliği stratejilerini deneyin.

İşte varsayımsal bir soru: Bir sağlık şirketinde veri bilimcisi olduğunuzu hayal edin. Belirli bir hastalık riski taşıyan hastaları belirlemek için tahmine dayalı bir model geliştirmekle görevlendirildiniz. En büyük zorluğunuz ne olabilir?

Cevabınız "ETL boru hatlarıyla boğuşmak" ise yanılıyorsunuz. Karşılaşacağınız en büyük zorluk muhtemelen modelinizin yalnızca etkili değil aynı zamanda uyumlu, etik ve sürdürülebilir olduğundan da emin olmak olacaktır. Bu, model için topladığınız tüm verilerin konumunuza bağlı olarak HIPAA ve GDPR gibi düzenlemelere uygun olmasını sağlamayı da içerir. Bu verileri kullanmanın ne zaman yasal olduğunu, verileri nasıl anonimleştirmeniz gerektiğini, hastalardan ne tür bir onay almanız gerektiğini ve bu onayı nasıl alacağınızı bilmeniz gerekir.

Uzman olmayan birinin modeli denetleyebilmesi için veri kaynaklarını, dönüşümleri ve model kararlarını belgeleyebilmeniz gerekir. Bu izlenebilirlik yalnızca mevzuata uygunluk açısından değil, aynı zamanda gelecekteki model denetimleri ve iyileştirmeleri için de hayati öneme sahiptir.

Veri yönetimi nerede öğrenilir: Yoğundur ancak harika bir kaynaktır. Küresel Veri Yönetimi Topluluğu.

 

İşe Girmenize Yardımcı Olabilecek 5 Nadir Veri Bilimi Becerisi
Image veriedo

"Veri biliminin temel olarak istatistikleri bilebileceğini, modeller oluşturabileceğini, trendleri bulabileceğini biliyorum, ancak bana sorarsanız gerçek bir etik ikilem düşünemedim. Bence veri bilimi sadece gerçek gerçekleri ortaya çıkarıyor." şuraya Reddit kullanıcısı Carlos_tec17, yanlış.

Yasal uyumluluğun ötesinde dikkate alınması gereken etik bir husus vardır. Oluşturduğunuz herhangi bir modelin, yanlışlıkla belirli gruplara eşit olmayan muameleye yol açabilecek önyargılara yol açmadığından emin olmanız gerekir.

örneğini seviyorum Amazon'un eski işe alım modeli Etiğin neden önemli olduğunu göstermek için. Eğer buna aşina değilseniz, Amazon veri bilimcileri, özgeçmişlere dayalı olarak potansiyel işe alımları seçebilecek bir model oluşturarak işe alım iş akışlarını hızlandırmaya çalıştı. Sorun, modeli oldukça erkek egemen olan mevcut özgeçmiş tabanına göre eğitmeleriydi. Yeni modelleri erkek işe alımlara karşı önyargılıydı. Bu son derece etik dışı.

Veri biliminin "hızlı hareket et ve işleri boz" aşamasını çoktan geçtik. Artık bir veri bilimci olarak kararlarınızın insanlar üzerinde gerçek bir etki yaratacağını bilmeniz gerekir. Cehalet artık bir mazeret değil; Modelinizin sahip olabileceği tüm olası sonuçların ve aldığı kararları neden aldığının tam olarak farkında olmanız gerekir.

UMichigan'ın yararlı bir özelliği var kurs “veri bilimi etiği” üzerine. ben de begendim Bu kitap veri bilimi gibi "sayıya dayalı" bilimlerde bile etiğin neden ve nasıl ortaya çıktığını göstermek.

Hayattaki gizli tüyolardan biri şu: Nasıl pazarlama yapacağınızı ne kadar iyi bilirseniz, iş bulmayı da o kadar kolay bulursunuz. Ve "piyasa" derken, "işleri nasıl seksi hale getireceğini bilmek"ten bahsediyorum. Pazarlama yeteneği sayesinde becerilerinizi satan bir özgeçmiş hazırlama konusunda daha iyi olacaksınız. Bir görüşmeciyi etkileme konusunda daha iyi olacaksınız. Ve özellikle veri biliminde, modelinizin ve modelinizin sonuçlarının neden önemli olduğunu açıklamakta daha iyi olacaksınız.

Unutmayın, başkasını bunun gerekli olduğuna ikna edemezseniz modelinizin ne kadar iyi olduğunun bir önemi yoktur. Örneğin, bir üretim tesisindeki ekipman arızalarını tahmin edebilecek bir model geliştirdiğinizi hayal edin. Teorik olarak modeliniz, şirketinizin planlanmamış kesintilerden milyonlarca tasarruf etmesini sağlayabilir. Ancak bu gerçeği üst düzey yöneticilere iletemezseniz, modeliniz bilgisayarınızda kullanılmadan çürüyüp gidecektir.

Pazarlama becerilerinizle, modelinizin kullanımını ve ihtiyacını, finansal faydaları, artan üretkenlik potansiyelini ve modelinizi benimsemenin uzun vadeli avantajlarını vurgulayan ilgi çekici bir sunumla kanıtlayabilirsiniz.

Bu, veri bilimi dünyasında çok nadir görülen bir beceridir çünkü çoğu veri bilimci, sayılara önem veren insanlardır. Veri bilimci adaylarının çoğu, elinizden gelenin en iyisini yapmanın ve başınızı öne eğmemenin kazanan bir istihdam stratejisi olduğuna gerçekten inanıyor. Maalesef sizi işe alan bilgisayarlar değil, insanlardır. Kendinizi, becerilerinizi ve ürünlerinizi pazarlayabilmek günümüz iş piyasasında gerçek bir avantajdır.

Nasıl pazarlama yapılacağını öğrenmek için başlangıç ​​seviyesindeki birkaç ücretsiz kursu öneririm sevmek Coursera tarafından sunulan “Dijital Dünyada Pazarlama”. Özellikle “Dijital dünyada kalıcı ürün fikirleri sunmak” bölümünü beğendim. Veri bilimine özgü pazarlama kursları yok ama hoşuma gitti Bu blog yazısı Bu, bir veri bilimcisi olarak kendinizi nasıl pazarlayacağınızı anlatıyor.

Dışarısı zor. olmasına rağmen öngörülen büyüme Çalışma İstatistikleri Bürosu'na göre, veri bilimci istihdamının artmasıyla birlikte, giriş seviyesi veri bilimi adaylarının çoğu iş bulmakta zorlanıyor, as bunlar Reddit mesajları örneklemek. ChatGPT'de rekabet var ve işten çıkarma akbabaları etrafta dolaşıyor.

İş piyasasında rekabet etmek ve öne çıkmak için teknik becerilerin ötesine geçmelisiniz. Veri yönetimi, etik, model vizyonu, özellik mühendisliği ve pazarlama becerileri sizi işe alım yöneticileri için daha düşünceli, güçlü ve ilgi çekici bir aday haline getirir.
 
 

Nate Rosidi bir veri bilimcisi ve ürün stratejisidir. Aynı zamanda analitik öğreten bir yardımcı profesördür ve kurucusudur. StrataScratch, veri bilimcilerinin en iyi şirketlerden gelen gerçek röportaj sorularıyla röportajlarına hazırlanmalarına yardımcı olan bir platform. onunla bağlantı kurun Twitter: StrataScratch or LinkedIn.

spot_img

En Son İstihbarat

spot_img