Zephyrnet Logosu

İnsan Poz Tahmini Üzerine Kapsamlı Bir Kılavuz

Tarih:

İnsan Poz tahmini, bir kişinin yönelimini grafik biçiminde temsil eden bir bilgisayarlı görme görevidir. Bu teknik, bir kişinin vücut bölümlerini veya eklem pozisyonunu tahmin etmek için yaygın olarak uygulanır. Bu tür bir teknolojiden yararlanabilecek uygulamaların bolluğu nedeniyle çok fazla ilgi çeken bilgisayarlı görü alanındaki en heyecan verici araştırma alanlarından biridir.

Bugünün makalesi, insan poz tahmini ve nasıl çalıştığına ışık tutacak. Ayrıca, bu alanda muazzam ilerlemeler kaydettiğini kanıtlayan bazı son teknoloji modeller, teknikler ve poz tahmini türleri ile birlikte Github'daki bazı üst düzey ve açık kaynaklı poz tahmin projelerini ele almaya çalışacağım.

Bu kapsamlı kılavuzu incelerken, aşağıdaki konularla karşılaşacaksınız:

  1. İnsan Poz Tahmini Nedir?
  2. İnsan Poz Tahmininin Önemi
  3. 2D ve 3D İnsan Pozu Tahmini Arasındaki Fark
  4. İnsan Pozu Tahmin Modellerinin Türleri
  5. Aşağıdan Yukarıya VS. Poz Tahmininde Yukarıdan Aşağıya Yöntemler
  6. İnsan Poz Tahmini Nasıl Çalışır?
  7. Basit İnsan Pozu Tahmini Kodu
  8. İnsan Poz Tahmini Uygulamaları
  9. Final Kelimeler
  10. Yazar Hakkında
  11. Referanslar

İnsan Poz Tahmini Nedir?

Python'da Makine Öğrenimi Kullanarak İnsan Pozu Tahmini

https://www.analyticsvidhya.com/blog/2021/10/human-pose-estimation-using-machine-learning-in-python/

İnsan Poz Tahmini, görüntülerdeki veya videolardaki insan vücudu bölümlerinin ve eklemlerin pozlarını tanımlar ve sınıflandırır. Genel olarak, 2B ve 3B uzayda insan vücudu pozlarını temsil etmek ve sonuç çıkarmak için model tabanlı bir teknik kullanılır.

Esasen, bir kişinin pozunu tanımlayabilen resim ve videolarda önemli bir nokta olan bilek, omuz, dizler, gözler, kulaklar, ayak bilekleri ve kollar gibi insan vücudu eklemlerini tanımlayarak bir dizi koordinat yakalamanın bir yoludur. .

Daha sonra, poz tahmin edici modeline girdi olarak bir görüntü veya video verildiğinde, bu tespit edilen vücut bölümlerinin ve eklemlerin koordinatlarını çıktı olarak ve tahminlerin kesinliğini gösteren bir güven puanı olarak tanımlar.

İnsan Poz Tahmininin Önemi

İnsanların algılanması, geleneksel nesne algılamadaki çeşitli uygulamalar için uzun süredir birincil tartışma merkezi olmuştur. Makine öğrenimi algoritmalarındaki son gelişmelerle birlikte, bilgisayarlar artık poz algılama ve poz takibi yaparak insan vücut dilini anlayabilir. Bu tespitlerin doğruluğu ve bunları çalıştırmak için gereken donanım gereksinimleri artık ticari olarak uygulanabilir hale geldiği bir noktaya ulaştı.

Buna ek olarak, teknolojinin büyümesi, yüksek performanslı gerçek zamanlı poz algılama ve izlemenin bilgisayarlı görme alanındaki en etkili trendlerden bazılarını getireceği koronavirüs pandemisi sırasında derinden dönüştürülmüştür. Örneğin, insan poz tahmini ve mesafe projeksiyonu buluşsal yöntemlerini birleştirerek sosyal mesafe için kullanılabilir. İnsanların kalabalık bir yerde fiziksel mesafeyi korumalarına yardımcı olur.

İnsan duruşu tahmini, güvenlik, iş zekası, sağlık ve güvenlik ve eğlence dahil olmak üzere çeşitli endüstrileri önemli ölçüde etkileyecektir. Bu tekniğin varlığını kanıtladığı alanlardan biri de otonom sürüş. Gerçek zamanlı insan pozu algılama ve izlemenin yardımıyla, bilgisayarlar yaya davranışını çok daha kapsamlı bir şekilde algılayabilir ve tahmin edebilir - bu da daha tutarlı sürüşe olanak tanır.

2D ve 3D İnsan Pozu Tahmini Arasındaki Fark

https://openaccess.thecvf.com/content_cvpr_2017/papers/Chen_3D_Human_Pose_CVPR_2017_paper.pdf

Poz tahmin modellerinin insan pozlarını algılayabildiği başlıca iki teknik vardır.

  1. 2D Poz Tahmini: Bu tür poz tahmininde, giriş verilerine (yani görüntü veya video karesi) göre 2B uzayda vücut eklemlerinin konumlarını basitçe tahmin edersiniz. Konum, her bir anahtar nokta için X ve Y koordinatlarıyla temsil edilir.
  2. 3D Poz Tahmini: Bu tür poz tahmininde, tahmine ek bir Z boyutu tahmin ederek 2B görüntüyü 3B nesneye dönüştürürsünüz. 3D poz tahmini, temsil edilen bir kişinin veya şeyin doğru uzaysal konumunu tahmin etmemizi sağlar.

3B poz tahmini, bir görüntünün veya videonun arka plan sahnesi, ışık koşulları gibi çeşitli faktörleri tahmin eden veri kümeleri ve algoritmalar oluşturmanın gerektirdiği karmaşıklık nedeniyle makine öğrenimi mühendislerinin karşılaştığı önemli bir zorluktur.

İnsan Pozu Tahmin Modellerinin Türleri

İnsan vücudunu 2B ve 3B düzlemlerde temsil etmek için kullanılan üç ana insan pozu tahmin modeli türü vardır.

OpenCV ve Python Kullanarak İnsan Poz Tahmini - TechVidvan

https://www.semanticscholar.org/paper/Deep-Learning-Based-Human-Pose-Estimation%3A-A-Survey-Zheng-Wu/0edef16d8fb78625ec5a050e2a7ae4efffef3689

#1. İskelet tabanlı model: Kinematik model olarak da adlandırılan bu temsilci, ayak bilekleri, dizler, omuzlar, dirsekler, bilekler ve öncelikle 3B ve 2B poz tahmini için kullanılan uzuv yönelimleri gibi bir dizi kilit nokta (eklem) içerir.

Bu esnek ve sezgisel insan vücudu modeli, insan vücudunun iskelet yapısını içerir ve farklı vücut bölümleri arasındaki ilişkileri yakalamak için sıklıkla uygulanır.

#2. Kontur tabanlı model: düzlemsel model olarak da adlandırılır, 2B poz tahmini için kullanılır ve gövde, gövde ve uzuvların kontur ve kaba genişliğinden oluşur. Temel olarak, vücut bölümlerinin bir kişinin konturunun sınırları ve dikdörtgenleriyle görüntülendiği bir insan vücudunun görünümünü ve şeklini temsil eder.

Ünlü bir örnek, Aktif Şekil Modeli (ASM), temel bileşen analizi (PCA) tekniğini kullanarak tüm insan vücudu grafiğini ve siluet deformasyonlarını yakalar.

# 3. Hacim tabanlı model: Hacimsel model olarak da adlandırılan bu model, 3B poz tahmini için kullanılır. Genellikle derin öğrenmeye dayalı 3B insan poz tahmini için yakalanan, insan geometrik ağları ve şekilleri ile temsil edilen çok sayıda popüler 3B insan vücudu modeli ve pozundan oluşur.

Aşağıdan Yukarıya VS. Poz Tahmininde Yukarıdan Aşağıya Yöntemler

İnsan poz tahmini için tüm yöntemler iki temel yaklaşımda sınıflandırılabilir: aşağıdan yukarıya ve yukarıdan aşağıya.

  1. Aşağıdan yukarıya yöntemler önce her bir vücut eklemini değerlendirin ve ardından benzersiz bir poz oluşturacak şekilde düzenleyin.
  2. Yukarıdan aşağıya yöntemler önce bir vücut detektörü çalıştırın ve keşfedilen sınırlayıcı kutular içindeki vücut eklemlerini belirleyin.

İnsan Poz Tahmini Nasıl Çalışır?

Artık poz tahmininin ne olduğunu, neden gerekli olduğunu ve çeşitli yöntemler, modeller ve teknikler arasındaki farkı bildiğinize göre, şimdi çalışmasına bakmanın zamanı geldi. Evet, insan poz tahmininin nasıl çalıştığından bahsedeceğiz ve bu bölüm sırasıyla 3 alt kategoriye ayrılmıştır:

  • Temel Yapı
  • Model Mimarisine Genel Bakış
  • İnsan Pozu Tahmini İçin Farklı Yaklaşımlar

Fitness ve Terapi Uygulaması için İnsan Aktivitesi Tanıma – InData Labs

https://indatalabs.com/resources/human-activity-recognition-fitness-app

Basit yapı

Derin Öğrenme ile İnsan Poz Tahmini için 2019 Kılavuzu

https://nanonets.com/blog/human-pose-estimation-2d-guide/

İnsan poz tahmini problemi için önerilen birkaç çözüm vardır. Bununla birlikte, genel olarak, mevcut yöntemler, Mutlak Poz Tahmini, Göreli Poz Tahmini ve her ikisinin birleşimi olan uygun Poz tahmini olmak üzere üç gruba ayrılabilir.

Birincisi: Mutlak poz tahmini yöntemi, uydu tabanlı navigasyon sinyallerine, navigasyon işaretlerine, aktif ve pasif yer işaretlerine ve ısı haritası eşleştirmesine dayanır. İkincisi: Göreceli poz tahmini yöntemi, bilinen bir eklemden olan mesafeyi, yani bir insanın ilk konumu ve oryantasyonunu tahmin ederek insan pozunu aşamalı olarak güncelleyen ölü hesaplamaya dayanır.

Temel olarak, çoğu algoritma, bir kişinin arka planla ilgili konumunu tahmin etmek için insan pozunu ve yönünü kullanır. İnsan sınırlayıcı kutuları tanımlayan ve ardından her kutunun pozunu değerlendiren 2 adımlı bir çerçevedir.

Ardından, dirsek, diz, bilek vb. eklemlenecek bir kişi için kilit noktaları tahmin eder. Uygulamaya bağlı olarak tek bir kişi veya birden fazla kişi için pozları tahmin edebiliriz.

Tek poz tahmininde model, belirli bir sahnede tek bir kişi için pozları tahmin eder. Buna karşılık, çoklu poz tahmini durumunda, model, verilen girdi dizisindeki birden çok kişi için pozları tahmin eder.

Model Mimarisine Genel Bakış

https://nanonets.com/blog/human-pose-estimation-2d-guide/

Birden fazla özel sinir ağı mimarisi burada tek bir makalede ele alınamaz, ancak başlamak için iyi noktalar oluşturan birkaç sağlam, güvenilir olandan bahsedeceğiz.

İnsan pozu tahmin modelleri birkaç çeşittir, yani yukarıda bahsedilen aşağıdan yukarıya ve yukarıdan aşağıya yaklaşımlar. En ünlü mimari, bir giriş görüntüsü alan ve bir dizi daraltıcı evrişim bloğu kullanarak özellikleri çıkaran bir kodlayıcı ile başlar. Kodlayıcıdan sonraki adım, poz tahmini için kullanılan yönteme göre değişir.

Kavramsal olarak en basit sistem, bir giriş görüntüsünü kabul ederek ve tahmin etmeye çalıştığınız her kilit nokta için X, Y ve Z koordinatlarını çıkararak her bir anahtar nokta konumunun nihai çıktı tahminlerine bir gerileme uygular. Bununla birlikte, pratikte bu mimari, daha fazla iyileştirme yapılmadan doğru sonuçlar üretmediği için kullanılmamaktadır.

Biraz daha karmaşık bir yaklaşım, bir kodlayıcı-kod çözücü mimarisini uygular. Doğrudan bu mimaride ortak koordinatları hesaplamak yerine, kodlayıcı bir kod çözücüye beslenir ve ısı haritaları oluşturur. Bu ısı haritaları, bir girdi görüntüsünün belirli bir bölümünde tespit edilen bir eklem olasılığını temsil eder.

Kesin koordinatlar, son işlem sırasında ortak olasılığı en yüksek olan ısı haritası konumları seçilerek seçilir. Ayrıca, çok pozlu tahmin durumunda, bir ısı haritası, örneğin bir görüntüde 2 veya daha fazla sol el gibi yüksek anahtar nokta olasılığına sahip birden çok bölge içerir. Her konumu belirli bir insan modeline atamak için yapılır.

Yukarıda tartışılan mimariler, 2B ve 3B poz tahmini için eşit olarak geçerlidir.

İnsan Poz Tahmini İçin Farklı Kitaplıklar

Klasik bilgisayarlı görme yöntemlerindeki hızlı gelişmeyle birlikte, görüntü bölütleme ve nesne algılama dahil olmak üzere poz tahmini, çeşitli görevlerde daha iyi performans göstermiştir.

Bu bölüm, halka açık kullanım için internette mevcut olan en popüler beş poz tahmin kitaplığını listeleyecek ve gözden geçirecektir. Aşağıdaki kitaplıkları kullanarak özel bir insan pozu tahmincisi uygulayabilirsiniz.

#1. Açık Poz

Logo

Belgeler: https://cmu-perceptual-computing-lab.github.io/openpose/web/html/doc/index.html

Github Bağlantısı: https://github.com/CMU-Perceptual-Computing-Lab/openpose

Github Yıldızları: 22.8K

Github Çatal: 6.8K

OpenPose, gerçek zamanlı olarak çalışan ücretsiz bir insan eklemi algılama kitaplığıdır. Vücut, yüz, eller ve ayak tahmini için önemli noktaları tespit eder. Tek bir giriş görüntüsünde toplam 135 kilit noktayı ortaklaşa algılayan ilk çok kişili sistemdir. Aşağıdan yukarıya bir yaklaşım kullanan en popüler çok kişili insan pozu tahmin kitaplıklarından biridir.

OpenPose, kullanıcılara kamera alanlarından, web kameralarından ve gömülü sistem uygulamaları için diğer kaynaklardan giriş görüntülerini seçme esnekliği sağlayan açık kaynaklı bir API'dir. CUDA GPU'lar, OpenCL GPU'lar ve yalnızca CPU sistemleri dahil olmak üzere farklı donanım mimarilerini destekler. 2B poz tahmini (tüm vücut), 3B poz yeniden oluşturma ve tahmin (tüm vücut) ve birlik eklentisi için yaygın olarak kullanılır.

#2. Poz Algılama

Github Bağlantısı: https://github.com/tensorflow/tfjs-models/tree/master/pose-detection

Github Yıldızları: 10.3K

Github Çatal: 3.2K

Poz algılama, görüntülerdeki veya videolardaki insan pozlarını algılayabilen, açık kaynaklı, gerçek zamanlı bir poz algılama kitaplığıdır. Bu, tensorflow.js üzerine kurulu bir poz tahmincisi mimarisidir ve dirsekler, kalçalar, bilekler, dizler, ayak bilekleri ve diğerleri gibi vücut kısımlarını tek bir poz veya birden fazla poz için algılamanıza olanak tanır.

Tarayıcılar veya mobil cihazlar gibi hafif cihazlarda verimli bir şekilde çalışacak şekilde tasarlanmıştır. Bu paket, gerçek zamanlı poz tahminini çalıştırmak için son teknoloji ürünü üç model sunar:

  • MoveNet (17 kilit noktayı algılar ve 50+ fps'de çalışır)
  • BlazePose (33 kilit noktayı algılar)
  • PoseNet (birden çok pozu algılayabilir ve her poz 17 anahtar nokta içerir)

#3. YoğunPoz

Belgeler: http://densepose.org/

Github Bağlantısı: https://github.com/facebookresearch/Densepose

Github Yıldızları: 6.2K

Github Çatal: 1.2K

Yoğun insan poz tahmini, 2B RGB görüntülerin tüm insan piksellerini gerçek zamanlı olarak vücudun 3B yüzey tabanlı modeliyle eşleyebilen ücretsiz, açık kaynaklı bir kitaplıktır. Bu kitaplık, caffe2 tarafından desteklenen detektör çerçevesinde uygulanmaktadır ve ayrıca tekli ve çoklu poz tahmini problemleri için de kullanılabilir.

#4. AlfaPoz


Belgeler: https://www.mvig.org/research/alphapose.html

Github Bağlantısı: https://github.com/MVIG-SJTU/AlphaPose

Github Yıldızları: 5.7K

Github Çatal: 1.6K

Alphapose, popüler bir yukarıdan aşağıya yaklaşımı kullanan ve çok doğru olan, açık kaynaklı, gerçek zamanlı, çok kişili bir poz tahmin kitaplığıdır. Bu kitaplık, hatalı insan sınırlayıcı kutuların varlığında pozları algılamaya yardımcı olur ve en uygun şekilde algılanan sınırlayıcı kutularla insan pozlarını belirlemek için en uygun mimaridir.

Alphapose ayrıca, kareler arasında aynı kişiyi gösteren pozları ilişkilendirmek için etkili bir çevrimiçi poz izleyici sağlar. İlk açık kaynaklı çevrimiçi poz izleyicidir ve PoseFlow olarak adlandırılır. Bu kitaplık, resimler, videolar ve resim listelerindeki gerçek zamanlı çok kişili ve tek kişilik kilit noktaları doğru bir şekilde algılayabilir.

#5. HRNet (Yüksek Çözünürlüklü Net)


Belgeler: https://jingdongwang2017.github.io/Projects/HRNet/PoseEstimation.html

Github Bağlantısı: https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

Github Yıldızları: 3.5K

Github Çatal: 810

HRNet, bir görüntüdeki belirli nesnelere veya kişiye göre kilit noktalar olarak bildiklerimizi bulmak için insan duruşu tahmini için kullanılan bir mimaridir. Süreç boyunca yüksek çözünürlüklü temsilleri korur ve çok doğru bir anahtar nokta ısı haritası tahmin eder.

Ek olarak, bu mimari televizyonda yayınlanan sporlarda insan duruşunu tespit etmek için uygundur. Segmentasyon, yüz hizalama, nesne algılama vb. gibi diğer birçok yoğun tahmin görevi HRNet'ten yararlanmıştır.

Basit İnsan Pozu Tahmini Kodu

Hem 3B hem de 2B poz tahmini için çok sayıda genel veri seti mevcuttur.

3B Poz Tahmini Veri Kümeleri

2B Poz Tahmini Veri Kümeleri

Örneğimizde, insan vücudundaki çeşitli eklemleri tanımlamak için 15 kilit nokta içeren MPI Veri Kümesi üzerinde Caffe kullanan Openpose ekibi tarafından önceden eğitilmiş modeli kullanacağız.

"Kafa": 0, "Boyun": 1, "RSomuz": 2, "Dikkat": 3, "Sağır": 4, "LSomuz": 5, "Sol Büküm": 6, "Sol Bilek": 7, "Sağ Kalça" ": 8, "RKnee": 9, "Rankle": 10, "LHip": 11, "LKnee": 12, "Bankle": 13, "Göğüs": 14, "Arka Plan": 15

Kilit noktaları birleştirecek uzuvları oluşturmak için kullanılan poz çiftlerini tanımlayın. Ardından, eğitilmiş modelleri indirin.

Pose_Pairs = [ ["Kafa", "Boyun"], ["Boyun", "RShoulder"], ["RShoulder", "RElbow"], ["RElbow", "RWrist"], ["Boyun", "LSomuz "], ["LSomuz", "LElbow"], ["LElbow", "LWrist"], ["Boyun", "Göğüs"], ["Göğüs", "RKalça"], ["RKalça", "RKnee "], ["RKnee", "Rankle"], ["Göğüs", "LKalça"], ["LKalça", "LKnee"], ["LKnee", "Lankle"] ] MODEL_URL="http:// posefs1.perception.cs.cmu.edu/OpenPose/models/" POSE_FOLDER="pose/" MPI_FOLDER=${POSE_FOLDER}"mpi/" MPI_MODEL=${MPI_FOLDER}"pose_iter_160000.caffemodel" wget -c ${}$MODEL_ {MPI_MODEL} -P ${MPI_FOLDER}

#1. .prototxt dosyasını okuyun ve önceden eğitilmiş ağırlıkları ağa yükleyin.

net = cv.dnn.readNetFromCaffe(args.proto, args.model)

#2. Ardından, görüntüleri toplu halde yükleyin ve bunları sinir ağından geçirin.

blob = cv.dnn.blobFromImage(görüntü, ölçek faktörü, boyut, ortalama, takasRB, kırpma)

#3. Giriş görüntülerinde çıkarımı çalıştırmak için ileri işlevini çağırın. Ardından her bir kilit nokta için güven haritasını oluşturun.

inp = cv.dnn.blobFromImage(çerçeve, 1.0 / 255, (inWidth, inHeight), (0, 0, 0), swapRB=Yanlış, kırp=Yanlış) net.setInput(inp)

dışarı = net.forward()


#4. Bu kritik noktaları orijinal görüntüde görüntüleyin.

i in range(len(BODY_PARTS)): # Karşılık gelen vücut parçasının dilim ısı haritası. heatMap = out[0, i, :, :] # Başlangıçta, tüm yerel maksimumları bulmaya çalışırız. Bir örneği basitleştirmek için # sadece global bir tane buluyoruz. Ancak aynı anda yalnızca tek bir poz bu şekilde # tespit edilebilir. _, conf, _, nokta = cv.minMaxLoc(heatMap) x = (frameWidth * nokta[0]) / out.shape[3] y = (frameHeight * nokta[1]) / out.shape[2] # Ekle güven eşiğinden yüksekse bir puan. point.append((int(x), int(y)) if conf > args.thr başka Yok)
POSE_PAIRS'de çift için: partFrom = pair[0] partTo = pair[1] assert(partFrom in BODY_PARTS) assert(partTo in BODY_PARTS) idFrom = BODY_PARTS[partFrom] idTo = BODY_PARTS[partTo] if puanları[idFrom] ve puanlar[idTo ]: cv.line(çerçeve, noktalar[idFrom], noktalar[idTo], (255, 74, 0), 3) cv.ellipse(frame, noktalar[idFrom], (4, 4), 0, 0, 360 , (255, 255, 255), cv.FILLED) cv.ellipse(çerçeve, noktalar[idTo], (4, 4), 0, 0, 360, (255, 255, 255), cv.FILLED) cv. putText(frame, str(idFrom), noktalar[idFrom], cv.FONT_HERSHEY_SIMPLEX, 0.75, (255, 255, 255),2,cv.LINE_AA) cv.putText(çerçeve, str(idTo), noktalar[idTo], cv.FONT_HERSHEY_SIMPLEX, 0.75, (255, 255, 255),2,cv.LINE_AA)

#5. Dosyayı kaydedin ve atanan bağımsız değişkenleri kullanarak komut isteminden çalıştırın.

python3 sample.py --input sample.jpg --proto poz/mpi/pose_deploy_linevec_faster_4_stages.prototxt --model poz/mpi/pose_iter_160000.caffemodel --dataset MPI

#6. Sonuçlar

bir görüntü üzerinde çalışan poz tahmininin sonuçları

İnsan Poz Tahmini Uygulamaları

İnsan poz tahmini, bilgisayarla görü alanında en çok konuşulan konudur ve çok çeşitli uygulamalarda ve kullanım durumlarında kullanılmıştır. Bazıları insan-bilgisayar etkileşimi, hareket analizi, artırılmış gerçeklik ve robotiği içerir.

Genel olarak, insan poz tahmini hemen hemen her alanda sonsuz uygulamaya sahiptir. Geliştirme aşamasında olan en yaygın uygulamalardan bazıları şunlardır:

1. İnsan Aktivitesi ve Hareket Tahmini

Poz tahmini için geçerli olan en belirgin boyutlardan biri, insan faaliyetini ve hareketini izlemek ve ölçmektir. OpenPose, PoseNet ve DensePose gibi birçok mimari genellikle eylem, jest veya yürüyüş tanıma için uygulanır. İnsan etkinliği izlemenin bazı örnekleri şunlardır:

  • AI destekli spor antrenörleri veya kişisel spor salonu antrenörü
  • Oturma hareketleri algılama
  • İşyeri etkinliği izleme
  • Engelliler için işaret dili iletişimi
  • Trafik polisleri sinyal algılama
  • Kriket hakem sinyal algılama
  • Dans teknikleri tespiti
  • Güvenlik ve gözetimdeki hareketlerin izlenmesi
  • Perakende satış noktaları için kalabalık sayımı ve takibi

2. Artırılmış Gerçeklik ve Sanal Gerçeklik (AR/ VR)

Artırılmış ve sanal gerçeklik uygulamalarıyla birleştirildiğinde, insan poz tahmini, daha gerçekçi ve duyarlı deneyimler yaratma fırsatı sunar. Örneğin, poz resimli sanal eğitmenler aracılığıyla tenis veya golf gibi çeşitli oyunları oynamayı öğrenebilirsiniz. Dahası, ABD ordusu savaşta AR programları uyguladı. Askerlerin düşmanları ve dost birlikleri ayırt etmesine yardımcı olur.

3. Robotik

Geleneksel endüstriyel robotlar, birçok sınırlamaya sahip 2B görüntü sistemlerine dayanmaktadır. Hareketleri öğrenmek için robotları manuel olarak programlamak yerine, bir 3D poz tahmini tekniği kullanılabilir. Bu yaklaşım, daha duyarlı, esnek ve gerçeğe yakın robotik sistemler oluşturur. Öğretmenin duruşunu, bakışını veya görünüşünü takip ederek robotların eylemleri ve hareketleri anlamasını sağlar.

4. Animasyon ve Oyun

Poz tahmini ve hareket yakalama teknolojisindeki modern gelişmeler, karakter animasyonunu akıcı ve otomatikleştirilmiş bir süreç haline getiriyor. Örneğin, Microsoft'un Kinect derinlik kamerası, IR sensör verilerini kullanarak insan hareketini gerçek zamanlı olarak yakalar ve bunu karakterlerin eylemlerini sanal olarak oyun ortamına aktarmak için kullanır. Benzer şekilde, sürükleyici video oyunu deneyimleri için animasyonları yakalamak da farklı poz tahmin mimarileri tarafından zahmetsizce otomatikleştirilebilir.

Son Notlar

Poz tahmini, teknoloji, sağlık, oyun vb. dahil olmak üzere birden fazla alan tarafından kullanılan büyüleyici bir bilgisayarlı görü bileşenidir. Umarım kapsamlı İnsan Poz Tahmini kılavuzum, insan poz tahmininin temellerini, çalışma ilkelerini ve nasıl kullanılabileceğini açıklamaya yardımcı olmuştur. gerçek dünyada.

Yazar Hakkında

Mrinal Walia, Makine Öğrenimi, Yapay Zeka ve Bilgisayarla Görme konusunda uzmanlaşmış bilgisayar bilimleri alanında lisans derecesine sahip profesyonel bir Python Geliştiricisidir. Mrinal aynı zamanda serbest çalışan bir blogcu, yazar ve işinde dört yıllık deneyime sahip bir inektir.

Yazımı okumayı beğendiyseniz, sosyal medya profillerimden benimle bağlantı kurun ve hızlı bir sanal kahve içmek için beni takip edin.

Instagram | Facebook | LinkedIn | Github | e-posta |

Teşekkürler, iyi günler değil, iyi günler!

Diğer makaleleri okuyun okuyun İnsan ve Nesne algılama üzerine.

Referanslar

  • https://www.researchgate.net/publication/225561390_A_Novel_Pose_Estimation_System_for_Indoor_Mobile_Robots_Based_on_Two_Optical_Sensors
  • https://viso.ai/deep-learning/pose-estimation-ultimate-overview/
  • https://www.fritz.ai/pose-estimation/#part-how
  • https://learnopencv.com/deep-learning-based-human-pose-estimation-using-opencv-cpp-python/
  • https://cv-tricks.com/pose-estimation/using-deep-learning-in-opencv/

Bu makalede gösterilen medya Analytics Vidhya'ya ait değildir ve Yazarın takdirine bağlı olarak kullanılır. 

Kaynak: https://www.analyticsvidhya.com/blog/2022/01/a-comprehensive-guide-on-human-pose-estimation/

spot_img

En Son İstihbarat

spot_img