Logo Zephyrnet

Hướng dẫn Toàn diện về Ước tính Tư thế Con người

Ngày:

Ước tính Tư thế người là một nhiệm vụ thị giác máy tính thể hiện định hướng của một người ở định dạng đồ họa. Kỹ thuật này được áp dụng rộng rãi để dự đoán các bộ phận cơ thể hoặc vị trí khớp của một người. Đây là một trong những lĩnh vực nghiên cứu thú vị nhất về thị giác máy tính đã thu được rất nhiều sức hút vì sự phong phú của các ứng dụng có thể được hưởng lợi từ một công nghệ như vậy.

Bài viết hôm nay sẽ làm sáng tỏ về ước tính tư thế con người và cách thức hoạt động của nó. Ngoài ra, tôi sẽ cố gắng đề cập đến một số dự án ước tính tư thế mã nguồn mở và hàng đầu trên Github cùng với một số mô hình, kỹ thuật và kiểu ước tính tư thế hiện đại đã chứng minh được những tiến bộ vượt bậc trong lĩnh vực này.

Xem qua hướng dẫn toàn diện này, bạn sẽ bắt gặp các chủ đề dưới đây:

  1. Ước tính tư thế người là gì?
  2. Tầm quan trọng của ước tính tư thế người
  3. Sự khác biệt giữa ước tính tư thế người 2D và 3D
  4. Các loại mô hình ước tính tư thế người
  5. Từ dưới lên VS. Các phương pháp ước tính tư thế từ trên xuống
  6. Ước tính tư thế người hoạt động như thế nào?
  7. Mã ước tính tư thế người đơn giản
  8. Các ứng dụng của ước tính tư thế người
  9. Kết Luận
  10. về tác giả
  11. dự án

Ước tính tư thế người là gì?

Ước tính tư thế con người bằng cách sử dụng máy học trong Python

https://www.analyticsvidhya.com/blog/2021/10/human-pose-estimation-using-machine-learning-in-python/

Ước tính tư thế người xác định và phân loại tư thế của các bộ phận cơ thể người và khớp trong hình ảnh hoặc video. Nói chung, kỹ thuật dựa trên mô hình được sử dụng để biểu diễn và suy ra các tư thế cơ thể người trong không gian 2D và 3D.

Về cơ bản, nó là một cách để nắm bắt một tập hợp các tọa độ bằng cách xác định các khớp cơ thể con người như cổ tay, vai, đầu gối, mắt, tai, mắt cá chân và cánh tay, đây là điểm chính trong hình ảnh và video có thể mô tả tư thế của một người .

Sau đó, khi một hình ảnh hoặc video được cung cấp cho mô hình ước lượng tư thế làm đầu vào, nó sẽ xác định tọa độ của các bộ phận cơ thể và khớp được phát hiện này làm đầu ra và điểm tin cậy cho thấy độ chính xác của các ước tính.

Tầm quan trọng của ước tính tư thế người

Phát hiện người từ lâu đã trở thành trung tâm thảo luận chính cho các ứng dụng khác nhau trong phát hiện đối tượng truyền thống. Với những phát triển gần đây trong thuật toán học máy, máy tính hiện có thể hiểu ngôn ngữ cơ thể của con người bằng cách thực hiện phát hiện tư thế và theo dõi tư thế. Độ chính xác của những phát hiện này và các yêu cầu phần cứng để chạy chúng hiện đã đạt đến mức khả thi về mặt thương mại.

Ngoài ra, sự phát triển của công nghệ cũng biến đổi sâu sắc trong bối cảnh đại dịch coronavirus, nơi phát hiện và theo dõi tư thế thời gian thực hiệu suất cao sẽ mang lại một số xu hướng có ảnh hưởng nhất đến thị giác máy tính. Ví dụ, nó có thể được sử dụng để tạo khoảng cách xã hội bằng cách kết hợp ước tính tư thế con người và kinh nghiệm dự đoán khoảng cách. Nó hỗ trợ mọi người duy trì khoảng cách vật lý với nhau ở một nơi đông đúc.

Ước tính tư thế con người sẽ tác động đáng kể đến các ngành khác nhau, bao gồm an ninh, kinh doanh thông minh, sức khỏe và an toàn, và giải trí. Một trong những lĩnh vực mà kỹ thuật này đã chứng minh sự tồn tại của nó là lái xe tự hành. Với sự trợ giúp của phát hiện và theo dõi tư thế con người trong thời gian thực, máy tính có thể cảm nhận và dự đoán hành vi của người đi bộ một cách triệt để - cho phép lái xe ổn định hơn.

Sự khác biệt giữa ước tính tư thế người 2D và 3D

https://openaccess.thecvf.com/content_cvpr_2017/papers/Chen_3D_Human_Pose_CVPR_2017_paper.pdf

Có hai kỹ thuật chính trong đó các mô hình ước lượng tư thế có thể phát hiện tư thế của con người.

  1. Ước tính tư thế 2D: Trong kiểu ước lượng tư thế này, bạn chỉ cần ước tính vị trí của các khớp cơ thể trong không gian 2D so với dữ liệu đầu vào (tức là khung hình ảnh hoặc video). Vị trí được biểu thị bằng tọa độ X và Y cho mỗi điểm chính.
  2. Ước tính tư thế 3D: Trong loại ước tính tư thế này, bạn biến hình ảnh 2D thành vật thể 3D bằng cách ước tính thêm một chiều Z cho dự đoán. Ước tính tư thế 3D cho phép chúng tôi dự đoán vị trí không gian chính xác của một người hoặc sự vật được đại diện.

Ước tính tư thế 3D là một thách thức đáng kể mà các kỹ sư học máy phải đối mặt vì sự phức tạp kéo theo việc xây dựng bộ dữ liệu và thuật toán ước tính một số yếu tố, chẳng hạn như cảnh nền của hình ảnh hoặc video, điều kiện ánh sáng, v.v.

Các loại mô hình ước tính tư thế người

Có ba loại mô hình ước tính tư thế người chính được sử dụng để thể hiện cơ thể người trong mặt phẳng 2D và 3D.

Ước tính tư thế người bằng OpenCV & Python - TechVidvan

https://www.semanticscholar.org/paper/Deep-Learning-Based-Human-Pose-Estimation%3A-A-Survey-Zheng-Wu/0edef16d8fb78625ec5a050e2a7ae4efffef3689

# 1. Mô hình dựa trên bộ xương: còn được gọi là mô hình động học, đại diện này bao gồm một tập hợp các điểm chính (khớp) như mắt cá chân, đầu gối, vai, khuỷu tay, cổ tay và các hướng chi chủ yếu được sử dụng để ước tính tư thế 3D và 2D.

Mô hình cơ thể người linh hoạt và trực quan này bao gồm cấu trúc xương của cơ thể con người và thường được áp dụng để nắm bắt mối quan hệ giữa các bộ phận cơ thể khác nhau.

# 2. Mô hình dựa trên đường viền: còn được gọi là mô hình phẳng, nó được sử dụng để ước tính tư thế 2D và bao gồm đường viền và chiều rộng thô của cơ thể, thân mình và các chi. Về cơ bản, nó đại diện cho sự xuất hiện và hình dạng của cơ thể người, nơi các bộ phận cơ thể được hiển thị bằng các ranh giới và hình chữ nhật của đường viền của một người.

Một ví dụ nổi tiếng là Mô hình hình dạng hoạt động (ASM), ghi lại toàn bộ biểu đồ cơ thể người và các biến dạng hình bóng bằng kỹ thuật phân tích thành phần chính (PCA).

# 3. Mô hình dựa trên khối lượng: còn được gọi là mô hình thể tích, được sử dụng để ước tính tư thế 3D. Nó bao gồm nhiều mô hình cơ thể người 3D phổ biến và các tư thế được thể hiện bằng các lưới và hình dạng hình học của con người, thường được chụp để ước tính tư thế người 3D dựa trên học tập sâu.

Từ dưới lên VS. Các phương pháp ước tính tư thế từ trên xuống

Tất cả các phương pháp ước lượng tư thế con người có thể được phân loại thành hai cách tiếp cận chính: từ dưới lên và từ trên xuống.

  1. Phương pháp từ dưới lên Đánh giá từng khớp cơ thể trước và sau đó sắp xếp chúng để tạo ra một tư thế độc đáo.
  2. Phương pháp từ trên xuống trước tiên hãy chạy máy dò tìm cơ thể và xác định các khớp của cơ thể bên trong các hộp giới hạn được phát hiện.

Ước tính tư thế người hoạt động như thế nào?

Bây giờ bạn đã biết ước lượng tư thế là gì, tại sao nó lại cần thiết và sự khác biệt giữa các phương pháp, mô hình và kỹ thuật khác nhau, bây giờ đã đến lúc xem xét hoạt động của nó. Có, chúng ta sẽ nói về cách ước tính tư thế con người hoạt động và phần này được chia thành 3 danh mục phụ tương ứng:

  • Cấu trúc cơ sở
  • Tổng quan về kiến ​​trúc mô hình
  • Các cách tiếp cận khác nhau để ước tính tư thế người

Nhận biết hoạt động của con người cho ứng dụng thể dục & trị liệu - Phòng thí nghiệm InData

https://indatalabs.com/resources/human-activity-recognition-fitness-app

Cấu trúc cơ bản

Hướng dẫn năm 2019 về Ước tính tư thế người với Học sâu

https://nanonets.com/blog/human-pose-estimation-2d-guide/

Có một số giải pháp được đề xuất cho vấn đề ước lượng tư thế con người. Tuy nhiên, về tổng thể, các phương pháp hiện có có thể được phân loại thành ba nhóm, đó là Ước tính tư thế tuyệt đối, Ước tính tư thế tương đối và ước tính tư thế thích hợp, là sự kết hợp của cả hai.

Phương pháp đầu tiên: Phương pháp ước tính tư thế tuyệt đối dựa trên các tín hiệu điều hướng dựa trên vệ tinh, đèn hiệu điều hướng, các điểm mốc chủ động và thụ động cũng như đối sánh bản đồ nhiệt. Phương pháp thứ hai: Phương pháp ước tính tư thế tương đối dựa trên tính toán chết, trong đó từng bước cập nhật tư thế của con người bằng cách ước tính khoảng cách từ một khớp đã biết, tức là vị trí và hướng ban đầu của con người.

Về cơ bản, hầu hết các thuật toán sử dụng tư thế và định hướng của con người để dự đoán vị trí của một người liên quan đến nền. Nó là một khung 2 bước xác định các hộp giới hạn của con người và sau đó đánh giá tư thế của mỗi hộp.

Tiếp theo, nó ước tính các điểm chính của một người sẽ được khớp như khuỷu tay, đầu gối, cổ tay, v.v. Chúng tôi có thể ước tính tư thế cho một người hoặc nhiều người tùy thuộc vào ứng dụng.

Trong ước tính tư thế đơn lẻ, người mẫu ước tính tư thế của một người trong một cảnh nhất định. Ngược lại, trong trường hợp ước tính nhiều tư thế, mô hình ước tính tư thế cho nhiều người trong chuỗi đầu vào nhất định.

Tổng quan về kiến ​​trúc mô hình

https://nanonets.com/blog/human-pose-estimation-2d-guide/

Không thể đề cập đến nhiều kiến ​​trúc mạng nơ-ron cụ thể ở đây trong một bài viết, nhưng chúng ta sẽ nói về một số kiến ​​trúc mạnh mẽ, đáng tin cậy tạo nên những điểm tốt để bắt đầu.

Các mô hình ước lượng tư thế con người có một số loại, tức là, các phương pháp tiếp cận từ dưới lên và từ trên xuống được đề cập ở trên. Kiến trúc nổi tiếng nhất bắt đầu với một bộ mã hóa lấy hình ảnh đầu vào và trích xuất các tính năng bằng cách sử dụng một loạt các khối tích chập thu hẹp. Bước tiếp theo sau khi bộ mã hóa thay đổi theo phương pháp được sử dụng để ước tính tư thế.

Hệ thống đơn giản nhất về mặt khái niệm thực hành một bộ hồi quy để đưa ra các dự đoán đầu ra cuối cùng của mỗi vị trí điểm chính bằng cách chấp nhận hình ảnh đầu vào và xuất ra các tọa độ X, Y và Z cho mỗi điểm chính mà bạn đang cố gắng dự đoán. Tuy nhiên, trên thực tế kiến ​​trúc này không được sử dụng vì nó không tạo ra kết quả chính xác nếu không được tinh chỉnh thêm.

Một cách tiếp cận phức tạp hơn thực hành một kiến ​​trúc bộ mã hóa-giải mã. Thay vì tính toán tọa độ chung trực tiếp trong kiến ​​trúc này, bộ mã hóa được đưa vào bộ giải mã, tạo ra bản đồ nhiệt. Các bản đồ nhiệt này thể hiện khả năng khớp được phát hiện trong một phần nhất định của hình ảnh đầu vào.

Các tọa độ chính xác được chọn bằng cách chọn các vị trí bản đồ nhiệt có khả năng khớp cao nhất trong quá trình xử lý hậu kỳ. Hơn nữa, trong trường hợp ước tính nhiều tư thế, bản đồ nhiệt bao gồm nhiều vùng có khả năng xảy ra điểm chính cao, ví dụ: 2 hoặc nhiều tay trái trong một hình ảnh. Nó được thực hiện để chỉ định mỗi vị trí cho một mô hình con người cụ thể.

Các kiến ​​trúc được thảo luận ở trên áp dụng như nhau đối với ước tính tư thế 2D và 3D.

Các thư viện khác nhau để ước tính tư thế con người

Với sự phát triển nhanh chóng của các phương pháp thị giác máy tính cổ điển, ước lượng tư thế, bao gồm phân đoạn hình ảnh và phát hiện đối tượng, đã hoạt động tốt hơn trong các nhiệm vụ khác nhau.

Phần này sẽ liệt kê và xem xét năm thư viện ước lượng tư thế phổ biến nhất hiện có trên internet để sử dụng cho công chúng. Bạn có thể triển khai công cụ ước tính tư thế người tùy chỉnh bằng cách sử dụng các thư viện bên dưới.

# 1. OpenPose

Logo

Tài liệu: https://cmu-perceptual-computing-lab.github.io/openpose/web/html/doc/index.html

Liên kết Github: https://github.com/CMU-Perceptual-Computing-Lab/openpose

Ngôi sao GitHub: 22.8K

GitHub Fork: 6.8K

OpenPose là một thư viện phát hiện khớp người miễn phí hoạt động trong thời gian thực. Nó phát hiện các điểm chính để ước lượng cơ thể, khuôn mặt, bàn tay và bàn chân. Đây là hệ thống nhiều người đầu tiên cùng phát hiện tổng cộng 135 điểm chính trên một hình ảnh đầu vào duy nhất. Đây là một trong những thư viện ước tính tư thế con người phổ biến nhất sử dụng phương pháp tiếp cận từ dưới lên.

OpenPose là một API mã nguồn mở cung cấp cho người dùng sự linh hoạt trong việc chọn hình ảnh đầu vào từ các trường camera, webcam và các nguồn khác cho các ứng dụng hệ thống nhúng. Nó hỗ trợ các kiến ​​trúc phần cứng khác nhau, bao gồm GPU CUDA, GPU OpenCL và các hệ thống chỉ dành cho CPU. Nó được sử dụng rộng rãi để ước lượng tư thế 2D (toàn bộ cơ thể), tái tạo và ước lượng tư thế 3D (toàn bộ cơ thể) và plugin thống nhất.

# 2. PoseDetection

Liên kết Github: https://github.com/tensorflow/tfjs-models/tree/master/pose-detection

Ngôi sao GitHub: 10.3K

GitHub Fork: 3.2K

Phát hiện tư thế là một thư viện phát hiện tư thế theo thời gian thực mã nguồn mở có thể phát hiện tư thế của con người trong hình ảnh hoặc video. Đây là một kiến ​​trúc ước tính tư thế được xây dựng trên tensorflow.js và cho phép bạn phát hiện các bộ phận cơ thể như khuỷu tay, hông, cổ tay, đầu gối, mắt cá chân và những bộ phận khác cho một tư thế duy nhất hoặc nhiều tư thế.

Nó được xây dựng để chạy hiệu quả trên các thiết bị nhẹ như trình duyệt hoặc thiết bị di động. Gói này cung cấp ba mô hình hiện đại để chạy ước tính tư thế trong thời gian thực:

  • MoveNet (phát hiện 17 điểm chính và chạy ở tốc độ hơn 50 khung hình / giây)
  • BlazePose (phát hiện 33 điểm chính)
  • PoseNet (có khả năng phát hiện nhiều tư thế và mỗi tư thế chứa 17 điểm chính)

# 3. DensePose

Tài liệu: http://densepose.org/

Liên kết Github: https://github.com/facebookresearch/Densepose

Ngôi sao GitHub: 6.2K

GitHub Fork: 1.2K

Ước tính tư thế người dày đặc là một thư viện mã nguồn mở miễn phí có thể ánh xạ tất cả các pixel của con người của hình ảnh 2D RGB sang mô hình cơ thể dựa trên bề mặt 3D trong thời gian thực. Thư viện này được triển khai trong khung công tác phát hiện, được cung cấp bởi caffe2 và cũng có thể được sử dụng cho các bài toán ước lượng đơn và nhiều đặt ra.

#4. Bảng chữ cái


Tài liệu: https://www.mvig.org/research/alphapose.html

Liên kết Github: https://github.com/MVIG-SJTU/AlphaPose

Ngôi sao GitHub: 5.7K

GitHub Fork: 1.6K

Alphapose là một thư viện ước tính tư thế nhiều người theo thời gian thực mã nguồn mở sử dụng phương pháp tiếp cận từ trên xuống phổ biến và rất chính xác. Thư viện này giúp phát hiện các tư thế khi có các hộp giới hạn không chính xác của con người và nó là một kiến ​​trúc tối ưu để xác định tư thế của con người bằng các ô giới hạn được phát hiện một cách tối ưu.

Alphapose cũng cung cấp trình theo dõi tư thế trực tuyến hiệu quả để liên kết các tư thế chỉ ra cùng một người trên các khung hình. Đây là công cụ theo dõi tư thế trực tuyến nguồn mở đầu tiên và được gọi là PoseFlow. Thư viện này có thể phát hiện chính xác các điểm chính của nhiều người và một người trong thời gian thực trong hình ảnh, video và danh sách hình ảnh.

# 5. HRNet (Mạng độ phân giải cao)


Tài liệu: https://jingdongwang2017.github.io/Projects/HRNet/PoseEstimation.html

Liên kết Github: https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

Ngôi sao GitHub: 3.5K

GitHub Fork: 810

HRNet là một kiến ​​trúc được sử dụng để ước tính tư thế con người nhằm tìm ra những gì chúng ta biết là các điểm chính liên quan đến các đối tượng hoặc người cụ thể trong một hình ảnh. Nó duy trì các đại diện có độ phân giải cao trong suốt quá trình và dự đoán một bản đồ nhiệt điểm chính rất chính xác.

Ngoài ra, kiến ​​trúc này phù hợp để phát hiện tư thế của con người trong các môn thể thao được truyền hình. Nhiều tác vụ dự đoán dày đặc khác, chẳng hạn như phân đoạn, căn chỉnh khuôn mặt, phát hiện đối tượng, v.v., đã được hưởng lợi từ HRNet.

Mã ước tính tư thế người đơn giản

Có rất nhiều bộ dữ liệu công khai có sẵn cho cả ước tính tư thế 3D và 2D.

Tập dữ liệu ước tính tư thế 3D

Tập dữ liệu ước tính tư thế 2D

Trong ví dụ của chúng tôi, chúng tôi sẽ sử dụng mô hình được đào tạo trước bởi nhóm Openpose bằng cách sử dụng Caffe trên Bộ dữ liệu MPI, có 15 điểm chính để xác định các khớp khác nhau trong cơ thể con người.

"Head": 0, "Neck": 1, "RShoulder": 2, "RElbow": 3, "RWrist": 4, "LShoulder": 5, "LElbow": 6, "LWrist": 7, "RHip ": 8," RKnee ": 9," RAnkle ": 10," LHip ": 11," LKnee ": 12," LAnkle ": 13," Chest ": 14," Bối cảnh ": 15

Xác định các cặp tư thế được sử dụng để tạo các chi sẽ kết nối các điểm chính. Sau đó, tải xuống các mô hình đã được đào tạo.

Pose_Pairs = [["Head", "Neck"], ["Neck", "RShoulder"], ["RShoulder", "RElbow"], ["RElbow", "RWrist"], ["Neck", "LShoulder "], [" LShoulder "," LElbow "], [" LElbow "," LWrist "], [" Cổ "," Ngực "], [" Ngực "," RHip "], [" RHip "," RKnee "], [" RKnee "," RAnkle "], [" Chest "," LHip "], [" LHip "," LKnee "], [" LKnee "," LAnkle "]] MODEL_URL =" http: // posefs1.perception.cs.cmu.edu/OpenPose/models/ "POSE_FOLDER =" pose / "MPI_FOLDER = $ {POSE_FOLDER}" mpi / "MPI_MODEL = $ {MPI_FOLDER}" pose_iter_160000.caffemodel "wget ​​-c $ {MODEL_URL} $ {MPI_MODEL} -P $ {MPI_FOLDER}

# 1. Đọc tệp .prototxt và tải các trọng số được đào tạo trước trên mạng.

net = cv.dnn.readNetFromCaffe (args.proto, args.model)

# 2. Tiếp theo, tải hình ảnh hàng loạt và chuyển chúng qua mạng nơ-ron.

blob = cv.dnn.blobFromImage (hình ảnh, hệ số tỷ lệ, kích thước, trung bình, swapRB, cắt)

# 3. Gọi hàm chuyển tiếp để chạy suy luận trên các hình ảnh đầu vào. Sau đó, tạo bản đồ tin cậy cho mỗi điểm chính.

inp = cv.dnn.blobFromImage (frame, 1.0 / 255, (inWidth, inHeight), (0, 0, 0), swapRB = False, crop = False) net.setInput (inp)

out = net.osystem ()


#4. Hiển thị các điểm quan trọng này trên hình ảnh gốc.

for i in range (len (BODY_PARTS)): # Bản đồ nhiệt cắt lát của phần cơ thể tương ứng. HeatMap = out [0, i,:,:] # Ban đầu, chúng tôi cố gắng tìm tất cả các điểm tối đa cục bộ. Để đơn giản hóa một mẫu #, chúng tôi chỉ tìm một mẫu chung. Tuy nhiên, chỉ một tư thế duy nhất cùng lúc # có thể được phát hiện theo cách này. _, conf, _, point = cv.minMaxLoc (heatMap) x = (frameWidth * point [0]) / out.shape [3] y = (frameHeight * point [1]) / out.shape [2] # Thêm một điểm nếu độ tin cậy của nó cao hơn ngưỡng. point.append ((int (x), int (y)) if conf> args.thr else None)
cho cặp trong POSE_PAIRS: partFrom = pair [0] partTo = pair [1] khẳng định (partFrom trong BODY_PARTS) khẳng định (partTo trong BODY_PARTS) idFrom = BODY_PARTS [partFrom] idTo = BODY_PARTS [partTo] nếu điểm [idFrom] và điểm [idTo ]: cv.line (khung, điểm [idFrom], điểm [idTo], (255, 74, 0), 3) cv.ellipse (khung, điểm [idFrom], (4, 4), 0, 0, 360 , (255, 255, 255), cv.FILLED) cv.ellipse (khung, điểm [idTo], (4, 4), 0, 0, 360, (255, 255, 255), cv.FILLED) cv. putText (khung, str (idFrom), điểm [idFrom], cv.FONT_HERSHEY_SIMPLEX, 0.75, (255, 255, 255), 2, cv.LINE_AA) cv.putText (khung, str (idTo), điểm [idTo], cv.FONT_HERSHEY_SIMPLEX, 0.75, (255, 255, 255), 2, cv.LINE_AA)

# 5. Lưu tệp và chạy từ dấu nhắc lệnh bằng cách sử dụng các đối số được chỉ định.

python3 sample.py --input sample.jpg --proto pose / mpi / pose_deploy_linevec_faster_4_stages.prototxt --model pose / mpi / pose_iter_160000.caffemodel --dataset MPI

# 6. Các kết quả

kết quả của ước tính tư thế chạy trên một hình ảnh

Các ứng dụng của ước tính tư thế người

Ước tính tư thế con người là chủ đề được nói đến nhiều nhất trong thị giác máy tính và nó đã được sử dụng trong một loạt các ứng dụng và trường hợp sử dụng. Một số bao gồm tương tác giữa người và máy tính, phân tích chuyển động, thực tế tăng cường và người máy.

Nói chung, ước tính tư thế con người có vô số ứng dụng trong hầu hết mọi lĩnh vực. Một số ứng dụng phổ biến nhất đang được phát triển là:

1. Ước tính hoạt động và chuyển động của con người

Một trong những kích thước rõ ràng nhất có thể áp dụng để ước lượng đặt ra là theo dõi và đo lường hoạt động và chuyển động của con người. Nhiều kiến ​​trúc như OpenPose, PoseNet và DensePose thường được thực hành để nhận dạng hành động, cử chỉ hoặc dáng đi. Một số ví dụ về theo dõi hoạt động của con người là:

  • Huấn luyện viên thể thao hỗ trợ bởi AI hoặc huấn luyện viên thể dục cá nhân
  • Phát hiện cử chỉ ngồi
  • Giám sát hoạt động tại nơi làm việc
  • Giao tiếp bằng ngôn ngữ ký hiệu dành cho người khuyết tật
  • Phát hiện tín hiệu cảnh sát giao thông
  • Phát hiện tín hiệu trọng tài cricket
  • Phát hiện kỹ thuật khiêu vũ
  • Giám sát các chuyển động trong an ninh và giám sát
  • Đếm và theo dõi đám đông cho các cửa hàng bán lẻ

2. Thực tế tăng cường & Thực tế ảo (AR / VR)

Khi được kết hợp với các ứng dụng thực tế ảo và tăng cường, ước tính tư thế con người mang đến cơ hội tạo ra trải nghiệm thực tế và nhạy bén hơn. Ví dụ, bạn có thể học chơi các trò chơi khác nhau như quần vợt hoặc chơi gôn thông qua người dạy kèm ảo có tư thế minh họa. Hơn thế nữa, quân đội Mỹ đã triển khai các chương trình AR trong chiến đấu. Nó giúp binh lính phân biệt được đâu là kẻ thù và đâu là quân thiện chiến.

3. Người máy

Robot công nghiệp truyền thống dựa trên hệ thống thị giác 2D với nhiều hạn chế. Thay vì lập trình thủ công cho robot để học chuyển động, kỹ thuật ước tính tư thế 3D có thể được sử dụng. Cách tiếp cận này tạo ra các hệ thống rô bốt phản ứng nhanh hơn, linh hoạt hơn và giống như cuộc sống. Nó cho phép robot hiểu các hành động và chuyển động bằng cách làm theo tư thế, dáng vẻ hoặc ngoại hình của người dạy kèm.

4. Hoạt hình & Trò chơi

Những tiến bộ hiện đại trong công nghệ ước tính tư thế và bắt chuyển động làm cho hoạt ảnh nhân vật trở thành một quy trình tự động và hợp lý hóa. Ví dụ: máy ảnh độ sâu Kinect của Microsoft ghi lại chuyển động của con người trong thời gian thực bằng cách sử dụng dữ liệu cảm biến IR và sử dụng nó để hiển thị các hành động của nhân vật trong môi trường chơi game. Tương tự như vậy, việc chụp ảnh động để có trải nghiệm trò chơi điện tử nhập vai cũng có thể được tự động hóa dễ dàng bằng các kiến ​​trúc ước tính tư thế khác nhau.

Ghi chú cuối

Ước tính tư thế là một thành phần thị giác máy tính hấp dẫn được sử dụng bởi nhiều lĩnh vực, bao gồm công nghệ, chăm sóc sức khỏe, trò chơi, v.v. Tôi hy vọng hướng dẫn toàn diện của tôi về Ước tính tư thế người đã giúp giải thích những điều cơ bản về ước tính tư thế con người, nguyên tắc hoạt động của nó và cách nó có thể được sử dụng trong thế giới thực.

về tác giả

Mrinal Walia là Nhà phát triển Python chuyên nghiệp với bằng Cử nhân khoa học máy tính chuyên về Máy học, Trí tuệ nhân tạo và Thị giác máy tính. Mrinal cũng là một blogger, tác giả và một người đam mê tự do với bốn năm kinh nghiệm trong công việc của mình.

Nếu bạn thích đọc bài viết của tôi, hãy kết nối với tôi trên các trang mạng xã hội của tôi và theo dõi tôi để thưởng thức một tách cà phê ảo nhanh chóng.

Instagram | Facebook | LinkedIn | Github | E-mail |

Cảm ơn bạn, và không có một ngày tốt lành, có một ngày tuyệt vời!

Đọc thêm bài viết Ở đây về phát hiện Con người và Đối tượng.

dự án

  • https://www.researchgate.net/publication/225561390_A_Novel_Pose_Estimation_System_for_Indoor_Mobile_Robots_Based_on_Two_Optical_Sensors
  • https://viso.ai/deep-learning/pose-estimation-ultimate-overview/
  • https://www.fritz.ai/pose-estimation/#part-how
  • https://learnopencv.com/deep-learning-based-human-pose-estimation-using-opencv-cpp-python/
  • https://cv-tricks.com/pose-estimation/using-deep-learning-in-opencv/

Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định riêng của Tác giả. 

Nguồn: https://www.analyticsvidhya.com/blog/2022/01/a-comprehensive-guide-on-human-pose-estimation/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?