Logo Zephyrnet

Điều khiển điện thoại thông minh bằng mắt và cử chỉ đơn giản là ở đây

Ngày:

Sử dụng công nghệ theo dõi ánh nhìn mới này, bạn sẽ sớm có thể điều khiển điện thoại thông minh của mình bằng mắt và cử chỉ thay vì các lệnh nói hoặc nhập.

Khi người dùng tiếp tục sử dụng điện thoại của họ để đọc tin tức, xem phim, chỉnh sửa đa phương tiện và cập nhật phương tiện truyền thông xã hội, các thiết bị này đã phát triển để đáp ứng sức mạnh xử lý cao hơn và màn hình lớn hơn cần thiết cho những tác vụ khắt khe đó. 

Tuy nhiên, những chiếc điện thoại này thường cần khẩu lệnh hoặc kim giây để hoạt động, khá bất tiện và cồng kềnh (1). 

Đáp lại, các nhà nghiên cứu của Future Interfaces Groups tại HCII, Viện Tương tác Người-Máy tính thuộc Đại học Carnegie Mellon, đang phát triển một công cụ mới có tên là EyeMU. Nó cho phép người dùng thực hiện các thao tác trên điện thoại của họ bằng cách sử dụng điều khiển ánh mắt và cử chỉ tay đơn giản.

[Nhúng nội dung]

Đọc thêm: Bây giờ bạn có thể thanh toán bằng khuôn mặt của mình với công nghệ này

Tìm hiểu thêm về Công cụ theo dõi Gaze

“Chúng tôi đã hỏi liệu có cách nào tự nhiên hơn để tương tác với điện thoại thông minh không. Và người tiên phong cho rất nhiều việc chúng tôi làm là xem xét một thứ gì đó, ”Karan Ahuja, một nghiên cứu sinh tiến sĩ tại HCII cho biết (2). 

Mặc dù phân tích và dự đoán ánh nhìn không phải là một công nghệ mới, nhưng nó sẽ là một tiến bộ đáng chú ý nếu chúng ta đạt được mức chức năng có thể chấp nhận được. 

“Đôi mắt của chúng tôi có những gì chúng tôi gọi là vấn đề cảm ứng Midas. Chúng ta không thể có một tình huống mà một cái gì đó xảy ra trên điện thoại ở mọi nơi mà chúng ta nhìn. Chúng tôi có thể mở nhiều ứng dụng cùng một lúc, ”Chris Harrison, phó giáo sư tại HCII và giám đốc của Future Interfaces Group (3). 

Khó khăn này có thể được giải quyết bằng phần mềm theo dõi chính xác mắt. Là sinh viên năm cuối ngành khoa học máy tính, Andy Kong đã bị mê hoặc bởi công nghệ theo dõi mắt kể từ những ngày đầu tiên học tại CMU (4). Anh ấy nhận thấy các phiên bản thương mại quá đắt, vì vậy anh ấy đã thiết kế một chương trình theo dõi mắt của người dùng và di chuyển con trỏ trên màn hình bằng camera tích hợp của máy tính xách tay, một bước quan trọng đầu tiên đối với EyeMU.

Kong giải thích: “Hiện tại, điện thoại chỉ tương tác khi chúng tôi yêu cầu điều gì đó, cho dù là thông qua giọng nói, các lần nhấn hay nhấp vào nút. “Hãy nghĩ xem sẽ bổ ích đến mức nào nếu chúng ta có thể dự đoán những gì người dùng mong muốn bằng cách phân tích giao diện hoặc các sinh trắc học khác”.

Thật khó để sắp xếp hợp lý chương trình để chạy nhanh trên điện thoại thông minh.

“Điều này là do thiếu nguồn lực. Bạn phải đảm bảo rằng các thuật toán của bạn đủ nhanh, "Ahuja nhận xét. “Mắt của bạn sẽ bỏ qua nếu mất quá nhiều thời gian.”

Để biết thêm chi tiết, hãy xem xét đọc bài báo nghiên cứu về Tương tác EyeMU. Nhóm cũng đã trình bày những phát hiện của họ tại Hội nghị Quốc tế về Tương tác Đa phương thức năm ngoái (5). 

Kong và Ahuja đã nâng cấp nguyên mẫu ban đầu đó bằng cách nghiên cứu kiểu nhìn của người dùng khi nhìn vào các phần khác nhau của màn hình và hiển thị dữ liệu ánh xạ bằng công cụ Face Mesh của Google. Sau đó, nhóm nghiên cứu đã tạo ra một công cụ dự đoán ánh nhìn, sử dụng camera phía trước của điện thoại để lấy nét và ghi lại những gì người dùng đang nhìn làm mục tiêu.

Nhóm có thể làm cho công cụ này hiệu quả hơn bằng cách tích hợp công cụ dự đoán ánh nhìn với cảm biến chuyển động tích hợp trên điện thoại thông minh để kích hoạt các lệnh. 

Ví dụ: người dùng có thể bảo mật một thông báo dưới dạng mục tiêu bằng cách nhìn vào nó đủ lâu, sau đó vuốt điện thoại sang trái để loại bỏ hoặc sang phải để phản hồi thông báo đó. Tương tự, khi cầm một cốc cappuccino cao bằng một tay, người dùng có thể kéo điện thoại lại gần để mở rộng hình ảnh hoặc di chuyển điện thoại sang một bên để tắt tính năng kiểm soát ánh nhìn.

Harrison nói: “Những gã khổng lồ công nghệ lớn như Apple và Google đã tiến gần đến khả năng dự đoán bằng ánh mắt, nhưng chỉ đơn giản là nhìn vào thứ gì đó sẽ không giúp bạn đạt được điều đó.” 

“Bước đột phá quan trọng trong nỗ lực này là tích hợp phương thức thứ hai, chẳng hạn như vuốt điện thoại sang trái hoặc phải, kết hợp với dự đoán ánh nhìn. Đó là những gì làm cho nó rất hiệu quả. Nó có vẻ hiển nhiên, nhưng đó là một ý tưởng tuyệt vời giúp EyeMU trở nên trực quan hơn rất nhiều. "

Đọc thêm: Các công ty trên toàn thế giới đang đặt cược lớn vào Metaverse!

Theo dõi tương lai

Các công ty điện thoại thông minh đang cố gắng làm cho thiết bị của họ thông minh hơn. Tuy nhiên, khả năng theo dõi ánh nhìn của người dùng và thực hiện lệnh thích hợp của thiết bị di động vẫn còn khó nắm bắt (6).

Điện thoại thông minh đã xuất hiện từ cuối thế kỷ 20, nhưng thiết kế cơ bản mà chúng ta sử dụng ngày nay chủ yếu dựa trên iPhone, được phát hành vào năm 2007. 

Đã 15 năm kể từ đó. Vào năm 2022, khi điện thoại của chúng ta trở nên thông minh hơn, điều quan trọng cần nhớ là chúng cũng đang trở thành tâm điểm của vũ trụ “thông minh” của chúng ta. Điện thoại rất cần thiết trong các ngôi nhà thông minh và công nghệ ô tô. 

Điều đó sẽ không sớm thay đổi. Cố gắng loại bỏ điện thoại thông minh của bạn vào năm 2022 sẽ thậm chí còn khó khăn hơn bây giờ (Đáp lại, một biện pháp đối phó cũng đang gia tăng, Các thiết bị câm đang trở lại trong các ngành công nghiệp).

Vào năm 2020, Google bắt đầu thử nghiệm ứng dụng Look to Speak cho phép những người bị khiếm khuyết về vận động hoặc giọng nói chọn và nói các cụm từ (7).

Ứng dụng cho phép người dùng chọn các cụm từ đã chọn trước trên màn hình điện thoại của họ bằng ánh mắt của họ. 

Richard Cave, nhà trị liệu ngôn ngữ và ngôn ngữ của Google, làm việc với những cá nhân bị khuyết tật về khả năng nói và vận động, đặc biệt là những người không nói được và cần hỗ trợ giao tiếp (8). 

Cave đã nói thêm trong một bài đăng trên blog tiết lộ về ứng dụng, “Đó không chỉ là một công việc đối với tôi; đó là một niềm đam mê. ” “Mỗi ngày, tôi đều làm việc để giúp mọi người có thể dễ dàng hơn và dễ tiếp cận hơn trong việc giao tiếp các nhu cầu, suy nghĩ, tình cảm và bản sắc cơ bản của họ”.

Google đã thiết kế ứng dụng để sử dụng trên điện thoại thông minh và kết hợp với các thiết bị hỗ trợ tiên tiến hơn. Sau khi đặt điện thoại thấp hơn tầm mắt một chút, người dùng nhìn sang trái hoặc phải để chọn từ danh sách các câu mà tiện ích sau đó sẽ nói to. 

Theo Cave, các câu có thể được tùy chỉnh để cho phép mọi người thể hiện bản thân bằng giọng nói của họ. Theo Google, tất cả dữ liệu trong ứng dụng Look to Speak đều được bảo mật và không bao giờ rời khỏi điện thoại.

[Nhúng nội dung]

Theo dõi mắt và các công nghệ cảm ứng hỗ trợ khác cũng tương thích với các thiết bị của Apple (9). Tính năng theo dõi bằng mắt cũng đã được đưa vào các trò chơi, với việc Meta nộp bằng sáng chế cho công nghệ này, sẽ được đưa vào tai nghe Oculus VR mới nhất. 

Zuckerberg trước đây đã tuyên bố rằng một Quest Pro có thể đang trong quá trình hoạt động và sẽ được trang bị các cảm biến tiên tiến như theo dõi khuôn mặt và mắt. PS VR2 theo kế hoạch của Sony được cho là tai nghe cấp người tiêu dùng đầu tiên có tính năng theo dõi mắt, nhưng Meta có thể đánh bại chúng nếu Quest Pro ra mắt vào mùa hè hoặc mùa thu, như dự kiến ​​hiện tại.

Vào tháng XNUMX, Meta đã thêm tính năng theo dõi toàn bộ cơ thể vào Hệ điều hành Quest, chứng tỏ rằng doanh nghiệp luôn nghiên cứu các khả năng mới cho tai nghe VR tiềm năng. Theo dõi khuôn mặt, mắt và cơ thể chắc chắn sẽ khiến Quest Pro trở thành một đối thủ đáng gờm.

Trong VR, chuyển động của mắt sẽ được sử dụng đầu tiên (10) (Cách đọc được đề nghị: Theo dõi bằng mắt, đảo ngược và khủng hoảng sức khỏe với chứng nghiện ảo).

Tương lai thông minh hơn

Sự tiến bộ này trong việc theo dõi ánh mắt đã có thể thực hiện được bằng cách thêm một phương thức mới: cử chỉ. 

Cử chỉ cung cấp nhiều thông tin có ý nghĩa hơn là giao diện và cải thiện độ chính xác của công nghệ. Sự kết hợp này làm cho việc sử dụng một tiện ích khi đang di chuyển dễ dàng hơn nhiều. 

Khi được sử dụng với kính AR thay vì điện thoại di động, công nghệ nhìn sẽ có ý nghĩa hơn. Ví dụ: người dùng có thể điều hướng qua nguồn cấp dữ liệu hoặc đọc email trong khi nhìn thẳng về phía trước thay vì nhìn xuống điện thoại.

Giả sử nó trở nên phổ biến với các nhà phát triển của các nền tảng kỹ thuật số khác. Trong trường hợp đó, điều đó có nghĩa là kính AR thế hệ thứ hai và thứ ba sẽ có thể hoạt động nhiều hơn chỉ bằng một cái liếc mắt hoặc một cử chỉ đơn giản hơn bao giờ hết.

Đọc thêm: Robot Eldercare đã sẵn sàng để phá vỡ ngành công nghiệp chăm sóc sức khỏe

Kính AR có thể sớm thay thế điện thoại thông minh

Vào tháng 2021 năm 2022, nhà phân tích Ming-Chi Kuo của Apple thông báo rằng công ty sẽ ra mắt tai nghe AR mới vào năm XNUMX. Đồng thời, ông cũng dự đoán rằng iPhone sẽ tồn tại thêm một thập kỷ nữa trước khi Apple thay thế nó bằng AR (11).

Đây không phải là lần đầu tiên bất kỳ nhà phân tích nào thảo luận về sự kết thúc của iPhone. Như chúng ta đã thảo luận trước đây, Apple đã chuyển hướng nhiều hơn sang các dịch vụ bổ sung trong các sản phẩm Phần cứng và Phần mềm của mình (Bài đọc được đề xuất: Apple trong trận chiến tích cực để giành thị trường Ấn Độ). 

Apple có thể là một trong những công ty nổi bật nhất hiện nay; Có vẻ như Giám đốc điều hành Tim Cook nhận thức rõ rằng một doanh nghiệp không thể phụ thuộc quá nhiều vào một sản phẩm (Bài đọc được đề xuất: Netflix có thể áp dụng chiến lược tăng trưởng mới để khôi phục các khoản lỗ kỷ lục), và thậm chí cho đến ngày nay, một nửa doanh thu của nó vẫn là từ iPhone. 

Do đó, Kuo tin rằng tương lai của Apple phụ thuộc vào sự thành công của nó với liên doanh AR của công ty. 

“Apple đặt mục tiêu thay thế iPhone bằng AR trong thập kỷ tới, cho thấy nhu cầu về ABF của tai nghe AR sẽ vượt quá ít nhất một tỷ trong mười năm tới. Unimicron, nhà cung cấp ABF duy nhất của Apple, được coi là người hưởng lợi hàng đầu, ”Kuo nói (12).

Ông cũng nói thêm rằng nếu tai nghe AR chỉ được định vị như một phụ kiện của Mac hoặc iPhone, nó có thể ảnh hưởng đến sự thành công của sản phẩm. Tuy nhiên, nếu Apple cung cấp tai nghe AR hoạt động độc lập, điều đó có nghĩa là nó có thể mang lại trải nghiệm người dùng hoàn chỉnh và linh hoạt với hệ sinh thái của mình. 

Và với nhiều đột phá như công nghệ theo dõi ánh nhìn, không chỉ iPhone, cuối cùng chúng ta có thể thấy tai nghe AR thay thế điện thoại thông minh trong mười năm tới. 

Rucha Joshi, hiện đang quản lý một nhóm hơn 20 nhà văn nội dung tại TimesNext được thúc đẩy bởi niềm đam mê viết lách sáng tạo của cô ấy. Cô ấy háo hức biến thông tin thành hành động. Với khao khát kiến ​​thức của mình, cô ấy tự coi mình là một sinh viên mãi mãi và một nhà lãnh đạo đầy nhiệt huyết.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?