Dudak Okuma Yapay Zekası, Sessiz Cümleleri Yorumlamada İnsanları Eziyor

LipNet: Dudak okumanın ne kadar kolay olduğunu düşünüyorsunuz?

Stanley Kubrick'in bilimkurgu başyapıtının en unutulmaz parçalarından biri 2001: Bir Uzay Macerası iki üyenin yer aldığı bir olay örgüsüdür. Keşif Bir Uzay gemisi mürettebatı, geminin yapay zeka asistanı HAL 9000'in davranışları konusunda giderek daha fazla şüphelenmeye başlıyor.

HAL'in sürekli onların söylediklerini dinlediğini bilerek, HAL'in dinleyemeyeceğini bildikleri bir yere çekilirler ve onun bağlantısını kesmeyi kabul ederler. İki astronotun durumu hesaba katmaması üzerine HAL planlarını bozar. Yapay zekanın üstün dudak okuma yetenekleri.

Fütüristik şeyler, değil mi? Oxford Üniversitesi'ndeki araştırmacıların yürüttüğü araştırmaya göre hayır. İnsanların söylediklerini yalnızca konuşurken ağız hareketlerini temel alarak doğru bir şekilde yorumlayabilen LipNet adında bir yapay zeka programı geliştirdiler.

İlgili

  • Photoshop AI 'mutluluğun' çürük dişlerle bir gülümseme olduğunu düşünüyor
  • Saçma başlangıç ​​fikrimi bir robot VC'ye sundum
  • Bir yapay zekanın gerçekten duyarlı hale geldiğini nasıl bileceğiz?

"LipNet, makine öğrenimini kullanarak cümle düzeyinde dudak okuma gerçekleştiriyor" Brendan Shillingfordaraştırmacılardan biri olan kağıt, Digital Trends'e söyledi. "En son teknolojiye sahip konuşma tanıma modellerine benzer bir sinir ağı, bir dizi video karesini işleyerek bunları bir cümleyle eşleştiriyor. Önceki yaklaşımlar cümleler yerine tahmin edilen tek tek kelimelerle çalışıyordu."

Önerilen Videolar

LipNet'in performansı, halka açık en büyük cümle düzeyinde dudak okuma veri seti olan GRID derlemindeki insan dudak okuma uzmanlarıyla inanılmaz derecede olumlu bir performans sergiliyor. Aslında insan uzmanların sadece yüzde 52 puan aldığı bir dönemde LipNet yüzde 93 puan aldı. Dudak okumaya yönelik cümle temelli yaklaşımı, aynı veri kümesinde yüzde 79,6 doğruluk elde eden bir makinenin daha önceki en iyi girişimini de alt üst etti.

Ancak hayali HAL 9000, dudak okuma güçlerini boşuna kullanırken, LipNet'in arkasındaki ekibin onları yaratmak için başka hedefleri var. Dünya çapında yaklaşık 360 milyon insan işitme kaybına neden oluyor. LipNet gibi araçlar, konuşmayı hayatlarını kolaylaştıracak şekilde doğru bir şekilde yorumlamaya yardımcı olarak bu kişiler için oldukça önemli olabilir.

"İlgilendiğimiz diğer uygulamalar arasında kamusal alanlarda sessiz dikte, gizli konuşmalar, Gürültülü ortamlarda konuşma tanıma, biyometrik tanımlama ve sessiz film işleme." Shillingford devam etti.

Gözetleme bunun gibi herhangi bir teknolojide bir sorun olacak olsa da, Nando de FreitasProjede de görev alan Dr., bunun odaklandıkları bir uygulama olmadığını söyledi. Ancak gelecekte diğer laboratuvarların bu amaçla bu tür çalışmalar yapmaya çalışmasının "şaşırtıcı olmayacağını" söyledi.

De Freitas şöyle devam etti: "Halk bunun farkında olmalı ve gizliliğimizi ve onurumuzu koruyan uygun yasaları oluşturmak için yasal demokratik kurumlarımıza güvenmelidir." "Bu çalışmayı yayınlayarak farkındalığın artmasına yardımcı olmayı ve aynı zamanda bu teknolojinin ihtiyacı olan insanlara yardım etmedeki yararlılığını vurgulamayı umuyoruz."

Editörlerin Önerileri

  • Apple'ın ChatGPT rakibi sizin için otomatik olarak kod yazabilir
  • Meta, DALL-E'yi video için yaptı ve bu hem ürkütücü hem de şaşırtıcı
  • Optik illüzyonlar yeni nesil yapay zekayı oluşturmamıza yardımcı olabilir
  • Lambda'nın makine öğrenimi sağlayan dizüstü bilgisayarı kılık değiştirmiş bir Razer
  • Bir A.I.'nin tüyler ürpertici derecede güzel "sentetik kutsal kitabını" okuyun. kendini Tanrı sanan

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.