ახალი IBM Speech Tech მიზნად ისახავს იყოს ზეადამიანური

IBM აქვს გამოაქვეყნა Embedded ViaVoice 4.4, რომელიც გთავაზობთ თავისუფალი ფორმის ბრძანებების ამოცნობას, ფრენის რეჟიმში თარგმნისა და სუბტიტრების სერვისებს და შეუძლია პრეტენზია ჰქონდეს სალაპარაკო ინგლისურის ზოგიერთი ნიუანსის გაგებაზე. ტექნოლოგია შექმნილია იმისთვის, რომ მომხმარებლებს საშუალება მისცენ გააკონტროლონ მანქანებში ჩაშენებული სისტემები, ხელის მოწყობილობები და სხვა არაკომპიუტერები. აპლიკაციები მოქნილად და ბუნებრივად საუბრისას მოწყობილობებზე დამახსოვრების გარეშე და წინასწარ განსაზღვრული სალაპარაკო საგულდაგულოდ წარმოთქმის გარეშე ბრძანებებს.

როგორც "უფასო ფორმის ბრძანების ამოცნობის" მაგალითი, IBM გთავაზობთ, რომ ბრძანება შეცვალოს მანქანაში რადიოსადგური 104.3 FM სიხშირეზე, მომხმარებლებს შეუძლიათ. წარმოთქვით სხვადასხვა ბრძანებები, როგორიცაა "Change to 104.3", "Tune to 104.3 FM" ან "Set რადიოსადგური 104.3". სისტემის ჩართვა ინტუიციური ბრძანებების უფრო დიდი დიაპაზონის გაგება საშუალებას მისცემს ხმის ამოცნობის ტექნოლოგიას უფრო წარმატებულად გამოიყენოს უფრო ფართო დიაპაზონში აპლიკაციები. ViaVoice ახლა იყენებს ბრძანებების სტატისტიკურ და სემანტიკურ ანალიზს ბრძანებების ინტერპრეტაციისთვის წინასწარ განსაზღვრული, დამახსოვრებული ნაკრების გარეთ, და გაძლიერებული აკუსტიკური მოდელირება უზრუნველყოფს უფრო მეტ სიზუსტეს ხმაურიან პირობებში და სადაც მეტყველება წყდება გარდამავალი გზით ხმები.

რეკომენდებული ვიდეოები

IBM-ის სიტყვის ამოცნობის კიდევ ორი ​​პროექტი, MASTOR და Tales, გვთავაზობს ორ საინტერესო ახალ მიმართულებას მეტყველების კვლევისთვის. მასტორი (Multilingual Automatic Speech-to-Speech Translator), IBM-ის კვლევითი პროექტი, შეუძლია დინამიურად თარგმნოს ინგლისური მეტყველება მანდარინის ჩინურ ენაზე. მომხმარებელი საუბრობს მიკროფონში ინგლისურად და MASTOR თარგმნის წინადადებას მანდარინზე. MASTOR იყენებს სალაპარაკო შეყვანის სტატისტიკურ ანალიზს, ჯერ წინადადების დეკომპილაციას სტრუქტურულ ნაკრებში. და კონცეპტუალური ნიმუშები, შემდეგ თარგმნილი წინადადების შედგენა სამიზნე ენაზე იმავე გამოყენებით ნიმუშები. ასეთ სისტემებში გარკვეული შეფერხება გარდაუვალია

რედაქტორების რეკომენდაციები

  • საუკეთესო პროგრამული უზრუნველყოფა მეტყველება ტექსტში 2022 წლისთვის
  • დათვებისთვის სახის ამოცნობის ტექნოლოგია მიზნად ისახავს ადამიანების უსაფრთხოებას
  • IBM აღარ შეიმუშავებს ან შეისწავლის სახის ამოცნობის ტექნოლოგიას

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

კატეგორიები

Ბოლო

Nvidia-ს RTX 2080 აორმაგებს GTX 1080-ის ძალას A.I-ის საშუალებით.

Nvidia-ს RTX 2080 აორმაგებს GTX 1080-ის ძალას A.I-ის საშუალებით.

შესრულების ახალი დეტალები ჟღერს Nvidia-ს უახლეს...

Aston Martin Valkyrie-ის დეტალები გამოქვეყნდა

Aston Martin Valkyrie-ის დეტალები გამოქვეყნდა

წინა შემდეგი 1 დან 12რამდენიმე შესამჩნევი გამ...

Capcom Pro Tour-ის ტურნირების სერია ბრუნდება 2021 წელს

Capcom Pro Tour-ის ტურნირების სერია ბრუნდება 2021 წელს

Capcom-მა ოფიციალურად გამოავლინა მისი დაბრუნება...