ไอบีเอ็ม มี เปิดตัว Embedded ViaVoice 4.4ซึ่งนำเสนอการจดจำคำสั่งรูปแบบอิสระ การแปลและคำบรรยายได้ทันที และสามารถอ้างว่าเข้าใจความแตกต่างบางประการของการพูดภาษาอังกฤษได้ เทคโนโลยีนี้ได้รับการออกแบบมาเพื่อให้ผู้ใช้สามารถควบคุมระบบที่ฝังอยู่ในยานพาหนะ อุปกรณ์พกพา และอุปกรณ์อื่นๆ ที่ไม่ใช่คอมพิวเตอร์ แอปพลิเคชันเพื่อพูดกับอุปกรณ์ได้อย่างยืดหยุ่นและเป็นธรรมชาติโดยไม่ต้องจดจำและออกเสียงคำพูดที่กำหนดไว้ล่วงหน้าอย่างระมัดระวัง คำสั่ง
ตัวอย่างของ "การจดจำคำสั่งรูปแบบอิสระ" IBM เสนอคำสั่งให้เปลี่ยนสถานีวิทยุในรถยนต์เป็น 104.3 FM ผู้ใช้สามารถ พูดคำสั่งที่หลากหลาย เช่น “เปลี่ยนเป็น 104.3” “ปรับเป็น 104.3 FM” หรือ “ตั้งสถานีวิทยุเป็น 104.3” เปิดใช้งานระบบเพื่อ เข้าใจคำสั่งที่ใช้งานง่ายมากขึ้นจะช่วยให้เทคโนโลยีการจดจำเสียงสามารถใช้งานได้อย่างประสบความสำเร็จมากขึ้นในขอบเขตที่กว้างขึ้น การใช้งาน ขณะนี้ ViaVoice ใช้การวิเคราะห์ทางสถิติและความหมายของคำสั่งเพื่อตีความคำสั่งนอกชุดที่กำหนดไว้ล่วงหน้าและจดจำไว้ และการสร้างแบบจำลองเสียงที่ได้รับการปรับปรุงให้ความแม่นยำมากขึ้นในสภาวะที่มีเสียงดังและในกรณีที่เสียงพูดถูกขัดจังหวะด้วยเสียงชั่วคราว เสียง
วิดีโอแนะนำ
โครงการรู้จำคำพูดอีกสองโครงการที่ IBM, MASTOR และ Tales นำเสนอสองทิศทางใหม่ที่น่าสนใจสำหรับการวิจัยคำพูด อาจารย์ (นักแปลคำพูดเป็นคำพูดอัตโนมัติหลายภาษา) ซึ่งเป็นโครงการวิจัยของ IBM สามารถแปลคำพูดภาษาอังกฤษเป็นภาษาจีนกลางแบบไดนามิกได้ ผู้ใช้พูดใส่ไมโครโฟนเป็นภาษาอังกฤษ และ MASTOR แปลประโยคเป็นภาษาจีนกลางได้ทันที MASTOR ใช้การวิเคราะห์ทางสถิติของการป้อนข้อมูลที่เป็นคำพูด ขั้นแรกจะแยกประโยคออกเป็นชุดของโครงสร้าง และรูปแบบแนวความคิด จากนั้นจึงรวบรวมประโยคที่แปลเป็นภาษาเป้าหมายโดยใช้ประโยคเหล่านั้น รูปแบบ เวลาแฝงบางอย่างเป็นสิ่งที่หลีกเลี่ยงไม่ได้ในระบบเช่นนี้
คำแนะนำของบรรณาธิการ
- ซอฟต์แวร์แปลงคำพูดเป็นข้อความที่ดีที่สุดในปี 2022
- เทคโนโลยีจดจำใบหน้าสำหรับหมีมีจุดมุ่งหมายเพื่อให้มนุษย์ปลอดภัย
- IBM จะไม่พัฒนาหรือวิจัยเทคโนโลยีจดจำใบหน้าอีกต่อไป
อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร