Дослідження корпорації Майкрософт вигадує розпізнавання мовлення краще, ніж людське

$config[ads_kvadrat] not found

Время и Стекло Так выпала Карта HD VKlipe Net

Время и Стекло Так выпала Карта HD VKlipe Net
Anonim

Корпорація Майкрософт стала першою в світі компанією, що розробляє програмне забезпечення для розпізнавання мовлення, яке є більш точним, ніж люди. У документі «Досягнення людського паритету в розмовному розпізнаванні мовлення», опублікованому в понеділок, програмне забезпечення випустило розшифровки, які містили на піввідсотка менше помилок, ніж людські зусилля, що є неймовірним, враховуючи, наскільки хороші люди розуміють мову. Прорив відкриває двері для нового А.І. помічники, які є більш точними, ніж будь-коли раніше.

Це вражає, наскільки далеко технологія прийшла за такий короткий проміжок часу. Не так давно, що комп'ютерне розпізнавання мови було дивною нішею, яка здавалася безнадійно віддаленою. Перегляньте цю демонстрацію мовного програмного забезпечення Windows Vista з 2006 року:

Команда використовувала тестування Національного інституту стандартів і технологій (NIST) 2000, яке використовувалося в промисловості для вимірювання надійності транскрипції мовлення. Розмова відбувається між двома учасниками по телефону, по черзі, перед тим, як результуючий скрипт порівнюється і перевіряється з написанням словників.

У комутаторній частині, де два незнайомці говорять вперше, коефіцієнт людської помилки становить близько 5,9%, а на виклику домашній частині, де дві людини, які знають один одного, говорять, рівень помилок становить близько 11,3%. Програмне забезпечення корпорації Майкрософт набрало приблизно на 0,4 відсотка менше помилок.

У серпні студент Джошуа Браудер взяв обгортку свого чату в DoNotPay, який може допомогти бездомним отримати безкоштовну юридичну консультацію. У поєднанні з удосконаленням розпізнавання можна легко уявити собі майбутнє, де люди запитують віртуального помічника про допомогу з житлом, регулярно розмовляючи зі своїм комп'ютером.

На даному етапі дослідники розглядають, як розпізнавання мови на основі A.I. може дати розумніші відповіді. Sensay, виявляє гнів A.I. з лабораторії, що стоїть за Siri, використовує передові можливості розпізнавання, щоб визначити, чи користувач відчуває себе злим або збентеженим, змінюючи свої відповіді відповідно до ситуації. Видалення перешкод розпізнавання голосів, схильних до помилок, створює цікаві нові можливості для віртуальної допомоги.

$config[ads_kvadrat] not found