Природне мовне розуміння - це майбутнє А.І. Розпізнавання голосу

З появою в Амазонки послідовної здатності Alexa та Siri взяти на себе більше завдань (і отримати все більш і більш нахабно), багато хто дивується: що наступне для розуміння природної мови і розмовних голосових інтерфейсів?

У цій гонці існують декілька компаній, які займаються шию. Там є Wit.ai, компанія Facebook придбала - ви можете грати з демо. (Спробуйте цю команду: "Я хочу спостерігати за кішками.") Компанія Apple має свій HomeKit і разом з нею робить те, що Apple робить найкраще - ногами. Амазонка також має фронт з ехо-обладнаною системою "Ехо" та "Ехо-точка".

Однією з компаній, яка гаряча на шляху розуміння природної мови, є MindMeld. MindMeld надає свої можливості для розуміння природної мови іншим компаніям, які прагнуть додати інтелектуальні голосові інтерфейси до своїх продуктів, послуг або пристроїв. Компанія, що базується на Сан-Франциско, надає партнерам інфраструктуру та параметри налаштування, щоб їхні пристрої могли мати власні, налаштовані особисті помічники. MindMeld нещодавно оголосив таке партнерство з Spotify, але також працює з автомобільними компаніями, оборонними агентствами, компаніями електронної комерції та багато іншого. (І, природно, вона не може поділитися багатьма специфікою таких партнерств.)

Обернено розмовляв із Сем Васіштом про стан розпізнавання голосу - але він швидко згадав, що «розпізнавання голосу», як підприємство, тепер є «земною темою». У ці дні йдеться про розуміння природної мови. «Розпізнавання голосу майже досягло свого розквіту: після 50-літнього року розвитку ІІ тепер можуть ефективно розпізнавати мовлення. Ці системи є майже краще, ніж люди на роботі, і, безумовно, скоро перевершують простих смертних.

Передбачуваний наступний крок, як і розвиток дитини, - це навчити ці системи зрозуміти мови, які вони тепер можуть визнати. Це людина говорить слова; це такі слова ”- це далеко не так:“ Я розумію, що говорить ця людина; дозвольте мені допомогти."

І що подальший крок і розвиток потребують інтерпретації сенс: Наслідуючи спосіб людського розуму обробляє вербальну інформацію. Існують дві частини цього рівняння. Перший - це наміри: яка мета або бажання людини говорити про це висловлювання? Комп'ютер, який може витягнути намір із вимовленого речення, може "зрозуміти", на що людина хоче вплинути x або взаємодіяти y. Переплітається з цим процесом друга частина рівняння: Entity. A.I. повинні знати, як визначити об'єкт, який розглядається, об'єкт намірів людини.

Для цього MindMeld не використовує (як я припускав, або сподівався) використання філософів. Він використовує фахівців з природних мов, але більша частина А.І. Процес “навчання” сам по собі є відносно несприятливим. Якщо ви навчаєте систему розуміти замовлення на каву, вам потрібно показати системі всілякі способи, якими люди можуть замовити каву.

"Я б хотів мокко".

- Можна, будь ласка, випити чашку Джо?

"Просто велика кава для мене."

І ось тут приходять фахівці з природних мов - мовознавці. Але навіть це не є необхідним, тому що ми можемо перекрити ці дані. Ці інструменти дозволяють запитувати тисячі людей одним і тим самим питанням і компілювати їхні відповіді. Тоді ви просто подаєте ці відповіді в A.I., і вуаля: А.І. може реагувати на широкий спектр можливих запитів. "З тисяч запитів, ми тепер можемо просто в основному дізнатися, як можуть бути створені мільярди інших запитів", - каже Васишт.

Обернено запитав Васішта, який довгий час був інсайдером в А.І. і розуміння природної мови, щоб спекулювати для нас.

Чи може MindMeld брати участь у розширеному діалозі? Наприклад, якщо я запитую наступне питання, чи буде A.I. розуміти і продовжувати відповідати?

Так. Це частина дизайну. Якщо хтось задає питання, яке є неповним - так, наприклад, якщо я замовляю каву, і я не вказую розмір кави, який я хочу, це повернеться і скаже: «Який розмір кави ти хочете?"

Чи очікуєте ви прогрес на тесті Тьюринга?

Думаю, ми дуже близькі до неї. Я маю на увазі, IBM Watson Небезпека!, і я думаю, що це був дійсно хороший приклад. Ми знаходимося в цій точці: вона стає дуже близькою. Так само, як тепер, з точки зору розпізнавання мови, ми знаходимося в точці, де машини настільки ж хороші, як люди, я думаю, що ми, звичайно, протягом наступних трьох-п'яти років, будемо в точці, де більшість цих розмовних голосів системи будуть вважатися такими ж хорошими, як і люди.

Який вид домашньої автоматизації робить MindMeld?

Ми можемо застосувати нашу технологію до будь-якого виду продукції, будь-якого виду послуг, доменів даних. Однією з них є домашня автоматизація. У будинку є керування освітленням, термостат, системи безпеки, аудіосистеми, відеосистеми, всі ці види речей. Ми можемо керувати будь-якими системами за умови відповідного інтерфейсу.

Що ви хотіли б підключити до MindMeld у вашому власному домі?

Я думаю, що більш просунуті випадки використання - наприклад, розмовляють зі своїм Spotify, щоб сказати «Грати мені плейлист Rolling Stones», або «Грати мені класичною музикою цього вечора» - такі речі були б… дивними.

Щось більш несподіване або нестандартне, яке ви хотіли б контролювати своїм голосом?

Речі, які я вам описав, - це те, що я вважаю неминучим. Іншими словами, це станеться дуже скоро. Що не відбудеться відразу, я думаю, це такі речі, як мікрохвильові печі, кавоварки та холодильники. Керувати такими приладами - таким чином, я можу сказати: «Чи готова моя кавова машина для приготування кави? Увімкніть кавоварку », і якщо вона не була підготовлена, вона повинна повернутися і сказати:« Мені дуже шкода, але ваша кавова машина не готова »- такого роду розвідка ще не існує. Це буде святий Грааль: де в основному кожен пристрій може відповісти вам і сказати вам, що він може і не може зробити. Але ми ще не зовсім там.

Що, на вашу думку, повертає промисловість назад?

Зараз це надзвичайно дешева техніка. Я маю на увазі, це техніка, яку можна купити майже нічого. Десять років тому вони коштували набагато більше.Таким чином, побудова нових функцій - це те, що збільшує вартість цих пристроїв. Зрештою, пропозиція цінності є дуже сильною; більшість цих виробників не схильні до додавання нових функцій, якщо вони не знаходяться на дуже низькому рівні.

Я думаю, що це один з його аспектів. Інший аспект - ми говоримо про підключення цих пристроїв. Отже, для підключення цих пристроїв має бути більше, ніж просто використання голосового корпусу. Потрібно мати більше можливостей, які треба їздити на цьому зв'язку, перш ніж вони стануть життєздатними.

Чи знаєте ви будь-яку компанію, яка працює над цим останнім потенціалом?

Багато напівпровідникових компаній працюють над дуже дешевими мікрофонними масивами. Річ, яку ви можете в основному вбудувати - за дуже низькою ціною, на практично будь-який пристрій або додаток - що дозволить там бути голосовим введенням. І ви не повинні стояти поруч із цими пристроями - ви можете говорити на відстані 10 футів. Побудова цієї можливості - я думаю, що це відправна точка. І я думаю, що дозволить людям почати розміщувати мікрофони на пристроях, а потім й інші, просунуті можливості. Але на даний момент я не знаю жодної компанії, яка б будувала цей вид смарт-кавоварки, або розумної мікрохвильової печі, або пральної машини.

Яка ваша найкраща оцінка, коли у нас є повністю розумні будинки, повністю розумні квартири?

Сьогодні ми практично маємо всі необхідні підсистеми в будинку, які люди хочуть автоматизувати, які здатні бути автоматизованими. Це включає в себе фари, термостати, системи безпеки, гаражні ворота, замки передніх дверей - такі речі. Все це можна зробити. Питання дійсно навколо цін. Вони все ще знаходяться у ціновій точці, де в першу чергу є раннім прийомним особам і людям, які мають дуже гостру потребу в них. Але ціни на ці речі різко падають, дуже швидко. Думаю, що ці підсистеми, ймовірно, отримають на масовий ринок у найближчі кілька років.

Інші речі, про які я говорив - автоматизація дуже недорогих приладів - я вважаю, що це, швидше за все, не раніше п'яти-семи років. Більше 10 років, перш ніж вони стануть реальністю. Але, як я вже говорив раніше, це ті речі, які потребують ряду інших речей. І це може статися раніше, якщо ці різноманітні інгредієнти рано з'єднаються.

Що, на вашу думку, буде виглядати квартира Нью-Йорка чи Сан-Франциско, скажімо, у 2050 році?

2050! Ого. Думаю, ми будемо там повністю. Такі речі, які ми бачимо в науково-фантастичних фільмах - де ви можете багато говорити з кожною системою у вашому домі, і керувати всім голосом - я думаю, що такі можливості будуть широко поширені. Звичайно в таких містах, як Нью-Йорк і Сан-Франциско.

Імплантат тканин для вокального шнура може допомогти лікувати порушення голосу

Багато хто з нас відчули неприємність голосу - неприємний кашель, крики на концерті Але, ось, наука знаходить спосіб допомогти. У середу міжнародна команда вчених оголосила, що відтворила людську тканину вокальних шнурів у блюді, яке при трансплантації в незруйновані голосові ящики собак може створити ...

Фанати "Зоряних воєн" пропонують данину Джейсону Вінгріне, Голосу Боби Фетта

Хоча Джейсон Wingreen тільки чотири лінії, як мисливець за головами Боба Фетт в імперії завдає удар, його характер запам'ятовується як один з найкрутіших фанів Star Wars навіть 35 років по тому. Після того, як Дарт Вейдер і Хан Соло, Боба Фетт, посідав третє місце в списку «50 кращих персонажів« Зоряних воєн ». Це ...

Як прислухатися до своєї кишки і дати силу своєму внутрішньому голосу

Ви повинні слухати свою кишку? Друге здогадування, здається, вбудоване в нашу ДНК. Але коли твоя кишка говорить тобі щось, то слід слухати.

Природне мовне розуміння - це майбутнє А.І. Розпізнавання голосу

Ð Ð¡ DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° ÐºÐ»Ð¸Ð¿Ð°, 2014

Імплантат тканин для вокального шнура може допомогти лікувати порушення голосу

Фанати "Зоряних воєн" пропонують данину Джейсону Вінгріне, Голосу Боби Фетта

Як прислухатися до своєї кишки і дати силу своєму внутрішньому голосу