Новий алгоритм MIT може передбачити людські взаємодії перед тим, як вони стануть незручними

$config[ads_kvadrat] not found

Сумасшедший лягушка - Аксель F (Официальное видео)

Сумасшедший лягушка - Аксель F (Официальное видео)
Anonim

Наша нездатність читати інших людей призвела до епічних високих п'яти і пропущених поцілунків. Навіть після досвіду життя людські взаємодії важко передбачити. Але дослідники лабораторії MIT з комп'ютерних наук і штучного інтелекту вважають, що вони можуть допомогти: за допомогою нового алгоритму глибокого навчання, який може передбачити, коли дві людини обійдуться, поцілуються, потиснуть руки або п'ять, вони зробили великий крок до майбутнього благословенно позбавлений цих незручних моментів.

Вони сподіваються, що їхній новий алгоритм - навчений на 600 годин відео YouTube і телевізійних шоу Офіс, Скраби, Теорія великого вибуху, і Відчайдушні домогосподарки - може використовуватися для програмування менш соціально незручних роботів і розробки гарнітур у стилі Google Glass, щоб запропонувати нам дії перед тим, як ми навіть матимемо шанс пропустити. У майбутньому вони уявлятимуть, що ви ніколи більше не зіпсуєтеся з можливістю перенести високу п'ятірку зі своїм колегою.

Усвідомлення того, що роботи навчаються бути соціальними так само, як і ми, було ключем до успіху алгоритму. "Люди автоматично навчаються передбачати дії через досвід, що і нас зацікавило в тому, щоб намагатися наповнити комп'ютери тим же самим здоровим глуздом", - стверджує CSAIL Ph.D. студент Карл Вондрік, перший автор родинного документа, який був представлений на цьому тижні на Міжнародній конференції з комп'ютерного бачення і розпізнавання образів. "Ми хотіли показати, що, просто спостерігаючи великі обсяги відео, комп'ютери можуть отримати достатньо знань, щоб послідовно робити прогнози про своє оточення."

Вондрік і його команда навчали численним «нейронним мережам» алгоритму проаналізувати величезні обсяги даних у цьому випадку, годинник Джима і Пама, п'ять високих, і потайні поцілунки Майка і Сьюзен. Беручи до уваги такі фактори, як витягнуті руки, піднята рука, або тривалий погляд, кожна з нейронних мереж вгадувала, що відбудеться в наступну секунду, і загальний консенсус мереж був прийнятий як остаточний «прогноз» в вивчення.

Алгоритм отримав його правильно протягом 43 відсотків часу. Хоча це може здатися недостатньо високим, щоб гарантувати, що наші повсякденні взаємодії стануть менш дивними, це значно покращить існуючі алгоритми, які мають точність лише 36%.

Крім того, люди можуть передбачати дії лише 71% часу. Нам потрібна вся допомога, яку ми можемо отримати.

У другій частині дослідження алгоритм навчився передбачати, який предмет - вітчизняні скоби для комедійного відтворення, як пульти, посуд і сміттєві баки - з'являться на сцені через п'ять секунд. Наприклад, якщо відкриваються дверцята мікрохвильової печі, існує відносно висока ймовірність того, що наступна кружка з'явиться.

Їх алгоритм ще не достатньо точний для Google Glass, але з співавтором Антоніо Торральба, доктора філософії. - фінансується за рахунок дослідницької премії факультету Google і Vondrick, що працює з Ph.D. товариство - ми можемо посперечатися, що він потрапить туди. Майбутні версії алгоритму, прогнозує Вондрік, можуть бути використані для програмування роботів для взаємодії з людьми або навіть для навчання камер безпеки для реєстрації, коли людина падає або травмується.

"Відео не схоже на книгу" Вибрати свою власну пригода ", де можна побачити всі потенційні шляхи, - говорить Вондрік. "Майбутнє за своєю суттю неоднозначне, тому цікаво кинути виклик собі, щоб розробити систему, яка використовує ці уявлення, щоб передбачити всі можливості".

$config[ads_kvadrat] not found