Чому А.І. Може боротися за розуміння арабської мови

$config[ads_kvadrat] not found

Латвия Орган Домского собора. Latvia organ music. Domsky cathedral

Латвия Орган Домского собора. Latvia organ music. Domsky cathedral
Anonim

У світі штучного інтелекту дані є королем. Чим більше у вас є, тим краще ваші інструменти стануть, оскільки системи здатні “більше” вивчати, чого очікувати. Але в залежності від платформи А.І. за даними Міріам Реді, дослідник Yahoo Labs, деякі мови можуть бути краще представлені, ніж інші.

"Наприклад, як Flickr, де ми беремо наші дані, деякі мови дуже мало представлені", сказав Реді, виступаючи на Лондонському саміті Deep Learning у четвер. "Таким чином, ми маємо англійську, мільйони зображень для англійської мови, але ми можемо мати 100,000 для арабської".

Команда Реді працює над інструментом, який може ідентифікувати невидимі елементи зображення, наприклад, культурні цінності та емоційні конотації. Інструмент аналізує текст, доданий до загальнодоступних зображень на Flickr. Згодом А.І. починає розуміти, чому хтось може позначати зображення "щасливою стороною" або "незручним моментом", але ці ідеї стануть ще більш точними, оскільки інструмент аналізує більше зображень.

"На жаль, точність виявлення настроїв у зображеннях для арабських мов, як правило, нижче, тому що ми не маємо достатньо даних", - сказав Реді.

На мовах, які мали більші обсяги даних, команда Реді помітила кілька цікавих моделей. Романські мови, такі як французька та іспанська, мали тенденцію висловлюватися подібними способами, тоді як італійська мова була єдиною мовою, де користувачі ідентифікували образи з терміном "ухилення від сплати податків".

Мовні бар'єри як і раніше залишаються чимось проблемою для А.І. дослідників. Будь-хто, хто використовував Google Translate, знатиме, що перемикання мов ніколи не є настільки простим, як здається. Тим не менш, нові події змінюють ситуацію, коли Facebook оголосив цього літа, що він наближається до своєї мрії про одномовну соціальну мережу, автоматично перекладаючи тексти для користувачів.

Розвиток усунення мовних бар'єрів може допомогти сприяти міжнародному спілкуванню, але для таких проектів, як Реді, немає реальної заміни даних, які генерують люди.

$config[ads_kvadrat] not found