ÐÑÐµÐ¼Ñ Ð¸ СÑекло Так вÑпала ÐаÑÑа HD VKlipe Net
Мовленнєва техніка йде після Google. Британський стартап взяв обгортку від Automatic Linguist минулого місяця, потужний штучний інтелект, який може вивчити будь-яку мову для транскрипції мови до тексту за лічені дні. Команда хоче включити технологію для кожного з приблизно 7000 мов у світі, з можливістю трансформувати життя.
З моменту запуску лінгвістичного інструменту Speechmatics працює над Omniglot, викликом для побудови мови на день. Минулого тижня компанія досягла великої віхи: вона офіційно побила Google, із загальною кількістю 72 унікальних мов.
Система використовує машинне навчання для відповідності аудіоданих з аналогом транскрипту. Потім він використовує мовні шаблони з інших мов, щоб зробити процес якомога простішим, виявляючи подібність між звуками і граматичними структурами і застосовуючи їх до нових мов. Процес дуже ефективний: як приклад, робота Speechmatics на хінді тривала всього два тижні, щоб досягти 80-відсоткової точності. Коли кінцевий продукт пройшов випробування проти зусиль Google, він зробив на 23% менше помилок.
Обернено розмовляв з Benedikt von Thüngen, генеральним директором Speechmatics, щоб дізнатися більше.
Як ви вперше почали працювати над проектом?
Ми почали проект Omniglot як виклик для себе - побачити, скільки мов ми зможемо побудувати за шість тижнів. Ми зрозуміли, що традиційний підхід до побудови кожної мови окремо більше не є життєздатним при швидкому розширенні масштабу. Беручи це до уваги, нам треба було переосмислити, що таке мова, як вона структурована і які подібності існують між різними мовами. Ми знайшли спосіб скористатися цими спільностями для ідентифікації зразків і допомогти нашій структурі з автоматичним лінгвістиком (AL), будувати мови швидше, ніж будь-коли - 46 протягом шести тижнів, щоб бути точним, або близько однієї мови на день протягом шести тижнів !
Чим це відрізняється від зусиль Google?
Наш підхід до побудови мов є одним з основних аспектів, що відрізняє нас від Google. Хоча ми припускаємо, що вони будують свої мови окремо (або тим, що ми називаємо «грубою силою»), ми використовуємо силу A.I. спростити та прискорити процес створення мови. Крім того, хоча інші служби, такі як Google, зосереджені на побудові діалектів, а не на унікальних мовах, ми з гордістю можемо сказати, що наші зусилля зосереджені на унікальних мовах з усього світу, включаючи області, які раніше були недостатньо розвинені великими технологічними компаніями.
Які реальні додатки для цього?
Тепер у нас є технології та знання, які роблять наш сервіс більш далекосяжним, ніж будь-коли раніше, і забезпечують автоматичне розпізнавання мови (ASR) кожному. Це особливо актуально в країнах з низьким рівнем грамотності, де можливість використовувати раніше недоступну технологію мовлення до тексту для спілкування може зробити все для людей. Інші реальні випадки, коли технологія ASR може допомогти у вирішенні питань доступності - люди з порушеннями слуху та / або зору з усього світу тепер можуть використовувати пристрій так само просто, як телефон, для взаємодії з оточуючими.
Це покращує точність добре охоплених мов, таких як англійська?
Оскільки ми продовжуємо розвивати більше мов, наша А.І. рамки стануть все більш вправними у визначенні лінгвістичних особливостей і закономірностей. Ми будемо використовувати ці знання для продовження вдосконалення нашої мовної бази, включаючи англійську.
Чи може це поліпшити щось подібне до інструментів перекладу в реальному часі Google Pixel Buds?
Ми, безумовно, бачимо проекти, як Omniglot, допомагаючи покращити інструменти перекладу в реальному часі. Оскільки більше ресурсів буде інвестовано у розширення зони досяжності та точності мов, ми побачимо постійне вдосконалення у сфері послуг перекладу.
Чи працює це з будь-якою мовою, навіть з мовами, подібними до клінгонського?
Ми ще спробуємо побудувати будь-які конланг, але ми не бачимо жодних причин, чому вони не працюватимуть. Оскільки ці мови все ще говорять люди, вони також слідують подібним структурним правилам і обмеженням, як і повсякденні мови (наприклад, кількість фонем), які дають AL достатньо даних для побудови.
Ви відкриті для пошуку проекту?
Ні, у нас немає планів для цього.
Як буде працювати ліцензування?
Мови, пропоновані в рамках проекту Omniglot, безкоштовні і не можуть використовуватися для комерційних цілей. Таким чином, у передбачуваному майбутньому не буде надано їм жодних ліцензій.
Які тут наступні кроки?
Проект Omniglot - це тільки початок для нас. Ми хочемо зрештою побудувати кожну мову в світі, тому ми наполегливо працюватимемо над цією метою!
Facebook каже, що відповідь на ненавидіння мови та терористичних груп - це "більше мови"
Facebook знає, що завжди будуть люди, які поширюють негативну та ненависну промову в Інтернеті, але імперія соціальних медіа вірить у силу позитивного розміщення. На щорічній зустрічі акціонерів Facebook сьогодні Джоел Каплан, віце-президент компанії з державної політики, сказав, що відповідь на терор ...
Жінки використовують "тепліші" мови на Facebook, ніж чоловіки
Чоловіки і жінки дійсно різні - принаймні, коли мова йде про вибір на Facebook. Хоча ми можемо хотіти думати про себе, як про кожного яскравого і унікального сніжинки, вільної від гендерної двійкової системи, комп'ютерні алгоритми можуть вирізати до ядра: Статистичні моделі можуть здогадатися, який стать письменник має більше 90%
Він мені подобається? 18 ознак для розшифровки мови тіла
Якщо інтенсивне відхилення від питання, яке подобається мені, турбує вас весь час, використовуйте ці 18 знаків мови тіла, щоб дізнатися, чи він вам справді подобається.