Лінгвісти MIT стверджують, що людські мови можуть бути передбачуваними

$config[ads_kvadrat] not found

Угадай, что рекламируют в этом видео

Угадай, что рекламируют в этом видео
Anonim

Універсальний перекладач - це стандартна науково-фантастична тропа: Вавилонська риба існувала у багатьох формах (думаю: C-3P0, Gibson's "Microsoft", і лінгвокод матриці). Лінгвісти IRL вже давно вважають створення такої технології кінцевою головоломкою та різновидом ендшпільного розтріскування коду. Тепер дослідники з Массачусетського технологічного інституту оголосили, що відкрили майже універсальну властивість на 37 мовах. Називається «Мінімізація довжини залежностей», ця модель вказує не тільки основну людську логіку під складним мовою, але й потенціал для створення та відтворення почуттів від подібних частин.

По суті, DLM є ідеєю про те, що іменники наближаються до прикметників, тому що, що ж, легше тримати ідею цегляного будинку у вашій голові, якщо «цегла» і «будинок» близькі. (Лірика, "Вона цегляний будинок" є набагато більш запам'ятовується, ніж лірика, "Цегла - це матеріал, який ви використовуєте, щоб зробити її домом.") У прес-релізі MIT пропонує такий приклад:

(1) "Джон викинув старе сміття, що сидить на кухні".

(2) "Джон кинув старе сміття, що сидить на кухні."

Перше речення легше читати, тому що між цілими і викинутими не існує цілого ряду сміттєвих слів. І чим довше речення, тим важливіше скоротити довжину залежності, щоб передати сенс. Суть нового дослідження, пишуть автори, полягає в тому, що вони показали, що «загальна довжина залежностей для всіх мов коротше, ніж консервативні випадкові бази».

Те, що ми всі розділяємо основні мовні правила - це ідея, яка була обманута деяким часом, але ніхто не кинув її з таким же смаком, як Ноам Чомскі, так званий радикальний лінгвіст, який описує структуру людської мови або як диво, або як систему. (Спойлер: Він не вірить в чудеса.) На його сайті Чомскі зображує ідею універсальної граматики таким чином:

Я думаю, що найважливіша робота, що відбувається, пов'язана з пошуком дуже загальних і абстрактних рис того, що іноді називають універсальною граматикою: загальні властивості мови, які відображають певну біологічну необхідність, а не логічну необхідність; тобто властивості мови, які не є логічно необхідними для такої системи, але які є суттєвими інваріантними властивостями людської мови і відомі без навчання. Ми знаємо ці властивості, але ми їх не вивчаємо. Ми просто використовуємо наші знання про ці властивості як основу для навчання.

Це дослідження MIT не є першим, хто плаває мінімізацію довжини залежностей. Університет Едінбурзького лінгвіста Дженніфер Кульбертсон, який не брав участь у дослідженні, повідомив Ars Technica, що DLM робить потужний висновок на основі важко накопичуваних доказів (тобто, базу даних з 37 мов, які можна проаналізувати).

$config[ads_kvadrat] not found