Ось як ми можемо зупинити майбутнього Rogue A.I. від імітації HAL 9000

$config[ads_kvadrat] not found

The Simpsons - Ultrahouse 3000

The Simpsons - Ultrahouse 3000
Anonim

Як зупинити майбутнє А.І. від невиконання наказів і вибору власного шляху? Це може звучати як сюжет з 2001: Космічна Одіссея, але один експерт стверджує, що це те, про що ми можемо вже почати думати. Звичайно, ми могли б вимкнути алгоритм пошуку Google, якщо він коли-небудь вийшов із шахрайства, але, зіткнувшись з фінансовими та юридичними наслідками, це буде простіше сказати, ніж зробити. У майбутньому, коли ми стаємо залежними від більш розвинених А.І., це може виявитися неможливим.

«Цей алгоритм не був спеціально спроектованим себе неможливо перезавантажитися або вимкнути, але водночас він розвинувся таким чином », - сказав Стюарт Армстронг, дослідник Інституту майбутнього людства на Піратському саміті 2016 в середу. Це означає, що зміна з ненавмисними результатами може бути важко виправити, і вона може бути не першою A.I. знайти себе в цій ситуації.

Рішенням Ісаака Азімова були три закони робототехніки, які, на думку жорстких кодексів, не завдають шкоди людям. Проблема в тому, що шкода досить суб'єктивна і відкрита для інтерпретації. Люди працюють більше на цінностях, як розуміння того, що це погано викликати шкоду і інтерпретувати ситуацію, ніж працювати над певним жорстким правилом, щоб вони ніколи не завдали шкоди.

"Це через цю проблему, що люди набагато більше зацікавлені в тому, щоб використовувати машинне навчання для отримання цінностей, а не намагатися кодувати їх у цьому традиційному способі", - сказав Армстронг. “Цінності стабільні таким чином, що інші речі не в A.I. Цінності захищають себе.

Але навіть у таких ситуаціях важливо розробити A.I. щоб зробити їх переривними під час їх запуску. Безпека переривання дає змогу безпечно змінювати політику, що дозволяє уникнути непередбачених наслідків вивчених цінностей. Якщо HAL 9000 коли-небудь намагався зупинити відкриття дверей бункера, важливо, щоб ми визначили, що значення A.I. переплутані, і втручатися, не приводячи систему в автономний режим.

$config[ads_kvadrat] not found