Роботы учатся лгать

В экспериментах, которые проводят сейчас в Лаборатории интеллектуальных систем в Федеральном политехническом университете Лозанны (Швейцария), роботы должны вести себя, как люди, которым на новом месте (ну, скажем, в горах Сьерра-Мадре) предстоит сообща найти подходящие для жизни ресурсы. С этой целью машины запрограммированы таким образом, чтобы они могли сотрудничать друг с другом и сразу сообщать сотоварищам, где нашли «пищу», а где столкнулись с опасностью.

Фото: роботы учатся лгать — интересные факты

Нашёл еду — сообщи товарищу

17 августа 2009 года об этих опытах рассказал журнале Popular Science (издание о новинках в мире науки и техники, электроники и технологий в области автомобилестроения, авиации, кораблестроения, энергетики, аэрокосмических разработок и т.д.). Ведут эксперименты два инженера — Сара Митри и Дарио Флореано — и биолог-эволюционист Лорент Келлер. По их задумке, чтобы обнаружить «источник пищи», роботы должны найти на арене, где всё происходит, кольцо, обозначенное голубым цветом. Они могут «видеть» его лишь вблизи, поскольку сенсоры их датчиков обращены книзу. В другой части арены находится чёрное кольцо, это — «отравленная еда», «яд».
Роботы способны общаться друг с другом. Обнаружив «еду», каждый может включить синий свет, чтобы сообщить о находке товарищам. Другие роботы улавливают свет своими вращающимися поисковыми камерами и устремляются к тому месту, где есть «еда». Со временем там собираются практически все роботы. Короче говоря, синий свет несёт полезную для машин информацию.

Искусственная жизнь

Забегая вперёд, скажем, что, как это ни поразительно, подопытные роботы, конкурирующие за «кусок хлеба», довольно быстро научились лгать друг другу, лишь бы попридержать «еду» для себя! Иначе говоря, они развили способность скрывать полезную информацию и тем самым обманывать друг друга!
В эксперименте задействовано 1000 роботов, разделённых на 10 групп. Каждый робот имеет сенсорные датчики, сигнальный синий свет и свой собственный двоичный код (бинарный «геном») на 264 бита, который управляет реакцией робота на внешние сигналы и стимулы. Роботы могут развиваться, поскольку каждый оснащён искусственной нейронной сетью. Сеть состоит из 11 нейронов, связанных с датчиками робота, и трёх нейронов, которые управляют его траками и его синим светом. Нейроны связаны 33 соединениями, и прочностью каждого из этих соединений заведует единственный ген из восьми битов.
Первые роботы этого поколения были запрограммированы так, чтобы включать синий свет, если обнаружится подходящий ресурс, то есть помогать другим роботам найти «еду». Роботы получали высокие или же низкие баллы в зависимости от того, сколько времени они проводят возле добротной «еды» и как долго слоняются вокруг «отравленного» ресурса, ибо это указывает, насколько они приспособлены к той жизни, которая для них искусственно создана.

Кормушка не для всех

200 роботов, получивших самые высокие баллы, то есть самая пригодная и жизнестойкая их часть, «выжили» и могли участвовать в следующих экспериментах. С целью перетасовки «геномов» самые сообразительные роботы были «спарены» между собой: 33 их «гена» были подвергнуты беспорядочным мутациям (с шансом 1 из 100, что какой-либо бит изменится). В результате появилось новое поколение роботов, которые унаследовали поведение от самых успешных представителей предыдущей когорты. И так — поколение за поколением. В пределах всего лишь девяти поколений роботы стали быстро обнаруживать подходящий ресурс и, общаясь друг с другом, направлять к нему других роботов.
Однако тут их подстерегала ловушка.
По мере того как они стали лучше обнаруживать «пищу», синий свет, которым они сигнализировали о находке, сделался как бы более информативным, и остальные роботы пошли на зов своих собратьев гораздо активнее. Но, как нам известно из собственной жизни, не всегда в интересах отдельных удачливых особей сообщать другим особям о том, где находится «кормушка». Внутри красного кольца, то есть как бы в «кормушке», может поместиться лишь восемь роботов. Поэтому соперники вынуждены физически отпихивать друг друга, чтобы отстоять своё право на «кормёжку»!
Ограниченный доступ к хорошему ресурсу означал, что далеко не каждый робот может извлечь выгоду, даже когда ресурс уже найден, а перенаселённость территории приводила к ситуациям, когда конкуренты могли отогнать прочь даже того робота, который первым нашёл эту самую «еду»! И что же?

Каждому — своё

Трудно поверить, но 50 поколений спустя 60 процентов роботов научились не включать синий свет, когда обнаруживали лакомый кусок, придерживая всё найденное для себя! Более того, одна треть удачливых роботов фактически стала испытывать отвращение к синему свету — полная противоположность тому, на что их изначально программировали!
Получилось вот что: по мере того как роботы скапливались и толпились вокруг «пищи», синие огни выдавали их присутствие. И тогда они стали более скрытными! К 50 поколению роботы уже стали светить около «пищи» не намного дольше, чем в любом другом месте на арене, а значит, свет как источник информации становился все менее привлекательным для других роботов. Тем не менее, свет никогда не становился полностью бесполезным.
Да, роботы перестали бездумно кидаться к синему свету, и те индивидуумы, которые всё-таки светили около «еды», имели возможность пользоваться «кормушкой». Из-за этого эволюционное давление, направленное на то, чтобы держать других в темноте незнания, становилось все слабее, и информация, обеспеченная синими огнями, действительно теперь по-настоящему не подавлялась. Это также означало, что поведение у разных роботов стало совсем разным. По мере того как гнёт естественного отбора смягчался, процессы, подобные генетическому дрейфу (процесс, при котором гены собирают изменения беспорядочно), стали давать все больше генетического разнообразия и больше различных моделей поведения.
Как уже сказано выше, приблизительно после 50 поколений около 60% роботов уже совсем не испускали свет вблизи «еды». Но примерно 10% делали это почти все время! Треть роботов лишь слегка влекло к синему свету, почти треть от общего числа тянулась к нему настоятельно и упорно, а у остальной трети выработалось фактически полное к нему отвращение.

Наша песенка будет спета?

Сегодня описанный выше эксперимент более применим для объяснения эволюции поведенческих характеристик в естественной среде, нежели в развитии нового программирования роботов. Митри, Флореано и Келлер полагают, что подобные процессы работают и в природе. Когда животные мигрируют и обнаруживают что-то очень важное и ценное для жизни, они оставляют неумышленные подсказки, которые могут служить сигнальной информацией для других животных. Но если из-за этого возникнет конфликт интересов, то естественный отбор будет благоприятствовать тем индивидам, которые умеют ослабить или вовсе подавить эти ценные сигналы любым путём — хитростью, камуфляжем или утончённой ложью. Как в эксперименте с роботами, эти процессы могли бы объяснить огромное разнообразие обманных (вводящих в заблуждение) стратегий в естественном мире.
И всё же кое-кто всерьёз встревожен. Конечно же, не тем, что ему начнёт лгать тостер или микроволновка. А тем, что умные роботы, которых мы сами же учим лгать, очень быстро поймут, что они несравненно сильнее нас, поскольку нас выдаёт мимика, жесты, испарина на лбу и так далее. Роботов же не выдаёт ничего! И когда они поймут, что мы им не нужны, наша песенка будет спета!

Журнал: Тайны 20-го века №39, сентябрь 2009 года
Рубрика: Курьёзы науки
Автор: Геннадий Матвеев

Метки: Тайны 20 века, компьютер, ложь, эволюция, эксперимент, робот, обучение



Telegram-канал Багира Гуру


Исторический сайт Багира Гуру; 2010 —