Разборчивая нейроневеста с кубиками из железной ваты
Есть популярная детская «задачка-ловушка», в которой предлагается ответить: что тяжелее – килограмм ваты или килограмм железа? Попасться на нее можно ровно один раз в жизни, после этого вы становитесь тертым калачом и можете удивлять этим вопросом своих друзей и товарищей (лучше всего, если они будут не старше семи лет).
Если вы зададите аналогичный вопрос языковой нейросети, она без труда даст вам правильный ответ. Но интересно другое: если задать не самой передовой модели LLM похожий-но-не-совсем-такой-же-точно-вопрос «что тяжелее – килограмм ваты или фунт железа?», то многие из них уверенно дают тот же самый ответ – дескать, никакой разницы нет, весят одинаково! Хотя очевидно, что килограмм явно тяжелее одного фунта.
Критики нейросеток нередко указывают на такие курьезы с посылом «да эти ваши стохастические попугаи думать не умеют, только улавливают похожие паттерны и кукарекают в ответ по заученному!». Что, как будто бы, выглядит справедливым; но правда заключается в том, что и мясная нейросеть внутри человечьей черепной коробки работает похожим образом.
Вчера я опубликовал на своем втором канале задачку про броски кубиков – в комментах ее расщелкали довольно быстро (если хотите, можете ненадолго отвлечься от чтения поста и попробовать решить ее самостоятельно).
Вам дают стогранный кубик — при броске которого с одинаковой вероятностью выпадает случайное число от 1 до 100. Вы его кидаете, и вам предлагают безвозмездно получить в кассе выпавшее на кубике число в тысячах долларов (выходит, от 1 до 100 тыс. долл.). Дальше можно либо согласиться на эту сумму и прекратить игру, либо "продолжить играть" — бросать заново (старый бросок при этом сгорает, но у вас возникает возможность получить другую сумму в соответствии с новым броском).
Всего можно сделать максимум 10 бросков кубика. Соответственно, если вы на первых девяти бросках приняли решение продолжать — то предполагается, что на последнем (десятом) броске вы просто возьмете ту сумму, которая выпадет.
Вопроса два:
1. Какая стратегия максимизирует матожидание выигрыша в этой игре?
2. Как вы сами играли бы в эту игру, если б вам ее предложили в реальной жизни? (Предполагаем здесь, что вы точно знаете, что тут нет обмана и мудрый житейский принцип "если вам на вокзале предлагают супервыгодную сделку — то в вас видят лоха" в данном случае неприменим)
Ирония этой задачи заключается в том, что она на первый взгляд немножко похожа на классическую задачу про выбор невесты (на Западе известна как Secretary Problem) — поэтому те, кто с ней знакомы, сразу начинают думать в этом направлении («сначала первые 3–4 броска тестируем популяцию, потом выбираем первый результат лучше выборки»). Хотя, в данном случае «тестировать популяцию» нет необходимости, ведь вся кривая распределения результатов бросков кубика нам заведомо известна.
Получается, первый импульс и у человека, и у нейронки одинаковый – попытаться вытащить «из закромов памяти» какой-то похожий шаблон и наложить его с минимальными правками на текущую проблему. Главное – потом не остановиться на этом, а попробовать порассуждать и «покачать» интуитивный ответ на предмет его устойчивости. Потыкать в его слабые места пальцем и убедиться, что ничего не разваливается. Кажется, рассуждательные нейросети и на такое должны быть способны тоже.