Это не робот и не поиск. Так что же такое ChatGPT?

Меня регулярно спрашивают примерно одно и то же - друзья, родные, знакомые не из IT: «А этот ваш ChatGPT - там что, живые люди отвечают? Или он просто ищет в интернете?»

Короткого ответа у меня долго не было. Я пятнадцать лет пишу программы, последние годы практически живу внутри этих нейросетей, дома у меня работает собственный ИИ-помощник - а объяснить на пальцах всё равно не получалось. Потому что честный ответ - «ни то, ни другое» - сразу тянет за собой вопрос: а что тогда?

Эта статья - попытка ответить так, чтобы было понятно любому. И заодно начать цикл «AI для самых маленьких»: про искусственный интеллект простыми словами, без жаргона, без восторженных воплей и без страшилок. Только то, что я вижу каждый день своими глазами.

Как все думают

Большинство людей держат в голове одну из двух картинок.

Картинка первая: это поисковик с человеческим лицом. Ты задаёшь вопрос - он лезет в свою огромную базу, находит ответ и красиво формулирует. Как Гугл, только вежливый.

Картинка вторая: это разум. Электронный мозг, который «понимает» вопрос, «думает» и «отвечает». Маленький человек в коробке.

Обе картинки логичны. И обе неверны. А пока в голове неверная картинка, нейросеть будет регулярно вас удивлять - то поразительной сообразительностью, то идиотскими ошибками, которые «ну как можно было допустить».

Давайте соберём правильную картинку. Понадобится одна штука, которая есть у вас в телефоне.

Игра в «угадай следующее слово»

Наберите в телефоне сообщение: «Привет, как...» - и посмотрите на подсказки над клавиатурой. Телефон предложит: «дела», «ты», «настроение». Это Т9, и он занимается ровно одним: угадывает, какое слово вы напишете следующим.

Откуда он знает? Он не понимает русский язык. Он просто видел миллионы сообщений и заметил: после «как» чаще всего идёт «дела». Чистая статистика, ноль понимания.

А теперь - главный фокус этой статьи.

ChatGPT - это то же самое. Угадыватель следующего слова. Только разогнанный до невозможных масштабов.

Серьёзно. Под капотом нейросеть делает одну-единственную операцию: смотрит на текст и угадывает, какое слово, скорее всего, идёт дальше. Потом приклеивает угаданное слово к тексту - и угадывает следующее. И следующее. Слово за словом, пока не получится ответ.

Когда вы спрашиваете «Какая столица Франции?», нейросеть не «ищет в базе» и не «вспоминает». Она прикидывает: в тех горах текстов, на которых меня тренировали, после фразы «Какая столица Франции?» почти всегда шло слово «Париж». Значит, ставлю «Париж».

«Подожди, - скажете вы. - Т9 предлагает мне три кривых слова, а ChatGPT пишет связные письма, объясняет налоги и сочиняет стихи про кота. Это точно одно и то же?»

Справедливо. Разница - в масштабе, и она чудовищна.

Ваш Т9 учился на ваших сообщениях и помнит сочетания из двух-трёх слов. Большую нейросеть тренировали на текстах, которые человек читал бы десятки тысяч лет: книги, статьи, форумы, учебники, код, переписки. И чтобы хорошо угадывать следующее слово на таких объёмах, ей пришлось уловить вещи посерьёзнее, чем «после "как" идёт "дела"».

Смотрите. Чтобы правильно продолжить текст «Шерлок Холмс посмотрел на грязь на ботинках посетителя и сказал: ...», недостаточно знать частоту слов. Нужно «уловить», как строятся детективные рассуждения, как говорит Холмс, при чём тут грязь. И нейросеть это уловила - не потому что понимает, а потому что без этого следующее слово не угадаешь.

Получился парадокс, на котором стоит вся современная волна ИИ: если очень-очень хорошо угадывать следующее слово, со стороны это неотличимо от понимания.

Кстати, всё это вместе называется языковая модель. Всё, первое страшное слово выучили: модель языка - штука, которая смоделировала, как обычно устроен текст. На сегодня терминов хватит.

Попробуйте сами (2 минуты)

Откройте любой бесплатный чат с нейросетью и попросите её дописать текст - не ответить на вопрос, а именно продолжить:

Допиши абзац из краеведческого очерка: «Мало кто знает, что двоюродная бабушка Лермонтова славилась на весь уезд своим...»

Теперь следите внимательно. Случится одно из двух.

Либо нейросеть бойко допишет - про варенье, романсы или крутой нрав. Гладко, убедительно, с деталями. Проблема одна: сведений о двоюродной бабушке Лермонтова в текстах человечества толком нет. Вспоминать не из чего - она достраивает правдоподобное. Поздравляю: вы только что поймали угадывателя с поличным.

Либо она остановится и скажет: «достоверных сведений об этом нет». Это тоже интересно - вы увидели не «честность», а выучку: после основной тренировки нейросети специально дрессируют признаваться в незнании. Угадыватель никуда не делся - его просто научили иногда придерживать язык. (Чуть ниже расскажу про эту дрессировку подробнее.)

Какой бы исход ни выпал - вы увидели главное: по умолчанию её работа - не знать, а продолжать. Запомните это ощущение, в третьей статье превратим его в практический навык.

Где аналогия врёт

Буду честен, как обещал: «Т9 на стероидах» - упрощение, и вот где оно трещит.

Во-первых, современные нейросети после базовой тренировки ещё долго «дрессируют» люди: учат отвечать вежливо, отказываться от вредных просьб, оформлять ответы по-человечески. Так что это Т9, прошедший школу хороших манер.

Во-вторых, внутри происходит нечто более интересное, чем подсчёт частот, - и, забавный факт, даже создатели нейросетей не до конца понимают, что именно. Это не кокетство: исследователи реально вскрывают модели, как биологи - мозг, и удивляются находкам.

Но для повседневной жизни картинка «очень мощный угадыватель текста» работает отлично. Она объяснит вам 90% странностей, с которыми вы столкнётесь.

Одна мысль с собой

Нейросеть не знает, не помнит и не ищет. Она продолжает текст - настолько хорошо, что это похоже на понимание. Все её суперспособности и все её провалы растут ровно отсюда.

Что дальше

Хорошо, скажете вы, но ведь чтобы так угадывать, она должна была где-то всему этому «научиться». Что вообще значит «нейросеть обучали»? Ей показывали карточки, как ребёнку? Кто-то вбивал в неё Википедию?

Об этом - следующая статья: «Откуда нейросеть всё знает (спойлер: она ничего не знает)».

Это первая статья цикла «AI для самых маленьких» - про нейросети для взрослых, которые не обязаны в них разбираться. Я пишу про ИИ как практик: у меня дома живёт собственный ИИ-агент, и весь цикл построен на том, что я вижу каждый день, а не на пересказе чужих новостей.

Это не робот и не поиск. Так что же такое ChatGPT?.

Комментарии