AI [Перевод] Почему большие языковые модели застряли в пещере Платона (и что будет дальше)

AI

Редактор
Регистрация
23 Август 2023
Сообщения
3 641
Лучшие ответы
0
Реакции
0
Баллы
243
Offline
#1


Большие языковые модели кажутся умными, потому что говорят бегло, уверенно и в огромных масштабах. Но беглость - это не понимание, а уверенность - это не восприятие. Чтобы ухватить реальное ограничение сегодняшних ИИ-систем, полезно вернуться к идее возрастом более двух тысяч лет.

В "Государстве" Платон описывает аллегорию пещеры: узники, закованные в цепи внутри пещеры, могут видеть только тени, проецируемые на стену. Никогда не видев реальных объектов, отбрасывающих эти тени, они принимают видимость за реальность и лишены возможности испытать настоящий мир.

Большие языковые модели живут в очень похожей пещере.

LLM не воспринимают мир - они о нем читают


LLM не видят, не слышат, не касаются и не взаимодействуют с реальностью. Они обучены почти полностью на тексте: книгах, статьях, постах, комментариях, расшифровках и фрагментах человеческого самовыражения, собранных из истории и интернета. Этот текст - их единственный вход. Их единственный "опыт".

LLM видят только "тени": тексты, созданные людьми, описывающими мир. Эти тексты - их целая вселенная. Все, что LLM знает о реальности, приходит отфильтрованным через язык, написанный людьми с разной степенью интеллекта, честности, предвзятости, знаний и намерений.

Текст - это не реальность. Это человеческое представление реальности. Оно опосредовано, неполно, предвзято и дико гетерогенно, часто искажено. Человеческий язык отражает мнения, недопонимания, культурные слепые пятна и откровенную ложь. Книги и интернет содержат экстраординарные инсайты, но также теории заговора, пропаганду, порнографию, насилие и чистую чушь. Когда мы обучаем LLM на "всем тексте", мы не даем им доступ к миру. Мы даем им доступ к человеческим теням на стене.

Это не незначительное ограничение. Это основной архитектурный дефект современного ИИ.

Почему масштаб не решает проблему


Преобладающее предположение в стратегии ИИ было таким: масштаб исправляет все - больше данных, модели покрупнее, больше параметров, больше вычислений. Но больше теней на стене не равняется реальности.

Поскольку LLM обучены предсказывать статистически наиболее вероятное следующее слово, они отлично справляются с производством правдоподобного языка, но не с пониманием причинности, физических ограничений или реальных последствий. Вот почему галлюцинации - это не баг, который можно исправить патчем, а структурное ограничение.

Как неоднократно утверждал Ян ЛеКун, одного языка недостаточно как основы для интеллекта.

Сдвиг к мировым моделям


Вот почему внимание все больше поворачивается к world models (мировым моделям): системам, которые строят внутренние представления о том, как работают среды, учатся на взаимодействии и симулируют результаты перед действием.

В отличие от LLM, мировые модели не ограничены текстом. Они могут включать временные ряды данных, сенсорные входы, циклы обратной связи, данные ERP, таблицы, симуляции и последствия действий. Вместо вопроса "Какое наиболее вероятное следующее слово?" они задают гораздо более мощный вопрос:

"Что произойдет, если мы сделаем это?"

Как это выглядит на практике


Для руководителей это не абстрактные исследовательские дебаты. Мировые модели уже появляются (часто без соответствующей маркировки) в областях, где одного языка недостаточно.


  • Цепочки поставок и логистика: Языковая модель может суммировать сбои или генерировать отчеты. Мировая модель может симулировать, как закрытие порта, рост цен на топливо или провал поставщика распространяется по сети, и тестировать альтернативные ответы перед вложением капитала.

  • Страхование и управление рисками: LLM могут объяснять политики или отвечать на вопросы клиентов. Мировые модели могут изучать, как риск на самом деле эволюционирует во времени, симулировать экстремальные события и оценивать каскадные потери при разных сценариях - то, что ни одна текстовая система не может делать надежно.

  • Производство и операции: Цифровые двойники фабрик - это ранние мировые модели. Они не просто описывают процессы; они симулируют, как машины, материалы и тайминг взаимодействуют, позволяя компаниям предсказывать отказы, оптимизировать пропускную способность и тестировать изменения виртуально перед касанием реальной системы.

Во всех этих случаях язык полезен, но недостаточен. Понимание требует модели того, как ведет себя мир, а не только того, как люди о нем говорят.

Как подготовиться к эре мировых моделей - прямо сейчас


Весь этот разговор о переходе от языковых моделей к мировым моделям поднимает практический вопрос: как профессионалам и компаниям готовиться к этому сдвигу уже сегодня?

Проблема в том, что пока мировые модели развиваются в лабораториях и специализированных приложениях, понимание их принципов работы требует экспериментирования с современными ИИ-системами. Нельзя строить будущее, не понимая настоящего.

Сервисы вроде BotHub дают возможность экспериментировать с разными подходами к ИИ прямо из браузера - от языковых моделей до более сложных архитектур.



Для доступа не требуется VPN, можно использовать российскую карту.


По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Не привязывайтесь к одному источнику информации. Привяжитесь к инструментам, которые помогают видеть полную картину.

Пост-LLM архитектура


Это не значит отказываться от языковых моделей. Это значит поставить их на правильное место.

В следующей фазе ИИ:


  • LLM становятся интерфейсами, копилотами и переводчиками


  • Мировые модели обеспечивают заземление, предсказание и планирование


  • Язык располагается поверх систем, которые учатся на самой реальности

В аллегории Платона узники освобождаются не изучением теней более внимательно - они освобождаются, повернувшись и столкнувшись с источником этих теней, и в конечном счете с миром за пределами пещеры.

ИИ приближается к похожему моменту.

Организации, которые распознают это рано, перестанут принимать беглый язык за понимание и начнут инвестировать в архитектуры, моделирующие их собственную реальность. Эти компании не будут просто строить ИИ, который убедительно говорит о мире - они построят ИИ, который действительно понимает, как он работает.

Поймет ли ваша компания это? Сможет ли ваша компания построить свою мировую модель?
 
Яндекс.Метрика Рейтинг@Mail.ru
Сверху Снизу