2024 год стал переломным для LLM (Large Language Model, большую языковую модель, по-народному — ИИ, искусственный интеллект) в плане предоставления пользователям открытого доступа к собственной архитектуре, ранее по большей части закрытой.
4 марта компания Antropic анонсировала Claude 3 Opus, которая разрешила пользователям адаптировать модель к различным стилям и задачам, а также использовать одновременно мультимодальный ввод (не только текст, но и изображения).
В апреле компания Meta AI представила новую LLaMA 3. Она позволяет обучать модель на собственных данных и изменять важные параметры для оптимизации результатов под свои нужды.
Еще один важный прорыв LLaMA в версии 3.1 — это интеграция с системами Retrieval Augmented Generation (RAG) (генерация с использованием извлечения), которая дают моделям динамически обращаться к внешним источникам данных в реальном времени для улучшения качества ответов.
Процесс открытия LLM для пользователей проходил одновременно с двух сторон. Перечисленные выше компании и модели предпочли самостоятельно «демократизироваться» и предоставить максимум свободы для взаимодействия. Что касается LLM, защищенных авторским правом, то они также были «вскрыты» усилиями народных умельцев по децентрализации всего и вся.
Как бы там ни было, теперь возможно:
- а) с максимальной гибкостью подбирать данные, поступающие на входные узлы нейросети для обучения;
- б) менять сетевую архитектуру и настраивать параметры модели под собственные нужды;
- в) избавиться от навязчивой политкорректной цензуры.