"Ключевая задача привлечь к работе над KazLLM частные корпорации" – Алишер Бейсебай о казахстанском ИИ
Популярный казахстанский техноблогер Алишер Бейсебай о причинах, по которым казахстанские разработчики пока не повторили успех разработчиков популярных продуктов на базе искусственного интеллекта.
Создание эффективной LLM стоит больших денег. Не надо сравнивать этот процесс с ChatGPT – они вообще первопроходцы. Вот, как мне кажется, более подходящие примеры, построенные на уже существующих архитектурах:
DeepSeek. Все слышали, что на создание модели ушло 6-8 млн долларов. Но в прошлом году вскрылась правда. На деле эти деньги ушли только на аренду вычислительных мощностей. Полная сумма разработки (исследования, зарплаты специалистам и пр.) оценивается аналитиками в почти полмиллиарда долларов.
YandexGPT. Только языковую модель разрабатывали с 2023 года. Но и сейчас далеко не всё в Яндексе работает на ней. Чаще всего пользователи сталкиваются с этой моделью в Алисе. Она до сих пор во многом опирается на так называемые "навыки" – давно разработанные функции, похожие на обычные программы. Поэтому если считать срок с момента старта разработки Алисы, на это ушло почти 10 лет и несколько сотен миллиардов рублей.
В то же время на KazLLM было выделено 3,9 млрд тенге. Это примерно 15 квартир в Алматы. А YandexGPT – это по стоимости целый район таких квартир.
Но самая большая боль в другом: за KazLLM платит государство, а YandexGPT, DeepSeek, QWEN и все другие известные аналоги созданы за деньги частных компаний.
В таких условиях то, что у нас уже есть просто работающая модель – большое достижение. Да, есть недоработки, не хватает уникальных киллерфич. Как результат – пользователи продолжают выбирать зарубежных гигантов, вроде ChatGPT или Gemini.
Что нужно, чтобы проект стал действительно успешным и быстро вырос?
Главное – решить вопрос с финансами. Сейчас это национальный проект и оплачивается из бюджета. Токаев не хочет, чтобы это стало просто дырой, куда улетают деньги от налогов. Поэтому будут постоянные проверки, задержки финансирования и новые требования к разработчикам.
Так что сейчас ключевая задача для авторов проекта – привлечь к работе над LLM частные корпорации. Если они увидят интерес для инвестиций и снимут бремя финансирования с государства, всё полетит намного быстрее.
А для этого компании должны быть заинтересованы в собственной языковой модели. Так что должен идти более активный бизнес-девелопмент, чтобы KazLLM выглядела беспроигрышным выбором для корпораций. Или хотя бы более ценным, чем любая другая нейронка.
Я считаю, что со стороны разработчиков этому будет способствовать более глубокая разработка именно под Казахстан. Сейчас KazLLM построена на зарубежной архитектуре. По сути, она думает на английском, но отвечает на казахском. Это сильно её ограничивает.
Если нейросеть глубже обучить нашим менталитету и особенностям, она будет лучше нас понимать. А значит, будет лучше выполнять свои задачи. Вместе с этим у нее вырастет и ценность для популярных сервисов. Тогда будет больше интереса со стороны компаний – и так по кругу. Просто сейчас надо найти, кто запустит эту цепную реакцию. А главное – запустит ее правильно.
Примечание:
Мнение автора может не совпадать с мнением редакции.