4 млрд тенге на развитие ИИ – депутат Базарбек усомнился в тратах Astana Hub

Парламентарий задал вопросы МЦРИАП и Миннауки о содержании иностранных компаний и многомиллиардных расходах на искусственный интеллект.

Что произошло

4 млрд тенге, выделенные на развитие искусственного интеллекта через Astana Hub, могли быть направлены не туда, куда планировалось, считает депутат мажилиса Бакытжан Базарбек.

Детали

Выступая на парламентских слушаниях, депутат Базарбек задал два вопроса министру ИИ и цифрового развития Жаслану Мадиеву и министру науки и высшего образования Саясату Нурбеку.  

"Для развития ИИ Astana Hub получает спонсорскую помощь от крупной компании – 1 млрд 428 млн тенге. Эти средства перечисляют в компанию Sustainable Innovation and Technology Foundation для развития ИИ. Но тратятся они не на развитие ИИ: 1,3 млрд тенге – только на проведение семинаров по налоговому законодательству, 1,5 млрд тенге – на страхование болезней, 1,3 млрд тенге – на биометрические замки. Я бы не задавал вопрос, если бы там не было поручения МЦРИАП (старое название министерства). Вы искали эти деньги?" – спросил депутат. 

Кроме того, депутат обратил внимание на регистрацию дочерней компании Astana Hub в США.

"Для создания ЦОДов (центр обработки данных. – Ред.), Astana Hub зарегистрировала компанию в США. Для чего дочерняя компания Назарбаев университета – Sustainable Innovation and Technology Foundation создаёт и содержит в США компанию? Учитывая, что компьютерное оборудование, связанное с ИИ, будет размещаться на территории другой страны, существуют риски утечки информации. Расскажите, в чём смысл и истинные цели создания этой иностранной компании, если есть иностранная компания – создана Astana Hub", – сказал депутат (название компании неразборчиво). 

что ответил глава минцифры

Министр Мадиев прямо ответить не смог, пообещав предоставить письменный ответ. Но пояснил, что деньги пошли на разработку первой большой казахской языковой модели KazLLM.

"Astana Hub в свое время были получены спонсорские средства для развития ИИ. Их перечислили в Назарбаев университет, в команду инженеров – лаборатория ISAI. Команда помогла создать первую казахскую языковую модель – KazLLM на основе более 140 млрд токенов. Средства Astana Hub были полностью посвещены этой работе: создание токенизатора, подготовку данных, тренировку и настройку модели. Не связанных с этой работой не было никаких целей о постановке задачи для перечисления дополнительных средств", – сказал он. 

Он также добавил, что американский GPU-кластер (сеть компьютеров) использовался только для публичных моделей, поэтому утечки информации быть не могло:

"Американский GPU-кластер был запущен с компаниями из частного сектора. Персональные данные, которые запрещено выводить за пределы страны, не передавались. Те модели, которые тренируются в данном кластере – это публичные. Здесь риски компроментации персональных данных абсолютно отсутствуют", – объяснил министр Мадиев. 

что сказал министр науки

Министр Саясат Нурбек подтвердил, что аренда мощностей в США была вынужденной мерой:

"Были договорённости между Astana Hub и Назарбаев университетом. Университет был вынужден арендовать часть вычислительных мощностей в США, так как экспорт лицензий на чипы Nvidia тогда находился под вопросом. Проверка со стороны правительства США затянулась почти на два года. Сейчас, когда национальный суперкомпьютер доставлен и смонтирован в Казахстане, всё будет переведено сюда", – рассказал министр.

Что ещё

В завершение Бакытжан Базарбек резко обратился к представителям МЦРИАП. Он заявил, что располагает документами о нецелевом использовании 4,1 млрд тенге, и потребовал реакции министерства.

"Если я предоставлю вам документ, где эти 4,1 млрд потрачены не на те цели, о которых вы говорите, вы подключитесь к расследованию?" – спросил Базарбек.

Министр Жаслан Мадиев пообещал содействие и разъяснения.

Контекст

В апреле этого же года депутат Бакытжан Базарбек уже сомневался в прозрачности использования средств недропользователей, направляемых на научные проекты в Astana Hub. Он также указал на наличие в технопарке компаний, не связанных с приоритетными видами деятельности, в том числе майнинговых.

17 июня в МЦРИАП отреагировали на обнародованную информацию о масштабной утечке персональных данных 16 млн казахстанцев. Госорган заявил, что данные утекли из частных информационных систем, опровергая таким образом догадки о потере информации из государственных баз. А через два дня в Генпрокуратуре сказали, что начато расследование.