Корпус казахского языка для KazLLM разрабатывают более 140 ученых

Kapital.kz

В министерстве науки и высшего образования рассказали, что разработана большая языковая модель KazLLM для развитие искусственного интеллекта (ИИ) на казахском языке, сообщает корреспондент центра деловой информации Kapital.kz со ссылкой на пресс-службу ведомства.

Версия KazLLM с открытым исходным кодом доступна на платформе https://huggingface.co/issai.

«Модель можно использовать в некоммерческих научных и академических целях, при создании чат-ботов, виртуальных помощников, автоматических переводчиков по аналогии с Google Translate», — указали в Миннауки.

Для обеспечения корпуса казахского языка для KazLLM министерство привлекло специалистов Института информационных систем и искусственного интеллекта (ISSAI), научных институтов и высших учебных заведений.

В ведомстве считаю, в условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной, и будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также интеграции казахского языка в современные технологии.

Cвыше 140 учёных и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпуса казахского языка для KazLLM, занимались подготовкой больших объёмов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке.

«Казахский национальный университет имени аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям. Институт математики и математического моделирования занимался составлением данных по направлениям математики. Институт истории и этнологии имени Ш.Уалиханова – контентом по истории, а медицинские университеты – данными в области медицины. Это сотрудничество способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели», — сообщили в министерстве.

Напомним, 1 декабря 2024 года в Астане Президенту Казахстана Касым-Жомарту Токаеву была представлена национальная языковая модель KazLLM. Модель была разработана под руководством Института умных систем и искусственного интеллекта (ISSAI NU) в партнёрстве с Beeline Казахстан и его ИТ-компанией QazCode, а также Astana Hub. В конце года Касым-Жомарт Токаев посетил Международный центр искусственного интеллекта Alem.AI, который создается для трансформации Казахстана в ИИ-ориентированное государство. Главе государства была презентована концепция Центра искусственного интеллекта Alem.AI, который будет расположен в сфере Nur Alem.

Летом 2024 года в Казахстане стала доступна первая национальная языковая модель с открытым исходным кодом IrbisGPT.

ЦСКА обыграл "Астраханочку" и вышел в финал Кубка России

ЦСКА и «Ростов-Дон» сойдутся в финальном матче Кубка России по гандболу среди женщин. В Москве, 4 и 5 ...

  • 04.04.2026

Юрист ответил, какое отчество может дать мать-одиночка ребенку

Юрист Русяев: мать-одиночка может дать ребёнку любое отчество Мать одиночка может выбрат ...

  • 04.04.2026

Бывшая участница Spice Girls развеяла слухи о воссоединении группы

Мел Би опровергла слухи об их воссоединении группы Spice Girls Участница легендарной гру ...

  • 04.04.2026

Губернатор Анохин открыл в Смоленске центр помощи женщинам и детям

В Смоленске начал работу новый центр помощи беременным и женщинам с детьми под названием "Второе дыхание ...

  • 04.04.2026