post

Корпус казахского языка для KazLLM разрабатывают более 140 ученых

Kapital.kz

В министерстве науки и высшего образования рассказали, что разработана большая языковая модель KazLLM для развитие искусственного интеллекта (ИИ) на казахском языке, сообщает корреспондент центра деловой информации Kapital.kz со ссылкой на пресс-службу ведомства.

Версия KazLLM с открытым исходным кодом доступна на платформе https://huggingface.co/issai.

«Модель можно использовать в некоммерческих научных и академических целях, при создании чат-ботов, виртуальных помощников, автоматических переводчиков по аналогии с Google Translate», — указали в Миннауки.

Для обеспечения корпуса казахского языка для KazLLM министерство привлекло специалистов Института информационных систем и искусственного интеллекта (ISSAI), научных институтов и высших учебных заведений.

В ведомстве считаю, в условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной, и будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также интеграции казахского языка в современные технологии.

Cвыше 140 учёных и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпуса казахского языка для KazLLM, занимались подготовкой больших объёмов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке.

«Казахский национальный университет имени аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям. Институт математики и математического моделирования занимался составлением данных по направлениям математики. Институт истории и этнологии имени Ш.Уалиханова – контентом по истории, а медицинские университеты – данными в области медицины. Это сотрудничество способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели», — сообщили в министерстве.

Напомним, 1 декабря 2024 года в Астане Президенту Казахстана Касым-Жомарту Токаеву была представлена национальная языковая модель KazLLM. Модель была разработана под руководством Института умных систем и искусственного интеллекта (ISSAI NU) в партнёрстве с Beeline Казахстан и его ИТ-компанией QazCode, а также Astana Hub. В конце года Касым-Жомарт Токаев посетил Международный центр искусственного интеллекта Alem.AI, который создается для трансформации Казахстана в ИИ-ориентированное государство. Главе государства была презентована концепция Центра искусственного интеллекта Alem.AI, который будет расположен в сфере Nur Alem.

Летом 2024 года в Казахстане стала доступна первая национальная языковая модель с открытым исходным кодом IrbisGPT.

Группу вымогателей задержали в Алматинской области

Преступники искали жертв через соцсети Сотрудники управления по борьбе с организованной преступн ...

  • 13.02.2025

Оценка экономики Казахстана ВБ и МВФ: необходимы структурные реформы

Kapital.kz Автор: эксперт Аналитического центра Halyk Finance Салтанат Игенбекова В январе 2025 ...

  • 13.02.2025

В СКО запускают систему дронов для мониторинга паводков

В рамках поставленных Главой государства задач Правительством ведётся работа по внедрению цифровых р ...

  • 13.02.2025

Злостным нарушителям ПДД могут убрать возможность оплаты штрафа с 50% скидкой 

Фото: Telegram Сенатор отметил, что, судя по престижным авто таких нарушителей, речь идёт о молод ...

  • 13.02.2025