Представлена «Модель обучения казахскому языку «Tilqazyna» на основе искусственного интеллекта

Национальный научно-практический центр «Тіл-Қазына» при Комитете языковой политики Министерства науки и высшего образования представил первые результаты «Модели обучения казахскому языку «Tilqazyna» на основе искусственного интеллекта, передает пресс-служба Министерства науки и высшего образования.

На данный момент модель способна выполнять задачи в таких областях казахского языка, как лексика, морфология, семантика и др. В частности, она может генерировать текст на казахском языке, создавать перифразы, работать с контекстом, сокращать тексты, исправлять грамматические и пунктуационные ошибки, раскрывать значения фразеологизмов, а также переводить термины.

Эта отраслевая LLM модель уже загружена на платформу Hugging Face и доступна всем пользователям. Использование данной модели позволит разрабатывать множество IT-продуктов на казахском языке с помощью искусственного интеллекта. Это соответствует Посланию Президента Касым-Жомарта Токаева, в котором подчеркивалась важность превращения Казахстана в страну, широко использующую искусственный интеллект и развивающую цифровые технологии.

При разработке модели эксперты центра «Тіл-Қазына» применяли алгоритмы обработки естественного языка и целенаправленно анализировали большие объемы данных. В частности:

для проверки слов использовались 684 876 лексических единиц;
для улучшения системы проверки словосочетаний было использовано 20 212 правильных и ошибочных вариантов;
для исправления пунктуационных ошибок проанализировано 5 558 текстов;
для коррекции структуры текста было подготовлено 3 000 правильных и неправильных версий текстов;
для функции сокращения предложений создана база из 6 000 полных и сокращенных предложений;
для функции перифраза собрано 14 790 синонимических рядов;
общий объем обработанного корпуса казахского языка составил 35 ГБ.
В этом году в модель будет добавлена функция голосового общения, и будет разработан удобный интерфейс для пользователей. Также проект будет способен обучать казахскому языку на уровнях A1, A2 и B1, а к 2026 году – на уровнях B2 и C1.

Конечным результатом проекта станет голосовой помощник, способный создавать индивидуальную программу обучения казахскому языку в зависимости от уровня знания языка пользователя. Он будет представлен в виде мобильного приложения для систем IOS и Android.

Понравился пост? Расскажи об этом своим друзьям!
Загрузка...

Читайте также:

В Казахстане выходит отечественный мультфильм, объясняющий детям основы финансовой грамотности

Экологиялық сана бала кезден қалыптасады, бұл жерде мектептің рөлі ерекше – Экологическое сознание формируется с детства, и школа играет в этом важную роль

Түркістан облысы Арыс қаласындағы 600 оқушы орнына арналған №2 орта мектеп «Келешек мектептері» жобасы аясында салынды – В городе Арыс Туркестанской области в рамках проекта «Келешек мектептері» построена школа №2, рассчитанная на 600 ученических мест

«Келешек мектептері» ұлттық жобасы аясында Түркістан облысында 46 мыңға жуық оқушы орнына арналған 29 жаңа форматтағы мектеп пайдалануға берілуде – В рамках национального проекта «Келешек мектептері» в Туркестанской области реализуется строительство 29 школ нового формата, рассчитанных почти на 46 тыс. ученических мест

Мемлекет басшысының тапсырмасы бойынша «Келешек мектептері» жобасы жүзеге асырылуда – По поручению Главы государства реализуется проект «Келешек мектептері»

Добавить комментарий