На Kazan Digital Week представили разработанную в МТС новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке, ее назвали Rehmet — в переводе это означает спасибо.
Языковая модель способна обрабатывать документы объемом в 5 листов A4, извлекать и суммаризировать данные за несколько секунд. Она может пригодиться в архивах, библиотеках, в государственных и частных организациях, где нужно обрабатывать информацию и анализировать документы на татарском языке.
Также при помощи ИИ можно ускорить обработку заявлений в государственные органы. Языковая модель извлечет нужную информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в базу данных.
Исполнительный директор MTS AI Дмитрий Марков заявил, что, создавая языковую модель на татарском, разработчики хотели поддержать многообразие языков в стране, чтобы они были востребованными в цифровую эпоху. Также проект показал, что разработчики могут адаптировать модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на разных языках.
Обучение языковой модели Cotype Light происходит на мощностях МТС Web Services.
Ранее сообщалось, что в пятом по счету международном форуме Kazan Digital Week участвуют свыше 16 тысяч человек как из российских регионов, так и из иностранных государств. В частности из Ирана, Турции и Беларусии. При этом 600 гостей форума выступают в качестве тематических спикеров на более чем 100 мероприятиях. Включая стратегические сессии Минцифры, конференции и конкурсы от 200 IT-компаний.
Все самое интересное в нашем телеграм-канале.