Смиш, О. Р.О. Р.СмишЖежерун, О. П.О. П.Жежерун2023-07-062023-07-062023Смиш О. Р. Виправлення помилок лематизації тексту за допомогою словника / Смиш О. Р., Жежерун О. П. // «Наукова весна» 2023 : матеріали 13-ої Всеукраїнської наук.-техн. конф. студ., аспірантів та молодих вчених, Дніпро, 1-3 березня 2023 року– Дніпро : НТУ «ДП», 2023. – С. 193-194http://ir.nmu.org.ua/handle/123456789/164046Працюючи з обробкою природної мови важливим аспектом є точність отримуваних даних. У власному дисертаційному дослідженні, присвяченому створенню системи для розв’язування задач з геометрії, які записані природною українською мовою [1], головною і першочерговою частиною застосунку є модуль обробки тексту задач. Цей модуль поетапно виконує попереднє опрацювання сирого тексту, далі застосовує UDPipe [2] аналізатор для токенізації, теґування, лематизації та аналізу залежностей, потім проводить уніфікацію словосполук. Хоча для української мови UD 2.10 демонструє точність лематизації понад 97% [3], помилки трапляються, – інколи аналізатор може залишити початкове слово без змін або ж некоректно змінити це слово.ukлематизація текстуукраїнська моваВиправлення помилок лематизації тексту за допомогою словникаArticle004.622