Publication: Виправлення помилок лематизації тексту за допомогою словника
Loading...
Date
Authors
Смиш, О. Р.
Жежерун, О. П.
Journal Title
Journal ISSN
Volume Title
Publisher
НТУ ДП
DOI
Abstract
Працюючи з обробкою природної мови важливим аспектом є точність отримуваних даних. У власному дисертаційному дослідженні, присвяченому створенню системи для розв’язування задач з геометрії, які записані природною українською мовою [1], головною і першочерговою частиною застосунку є модуль обробки тексту задач. Цей модуль поетапно виконує попереднє опрацювання сирого тексту, далі застосовує UDPipe [2] аналізатор для токенізації, теґування, лематизації та аналізу залежностей, потім проводить уніфікацію словосполук. Хоча для української мови UD 2.10 демонструє точність лематизації понад 97% [3], помилки трапляються, – інколи аналізатор може залишити початкове слово без змін або ж некоректно змінити це слово.
Description
Keywords
Citation
Смиш О. Р. Виправлення помилок лематизації тексту за допомогою словника / Смиш О. Р., Жежерун О. П. // «Наукова весна» 2023 : матеріали 13-ої Всеукраїнської наук.-техн. конф. студ., аспірантів та молодих вчених, Дніпро, 1-3 березня 2023 року– Дніпро : НТУ «ДП», 2023. – С. 193-194