Виправлення помилок лематизації тексту за допомогою словника

Смиш, О. Р.; Жежерун, О. П.

Переглянути

Наукова_весна_2023-193-194.pdf (319.9Kb)

Дата

2023

Автор

Смиш, О. Р.

Жежерун, О. П.

Metadata

Показати повний опис матеріалу

Короткий опис(реферат)

Працюючи з обробкою природної мови важливим аспектом є точність отримуваних даних. У власному дисертаційному дослідженні, присвяченому створенню системи для розв’язування задач з геометрії, які записані природною українською мовою [1], головною і першочерговою частиною застосунку є модуль обробки тексту задач. Цей модуль поетапно виконує попереднє опрацювання сирого тексту, далі застосовує UDPipe [2] аналізатор для токенізації, теґування, лематизації та аналізу залежностей, потім проводить уніфікацію словосполук. Хоча для української мови UD 2.10 демонструє точність лематизації понад 97% [3], помилки трапляються, – інколи аналізатор може залишити початкове слово без змін або ж некоректно змінити це слово.

URI

http://ir.nmu.org.ua/handle/123456789/164046

Collections

Секція «Інформаційні технології та телекомунікації» [19]