Publication:
Виправлення помилок лематизації тексту за допомогою словника

Loading...
Thumbnail Image

Date

Authors

Смиш, О. Р.

Жежерун, О. П.

Journal Title

Journal ISSN

Volume Title

Publisher

НТУ ДП

DOI

Research Projects

Organizational Units

Journal Issue

Abstract

Працюючи з обробкою природної мови важливим аспектом є точність отримуваних даних. У власному дисертаційному дослідженні, присвяченому створенню системи для розв’язування задач з геометрії, які записані природною українською мовою [1], головною і першочерговою частиною застосунку є модуль обробки тексту задач. Цей модуль поетапно виконує попереднє опрацювання сирого тексту, далі застосовує UDPipe [2] аналізатор для токенізації, теґування, лематизації та аналізу залежностей, потім проводить уніфікацію словосполук. Хоча для української мови UD 2.10 демонструє точність лематизації понад 97% [3], помилки трапляються, – інколи аналізатор може залишити початкове слово без змін або ж некоректно змінити це слово.

Description

Citation

Смиш О. Р. Виправлення помилок лематизації тексту за допомогою словника / Смиш О. Р., Жежерун О. П. // «Наукова весна» 2023 : матеріали 13-ої Всеукраїнської наук.-техн. конф. студ., аспірантів та молодих вчених, Дніпро, 1-3 березня 2023 року– Дніпро : НТУ «ДП», 2023. – С. 193-194

Endorsement

Review

Supplemented By

Referenced By