Застосування алгоритмів машинного навчання для обробки коментарів
Resumen
В роботі вирішено задачу виявлення токсичних коментарів на відеохостінгу "Youtube" шляхом класифікації неструктурованого тексту за допомогою комбінації методів машинного навчання. Стрімко зростаючі обсяги текстових даних потребують автоматичного аналізу, адже обсяги переходять рубіж тих, що можна обробляти мануально, тому розробка методів і алгоритмів автоматизованої обробки і аналізу текстової інформації є, безсумнівно, актуальним напрямом досліджень. Неструктуровані дані – текст, зображення та відео – містять велику кількість інформації. Однак, через невід'ємну складність обробки та аналізу цих даних робота з ними часто вимагає витрачання значного часу та зусиль. Але потенційно ці дані можуть бути корисними, особливо в соціологічних або психологічних досліджень.