Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://ir.nmu.org.ua/handle/123456789/156854
Назва: | Застосування алгоритмів машинного навчання для обробки коментарів відеохостингу |
Інші назви: | ПОЯСНЮВАЛЬНА ЗАПИСКА кваліфікаційної роботи магістра студентки групи 124м–19–1 Симонець Галини Василівни спеціальності 124 Системний аналіз |
Автори: | Симонець, Галина |
Ключові слова: | коментарі;класифікація;логістична регресія;метод опорних векторів;градієнтний спуск;матриця помилок;перехресна помилка |
Дата публікації: | 2020 |
Короткий огляд (реферат): | Об’єкт дослідження: відеохостинг, що надає користувачам послуги зберігання, доставки та показу відео – «YouTube». Мета дослідження: виявлення токсичних коментарів на відеохостінгу "Youtube" шляхом класифікації неструктурованого тексту за допомогою комбінації методів машинного навчання. Практична цінність отриманих у роботі результатів полягає в оптимізації(спрощені) процесу аналізу коментарів. |
Опис: | Методи дослідження: методи машинного навчання для очищення, нормалізування, представлення текстових даних у вигляді прийнятним для обробки на ЕОМ. Класифікатор логістичної регресії, метод класифікації за допомогою лінійних опорних векторів без та з методом навчання – стохастичний градієнтний спуск, класифікатор «Випадковий ліс» та класифікатор з посиленням градієнта. Алгоритм оцінки роботи класифікаторів, що включає використання методів підрахунку матриці помилок, точності, повноти та Ф-міри для оцінки моделей. Для більш генералізованої оцінки використано метод перехресної перевірки. Мова програмування Python. Економічна ефективність: очікується позитивною завдяки розробці програмних модулів, які дозволяють автоматизувати процес класифікації коментарів. В інформаційно-аналітичному розділі розглянуто основні базові підходи до обробки тексту і виділено стратегії та їх алгоритми, які можна використати для опрацювання текстових коментарів під відео у «Youtube». Окрім того, описано можливості мови програмування Python. В спеціальному розділі розроблено модуль з вивантаження коментарів з під відео на «Youtube», та програмний комплекс для їх класифікації кількома методами. Проведено аналіз точності моделей за яким обрано найкращі. |
URI (Уніфікований ідентифікатор ресурсу): | http://ir.nmu.org.ua/handle/123456789/156854 |
Розташовується у зібраннях: | 2020-2021 навчальний рік |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
Диплом_Симонець Г.В.(спец124м).pdf | 181,99 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.