Симонець, ГалинаГалинаСимонець2020-12-262020-12-262020http://ir.nmu.org.ua/handle/123456789/156854Методи дослідження: методи машинного навчання для очищення, нормалізування, представлення текстових даних у вигляді прийнятним для обробки на ЕОМ. Класифікатор логістичної регресії, метод класифікації за допомогою лінійних опорних векторів без та з методом навчання – стохастичний градієнтний спуск, класифікатор «Випадковий ліс» та класифікатор з посиленням градієнта. Алгоритм оцінки роботи класифікаторів, що включає використання методів підрахунку матриці помилок, точності, повноти та Ф-міри для оцінки моделей. Для більш генералізованої оцінки використано метод перехресної перевірки. Мова програмування Python. Економічна ефективність: очікується позитивною завдяки розробці програмних модулів, які дозволяють автоматизувати процес класифікації коментарів. В інформаційно-аналітичному розділі розглянуто основні базові підходи до обробки тексту і виділено стратегії та їх алгоритми, які можна використати для опрацювання текстових коментарів під відео у «Youtube». Окрім того, описано можливості мови програмування Python. В спеціальному розділі розроблено модуль з вивантаження коментарів з під відео на «Youtube», та програмний комплекс для їх класифікації кількома методами. Проведено аналіз точності моделей за яким обрано найкращі.Об’єкт дослідження: відеохостинг, що надає користувачам послуги зберігання, доставки та показу відео – «YouTube». Мета дослідження: виявлення токсичних коментарів на відеохостінгу "Youtube" шляхом класифікації неструктурованого тексту за допомогою комбінації методів машинного навчання. Практична цінність отриманих у роботі результатів полягає в оптимізації(спрощені) процесу аналізу коментарів.ukкоментарікласифікаціялогістична регресіяметод опорних векторівградієнтний спускматриця помилокперехресна помилкаЗастосування алгоритмів машинного навчання для обробки коментарів відеохостингуПОЯСНЮВАЛЬНА ЗАПИСКА кваліфікаційної роботи магістра студентки групи 124м–19–1 Симонець Галини Василівни спеціальності 124 Системний аналізLearning Object