Publication:
Аналіз ефективності використання архітектури Transformer у задачі класифікації зображень

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

НТУ "ДП"

DOI

Research Projects

Organizational Units

Journal Issue

Abstract

Класифікація зображень є однією з основних задачах комп’ютерного зору в домені штучного інтелекту, що має важливе прикладне значення в обробці медичних даних, геопросторовому аналізі, розробці критичних безпекових систем, електронній комерції. Завдання класифікації полягає у співставленні нейронною мережею об’єкта на зображенні із певним класом, відповідно до якого він належить. Зі зростанням складності зображень, що оброблюються моделлю, збільшується й обчислювальна складність та час її навчання. На початку 90-х років минулого сторіччя навчальні дані для класифікації обмежувались відносно простими чорно-білими зображеннями, при роботі з якими досить довго використовувались повнозв’язні нейронні мережі. Однак зі збільшенням складності зображень, їхніх розмірів, впровадженні кольорових каналів, кількість параметрів навчання моделі також зростає. Ефективними архітектурами, що дозволяють досягти високих показників якості, є згорткові нейронні мережі та ViT (англ. – Vision Transformer), що є відносно новим підходом до обробки зображень.

Description

Citation

Костюченко А.Д. Аналіз ефективності використання архітектури Transformer у задачі класифікації зображень / Костюченко А.Д. // «Молодь : наука та інновації» 2024 матеріали XIІ Міжнародної науково-технічної конференції студентів, аспірантів та молодих вчених, Дніпро, 13–15 листопада 2024 року. – Дніпро : НТУ «ДП», 2024. – Том 2. – С. 113-114.

Endorsement

Review

Supplemented By

Referenced By