Publication: Аналіз ефективності використання архітектури Transformer у задачі класифікації зображень
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
НТУ "ДП"
DOI
Abstract
Класифікація зображень є однією з основних задачах комп’ютерного зору в
домені штучного інтелекту, що має важливе прикладне значення в обробці медичних
даних, геопросторовому аналізі, розробці критичних безпекових систем, електронній
комерції. Завдання класифікації полягає у співставленні нейронною мережею об’єкта
на зображенні із певним класом, відповідно до якого він належить. Зі зростанням
складності зображень, що оброблюються моделлю, збільшується й обчислювальна
складність та час її навчання. На початку 90-х років минулого сторіччя навчальні дані
для класифікації обмежувались відносно простими чорно-білими зображеннями, при
роботі з якими досить довго використовувались повнозв’язні нейронні мережі. Однак зі
збільшенням складності зображень, їхніх розмірів, впровадженні кольорових каналів,
кількість параметрів навчання моделі також зростає. Ефективними архітектурами, що
дозволяють досягти високих показників якості, є згорткові нейронні мережі та ViT
(англ. – Vision Transformer), що є відносно новим підходом до обробки зображень.
Description
Citation
Костюченко А.Д. Аналіз ефективності використання архітектури Transformer у задачі класифікації зображень / Костюченко А.Д. // «Молодь : наука та інновації» 2024 матеріали XIІ Міжнародної науково-технічної конференції студентів, аспірантів та молодих вчених, Дніпро, 13–15 листопада 2024 року. – Дніпро : НТУ «ДП», 2024. – Том 2. – С. 113-114.