Анотація та 1. Вступ
Пов'язані роботи
MaGGIe
3.1. Ефективне маскування керованого інстанс-маттінгу
3.2. Часова узгодженість ознак-матів
Набори даних інстанс-маттінгу
4.1. Інстанс-маттінг зображень та 4.2. Інстанс-маттінг відео
Експерименти
5.1. Попереднє навчання на даних зображень
5.2. Навчання на даних відео
Обговорення та посилання
\ Додатковий матеріал
Деталі архітектури
Маттінг зображень
8.1. Генерація та підготовка набору даних
8.2. Деталі навчання
8.3. Кількісні деталі
8.4. Більше якісних результатів на природних зображеннях
Маттінг відео
9.1. Генерація набору даних
9.2. Деталі навчання
9.3. Кількісні деталі
9.4. Більше якісних результатів
Рис. 13 демонструє продуктивність нашої моделі у складних сценаріях, зокрема в точному відтворенні ділянок волосся. Наш фреймворк постійно перевершує MGM⋆ у збереженні деталей, особливо у складній взаємодії інстансів. У порівнянні з InstMatt, наша модель демонструє кращу сепарацію інстансів та точність деталей у неоднозначних регіонах.
\ Рис. 14 та рис. 15 ілюструють продуктивність нашої моделі та попередніх робіт в екстремальних випадках з декількома інстансами. У той час як MGM⋆ має труднощі з шумом та точністю у сценаріях з щільними інстансами, наша модель зберігає високу точність. InstMatt без додаткових даних для навчання показує обмеження в цих складних умовах.
\ Надійність нашого підходу з маскованим керуванням додатково продемонстровано на рис. 16. Тут ми виділяємо проблеми, з якими стикаються варіанти MGM та SparseMat при прогнозуванні відсутніх частин у масках, які вирішує наша модель. Однак важливо зазначити, що наша модель не розроблена як мережа сегментації людських інстансів. Як показано на рис. 17, наш фреймворк дотримується вхідного керівництва, забезпечуючи точне прогнозування альфа-мату навіть з декількома інстансами в одній масці.
\ Нарешті, рис. 12 та рис. 11 підкреслюють можливості узагальнення нашої моделі. Модель точно виділяє як людей, так і інші об'єкти з фону, демонструючи свою універсальність у різних сценаріях та типах об'єктів.
\ Усі приклади є інтернет-зображеннями без істинних даних, а маска з r101fpn400e використовується як керівництво.
\ 
\ 
\ 
\ 
\ 
\ 
\ 
\ 
\ 
\ 
\
:::info Автори:
(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);
(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);
(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);
(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).
:::
:::info Ця стаття доступна на arxiv за ліцензією CC by 4.0 Deed (Attribution 4.0 International).
:::
\


