MaGGIe blinkt uit in het renderen van haar en het scheiden van instanties op natuurlijke afbeeldingen, en presteert beter dan MGM en InstMatt in complexe scenario's met meerdere instanties.MaGGIe blinkt uit in het renderen van haar en het scheiden van instanties op natuurlijke afbeeldingen, en presteert beter dan MGM en InstMatt in complexe scenario's met meerdere instanties.

Robuuste Maskergestuurde Matting: Beheer van Ruizige Invoer en Objectveelzijdigheid

Abstract en 1. Inleiding

  1. Gerelateerd Werk

  2. MaGGIe

    3.1. Efficiënte Gemaskeerde Begeleide Instance Matting

    3.2. Feature-Matte Temporele Consistentie

  3. Instance Matting Datasets

    4.1. Afbeelding Instance Matting en 4.2. Video Instance Matting

  4. Experimenten

    5.1. Pre-training op afbeeldingsdata

    5.2. Training op videodata

  5. Discussie en Referenties

\ Aanvullend Materiaal

  1. Architectuurdetails

  2. Afbeelding matting

    8.1. Datasetgeneratie en voorbereiding

    8.2. Trainingsdetails

    8.3. Kwantitatieve details

    8.4. Meer kwalitatieve resultaten op natuurlijke afbeeldingen

  3. Video matting

    9.1. Datasetgeneratie

    9.2. Trainingsdetails

    9.3. Kwantitatieve details

    9.4. Meer kwalitatieve resultaten

8.4. Meer kwalitatieve resultaten op natuurlijke afbeeldingen

Fig. 13 toont de prestaties van ons model in uitdagende scenario's, met name bij het nauwkeurig weergeven van haargebieden. Ons framework presteert consistent beter dan MGM⋆ in detailbehoud, vooral bij complexe instance-interacties. In vergelijking met InstMatt vertoont ons model superieure instance-scheiding en detailnauwkeurigheid in dubbelzinnige gebieden.

\ Fig. 14 en Fig. 15 illustreren de prestaties van ons model en eerdere werken in extreme gevallen met meerdere instances. Terwijl MGM⋆ worstelt met ruis en nauwkeurigheid in dichte instance-scenario's, behoudt ons model hoge precisie. InstMatt toont zonder aanvullende trainingsdata beperkingen in deze complexe situaties.

\ De robuustheid van onze maskbegeleide aanpak wordt verder gedemonstreerd in Fig. 16. Hier benadrukken we de uitdagingen waarmee MGM-varianten en SparseMat worden geconfronteerd bij het voorspellen van ontbrekende delen in maskerinvoer, wat ons model adresseert. Het is echter belangrijk op te merken dat ons model niet is ontworpen als een menselijk instance-segmentatienetwerk. Zoals getoond in Fig. 17, volgt ons framework de invoerbegeleiding en zorgt voor nauwkeurige alpha matte-voorspelling, zelfs met meerdere instances in hetzelfde masker.

\ Ten slotte benadrukken Fig. 12 en Fig. 11 de generalisatiemogelijkheden van ons model. Het model extraheert nauwkeurig zowel menselijke onderwerpen als andere objecten uit achtergronden, waarmee de veelzijdigheid in verschillende scenario's en objecttypen wordt aangetoond.

\ Alle voorbeelden zijn internetafbeeldingen zonder ground-truth en het masker van r101fpn400e wordt gebruikt als begeleiding.

\ Figuur 13. Ons model produceert zeer gedetailleerde alpha matte op natuurlijke afbeeldingen. Onze resultaten tonen aan dat het nauwkeurig is en vergelijkbaar met eerdere instance-agnostische en instance-bewustzijnsmethoden zonder dure rekenkosten. Rode vierkanten zoomen in op de detailgebieden voor elke instance. (Best bekeken in kleur en digitale zoom).

\ Figuur 14. Onze frameworks scheiden instances nauwkeurig in een extreem geval met veel instances. Terwijl MGM vaak overlapping tussen instances veroorzaakt en MGM⋆ ruis bevat, produceert ons werk vergelijkbare resultaten met InstMatt getraind op de externe dataset. Rode pijl geeft de fouten aan. (Best bekeken in kleur en digitale zoom).

\ Figuur 15. Onze frameworks scheiden instances nauwkeurig in één doorgang. De voorgestelde oplossing toont vergelijkbare resultaten met InstMatt en MGM zonder de voorspelling/verfijning vijf keer uit te voeren. Rode pijl geeft de fouten aan. (Best bekeken in kleur en digitale zoom).

\ Figuur 16. In tegenstelling tot MGM en SparseMat is ons model robuust ten opzichte van het invoerbegeleidingsmasker. Met de attentiekop produceert ons model stabielere resultaten voor maskerinvoer zonder complexe verfijning tussen instances zoals InstMatt. Rode pijl geeft de fouten aan. (Best bekeken in kleur en digitale zoom).

\ Figuur 17. Onze oplossing werkt correct met multi-instance maskerbegeleidingen. Wanneer meerdere instances in één begeleidingsmasker bestaan, produceren we nog steeds de correcte unie alpha matte voor die instances. Rode pijl geeft de fouten aan of het zoom-gebied in rode box. (Best bekeken in kleur en digitale zoom).

\ Tabel 12. Details van kwantitatieve resultaten op HIM2K+M-HIM2K (Uitbreiding van Tabel 5). Grijs geeft het publieke gewicht aan zonder hertraining.

\ Tabel 12. Details van kwantitatieve resultaten op HIM2K+M-HIM2K (Uitbreiding van Tabel 5). Grijs geeft het publieke gewicht aan zonder hertraining. (Vervolg)

\ Tabel 12. Details van kwantitatieve resultaten op HIM2K+M-HIM2K (Uitbreiding van Tabel 5). Grijs geeft het publieke gewicht aan zonder hertraining. (Vervolg)

\ Tabel 12. Details van kwantitatieve resultaten op HIM2K+M-HIM2K (Uitbreiding van Tabel 5). Grijs geeft het publieke gewicht aan zonder hertraining. (Vervolg)

\ Tabel 13. De effectiviteit van voorgestelde temporele consistentiemodules op V-HIM60 (Uitbreiding van Tabel 6). De combinatie van bidirectionele Conv-GRU en voorwaarts-achterwaartse fusie behaalt de beste algehele prestatie op drie testsets. Vetgedrukt benadrukt het beste voor elk niveau.

\

:::info Auteurs:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info Dit artikel is beschikbaar op arxiv onder CC by 4.0 Deed (Attribution 4.0 International) licentie.

:::

\

Marktkans
Mask Network logo
Mask Network koers(MASK)
$0.5814
$0.5814$0.5814
+1.39%
USD
Mask Network (MASK) live prijsgrafiek
Disclaimer: De artikelen die op deze site worden geplaatst, zijn afkomstig van openbare platforms en worden uitsluitend ter informatie verstrekt. Ze weerspiegelen niet noodzakelijkerwijs de standpunten van MEXC. Alle rechten blijven bij de oorspronkelijke auteurs. Als je van mening bent dat bepaalde inhoud inbreuk maakt op de rechten van derden, neem dan contact op met service@support.mexc.com om de content te laten verwijderen. MEXC geeft geen garanties met betrekking tot de nauwkeurigheid, volledigheid of tijdigheid van de inhoud en is niet aansprakelijk voor eventuele acties die worden ondernomen op basis van de verstrekte informatie. De inhoud vormt geen financieel, juridisch of ander professioneel advies en mag niet worden beschouwd als een aanbeveling of goedkeuring door MEXC.