1990-tal: experiment i köpcentrumkiosker
De tidigaste dokumenterade koncepten för virtuella provrum dök upp i forskningslabb för detaljhandel och akademiska uppsatser i början av 1990-talet. Implementeringen involverade vanligtvis en kamera, en spegelformad skärm och regelbaserad grafik som kunde lägga en förenklad klädsiluett ovanpå ett videoflöde. IBM och flera europeiska detaljhandelsgrupper genomförde begränsade pilotinstallationer i varuhus och galleriakiosker mellan 1994 och 1999.
Dessa system var opraktiska av två skäl: den datorkraft som krävdes för videobehandling i realtid var dyr och fysiskt skrymmande, och grafikkvaliteten låg långt under gränsen för vad shoppare fann trovärdigt. Användningen var genomgående låg. Projekten var användbara som demonstrationer av att konceptet fungerade i princip, men tekniken var decennier ifrån kommersiell lönsamhet.
2010-tal: genombrottet för AR och mobilkameror
Spridningen av smartphones med framåtvända kameror och dedikerade bildprocessorer skapade den första livskraftiga plattformen för AR-provning på massmarknaden. Snapchats Lens Studio, som lanserades 2017, demokratiserade skapandet av ansikts-AR och visade att tiotals miljoner användare var villiga att använda förstärkt verklighet i realtid när latensen var tillräckligt låg och renderingskvaliteten tillräckligt hög.
Mode- och skönhetsvarumärken rörde sig snabbt in på detta område. Solglasögonmärken byggde linsbaserade provningar för glasögon. Kosmetikmärken erbjöd förhandsvisningar av läppstift och foundation i realtid via AR. Dessa applikationer fungerade väl eftersom de krävde spårning av en relativt stel yta — ansiktet — vilket är ett enklare problem än att spåra draperat tyg på en kropp i rörelse. År 2019 var AR-provning ett bevisat kommersiellt verktyg för accessoarer och skönhet, men fortfarande i stort sett obeprövat för kläder.
2018–2020: första generationens e-handelsprovning
Den första vågen av virtuella provrumsprodukter för e-handel — specifikt inriktade på kläder — lanserades mellan 2018 och 2020. Dessa produkter använde vanligtvis en kombination av kroppspositionsestimering (uppskattning av kroppsledernas 3D-position utifrån en 2D-bild) och texturmappning för att drapera en 2D-plaggtextur på en identifierad kroppssiluett. Resultaten var tekniskt imponerande men visuellt föga övertygande: tygkanter var dåligt definierade, ljussättningen var inkonsekvent och komplexa plagg som lager-på-lager-ytterplagg eller fladdrande klänningar skapade artefakter.
Det kommersiella genomslaget var begränsat. Flera välfinansierade startups inom detta område bytte antingen inriktning till B2B-katalogfotografering eller lades ner mellan 2020 och 2022. Det grundläggande problemet var inte datorkraft eller ingenjörsinsats — betydande kapital satsades på båda — utan modellarkitekturen: texturmappning kunde inte realistiskt simulera hur tyg faller, viker sig och interagerar med kroppens geometri.
2022: det generativa AI-genombrottet
Lanseringen av latenta diffusionsmodeller med tillräcklig upplösning och kontrollmekanismer — den tekniska grunden för de bildgenereringssystem som blev framträdande under 2022 — förändrade förutsättningarna för virtuell provning i grunden. Istället för att texturmappa ett plagg på en kropp kunde diffusionsbaserade modeller generera en fotorealistisk bild av en person som bär ett plagg, baserat på både personens foto och plaggets utseende. Tygfallet, ljusinteraktionen och kroppens döljande av delar av plagget uppstod ur själva genereringsprocessen snarare än genom explicit simulering.
Detta arkitektoniska skifte var det som gjorde fotobaserad klädprovning till en kommersiell produkt. Photta lanserade sin B2B-widget driven av Nano Banana 2, en finjusterad diffusionsmodell optimerad för mode- och smyckesapplikationer, som en del av denna generativa AI-era. Renderingskvaliteten passerade den tröskel som driver faktiska kommersiella resultat: shoppare fann resultaten tillräckligt trovärdiga för att fatta köpbeslut baserat på dem, vilket bevisas av data för konvertering och returgrader från Photta:s handlargrupp.
2026: var tekniken står idag
Från och med 2026 är generativ AI-baserad virtuell provning en mogen kommersiell produkt för kläder och smycken. Tekniken levererar konsekventa fotorealistiska resultat med acceptabel fördröjning (8–15 sekunder), skalar till kataloger av alla storlekar utan produktionskostnad per artikel, och har samlat tillräckligt med data från handlarinstallationer för att stödja tillförlitliga ROI-mätvärden. Frågan för en modehandlare 2026 är inte 'fungerar den här tekniken?' utan 'vilken implementering passar min katalog och min trafiknivå?'.
Närliggande applikationer befinner sig fortfarande tidigare i sin utvecklingscykel. Provning av skor innebär specifika utmaningar kring fotens geometri och rendering av sulor som diffusionsmodeller för kläder inte hanterar väl. Provning i videoformat — att generera ett kort klipp snarare än en statisk bild — är under aktiv utveckling men har ännu inte nått kvalitetsgränsen för kommersiell användning i stor skala. Sammansättning av outfits med flera plagg (prova överdel, underdel och accessoar samtidigt) är ett aktivt forskningsområde där de första kommersiella implementeringarna börjar dyka upp under 2025–2026.