1990-tallet: eksperimenter med kjøpesenterkiosker
De tidligste dokumenterte konseptene for virtuelle prøverom dukket opp i forskningslaboratorier for detaljhandel og akademiske artikler tidlig på 1990-tallet. Implementeringen innebar vanligvis et kamera, en speilformet skjerm og regelbaserte grafikkoverlegg som kunne legge en forenklet klessilhuett over en videosending. IBM og flere europeiske detaljhandelsgrupper kjørte begrensede pilotinstallasjoner i varehus og kjøpesenterkiosker mellom 1994 og 1999.
Disse systemene var upraktiske av to grunner: datakraften som kreves for bildebehandling i sanntid var dyr og fysisk stor, og grafikkvaliteten var langt under grensen for hva kundene fant troverdig. Bruken var gjennomgående lav. Prosjektene var nyttige som demonstrasjoner på at konseptet kunne fungere i prinsippet, men teknologien var tiår unna kommersiell levedyktighet.
2010-tallet: øyeblikket for AR og mobilkameraer
Fremveksten av smarttelefoner med frontkameraer og dedikerte bildesignalprosessorer skapte den første levedyktige plattformen for AR-prøving i massemarkedet. Snapchats Lens Studio, lansert i 2017, demokratiserte ansikts-AR og demonstrerte at titalls millioner brukere ville engasjere seg i AR-opplevelser i sanntid når forsinkelsen var lav nok og gjengivelseskvaliteten var høy nok.
Mote- og skjønnhetsmerker beveget seg raskt inn i dette feltet. Solbrillemerker bygde prøveløsninger for briller. Kosmetikkmerker tilbød forhåndsvisning av leppestiftfarger og foundation-nyanser via AR i sanntid. Disse applikasjonene fungerte bra fordi de krevde sporing av en relativt stiv overflate — ansiktet — som er et enklere problem enn å spore tekstiler i bevegelse på en kropp. Innen 2019 var AR-prøving et velprøvd kommersielt verktøy for tilbehør og skjønnhet, men fortsatt i stor grad uprøvd for klær.
2018–2020: første generasjons prøving for e-handel
Den første bølgen av virtuelle prøveromsprodukter for e-handel — rettet spesifikt mot klær — ble lansert mellom 2018 og 2020. Disse produktene brukte vanligvis en kombinasjon av kroppsposisjonsestimering (beregning av 3D-posisjonen til ledd fra et 2D-bilde) og teksturkartlegging for å legge en 2D-tekstur over en detektert kroppssilhuett. Resultatene var teknisk imponerende, men visuelt lite overbevisende: stoffkanter var dårlig definerte, belysningen var inkonsekvent, og komplekse plagg som yttertøy i flere lag eller flagrende kjoler skapte visuelle feil.
Den kommersielle utbredelsen var begrenset. Flere godt finansierte oppstartsselskaper i dette feltet gikk enten over til B2B-katalogfotografering eller la ned mellom 2020 og 2022. Det grunnleggende problemet var ikke datakraft eller ingeniørkunst — betydelig kapital ble brukt på begge deler — men modellarkitektur: teksturkartlegging kunne ikke realistisk simulere hvordan stoff faller, folder seg og samhandler med kroppens geometri.
2022: vendepunktet for generativ AI
Lanseringen av latente diffusjonsmodeller med tilstrekkelig oppløsning og kontrollmekanismer — det tekniske fundamentet for bildegenereringssystemene som for alvor dukket opp i 2022 — endret hva som var mulig for virtuelle prøverom på en fundamental måte. I stedet for å kartlegge en tekstur på en kropp, kunne diffusjonsbaserte modeller generere et fotorealistisk bilde av en person som bærer et plagg, basert på både personens bilde og plaggets utseende. Stoffets fall, lysets samspill og kroppens okklusjon oppstod direkte fra genereringsprosessen fremfor fra eksplisitt simulering.
Dette arkitektoniske skiftet var det som gjorde bildebasert prøving av klær til et kommersielt produkt. Photta lanserte sin B2B-widget drevet av Nano Banana 2, en finjustert diffusjonsmodell optimalisert for mote og smykker, som en del av denne generativ AI-æraen. Gjengivelseskvaliteten krysset terskelen som driver faktiske kommersielle resultater: kundene fant resultatene troverdige nok til å ta kjøpsbeslutninger basert på dem, noe som bevises av data for konvertering og returrate fra Phottas brukergruppe.
2026: hvor teknologien står i dag
Per 2026 er generativ AI-basert virtuell prøving et modent kommersielt produkt for klær og smykker. Teknologien leverer konsistente fotorealistiske resultater med akseptabel forsinkelse (8–15 sekunder), skalerer til kataloger av alle størrelser uten produksjonskostnader per vare, og har samlet nok data til å støtte pålitelige ROI-sammenligninger. Spørsmålet for en moteaktør i 2026 er ikke 'fungerer denne teknologien?', men 'hvilken implementering passer min katalog og trafikknivå?'
Tilstøtende applikasjoner er fortsatt tidligere i utviklingssyklusen. Prøving av fottøy byr på spesifikke utfordringer rundt fotgeometri og gjengivelse av såler som diffusjonsmodeller for klær ikke håndterer like godt. Prøving i videoformat — generering av et kort klipp fremfor et statisk bilde — er under aktiv utvikling, men ennå ikke på kvalitetsnivået som kreves for kommersiell utrulling i stor skala. Sammensetning av antrekk med flere plagg (prøve overdel, underdel og tilbehør samtidig) er et aktivt forskningsfelt med tidlige kommersielle implementeringer som begynte å dukke opp i 2025–2026.