Jaren 90: experimenten met winkelcentrumkiosken
De vroegst gedocumenteerde concepten voor virtuele paskamers verschenen begin jaren 90 in retail-onderzoekslaboratoria en academische papers. De implementatie omvatte meestal een camera, een spiegelvormig scherm en op regels gebaseerde grafische overlays die een vereenvoudigd kledingsilhouet over een videofeed konden leggen. IBM en verschillende Europese retailgroepen voerden tussen 1994 and 1999 beperkte proefinstallaties uit in warenhuizen en winkelkiosken.
Deze systemen waren onpraktisch om twee redenen: de rekenkracht die nodig was voor real-time videoverwerking was duur en fysiek groot, en de grafische kwaliteit lag ver onder de drempel waar shoppers het resultaat geloofwaardig vonden. De adoptie was uniform laag. De projecten waren nuttig als demonstratie dat het concept in principe kon werken, maar de technologie was nog decennia verwijderd van commerciële levensvatbaarheid.
Jaren 2010: het AR- en mobiele cameramoment
De wildgroei aan smartphones met camera's aan de voorzijde en speciale beeldsignaalprocessoren creëerde het eerste levensvatbare AR-paspakket voor de massamarkt. Snapchat's Lens Studio, gelanceerd in 2017, democratiseerde de creatie van gezichts-AR en toonde aan dat tientallen miljoenen gebruikers real-time augmented reality-ervaringen zouden aangaan wanneer de latentie laag genoeg was en de renderkwaliteit hoog genoeg.
Mode- en cosmeticamerken bewogen zich snel in deze ruimte. Zonnebrilmerken bouwden lens-stijl try-ons voor brillen. Cosmeticamerken boden via AR real-time previews van lippenstiftkleuren en foundation-tinten aan. Deze toepassingen werkten goed omdat ze het volgen van een relatief rigide oppervlak — het gezicht — vereisten, wat een makkelijker probleem is dan het volgen van gedrapeerde stof op een bewegend lichaam. Tegen 2019 was AR try-on een bewezen commercieel hulpmiddel voor accessoires en cosmetica, maar voor kleding nog grotendeels onbewezen.
2018–2020: eerste generatie e-commerce try-on
De eerste golf van virtuele try-on producten voor e-commerce — specifiek gericht op kleding — werd gelanceerd tussen 2018 en 2020. Deze producten gebruikten doorgaans een combinatie van 'body pose estimation' (het schatten van de 3D-positie van lichaamsgewrichten op basis van een 2D-beeld) en 'texture mapping' om een 2D-kledingtextuur over een gedetecteerd lichaamssilhouet te draperen. De resultaten waren technisch indrukwekkend, maar visueel niet overtuigend: stofranden waren slecht gedefinieerd, de belichting was inconsistent en complexe kledingstukken zoals gelaagde bovenkleding of zwierige jurken produceerden artefacten.
Commerciële adoptie was beperkt. Verschillende goed gefinancierde startups in deze sector maakten tussen 2020 en 2022 een pivot naar B2B-catalogusfotografie of sloten hun deuren. Het fundamentele probleem was niet rekenkracht of technische inspanning — er werd substantieel kapitaal in beide geïnvesteerd — maar de modelarchitectuur: texture-mapping benaderingen konden niet realistisch simuleren hoe stof valt, plooit en reageert op de geometrie van het lichaam.
2022: de generatieve AI-buiging
De release van latent diffusion modellen met voldoende resolutie en controlemechanismen — de technische basis van beeldgeneratiesystemen die in 2022 prominent opkwamen — veranderde de mogelijkheden voor virtual try-on op een fundamentele manier. In plaats van een kledingstuk via texture-mapping op een lichaam te plaatsen, konden op diffusie gebaseerde modellen een fotorealistisch beeld genereren van een persoon die een kledingstuk draagt, geconditioneerd op zowel de foto van de persoon als het uiterlijk van het kledingstuk. De valling van de stof, de interactie met licht en lichaamsocclusie kwamen allemaal voort uit het generatieproces in plaats van uit expliciete simulatie.
Deze architecturale verschuiving is wat van op foto's gebaseerde kleding try-on een commercieel product maakte. Photta lanceerde zijn B2B-widget aangedreven door Nano Banana 2, een fijnmazig getraind diffusiemodel geoptimaliseerd voor mode- en sieradentoepassingen, als onderdeel van dit tijdperk van generatieve AI. De renderkwaliteit overschreed de drempel die daadwerkelijke commerciële resultaten drijft: shoppers vonden de resultaten geloofwaardig genoeg om er aankoopbeslissingen op te baseren, zoals blijkt uit de conversie- en retourgegevens van de merchant-cohort van Photta.
2026: waar de technologie nu staat
Vanaf 2026 is op generatieve AI gebaseerde virtual try-on een volwassen commercieel product voor kleding en sieraden. De technologie levert consistente fotorealistische resultaten met een acceptabele latentie (8–15 seconden), schaalt naar catalogi van elke omvang zonder overhead per SKU, en heeft genoeg implementatiegegevens verzameld om betrouwbare ROI-benchmarks te ondersteunen. De vraag voor een modewinkel in 2026 is niet 'werkt deze technologie?', maar 'welke implementatie past bij mijn catalogus en verkeersniveau?'
Aangrenzende toepassingen bevinden zich nog in een eerder stadium van hun ontwikkelingscyclus. Try-on voor schoeisel biedt specifieke uitdagingen rond voetgeometrie en zoolrendering die kledingdiffusiemodellen niet goed aanpakken. Try-on in videoformaat — waarbij een kort filmpje wordt gegenereerd in plaats van een statisch beeld — is in actieve ontwikkeling maar heeft nog niet de renderkwaliteit voor commerciële inzet op schaal bereikt. Outfitsamenstelling met meerdere kledingstukken (tegelijkertijd een top, broek en accessoire passen) is een actief onderzoeksgebied waarvan de eerste commerciële implementaties in 2025–2026 verschijnen.