1990 年代:商场信息亭实验
最早记录在案的虚拟更衣室概念于 1990 年代初期出现在零售研究实验室和学术论文中。其实施通常涉及一个摄像头、一个镜面显示器和基于规则的图形叠加,可以将简化的服装轮廓叠加在视频流上。IBM 和几家欧洲零售集团在 1994 年至 1999 年间在百货公司和商场信息亭运行了有限的试点装置。
这些系统在两个方面是不切实际的:实时视频处理所需的计算能力昂贵且体积庞大,而且图形质量远低于购物者认为真实可信的阈值。采用率一直很低。这些项目作为证明该概念在原则上可行的演示是有用的,但该技术距离商业可行性还有几十年的路要走。
2010 年代:AR 和移动摄像头时刻
配备前置摄像头和专用图像信号处理器的智能手机的普及,创造了第一个可行的面向大众市场的 AR 试穿平台。Snapchat 的 Lens Studio 于 2017 年推出,使面部 AR 创作民主化,并证明了当延迟足够低且渲染质量足够高时,数千万用户会参与实时增强现实体验。
时尚和美容品牌迅速进入这一领域。太阳镜品牌为眼镜构建了镜头式试穿。化妆品品牌通过 AR 提供实时唇色和粉底色号预览。这些应用效果良好,因为它们需要追踪一个相对僵硬的表面——面部——这比追踪移动身体上的褶皱织物更容易处理。到 2019 年,AR 试穿已被证明是配饰和美容行业的成熟商业工具,但在服装领域很大程度上仍未得到证实。
2018–2020:第一代电子商务试穿
专门针对服装的第一波电子商务虚拟试穿产品在 2018 年至 2020 年间推出。这些产品通常结合使用人体姿态估计(从 2D 图像估计身体关节的 3D 位置)和纹理映射,将 2D 服装纹理披在检测到的人体轮廓上。结果在技术上令人印象深刻,但在视觉上缺乏说服力:织物边缘定义模糊,光照不一致,而复杂的服装(如叠穿的外套或飘逸的连衣裙)会产生伪影。
商业采用非常有限。该领域的几家资金雄厚的初创公司要么转型为 B2B 目录摄影,要么在 2020 年至 2022 年间关闭。根本问题不在于计算能力或工程努力——这两方面都投入了大量资金——而在于模型架构:纹理映射方法无法真实地模拟织物如何悬垂、折叠以及与人体几何结构相互作用。
2022:生成式 AI 的拐点
具有足够分辨率和控制机制的潜扩散模型(Latent Diffusion Models)的发布——这是 2022 年突显的图像生成系统的技术基础——从根本上改变了虚拟试穿的可能性。扩散模型不再是将服装纹理映射到身体上,而是可以根据人的照片和服装外观,生成一张穿着该服装的人的照片级真实图像。织物的悬垂、光照交互和身体遮挡都产生于生成过程,而不是来自显式模拟。
这种架构转变使基于照片的服装试穿成为一种商业产品。作为生成式 AI 时代的一部分,Photta 推出了由 Nano Banana 2 提供支持的 B2B 组件,Nano Banana 2 是一种专门为时尚和珠宝应用优化的微调扩散模型。渲染质量跨越了推动实际商业成果的阈值:购物者发现结果足够可信,可以据此做出购买决策,Photta 商家群体的转化率和退货率数据证明了这一点。
2026:技术现状
截至 2026 年,基于生成式 AI 的虚拟试穿已成为服装和珠宝领域成熟的商业产品。该技术在可接受的延迟(8–15 秒)内提供一致的照片级真实结果,可扩展到任何规模的目录而无须针对单个 SKU 的制作开销,并积累了足够的商家部署数据来支持可靠的投资回报率(ROI)基准。2026 年,对于时尚商家来说,问题不再是“这项技术有效吗?”,而是“哪种实现方式适合我的目录和流量水平?”
相邻应用仍处于开发周期的早期阶段。鞋类试穿在脚部几何结构和鞋底渲染方面面临特殊挑战,服装扩散模型无法很好地解决这些问题。视频格式的试穿——生成短视频而不是静态图像——正在积极开发中,但尚未达到大规模商业部署的渲染质量阈值。多件服装搭配组合(同时试穿上衣、下装和配饰)是一个活跃的研究领域,早期的商业实现已于 2025–2026 年开始出现。