Thập niên 1990: Thử nghiệm ki-ốt tại trung tâm thương mại
Các khái niệm phòng thay đồ ảo sớm nhất được ghi nhận đã xuất hiện trong các phòng nghiên cứu bán lẻ và các bài báo học thuật vào đầu những năm 1990. Việc triển khai thường bao gồm một camera, một màn hình hình chiếc gương và các lớp phủ đồ họa dựa trên quy tắc có thể chồng một hình bóng quần áo đơn giản lên luồng video. IBM và một số nhóm bán lẻ châu Âu đã thực hiện các dự án thí điểm hạn chế trong các cửa hàng bách hóa và ki-ốt trung tâm thương mại từ năm 1994 đến 1999.
Các hệ thống này không thực tế vì hai lý do: sức mạnh tính toán cần thiết cho xử lý video thời gian thực rất đắt đỏ và cồng kềnh, và chất lượng đồ họa thấp hơn nhiều so với ngưỡng mà người mua hàng cảm thấy tin cậy. Tỷ lệ áp dụng đồng loạt ở mức thấp. Các dự án này hữu ích như một minh chứng rằng khái niệm này có thể hoạt động về mặt nguyên tắc, nhưng công nghệ lúc đó còn cách xa khả năng khả thi về mặt thương mại hàng thập kỷ.
Thập niên 2010: Thời điểm của AR và camera di động
Sự bùng nổ của điện thoại thông minh với camera trước và bộ xử lý tín hiệu hình ảnh chuyên dụng đã tạo ra nền tảng thử đồ AR thị trường đại chúng khả thi đầu tiên. Lens Studio của Snapchat, ra mắt vào năm 2017, đã dân chủ hóa việc tạo AR khuôn mặt và chứng minh rằng hàng chục triệu người dùng sẽ tương tác với các trải nghiệm thực tế tăng cường thời gian thực khi độ trễ đủ thấp và chất lượng hiển thị đủ cao.
Các thương hiệu thời trang và làm đẹp đã nhanh chóng tiến vào không gian này. Các thương hiệu kính mát đã xây dựng tính năng thử kính kiểu ống kính (lens). Các thương hiệu mỹ phẩm cung cấp bản xem trước màu môi và tông nền thời gian thực qua AR. Các ứng dụng này hoạt động tốt vì chúng chỉ yêu cầu theo dõi một bề mặt tương đối cứng — khuôn mặt — vốn là một bài toán dễ xử lý hơn so với việc theo dõi vải rủ trên một cơ thể đang chuyển động. Đến năm 2019, thử đồ AR đã là một công cụ thương mại đã được kiểm chứng cho phụ kiện và làm đẹp, nhưng phần lớn vẫn chưa được chứng minh đối với trang phục.
2018–2020: Thử đồ ảo thương mại điện tử thế hệ thứ nhất
Làn sóng sản phẩm thử đồ ảo thương mại điện tử đầu tiên — nhắm mục tiêu cụ thể vào trang phục — đã ra mắt từ năm 2018 đến 2020. Các sản phẩm này thường sử dụng kết hợp ước tính tư thế cơ thể (ước tính vị trí 3D của các khớp cơ thể từ hình ảnh 2D) và ánh xạ kết cấu (texture mapping) để phủ kết cấu quần áo 2D lên một hình bóng cơ thể được phát hiện. Kết quả rất ấn tượng về mặt kỹ thuật nhưng không thuyết phục về mặt thị giác: các cạnh vải không sắc nét, ánh sáng không nhất quán và các trang phục phức tạp như áo khoác nhiều lớp hoặc váy xòe tạo ra các lỗi hình ảnh.
Việc áp dụng thương mại bị hạn chế. Một số startup được đầu tư tốt trong không gian này đã phải chuyển hướng sang chụp ảnh danh mục B2B hoặc đóng cửa từ năm 2020 đến 2022. Vấn đề cơ bản không nằm ở sức mạnh tính toán hay nỗ lực kỹ thuật — nguồn vốn đáng kể đã được triển khai cho cả hai — mà là kiến trúc mô hình: các phương pháp ánh xạ kết cấu không thể mô phỏng thực tế cách vải rủ, gấp nếp và tương tác với hình học cơ thể.
2022: Bước ngoặt AI tạo sinh
Sự ra đời của các mô hình khuếch tán tiềm ẩn (latent diffusion models) với độ phân giải đủ cao và các cơ chế kiểm soát — nền tảng kỹ thuật của các hệ thống tạo hình ảnh nổi lên mạnh mẽ vào năm 2022 — đã thay đổi những gì khả thi cho thử đồ ảo một cách căn bản. Thay vì ánh xạ kết cấu của trang phục lên cơ thể, các mô hình dựa trên khuếch tán có thể tạo ra một hình ảnh thực tế của một người đang mặc trang phục, dựa trên cả ảnh của người đó và hình dáng của trang phục. Độ rủ của vải, tương tác ánh sáng và các điểm che khuất cơ thể đều xuất hiện từ quá trình tạo ảnh thay vì từ mô phỏng rõ ràng.
Sự thay đổi kiến trúc này là yếu tố giúp thử đồ trang phục dựa trên ảnh trở thành một sản phẩm thương mại. Photta đã ra mắt tiện ích B2B được hỗ trợ bởi Nano Banana 2, một mô hình khuếch tán được tinh chỉnh tối ưu cho các ứng dụng thời trang và trang sức, như một phần của kỷ nguyên AI tạo sinh này. Chất lượng hiển thị đã vượt qua ngưỡng thúc đẩy các kết quả thương mại thực tế: người mua hàng thấy kết quả đủ tin cậy để đưa ra quyết định mua hàng, minh chứng qua dữ liệu chuyển đổi và tỷ lệ trả hàng từ nhóm đối tác của Photta.
2026: Vị thế của công nghệ hiện nay
Tính đến năm 2026, thử đồ ảo dựa trên AI tạo sinh là một sản phẩm thương mại hoàn thiện cho trang phục và trang sức. Công nghệ này mang lại kết quả ảnh thực nhất quán với độ trễ chấp nhận được (8–15 giây), có thể mở rộng cho các danh mục ở mọi quy mô mà không tốn chi phí sản xuất cho từng mã hàng (SKU), và đã tích lũy đủ dữ liệu triển khai để hỗ trợ các tiêu chuẩn ROI đáng tin cậy. Câu hỏi đối với một nhà bán lẻ thời trang năm 2026 không phải là 'công nghệ này có hoạt động không?' mà là 'cách triển khai nào phù hợp với danh mục và lưu lượng truy cập của tôi?'
Các ứng dụng lân cận vẫn đang ở giai đoạn đầu của chu kỳ phát triển. Thử giày dép gặp những thách thức cụ thể về hình học bàn chân và hiển thị đế giày mà các mô hình khuếch tán trang phục không xử lý tốt. Thử đồ định dạng video — tạo một đoạn clip ngắn thay vì hình ảnh tĩnh — đang được phát triển tích cực nhưng chưa đạt đến ngưỡng chất lượng hiển thị để triển khai thương mại ở quy mô lớn. Việc kết hợp trang phục nhiều món (thử đồng thời áo, quần và phụ kiện) là một lĩnh vực nghiên cứu tích cực với các triển khai thương mại sớm bắt đầu xuất hiện vào năm 2025–2026.