Thử đồ qua video tạo sinh: chuyển động và độ rủ
Phần mở rộng logic của thử đồ qua ảnh tĩnh là một đoạn video ngắn cho thấy người mua hàng mặc trang phục khi đang chuyển động — đi bộ, xoay người hoặc ra hiệu. Video cho phép khách hàng đánh giá cách vải chuyển động, cách gấu áo rủ xuống khi đi bộ và cách các trang phục có cấu trúc giữ dáng trong các điều kiện động. Các nhóm nghiên cứu tại một số phòng thí nghiệm AI đã trình diễn các phiên bản đầu tiên của việc chuyển đổi trang phục trên video vào năm 2024 và 2025, với chất lượng cải thiện nhanh chóng.
Ngưỡng thương mại cho thử đồ qua video đòi hỏi sự nhất quán về thời gian — trang phục phải được hiển thị chính xác qua mọi khung hình mà không bị nhấp nháy hoặc biến dạng — đây là một bài toán khó hơn đáng kể so với hiển thị khung hình đơn. Việc tạo một clip 3 giây ở chất lượng chấp nhận được hiện mất vài phút trên phần cứng cao cấp, so với 8–15 giây cho một hình ảnh đơn lẻ. Ước tính khả thi cho việc thử đồ qua video chất lượng thương mại với độ trễ chấp nhận được là vào năm 2028.
AR trực tiếp kết hợp AI tạo sinh
Thử đồ AR hiện tại (lớp phủ camera thời gian thực) và thử đồ AI hiện tại (hiển thị từ ảnh tĩnh) là các hệ thống công nghệ riêng biệt. Bước tổng hợp tiếp theo là nguồn cấp dữ liệu camera trực tiếp được xử lý bởi một mô hình tạo sinh trong thời gian gần như thực — loại bỏ hạn chế 'chỉ camera vào và thấy một lớp phủ 3D cứng nhắc' của AR trong khi vẫn giữ được tính tức thời của trải nghiệm trực tiếp. Các bản demo sớm đã tồn tại dưới dạng nguyên mẫu nghiên cứu, thường chạy ở tốc độ 2–5 khung hình/giây trên phần cứng di động tính đến năm 2025.
Để đạt được mức 30+ khung hình/giây cần thiết cho trải nghiệm thử đồ trực tiếp tự nhiên đòi hỏi phần cứng suy luận chuyên dụng (khó có thể trở thành tiêu chuẩn trên thiết bị tiêu dùng trước năm 2028) hoặc nghiên cứu nén mô hình mạnh mẽ. Đây là một phát triển trung hạn khả thi nhưng không nên được trình bày như một điều sắp xảy ra. Giá trị ngắn hạn cho người bán vẫn nằm ở việc hiển thị dựa trên ảnh tĩnh, vốn đã mang lại kết quả chuyển đổi quan trọng.
Dự đoán độ vừa vặn không cần sinh trắc học
Một trong những khoảng cách dai dẳng trong thử đồ ảo là nó có thể cho thấy trang phục trông như thế nào nhưng không biết nó vừa vặn ra sao — liệu nó có quá chật ở eo, quá dài ở tay áo hay quá ngắn ở thân đối với một cơ thể cụ thể hay không. Dự đoán độ vừa vặn yêu cầu số đo cơ thể, mà các hệ thống hiện tại có được thông qua việc người dùng tự báo cáo (không chính xác) hoặc thông qua quét cơ thể 3D (không khả dụng với hầu hết người mua hàng trực tuyến).
Nghiên cứu về việc suy luận số đo cơ thể từ một bức ảnh 2D duy nhất — sử dụng phân tích bóng và ước tính tư thế — đã đạt được tiến bộ có ý nghĩa. Các hệ thống có thể ước tính số đo xấp xỉ của người mua hàng từ ảnh selfie với độ chính xác 2–3 cm trên các kích thước chính là thực tế về mặt thương mại trong giai đoạn 2027–2029. Khi kết hợp với dữ liệu số đo trang phục có cấu trúc từ các thương hiệu, điều này sẽ cho phép dự đoán độ vừa vặn thực sự mà không cần thước dây hay phần cứng chuyên dụng.
Phối hợp trang phục đa thành phần
Thử đồ dựa trên ảnh hiện tại xử lý từng trang phục một. Người mua hàng có thể thấy mình trong một chiếc váy cụ thể hoặc một chiếc áo khoác cụ thể, nhưng không phải cả hai cùng với một phụ kiện. Phối hợp toàn bộ trang phục — hiển thị đồng thời áo, quần, lớp khoác và phụ kiện trên cùng một bức ảnh — yêu cầu giải quyết vấn đề che khuất và tương tác giữa các trang phục, vốn phức tạp hơn nhiều so với hiển thị một trang phục duy nhất.
Các triển khai thương mại sớm của việc phối hợp đa trang phục đã xuất hiện vào năm 2025–2026 cho các kết hợp đơn giản (áo cộng quần, váy cộng phụ kiện). Hiển thị toàn bộ bộ đồ ở chất lượng ảnh thực là một phát triển của năm 2027–2028. Đối với những người bán thời trang, tính năng này có giá trị nhất đối với các cửa hàng bán các set đồ phối sẵn hoặc có mô hình mua hàng 'shop the look' mạnh mẽ, nơi việc nhìn thấy một bộ trang phục hoàn chỉnh có thể tăng AOV lên 30–50% so với mua các món đồ đơn lẻ.
Mô hình cơ thể người tiêu dùng nhất quán: sự chuyển dịch nền tảng trung hạn
Phát triển có ý nghĩa thương mại nhất trong trung hạn là mô hình cơ thể nhất quán: một đại diện kỹ thuật số về cơ thể của người mua hàng mà họ xây dựng một lần và tái sử dụng qua nhiều phiên mua sắm và nhiều nhà bán lẻ khác nhau. Thay vì tải lên một bức ảnh mới mỗi lần, mô hình cơ thể của người mua hàng được lưu trữ (với sự đồng ý của họ) và đóng vai trò là cơ sở cho mọi lần thử đồ. Điều này làm giảm đáng kể rào cản của trải nghiệm thử đồ và cho phép sự nhất quán về độ vừa vặn giữa các nhà bán lẻ.
Các tác động đến mô hình kinh doanh là rất đáng kể. Thực thể nắm giữ mô hình cơ thể nhất quán của người tiêu dùng sẽ có lợi thế phân phối trên mọi nhà bán lẻ tích hợp với nền tảng đó. Đây là động lực 'người thắng được tất cả', và hiện chưa rõ người chơi nào sẽ chiếm giữ vị trí đó — nhà sản xuất thiết bị, hệ điều hành, một nền tảng thời trang chuyên dụng hay một trong các nền tảng thương mại điện tử lớn. Hiện tại, đây là một hạng mục chiến lược dài hạn hơn là một hạng mục vận hành. Những gì người bán nên thực hiện ngay hôm nay là triển khai thử đồ dựa trên ảnh vốn đã mang lại ROI đã được chứng minh.