618開始了,你可能加購了很多夏季新衣,想趁優(yōu)惠激情下單,但一想到每件都要試穿,不合適的還要退貨郵寄,其繁瑣程度又讓你望而卻步。
“要是有人能幫我試穿衣服就好了。”
基于這樣的消費心聲,多款AI虛擬試衣產品相繼上線。
據“頭號AI玩家”不完全統(tǒng)計,目前AI虛擬試衣相關工具至少有十余個,既有具備谷歌研究院大廠背景的“TryOnDiffusion”,也有國內獨立團隊出品的“OOTDiffusion”,還有切合電商平臺使用需求的“淘寶試衣”、美圖設計室推出的“AI模特試衣”等。
近期,我們測評了多款不同AI虛擬試衣產品,并和相關項目負責人聊了聊,嘗試了解AI虛擬試衣領域存在哪些機遇與挑戰(zhàn)。
只需1張照片,就能試穿自由?
虛擬試衣,正成為AI玩家們爭相布局的熱門地帶。
從去年至今,谷歌、阿里、亞馬遜幾大頭部電商平臺相繼推出虛擬試衣模型,分別為Tryon Diffusion、Outfit Anything、Diffuse to Choose。目前,這幾款模型雖開放了demo試用,但并未技術開源。
此外,一些獨立團隊也有所動作。今年4月,小i機器人AIGC團隊上線了一款名為OOTDiffusion的虛擬試衣模型,不僅提供試用demo,更將github項目開源(https://github.com/levihsu/OOTDiffusion)。
目前大部分AI虛擬試衣技術都是基于擴散模型進行研發(fā)的,在這樣的背景之下,基本只需三步,AI就能幫你試穿任何一件衣服。
以OOTDiffusion為例,第一步,上傳試穿者的照片,盡量保證正面,且沒有遮擋身體,身穿衣服最好輕薄貼身;
第二步,上傳想要試穿的衣服,商品白底平鋪圖效果更佳,能夠更好展現(xiàn)試衣效果;
第三步,點擊“Run”并等待幾秒鐘,即可見證換裝時刻。
OOTDiffusion頁面提供了半身和全身的服裝試穿,包括上衣、褲子、裙子等類型,可以展現(xiàn)出不同的照片姿勢和試穿效果。
OOTDiffusion項目負責人徐余浩告訴我們,該項目基于Stable Diffusion,在兩個開源數(shù)據集VITON-HD (half-body) 和Dress Code (full-body)上進行了訓練。
在他看來,擴散模型的優(yōu)勢在于能夠將服裝的細節(jié)、紋理、圖案、文字與試穿者本人進行更自然的貼合,相比此前虛擬試穿產品的直接“套圖”,OOTDiffusion的試穿效果更加可控。
除了上傳試穿者和服裝的照片,還有AI虛擬試衣產品增加了更多維度的數(shù)據。
以淘寶試衣為例,用戶可以填寫體重、身高、身型、膚色相關數(shù)據,從而生成數(shù)字人形象進行試穿。同樣,淘寶試衣支持使用自己的照片生成試衣分身,要求也是正面全身或半身照,盡量不穿寬大衣物,以及不要遮擋身體。
同款連衣裙不同分身的試穿效果
據“頭號AI玩家”觀察,目前大多數(shù)AI虛擬試衣產品只需上傳一張照片即可,但在效果展現(xiàn)上可能存在不夠服帖、服裝穿模、姿態(tài)扭曲等問題。
因此,部分AI虛擬試衣產品會主動要求用戶上傳多張照片,生成更為全面的數(shù)字形象,從而獲取更自然的試衣效果。
以阿里媽媽推出的“Lookie”為例,用戶上傳一張正面照片+12張以上半身照片,可在十幾分鐘內生成數(shù)字形象。
Lookie還提供異域風情、搖滾辣妹、知識分子風等多種試穿風格,其數(shù)字“分身”可在1分鐘內完成各種試穿任務。
不過,通過創(chuàng)建數(shù)字分身來試穿的效果更接近于“換臉”,可能看不出服裝是否合身,所以可以選擇身材相近的模特圖進行生成。
AI試衣技術已達商用水平,一張商品圖只需2毛
作為AIGC圖片編輯領域的一個垂直應用,虛擬試衣從去年開始已有不少研究進展。
谷歌聯(lián)合華盛頓大學在2023年6月發(fā)布了“TryOnDiffusion”項目,提出了一種基于擴散模型的架構,統(tǒng)一了兩個UNet,可以輸入兩張圖片進行合成,讓圖中的人物更換不同的服飾,并在保留服飾細節(jié)的情況下適應人體的姿勢和形狀變化。
技術對比,從左到右依次是:輸入,TryOnGAN,SDAFN,HR-VITON,TryOnDiffusion
不過這個模型僅能實現(xiàn)上身服裝的試穿,訓練和測試數(shù)據集大多是干凈統(tǒng)一的背景,全身試穿效果和更復雜的背景下的表現(xiàn)還有待研究。
“當時這個方向還很不成熟,只能換一些簡單的衣服比如純色的,稍微復雜一點的版型生成的效果就很差。”OOTDiffusion團隊介紹道。
虛擬試衣主要面臨兩個挑戰(zhàn),一是生成的圖像要足夠真實自然,就像真實上身的效果;二是提高可控性,要盡可能保留服裝的細節(jié)特征。
之前的算法可能是通過對比衣服和模特的身材形狀的區(qū)別,直接對衣服進行變形,然后貼到模特身上,這種“貼圖”的方法會顯得比較假。而現(xiàn)在有了擴散模型,AI可以學習衣服的形狀、顏色和花紋文字等特征,然后和模特的特征進行融合,生成更自然的效果。
亞馬遜發(fā)布的“Diffuse to Choose”(https://diffuse2choose.github.io/)模型通過在擴散模型的潛在特征圖中直接融入參考圖像的細粒度特征,并結合感知損失來進一步保留參考物品的細節(jié)。它能讓用戶在任意場景中虛擬試穿服裝或放置其他電商產品,實現(xiàn)較為真實的光影。
Diffuse to Choose支持不同的衣服組合,沒有限制
國內方面,2023年12月,阿里巴巴旗下的智能計算研究院發(fā)布了一項虛擬試衣技術“Outfit Anyone”,通過雙流條件擴散模型克服了高保真和細節(jié)一致性結果的問題,能獲得更逼真的服裝變形效果。
不僅是真人,動畫角色也支持一鍵試衣,與視頻模型Animate Anyone結合,還能實現(xiàn)任何角色的服裝更換和動態(tài)視頻生成。
但Outfit Anyone并未對外開放代碼,用戶可在魔塔社區(qū)中試用。
OOTDiffusion團隊提出的試穿融合過程也有效提高了虛擬試穿的真實性和可控性,目前相關的AI試衣產品已在開發(fā)階段。之后團隊還會繼續(xù)探索解決用圖片指導圖片修改和編輯、人物換臉等問題,讓AIGC技術更好地應用到實際場景中。
徐余浩認為,與大廠相比,小團隊可能在技術研發(fā)上能領先一步,但如果將虛擬試衣作為一個獨立的產品來運營,其商業(yè)前景可能不如已擁有龐大用戶規(guī)模的的電商平臺。
據“頭號AI玩家”觀察,面向C端用戶的AI試衣產品主要來自于大廠。比如淘寶在App內置的試衣功能,可以與商品推薦、用戶購物車等版塊聯(lián)動,AI試衣體驗更流暢、穿搭選擇更豐富。在技術上,淘寶也可以及時應用阿里最新推出的虛擬試衣方法。
阿里團隊在今年3月發(fā)布了“Wear-Any-Way”,不僅支持試穿衣服,還能根據需要改變衣服的樣式,比如卷起袖子,打開/拖動外套等。
雖然這項技術目前還未上線應用,但對消費者來說可以改善購物體驗,對商家來說也有望進一步降低廣告營銷成本。
除了上文提到的面向消費者的AI試衣產品,從市場需求來看,面向電商商家的B端產品對AI初創(chuàng)公司來說是更有商業(yè)前景的選擇。
很多跨境電商賣家提到請模特拍照又貴又耗時,而使用AI工具出圖正好滿足了降本增效的需求。
比如阿里國際旗下的AI圖像設計工具Pic C o p i l o t近期上線了虛擬試衣功能,據介紹,出一張商品圖的平均成本被控制在0.2-0.3元人民幣以內,同時還有四十多位已授權模特,覆蓋各個膚色和年齡段,賣家在商用時無需擔心侵權問題。
從虛擬的QQ秀到真人一鍵試穿,從早期通過3D人體建模開發(fā)的虛擬試衣軟件,到如今生成式AI技術在電商行業(yè)開啟應用,隨著技術的不斷進步和市場的逐漸成熟,可以預見AI將在我們的消費生活中扮演更加重要的角色。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...