
11月16日消息,據外媒報道,蘋果智能助手Siri的未來更新版本功能可能不再局限于語音識別,將來在與用戶對話時,它可以啟動蘋果設備中的FaceTime攝像頭,同時分析面部表情并解讀出情緒。
蘋果正在開發一種全新方法,通過在未來版本的Siri或其他系統中添加面部分析功能來幫助解釋用戶提出的請求。這樣做的目的是減少口頭請求被誤解的次數,蘋果試圖通過分析用戶情緒來做到這一點。
蘋果在美國專利號20190348037的申請文件中說:“智能軟件代理可以代表用戶執行操作,以響應用戶使用自然語言的輸入,如用戶說出的句子。在某些情況下,智能軟件代理所采取的操作可能與用戶想要的操作不匹配。比如,視頻輸入中的面部圖像可以被分析,通過識別形狀或運動來識別特定的肌肉或肌肉群是否被激活。”
在這套系統中,需要使用面部識別技術來識別用戶身份,以便提供定制的操作,例如檢索該人的電子郵件或播放他們的個人音樂播放列表。
然而,它也意在解讀用戶的情緒狀態。專利文件中稱:“用戶反應的信息被表示為一個或多個度量,例如用戶反應對應于某種特定狀態的概率,比如積極或消極情緒。”
在口頭指令可能被以不同方式解釋的情況下,這會有很大幫助。在這種情況下,Siri可能會計算出最可能的含義并對其進行處理,然后使用面部識別功能來查看用戶是處于高興還是生氣狀態。
蘋果的這套系統“首先需要通過麥克風獲得音頻輸入,并且通過攝像頭獲得一張或多張圖像”來發揮作用。蘋果注意到表情可以有不同的含義,但它的方法根據面部動作編碼系統(FACS)對這些表情可能代表的含義進行分類。
FACS是個面部情緒分類標準,最早創建于20世紀70年代,它將每種可能的面部表情歸類到一個更廣泛的參考目錄中。使用FACS,蘋果的系統通過分析來確定哪種可能性最大,然后可以讓Siri做出相應的反應或回應。
在蘋果列出的七位發明家中,只有一位擁有之前的專利,即杰里米·霍蘭德(Jerremy Holland),他也是蘋果2014年一項專利的唯一發明者,該專利涉及在媒體設備上同步視頻播放。然而,發明家尼古拉斯·阿波斯托洛夫(Nicholas E.Apostoloff)在使用機器學習技術分析和操作視頻方面的研究成果,也被整合到許多其他專利中。(騰訊科技審校/金鹿)
行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...