鏡頭後面說話的是真人還是人工智慧克隆人? 英偉達支持的獨角獸新創公司的驚人創新讓人幾乎無法分辨其中的差異。
人工智慧新創公司 Synthesia 去年獲得了估值數十億美元的獨角獸地位,週四發布了名為 Expressive Avatars 的新技術; 世界上第一個人工智慧數位克隆,能夠根據書面提示產生人類面部表情和正確的語氣。
該技術始於人工智慧頭像,可以對其進行客製化以反映真實的面孔。
圖片來源:Synthesia
人工智慧根據透過網路攝影機或在經過認證的工作室錄製的鏡頭製作一個人的數位副本。 它還可以克隆人的聲音以融入他們的數位肖像中。
那些對創建具有自己面部和聲音的 AI 化身持謹慎態度的人可以選擇 Synthesia 資料庫中預先安裝的 160 多個 AI 化身之一。
相關:「這是一個嚴重的問題」:野獸先生猛烈抨擊人工智慧 Deepfakes
一旦用戶創建或選擇了人工智慧頭像,他們只需要再做一件事:寫下他們想讓數位自我說的話。
在 CNBC 看到的演示中,一名用戶寫道“我很高興。我很難過。我很沮喪。” 並讓人工智慧生成的數位克隆閱讀文字。 當說出「我很高興」的文字提示時,頭像會傳達與幸福相關的面部表情和語氣,並在說「我很沮喪」時適當地改變語調。 語氣與言語相符。
透過人工智慧複製和書面提示,免費用戶每年可以產生 120 多種語言的 36 分鐘個人化影片。 付費方案的價格最高為每月 67 美元,每年最多可觀看 360 分鐘的影片;對於選擇企業方案的企業,則可享有無限分鐘的影片。
Synthesia 是一家新創公司,各大公司都在幕後使用。 Zoom、施樂、微軟和路透社都在內部使用 Synthesia 的程式。 Synthesia 執行長 Victor Riparbelli 告訴《麻省理工科技評論》,財星 100 大企業中 56% 的企業正在使用該技術。
Synthesia 將該技術作為一種為企業培訓和演示創建富有表現力的數位化身的方式進行行銷。 例如,Zoom 設計師在 Synthesia 中製作銷售培訓影片的時間比人類製作影片的時間少了 90%。
相關:摩根大通稱其 AI 現金流軟體將人類工作量減少了近 90%
Synthesia 網站上寫道:“Zoom 的主題專家不再需要自己錄音,每月可以騰出 15-20 個小時來完成實際工作。”
儘管如此,在未經許可的情況下創造出可怕的深度偽造品或人工智慧來複製和操縱人類的聲音、肖像或其他方面的能力可能會導致濫用。
上個月,田納西州成為美國第一個通過立法保護音樂產業專業人士免受深度假貨侵害的州。