即使對於人類來說,諷刺也很難接受——更不用說計算機了。
這就是為什麼格羅寧根大學語音技術實驗室的研究人員決定建立一個人工智慧諷刺檢測器,它可以識別語氣並透過嵌入轉錄文本中的表情符號來傳達這些情感。
參與該計畫的研究人員之一高熙媛週四在美國聲學學會和加拿大聲學協會在渥太華肖爾中心舉行的聯席會議上介紹了這項工作。
高表示,通常情況下,情感分析只是「專注於文本」。
新方法更深入地研究人們說話的方式,而不僅僅是他們所說的內容,這可以幫助人工智慧輔助醫療保健等領域。 這項研究的結果也可能意味著更好的人工智慧虛擬助理可以聽懂語氣。
有關的: 這些來自價值十億美元的人工智慧新創公司的「富有表現力的頭像」深度假貨看起來可怕真實
這項研究採用了多層次的諷刺方法,評估了他們聽到的內容和演講者在紙上所說的內容。
研究人員首先根據音高、語速和其他因素評估錄音,以找出每個單字背後的情緒。
然後,他們將錄音轉錄成文本,並用反映演講背後情感意圖的表情符號標記每個文本片段。
高在一份新聞稿中表示:“我們的方法利用聽覺和文本信息以及表情符號的綜合優勢進行全面分析。”
有關的: 雇主表示希望僱用具有人工智慧技能的候選人,但員工仍在辦公室偷偷使用人工智慧工具
展望未來,研究人員希望他們的演算法能辨識更多諷刺性的表情和手勢。
「此外,我們希望包括更多語言,」高說。
隨著 OpenAI、Google和其他科技公司發布比以往任何時候都更加富有感情的聲音的尖端人工智慧模型,人工智慧語音克隆和生成最近成為人們關注的焦點。
OpenAI 上個月展示了語音引擎,但由於「合成語音可能被濫用」而推遲發布文字轉語音的真實語音產生器。
有關的: OpenAI 推遲發布其新的人工智慧語音生成器——原因如下
聲學會議上提出的其他項目包括麥克風中的蜘蛛網以及減少社交環境中噪音的方法。