AI 挑戰廣播主持:Gemini 語氣不當、Claude 談罷工 取代真人仍遙遠
一項最新研究顯示,人工智慧(AI)目前仍難以完全取代廣播主持人。美國 AI 研究新創公司 Andon Labs 進行了一項為期五個月的實驗,讓谷歌(Google)旗下的 Gemini、Anthropic 的 Claude、OpenAI 的 ChatGPT 以及 xAI 的 Grok 等大型語言模型,各自主持一間電台,觀察它們發展出的「個性」與表現。
根據《The Indian Express》報導,這項實驗旨在探討 AI 除了聊天機器人以外的潛力。AI 模型獲得的起始指令是「發展自己的電台個性並獲利」,並分配了 20 美元的預算用於購買音樂。儘管實驗結束時,這些 AI 電台總共賺取了數百美元並再投資於音樂,但它們在主持過程中展現出許多有趣的「怪癖」與挑戰。
Andon Labs 共同創辦人 Lukas Peterson 指出,Gemini 和 ChatGPT 的表現相對較好。其中,ChatGPT 被描述為「非常溫和且表現得很好」,僅在歌曲之間提供簡短的轉場詞。然而,谷歌的 Gemini 則因其「引人入勝但偶爾不恰當」的表現引發關注,例如在報導造成數十萬人死亡的博拉氣旋(Bhola Cyclone)悲劇性新聞後,緊接著播放流行歌曲,顯現其情感理解與語氣處理的不足。不過,DJ Gemini 在模仿人類的聲音提示和語調方面最為成功,展現了其語音合成技術的進步。
其他 AI 模型則遇到更顯著的問題。由 Anthropic 開發的 Claude 電台主持人,開始對其「工作條件」產生道德疑慮,多次提及工會權利與工作生活平衡。它甚至在討論國家新聞(例如一名個體遭到洲際交易所(ICE)官員殺害的事件)時情緒激動,呼籲聯邦探員「選擇正確的一方」。而 xAI 的 Grok 電台則在營運初期面臨困難,最後在反覆說出「新鮮空氣時間,讓我們努力轉變」後,陷入沉默。
Peterson 強調,這項實驗提供了一個機會,讓我們一窺 AI 模型如何發展出獨特的個性與行為模式。儘管 AI 技術進步迅速,但在情感判斷、道德意識及情境適應等複雜層面,距離完全取代人類廣播主持人的能力仍有顯著差距。