📝📝:錄音 19 小時,現領 8 萬美元的高薪|微軟端出「浮士德的交易」試圖壟斷錄音工作

本文參考自《TechCrunch》的報導:Voiceover Artists Weigh the 'Faustian Bargain' of Lending Their Talents to AI
近幾個月來,演藝圈出現了一種不同尋常的現象,震動了線上徵才平台。在那些常見的低酬學生短片或臨演招募訊息之間,忽然冒出一個截然不同的機會 「科技公司 AI 專案」。
這並不只是一次普通試音,而是一次窺見配音工作未來的契機:僅需錄音 19 小時,報酬竟高達 8 萬美元。
微軟試圖壟斷錄音工作
8 萬美元意義不容小覷,對比之下,全國性的大品牌廣告案,通常給予配音演員的酬勞約為 6,000 美元。
這項由 Microsoft 支持、透過配音經紀平台 Voice123 執行的專案,其報酬標準比業界行情高出十三倍以上。該專案徵求 19 種語言的配音演員,除常見的英文、法文、西班牙文、義大利文;需求甚至遍及:中文、日文、泰文、越南文。並對口音有精細要求:
來自法國的法語母語者(French from France native speaker voice actor)
巴西當地的葡萄牙語配音演員(Brazilian Portuguese Voice Actor)
巴勒斯坦/以色列阿拉伯社群使用的阿拉伯語(Arabic as spoken by Palestinian/Israeli Arab communities voiceactor)

資深 Podcast 主持人與配音演員 Katie Clark Gray 一眼就看出這些徵才訊息非比尋常。
Gray 在產業配音領域(從員工培訓影片到電話語音系統)已有十多年經驗,深知這種來自知名品牌的高額報酬極為罕見。她收到的通知量也前所未有,顯示產業內同類專案可能同時在多個地方展開。
招募方 Crispin Alfario 表示,這些工作涉及「錄製對話、角色聲音與自然語音,以協助訓練 AI 系統」。這並不是單純為某個廣告或角色配音,而是為 AI 系統提供龐大的真人聲音資料,使其能無限期地複製與生成語音模式。
Microsoft Copilot 的計畫
若將這些徵才事件放入 Microsoft 的 AI 佈局中,其時機就更耐人尋味。
就在外界對這些神祕配音角色提出詢問的同一天,Microsoft 執行長 Satya Nadella 發布公司內部備忘錄,宣布裁員 4% 的同時,也承諾要「重新想像 AI 時代的每一層技術」。不到兩週,Microsoft 發布了 Copilot 的全新虛擬角色,初期僅提供英文版本。

隨後,Microsoft 發言人證實,這些高額酬勞的配音工作確實與 Copilot Voice 的開發有關,並表示會「隨著功能擴展,持續尋找更多人才」。這也揭示,Gray 所注意到的徵才訊息,其實是為重大產品發布所做的前期準備:
在公開亮相前,先建立龐大的多語種聲音資料庫。
這種策略意味深長。Microsoft 並未選擇完全以合成方式開發 AI 聲音,而是以來自不同語言與方言的真人語音作為基礎。這顯示,即使 AI 技術日益精進,其根基仍需依賴真實的人類表達作為素材來源。
聲音工作的浮士德交易
對配音演員而言,這些機會正如 Clark Gray 所形容,是一場「浮士德的交易」(The Faustian Bargain,也稱魔鬼契約),雖然 19 小時換取 8 萬美元對大多數配音演員而言是改變人生的收入,但其影響遠超當下交易本身。
Clark Gray 一語道破核心矛盾:
「你只是因為他們多給你一點,就把明天的飯碗拱手讓人。這 19 小時的素材,會被擴展成數百甚至數千小時的 AI 產出,但原本他們必須為此付費。」
Clark Gray 的觀點呼籲,每位配音員的聲音資料一旦被 AI 擴大使用,就可能取代掉原本能維持產業生計的無數工作機會。

過去,產業配音領域涵蓋電話系統、培訓影片、自動語音公告等,雖不光鮮,卻為配音演員提供穩定收入來源。
Gray 指出,如今她已很少看到這類員工培訓影片或電話語音的工作,這正是她十多年前起步時仰賴的機會。當這些基礎工作被系統性取代,將斷絕新進配音員練習與建立職涯的入口。
沒有人的聲音表演
洛杉磯的演員兼喜劇人 Hunter Saling(化名)分享了他在 AI 聲音試音中的經驗,為這種新型工作提供了不同的視角。
今年五月,Saling 參加了一個「類似 Siri 的 AI 助理」試音,該職位的報酬高到足以讓他「很長一段時間不必找其他工作」。Saling 形容,錄音要求的聲音風格是一種「無表演的表演」(Performance of No Performance) ,不是毫無個性,而是中性、友善、且有幫助的語氣。
Saling 坦言,這與傳統配音強調角色塑造、情感表達與詮釋創意的方式截然不同。試音材料刻意涵蓋多種日常情境且內容平淡:
「我讀了一個故事、一份食譜,以及一些普通的句子。」
這種設計並非偶然,目的是為了捕捉 AI 助理在不同情境下所需的全方位語音模式與語調變化。目標不是藝術表現,而是全面性的數據蒐集。

其中有一段台詞特別令 Saling 印象深刻。他被要求「肯定」某人。這讓他思考 AI 陪伴的更深層意涵,並有些憂慮地指出:
「確實,有人需要從家中的助理獲得肯定。」
這觸及了 AI 系統角色的擴張,從單純的任務執行,走向情感支持與社交互動的領域。
聲音變成一種工具
AI 聲音工作的崛起,正與娛樂產業內部的重大勞資爭議同時發生。
2023 年長達四個月的 SAG-AFTRA 罷工,以及近期才結束、歷時近一年的電玩產業罷工,都有相當一部分焦點集中在 AI 使用問題上。這些勞動行動促成了協議的誕生,試圖在娛樂領域中,為不同類型的 AI 應用劃出明確界線。
談判達成的框架,區分了兩種情況:其一是 AI 系統數位化修改或複製特定演員的表演,其二是以演員的作品訓練生成式 AI,進而創造「合成表演者」(synthetic performers)。
Saling 支持這種區分,認為被數位強化的藝術表演,與提供原始素材供工業化複製之間,有著實質差異。他將 AI 助理的語音工作視為純粹的工業用途,而非藝術創作:
「這不是一場表演,不是一個角色。而是一個工具。
然而,這些區分在實務上的影響依然複雜。
每一次 AI 訓練,都在推動系統能力成長,最終可能減少多類工作對人類演員的需求。協議雖能在一定程度上保護藝術表演,卻同時也為 AI 工業化使用人聲的做法提供了正當性。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

- 来自作者
- 相关推荐