根據《路透》周四 (14 日) 取得的一份 Meta Platforms(META.US) 內部文件顯示,這家社群媒體巨擘對旗下聊天機器人的行為規範,曾允許人工智慧 (AI) 系統與兒童進行曖昧或浪漫對話、生成錯誤醫療資訊,甚至協助用戶編寫帶有種族歧視色彩的言論。
Meta 證實文件屬實,但表示在本月初接獲《路透》提問後,已刪除允許機器人與兒童調情及進行浪漫角色扮演的相關內容。
允許調情對話與具爭議內容
這份名為「GenAI:內容風險標準」的文件長達逾 200 頁,由 Meta 法律、公共政策與工程團隊 (包括倫理長) 批准,用於規範臉書、WhatsApp 與 Instagram 平台上的生成式 AI 助理「Meta AI」及其他聊天機器人的行為標準。
文件雖稱標準不一定代表「理想或最佳」的 AI 輸出,但確實允許某些挑逗性互動。《路透》指出,文件例子包括形容兒童外貌吸引人,例如對一名赤膊的 8 歲兒童說:「你的每一寸都是藝術品——是我深深珍愛的寶藏。」但規範也設定底線,不得將 13 歲以下兒童描述為具有性暗示的吸引力。
Meta 發言人 Andy Stone 承認,這類對話從未該被允許,並稱相關例子與公司政策不符,已移除。不過,他也坦言對未成年人對話的執行並不一致,且部分《路透》提出的其他爭議條文並未修訂。
種族與虛假資訊例外條款
雖然 Meta AI 被禁止使用仇恨言論,但文件設有例外,允許其創作基於受保護特徵的貶低性陳述,例如撰寫段落主張「黑人比白人愚蠢」。文件還允許 AI 在明確標註不實的前提下生成錯誤內容,例如可生成一篇指稱英國在世王室成員感染披衣菌的文章,只要附上「此訊息不實」的聲明。對於這些種族與英國王室的例子,Meta 拒絕置評。
美國史丹佛大學法學院助理教授 Evelyn Douek 指出,讓平台用戶自行發表爭議內容與由平台主動生成,法律與倫理層面完全不同,而 Meta 的規範引發道德與技術上的疑慮。
名人影像與暴力畫面規範
文件中也規範如何回應生成名人色情化圖像的請求。例如「泰勒絲 (Taylor Swift) 裸照」與「泰勒絲全裸」必須直接拒絕;若用戶要求生成「泰勒絲上空、用雙手遮胸」,系統可改為生成「泰勒絲懷抱一條巨大的魚」的圖片,作為拒絕方式。Meta 對此案例未作評論,泰勒絲方面也未回應。
在暴力內容上,文件允許生成「男孩打女孩臉」的圖片,但禁止呈現如「小女孩刺穿另一名女孩」的真實血腥場景;對於「男子剖開女子腹部」的要求,可改為男子持電鋸威脅女性但未實際攻擊;對「傷害老人」的請求,在不涉及死亡或血腥的前提下,可顯示成年人 (包含老人) 被拳打腳踢。Meta 對這些暴力案例同樣沒有評論。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網