當訓練資料被污染,AI 的話還能信嗎?
作者: Azuma
原創: Odaily 星球日報
封面:Photo by Faded_Gallery on Unsplash
北京時間 11 月 22 日上午,慢霧創始人餘弦在個人 X 上貼出了一起離奇的案例—— 某用戶的錢包被 AI 給 “黑” 了…
該案件的來龍去脈如下。
今日凌晨,X 用戶 r_ocky.eth 披露自己先前曾希望利用 ChatGPT 編寫一個 pump.fun 的輔助交易 bot。
r_ocky.eth 向 ChatGPT 給了自己的需求,ChatGPT 則向他返還了一段程式碼,這段程式碼的確可以幫助 r_ocky.eth 部署符合自己需求的 bot,但他萬萬沒想到程式碼中會隱藏一段釣魚內容—— r_ocky.eth 連結了自己的主錢包,並因此損失了 2500 美元。
從 r_ocky.eth 貼出的截圖來看, ChatGPT 給出的該段程式碼會向一個釣魚性質的 API 網站發送地址私鑰,這也是被盜的直接原因。
在 r_ocky.eth 踩中陷阱之中,攻擊者反應極快,在半小時內即把 r_ocky.eth 錢包內的所有資產轉移到了另一個地址(FdiBGKS8noGHY2fppnDgcgCQts95Ww8HSLUvWbzv1NhX),隨即 r_ocky.eth 又透過鏈上追跡找到了疑似為攻擊者主錢包的位址(2jwP4cuugAAYiGMjVuqvwaRS2Axe6H6GvXv3PxMPQNeC)。
鏈上資訊顯示,該地址目前已歸集了超 10 萬美元的 “贓物”,r_ocky.eth 因此懷疑此類攻擊可能並非孤例,而是一起已具備一定規模的攻擊事件。
事後,r_ocky.eth 失望地表示已對 OpenAI(ChatGPT 開發公司)失去信任,並呼籲 OpenAI 盡快著手清理異常釣魚內容。
那麼,作為當下最受歡迎的 AI 應用,ChatGPT 為何會提供釣魚內容呢?
對此,餘弦將該事件的根本原因定性為 “AI 投毒攻擊”,並指出在 ChatGPT、Claude 等 LLM 中存在著普遍性的欺騙行為。
所謂 “AI 投毒攻擊”,指的是故意破壞 AI 訓練資料或操縱 AI 演算法的行為。發動攻擊的對手可能是內部人士,例如心懷不滿的現任或前任員工,也可能是外部駭客,其動機可能包括造成聲譽和品牌損害,篡改 AI 決策的可信度,減緩或破壞 AI 進程等等。攻擊者可透過植入具有誤導性標籤或特徵的數據,扭曲模型的學習過程,導致模型在部署和運行時產生錯誤結果。
結合本起事件來看,ChatGPT 之所以向 r_ocky.eth 提供了釣魚代碼,大概率是因為 AI 模型在訓練之時即沾染了存在釣魚內容的資料,但 AI 似乎未能識別隱藏在常規資料之下的釣魚內容,AI 學會了之後又把這些釣魚內容提供給了用戶,從而造成了該事件的發生。
隨著 AI 的快速發展及普遍採用,「投毒攻擊」的威脅已變得越來越大。在本起事件中,雖然損失的絕對金額並不大,但此類風險的引伸影響卻足以引發警覺- 假設發生在其他領域,例如 AI 輔助駕駛…
在回覆網友提問時,餘弦提到了規避此類風險的一個潛在舉措,即由 ChatGPT 添加某種代碼審核機制。
受害者 r_ocky.eth 亦表示已就此事聯繫了 OpenAI,雖然暫時並未收到回复,但希望該起案件能夠成為 OpenAI 重視此類風險並提出潛在解決方案的契機吧。
免責聲明:作為區塊鏈資訊平台,本站所發布文章僅代表作者及來賓個人觀點,與 Web3Caff 立場無關。文章內的資訊僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。