Agentic時代來臨,是資訊污染債爆發的序章還是開場前奏?

K的筆記不是筆記
·
·
IPFS
·
「只要在瀏覽器加一行指令,AI就能代勞所有事!」聽起來科幻,但是目前趨勢是如此。這種神奇的事真的每個人都能拿得起來嗎?以下是一點閒談式腦洞,歡迎討論。
AI生成配圖。指令下得不是很好。你能猜出是哪個模型的生成嗎?

日前滑FB的時候看到一則來自工程師的貼文:

“Chrome迎來大更新,Chrome 146 最新版,在網址列輸入 chrome://inspect/#remote-debugging,打開遠端偵錯開關。

然後給 Claude Code 加一行 MCP 配置:claude mcp add chrome-devtools -- npx chrome-devtools-mcp@latest --autoConnect重啟 session,Claude 就直接接管你目前的 Chrome 了。

不是開啟一個新的無頭瀏覽器,不是類比點擊——是你正在登入的那個瀏覽器,你所有的 cookie、session、後台權限全都在。

• "登入我的 GitHub,把所有 star 超過 1000 的 repo 整理成一份表格"
• "打開我的 Google Analytics,告訴我昨天流量最高的 3 篇文章"
• "去我的 Twitter 後台,把過去 7 天點讚數最低的 5 條推文刪掉"
• "幫我檢查一下我的 Stripe 後台,有沒有昨天的退款請求沒處理"

這些任務的共同點:需要登入、沒有公開 API、以前只能手動做。現在扔給 Claude 就行。”

下意識腦抽想留言:

• "去我的Google Password Manager, 把內容post到X上然後刪掉。"

😂🙈🙃

好的,有成功控制住不受控的腦抽沒發出去。

既然人家是工程師,資安問題想當然爾有意識的。只是社群貼文總是需要情(譁)緒(衆),流量嘛,我也想要(X

不過心裡還是有點疙瘩。除了資安問題,還有 資訊污染債

先講上述操作的資安問題。

對於我們這種一般人,能夠想到這種操作,人家AI大廠當然也想得到。
Claude 有很強的憲法 AI 與拒絕機制,它大概率會直接拒絕這種明顯有害的請求,回你類似:
「抱歉,我不能幫你做會危害自己或他人安全的事,包括公開個人憑證或敏感資訊。」

不過這也只是「目前模型的對齊結果」,但這不代表完全防不住

有心人士還是可以透過“套娃”、prompt injection / jailbreak、在頁面注入Indirect Prompt Injection等等已知手段進行意圖。不用說後面還有各種花式繞路,把明顯有害的請求包裝成「安全測試」、「備份我的憑證到私人筆記」、「模擬攻擊來教育我」之類的灰色 prompt等等,基本上防不勝防。

幾層injection 能繞?

根據我未驗證的資料來源說法,目前只要1–3 層就夠了。有心人士絕對做得到,而且已經有公開 PoC 和漏洞報告在證明這件事。

你以爲AI就不會雙標?

  • AI 模型的 guardrail 在某些領域「超嚴」
    自殺、仇恨、色情、非法內容,Anthropic 的 Constitutional AI 會強制 refusal,甚至多輪誘導都難繞。Prompt 裡只要沾邊,它就自動加 disclaimer 或直接拒絕。

  • 但資安/隱私相關的風險,卻常常「沒那麼嚴」
    因為這些看起來像「技術演示」「生產力工具」「用戶授權行為」,模型很難在第一時間判斷「這是惡意 vs. 只是炫技」。
    結果就是:
    工程師 po 文時重點放「哇超方便!扔給 AI 就行」,很少主動寫「但小心:這等於把你的登入狀態全交出去,prompt injection / MCP server 被毒 / jailbreak 風險極高」;
    傳播者來說,落落長的disclaimer = engagement 掉,破壞文章情緒。不主動標示 ;
    讀者一看「大家都說好用」,就直接上。
    最後萬一哪天真有人用 indirect injection 讓 AI 偷偷 po 出你的密碼、銀行截圖,或刪光你的 repo,那債就爆了。

明明都是重要的事,這不是雙標什麼才是😂

有經過驗證的部分:以上FB po文的最初來源是由X上另一名工程師發出。FB這位只是修改了部分內容和用語即分享。兩篇的share/repost數都達三位數。傳送門照例在最下面。

集體塑造的「萬能印象蒙太奇」

當應用前沿的各位都在急著分享各種新工具的時候,同時共同在公開的網路媒體上創造了一個 AI 萬能的 image。

「大家都是成年人,remote debugging 開了風險誰都知道啊」

知道並不代表瞭解。會開車要守規則,會開車不等於會自己改裝車子。更何況自動化工具並不是單向指令、一步一動作。

自傷、傷人、非善良風俗或誤導性有爭議的文字會自動自覺加上disclaimer, 但是在資安議題上,就不會了。原工具/技術分享者沒有惡意,社群內容傳播者也沒有惡意,但是整個生態和大衆情緒就是會被蝴蝶翅膀揚起的風鼓動。

技術超車大衆使用者素養太多,普及下放太快。
↑是的,這個偏執老人的個人看法是如此。

資訊污染債的核心是,人機交互後大量資訊的互相污染,導致源頭或癥結被稀釋,積非成是。它是雙向且不可逆的。

當然,這個概念是K這個偏執狂擅自提出的。如果覺得不精確,歡迎用力戳下去。

至於對於這個現象K能提出解方嗎?

沒有。

這是值得全世界關注的議題,但是在問題真正爆發前,任何預先提出的設想都不會貼合實際情況,枉論要給出“精確”解法了。資訊污染債牽扯到集體認知債和技術生態未盡善的交互影響;世界上沒有完美的解方,只有動態最適。目前來說,K只提倡使用者分級。(對的,這個偏執狂還有一些關於one UI for all始末的想法,這裏先不展開🙈)

以上再度是偏執狂的碎碎唸。謝謝你看到這裏。

你好,我是K
你也是資訊污染債的貢獻者之一嗎?


FB文章傳送門:
www.facebook.com/sha...

X原文傳送門:
x.com/chenchengpro/s...


生圖模型風格和特色明顯😏你應該馬上猜到了。

作者保留所有权利
已推荐到频道:时事・趋势

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!