一種具體描述「資料最小化」原則的可能方法

討厭鬼 aka 劉維人
·
(修改过)
·
IPFS
·

在研究數位隱私時,遇到「資料最小化」(Data Minimization) 該如何敘述的問題。

「資料最小化」是一種隱私原則,要求在收集、處理、保留資料時,應該限定在完成具體目的所需的最小範圍。

這項原則當代非常重要。因為在數位世界,絕大多數時候資料都是「存取即複製」,只要有人向你索取了一筆資料,你就很難保證這筆資料未來會被怎麼利用。因此,為了防止歹徒利用資料進行各種追蹤監控騷擾、防止利用資料探知商業機密、以及防止利用資料冒充身份,個人與組織的資訊洩漏越少越好。

在討論如何落實時,有人說「資料最小化」難以具體化為法規敘述。世界其他國家的敘述方式,也經常遇到「何謂所需」、「何謂目的」困境。

但若暫時不管實務判斷時的自由裁量問題,以及刻意把「目的」寫得模糊或包山包海之類的奇技淫巧,我目前認為,「資料最小化」似乎還是能寫成具體的描述。

例如我參考 Rastegarpanah 等人在論文中的架構,寫了以下的初步描述:

「資料最小化」= 如果無論是否蒐集實體的屬性X (attribute X),都能準確判斷實體是否滿足條件C,那麼在判斷條件C時,便不應蒐集屬性X。


它在實務上的判準是:

「資料最小化」= 如果已有證據證明,即使不蒐集實體的屬性X,也能準確判斷實體是否滿足條件C,則不應允許在判斷條件C時,蒐集屬性X。已蒐集並處理之屬性X亦應盡速刪除,並出具刪除紀錄,與通知被蒐集屬性之實體。

雖然這種描述,依然會受到「條件C能否化為原子命題」的制約,使得稽核上產生灰色地帶;但至少在市場已經收斂出共同需求的環境,例如年齡、財務狀況、健康紀錄等等,應該可以提供一定程度的判斷原則。


我不確定這種想法方向是否正確。希望能聽到大家的聲音。



參考資料

Rastegarpanah, B., Gummadi, K., & Crovella, M. (2021). Auditing black-box prediction models for data minimization compliance. Advances in Neural Information Processing Systems, 34, 20621-20632.

Ganesh, P., Tran, C., Shokri, R., & Fioretto, F. (2025, June). The data minimization principle in machine learning. In Proceedings of the 2025 ACM Conference on Fairness, Accountability, and Transparency (pp. 3075-3093).

CC BY-NC-ND 4.0 授权
已推荐到频道:时事・趋势

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

logbook icon
討厭鬼 aka 劉維人自由研究者,社科譯者。 譯作著重當代民主、政經制度等議題,如《反民主》、《暴政》、《修辭的陷阱》、《民族重建》等。開設課程如《北歐幸福方法論》、《AI要搶走我的工作了嗎?》等等。
  • 来自作者
  • 相关推荐

停權的系統性風險:平台掌握的不是帳號,而是我們的觸及管道

當金光勝過田地:在 AI 時代,販賣夢想的說客,將決定資源分配

政府要活下來,就要讓人民需要它