此为历史版本和 IPFS 入口查阅区,回到作品页
討厭鬼 aka 劉維人
IPFS 指纹 这是什么

作品指纹
ISCN
iscn://likecoi...og/1

一種具體描述「資料最小化」原則的可能方法

討厭鬼 aka 劉維人
·
·

在研究數位隱私時,遇到「資料最小化」(Data Minimization) 該如何敘述的問題。

「資料最小化」是一種隱私原則,要求在收集、處理、保留資料時,應該限定在完成具體目的所需的最小範圍。

這項原則當代非常重要。因為在數位世界,絕大多數時候資料都是「存取即複製」,只要有人向你索取了一筆資料,你就很難保證這筆資料未來會被怎麼利用。因此,為了防止歹徒利用資料進行各種追蹤監控騷擾、防止利用資料探知商業機密、以及防止利用資料冒充身份,個人與組織的資訊洩漏越少越好。

在討論如何落實時,有人說「資料最小化」難以具體化為法規敘述。世界其他國家的敘述方式,也經常遇到「何謂所需」、「何謂目的」困境。

但若暫時不管實務判斷時的自由裁量問題,以及刻意把「目的」寫得模糊或包山包海之類的奇技淫巧,我目前認為,「資料最小化」似乎還是能寫成具體的描述。

例如我參考 Rastegarpanah 等人在論文中的架構,寫了以下的初步描述:

「資料最小化」= 如果無論是否蒐集實體的屬性X (attribute X),都能準確判斷實體是否滿足條件C,那麼在判斷條件C時,便不應蒐集屬性X。


它在實務上的判準是:

「資料最小化」= 如果已有證據證明,即使不蒐集實體的屬性X,也能準確判斷實體是否滿足條件C,則不應允許在判斷條件C時,蒐集屬性X。已蒐集並處理之屬性X亦應盡速刪除,並出具刪除紀錄,與通知被蒐集屬性之實體。

雖然這種描述,依然會受到「條件C能否化為原子命題」的制約,使得稽核上產生灰色地帶;但至少在市場已經收斂出共同需求的環境,例如年齡、財務狀況、健康紀錄等等,應該可以提供一定程度的判斷原則。


我不確定這種想法方向是否正確。希望能聽到大家的聲音。



參考資料

Rastegarpanah, B., Gummadi, K., & Crovella, M. (2021). Auditing black-box prediction models for data minimization compliance. Advances in Neural Information Processing Systems, 34, 20621-20632.

Ganesh, P., Tran, C., Shokri, R., & Fioretto, F. (2025, June). The data minimization principle in machine learning. In Proceedings of the 2025 ACM Conference on Fairness, Accountability, and Transparency (pp. 3075-3093).

CC BY-NC-ND 4.0 授权