【臉書】國防院PDF遮蔽個資的低級失誤

未簽名
已簽名資訊

豆泥的以太坊地址: mashbean.eth

狀態: 未簽名

文章的身分證字號

0xebe4947b678b08af16909405a713e5627f57e921d46907bf10d53945f38ca176

這是什麼?

已簽名表示這篇文章已建立獨特的身分證字號(內容雜湊,contentHash)並且由豆泥簽署認證,簽署是採用以太坊區塊鏈的豆泥專用地址(signer.mashbean.eth)。只要內容一經修改,就會需要重新驗證換發新的身分證字號。但豆泥不是每天都在公所上班,所以偶爾會慢一點認證。

國防安全研究院去年發表的《批踢踢影響力作戰前導研究》出現去識別化不足問題,PDF檔中以色塊遮蔽的PTT用戶ID仍可用編輯工具還原,導致個資外洩風險,引發對敏感資料保護的隱憂。

閱讀偏好

fb-0607-1 fb-0607-2 fb-0607-3 fb-0607-4 fb-0607-5

看來國防安全研究院的個資去識別化意識還需要再強化,每隔一段時間就會有人以為 PDF 的個資只要用色塊蓋上去就可以隱匿資料,殊不知只要用 PDF 編輯軟體就可以去色塊,竟連國防院也犯下如此低級錯誤。

我情願相信國防院是故意這麼做來洩漏個資 XD

該院兩天前發表的論文《PTT 八卦版 COVID-19 疫情輿情分析》,文章為去年同一機構於 2020 年 12 月發表的《批踢踢影響力作戰前導研究》之延伸。所以我也一起載下來閱讀。個人認為新的這篇比前導研究水準好很多。

就講最基本的去識別化好了,前導研究的附錄(Appendix )的 Visual 10 為使用者發文時頻熱點圖,ID 處雖然用黃色色塊遮住,但只要用 PDF 編輯工具點開就可以刪掉,ID 馬上顯示出來(如圖);又 Visual 11 為各使用者的網絡拓墣圖,一樣是點開編輯工具可以看到 ID,還可以看出論文作者的電腦螢幕截圖畫面(如圖),雖然沒有什麼重要的資訊洩漏就是。

新的這篇《輿情分析》便沒有這個問題,因為該論文直接將分析之 PTT ID 展示出來,所以八卦版這兩天才有人自稱 PTT47 浪士。

個人的觀點是 PTT ID 與發文本來就是公開資料,國防相關研究單位有無需要去識別化,我其實不太在意。但去年那篇前導研究看來是有心要去識別的,那就好好去啊,PTT ID 被煏空(Piak-khnag)事小,下次萬一是什麼敏感資料可慘了。

圖片引用自國防安全研究院《批踢踢影響力作戰前導研究》2020.12

← 回文章列表