人口普查的安全問題
對于即將到來的人口普查,,美國政府采取了最先進的隱私保護技術(shù)。
?

美國人口普查局(U.S. Census Bureau)每十年進行一次全國性的調(diào)查,為美國的民主格局確立條件,。調(diào)查問卷可以產(chǎn)生大量數(shù)據(jù),,包括人名、街道地址,、年齡,、種族,、民族和其他細節(jié)。這就產(chǎn)生了一個棘手的問題:別有用心者可以通過公開記錄知道某個人的詳細個人信息,。
人口普查局既負責發(fā)布普查結(jié)果摘要,,同時還要保護人們的隱私,不禁陷入兩難境地,?!爸灰l(fā)布了統(tǒng)計數(shù)據(jù),就會泄漏該機密數(shù)據(jù)庫的有關(guān)信息,?!比丝谄詹榫值囊晃挥嬎銠C科學家西姆森·加芬克爾(Simson Garfinkel)在今年5月向人口普查咨詢委員會表示。如果人們認為他們的回答無法得到保密,,他們可能會選擇不回答問卷,。而目前政府建議在2020年人口普查問卷中增加一個敏感問題—詢問受訪者是否是美國公民,因此,,對隱私的保護變得尤其重要,。
但是這里存在一個問題:保護人們隱私的常用方法已經(jīng)無法提供足夠的保護。2016年11月,,一個研究小組利用統(tǒng)計工具和公開數(shù)據(jù)將2010年人口普查的機密數(shù)據(jù)庫成功地進行了部分重建,重建比例達46%,。如果允許年齡有一年的浮動空間,,該比例躍升至71%。通過將人口普查局公布的表格和其他商業(yè)數(shù)據(jù)集相結(jié)合,,研究人員發(fā)現(xiàn)他們可以重新識別17%的人口,。
美國人口普查局的首席科學家、2016年研究的負責人約翰·阿博德(John Abowd)說,,舊的隱私保護措施是無效的,。“事實證明,,沒有誰的信息可以藏得像大海里的針一樣好,。”他說,。為了解決這個問題,,阿博德在2020年人口普查中實施了“差分隱私”的尖端技術(shù)。這種做法故意將干擾信息或隨機變量加入系統(tǒng)中,,這是谷歌(Google)等科技巨頭對用戶數(shù)據(jù)匿名化的常用方法,,其結(jié)果就是:想要揭秘數(shù)據(jù)庫的人只靠人口普查數(shù)據(jù)無法獲取詳細的個人記錄。
這是在精確性和隱私之間的權(quán)衡,。雖然一些社會科學研究人員抱怨新方法會妨礙他們的工作,,但如果不采用這種方法,,大規(guī)模數(shù)據(jù)泄露帶來的嚴重抵制將會影響到未來的人口普查工作。(財富中文網(wǎng))
譯者:Agatha
-
熱讀文章
-
熱門視頻