Zi 字媒體

谷歌聯合ProPublica發布機器學習工具，試圖預測美國的「仇恨犯罪」

2021/12/25

仇恨犯罪（Hate Crime）是針對某一特定社會群組成員的犯罪行為。這些社會群組中包括種族、宗教、身心障礙、國籍、性別等在內的多項分類。在美國，記錄仇恨犯罪長期以來給研究人員、記者和社會科學家帶來一系列的挑戰。在這一領域，記錄的情況充其量也只是零零散散的，數據要麼令人遺憾地不完整，要麼根本不存在。

然而現在，我們對仇恨犯罪的理解的重要性比以往任何時候都要重要了，特別是在上周末發生在弗吉尼亞州的種族暴力衝突事件后。

為了更好地解決仇恨犯罪這一問題，谷歌和ProPublica（一個獨立的非盈利新聞編輯部，為公眾利益進行調查報道）聯手推出了一個基於機器學習的工具——仇恨犯罪新聞記錄索引（Documenting Hate News Index）。它通過對大量新聞文章的分析，建立起一個全國範圍內的能預測仇恨犯罪發生地的預警圖。

這個工具由谷歌推出的的Google News Lab(谷歌去年為新聞工作者推出的一套工具），以及數據可視化工具 Pitch Interactive，聯合 ProPublica打造而成。它從過去6個月的谷歌新聞文章中獲取原始信息，再用Google Cloud Natural Language API 來創造出一個可視化工具，幫助新聞報道者及時在全國範圍內發現哪裡正在有仇恨犯罪事件發生。這個工具提供的數據是在當年發生的持續更新的數據快照，這能為新聞報道者提供一個報道入手點，這對於新聞報道來說非常有價值。

這個工具彙集了那些與仇恨犯罪、偏見或虐待有關的新聞文章。這可能包括反猶太主義的塗鴉，或者有關法庭案件的信息的類似事件等等。另外，谷歌還計劃對這個工具的新聞文章數據集進行監控，以確保不會出現像只提到「仇恨」一詞的文章那樣的錯誤新聞事件。

用戶可以通過這個工具按日期搜索，或使用關鍵字搜索與仇恨犯罪有關的新聞文章。它還通過演算法來提供相關的關鍵詞，比如罪犯的名字，犯罪發生地點，或者是仇恨犯罪的類別。

為了確保新聞數據始終是最近更新的，這個工具會每天對資料庫進行更新，並且相關事件可以追溯到當年的2月份。第三方開發人員可以通過Google Trends Github 訪問此工具。

當然，這個工具也不是100%地能對仇恨犯罪做出預測，它也有它的局限性。因為這個工具只是單獨地基於新聞文章報道，而大多數的仇恨犯罪事件都沒有被報道，因為那些犯罪人員並不總是想上新聞被曝光啊。

坦白地說，目前這個工具還不是很有效地適用於達成預測仇恨犯罪的目標。這是因為現在還非常缺少有關仇恨犯罪的新聞數據。雖然FBI在法律上有義務收集關於仇恨犯罪的信息，但他們的信息來源卻很依賴當地政府對仇恨犯罪的報告，而當地政府卻沒有被法律規定要求收集這些仇恨犯罪的信息。

總之，谷歌推出的這個工具對記者和社會科學家而言都將是一個有用的工具。而且如果有相關的法律來促使更多的仇恨犯罪信息被收集的話，那麼這一工具能用的數據就越多，就能更有效地降低仇恨犯罪的發生率，因為我們知道，現在的機器學習最需要的就是龐大的訓練數據。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點