digital data in human rights 筆記摘要

這篇文章主要是整理近日閱讀了The Engine Room「Navigation guide on digital data in human rights research」,以及另一篇有關人權實踐但偏向學術討論的文章「Data Visualization for Human RightsAdvocacy」筆記摘要。大概因為「意外」發現自己近來所讀的一系列報告，其中居然有許多彼此重疊互相呼應的地方，故為文記下作一點自我摸索中的學習見證吧。

其實目前第一份指引文件仍未正式發表，ＴＥＲ先在網路上釋出草稿以徵關心此議題同儕社群組織的回饋建議。之所以企圖要發表一份所謂處理「數位數據資料在人權研究應用」的指引資訊，就是想要回應這個問題： how can human rights defenders navigate and integrate new and emerging digital data streams in their work? 人權工作者如何面對不斷涌出的數位新形態式資料數據，在這數據淹没的大海中找出所遇到達之目地的的方向並且好好地利用這些新型態的數據來強化其人權工作？當然對於讀者，或者說有面臨了類似處境的人權工作者而言，在走入這目眩神迷的科技雨林、跳入浩浩數據之海前，不妨先靜下來好好地想清楚，到底對數據資料的需求是什麼？真正的動力動機又是什麼？這些前提的答案都會影響著資料與數據收集種類、方法以及如何使用應用它的結果呈現。而這本手冊所欲建立的某個指引指南，就是希望幫助人權工作者在相關領域研究上面能夠提高影響力以帶來社會改變。

為回應本指南一開始提出的問題與指引讀在摸索使用新式數位化數據資料的方向，故其內容試圖緊扣著以下四大原則來處理人權工作者所面對的新數據與工具使用的各種狀況：

１）新式與傳統資料之間的妥善結合與互動加分強化成果
２）擅用科技工具，尤其在緊急狀況下可以避免重新製造數據資料的麻煩與風險。
３）了解我們在收集新式資料數據上的有哪些技巧以及其限制
４）提高對於演進工具旳識別與使用能力來引導與協同新式出現的數據資料

當然新型態（數位資料）出現帶來不可避免地改變了人權團體或人權捍衛者在應用數據資料上的習慣和方式的改變，但也可能是沒有任何改變（僅是工具應用的改變，但其心態上仍處於前數位的類比式年代吧）、往「不正確」方向的改變（迷信技術的萬能、缺乏社會面向因素的考量……）。因此，本書不忘提醒讀者/使用者，數位資料數據雖然可以大大加快某些事實呈現、促進工作效率（嗯，這個效率其實說穿了也沒什麼比較基礎意義），科學佐證的背書基礎…….但是必須要正視和了解資料數據的限制，成為了解控制資料使用的主體而不是反而役於數據資料而自我作傅。資料數據的限制有：
１）陳述事實狀況規模長度，但無法提供「原因」
２）數據資料本身準確與「客觀」認定的缺陷
３）數據的相關性並不代表可以推出其因果關係的公式或驟下結論

前面都只是引言式的介紹，從第二部份開始應是手冊內文的主要重點，集中在討論：收集、使用、保護資料與數據時要作的考量與考慮，包括全面的安全、資料的所有權歸屬、人身安全等課題

A）精神情緒面向的照顧
人權工作者日常大量接觸處理這類人權侵害案例與數據資料後，本身面臨二手次級傷害的可能性與其負面影響（心理情緒上的「健康安全」調整與應對）#讀到這裏，不免讓我好奇起來，為何在許多HRDs＆Security 的討論中居然常常出現有關精神情緒層面的保護與適當解壓的資訊？不信去看看最近這二份資料: Security First’s umbrella app中文匯整； Tactics Technology Collective’s Holistic Security（人權捍衛者全面安檢手冊）。

B）人身安全與安危之考量與照顧
人權工作者自身的性命身家安全實與其面臨的數位威脅（與其持有數據資料）實不可分。

C）Data, Decisions + Discovery：蹬蹬噔！！！除了前面提及精神與人身「現實層面」的安全考量外，終於要進入到實際面對處理「data」這個玩意的討論了。
對於新型式數位數據資料的潛力評估，本章節主要協助人權研究者來評估新式數據的淨值對其研究問題與框架是否有所助益，到底它能提供更多協助還是反而造成傷害？因此不妨從其可負擔性（優點）與其限制（缺點）來入手。

What kinds of information do we need to answer our research questions?
Does new data add value to our work?
What are the characteristics of the medium of your new data?
Thinking of your context and your goals, what do these characteristics allow you to do,
and how might they get in your way?
What might you learn from past use of technologies with similar risks and benefits?

除了僅從資料與使用新工具可帶來潛力與負面影響外，在進行評估時也不忘記要放入更廣大的政治社會經濟面向之脈絡考慮,例如數位落差、資源分配、所有權與，以提醒研究在開始收集、使用新式數據資料之前有所準備。

發現新數據之美妙：從個案來示範評估新式數據與工具的優勢與缺點
本文中所指的新興數位式資料數據大概可畫分成6大類：
● Photo and visual
● Satellite and geospatial
● Perception and opinion (social media)
● Socioeconomic and administrative statistics
● Budgetary data
● Passively produced data

查證之重要與其基本步驟：五大Ｗ問題與相應的作法應用
核實查證其實是資料取得後，進一步使用利用之前很重要的一道工序。但我總感覺在台灣的脈絡中，這道工序卻往往被忽略或輕視，彷彿只要取得了資料資訊就趕快來應用或發佈，至於前端它的來源、真實可信度、使用上的倫理問題似乎不在考慮之列（希望我的感覺是錯誤的啊～～）。也許正因為國人對於查證核實這件事的忽視，我在讀到國外這方面的相關介紹時，往往易産生一種自己也不知所措的分裂，納悶著：咦我該要做什麼的疑惑。例如在社群媒體上看到一則突發的重大事件，我應該是趕快跟著轉推呢，還是先大略看過各媒體的報導確實事情基礎再作一名多手傳播者？但求證核實這件事卻似乎在西方的某種教育訓練過程中被相對視為理所當然的必要步驟，進入了數位化的網路通訊快速發展時代，進行求證核實的資訊對像與處理工具當然也大幅變動，因此我在看到後常常受到某種「文化震憾」：啊，居然有這種工具，啊居然要先做這種工作的驚奇之感。例如去年曾試玩過citizen　evidence實驗室所開發出的數位工具，這個實驗室是國際人權組織 Amnesty International 某個資助計畫中的一部份，其主要在研究開發數位資料（如照片、影片）作為人權侵害調查上查實工具應用，這根本是我想都沒想過的玩意啊。

D） Engaging with new data：投入新數據的應用
依數據與人權工作用途而區分
１　法庭上使用（Legally Admissible Evidence）
２　預算數據（Budgetary Data）
３　政府統計資料:使用政府提供的數據資料時所要小心注意的地方，尤其是要批判地來剖析這些數據背後的政策設計與
４　Image Metadata (EXIF) 影像照片的記錄資料（如拍攝的相機機型、拍攝日期時間、GPS）:Developing Your Video or Photo Catalog
當需要應用處理大量影像照片資料時，如何記錄與分類其中的每一筆資料（尤其是matadata）就變得很重要,而目錄化就是協助來系統化管理這些描述性的資訊，好更方便有效地使用。
5 How to Not Let the Internet Break You: Using Social Media
最後一部份是介紹網路世界裏正夯的社群媒體，使用者在其中所反應輿論與民情趨勢，透過收集社群媒體上反應的數據資料，是否能幫助人權工作者洞察某些文化規律或潮流？

而第二篇文章「Data Visualization for Human Rights Advocacy」則是由美國紐約大學法學院研究者與工學院教授一起搭配合作，以人權組織（主要是兩大團體：國際特赦組織Amnesty International 與人權觀察Human Rights Watch）發表的人權報告–Coding of human rights reports–為文本母體，來了解人權倡議上使用數據資料與將之視覺化的狀況，其研究方式除了採樣本數據的量化分析外，也包括對相關人權工作者或數據科學家的深度訪談，希望在人權界也如其它産業熱衷談論大數據商機（當然不是為了利潤而是希望擴大社會影響力），許多工具指引也如雨後春筍地出後教導社會非営利組織如何使用大數據。但這篇文章則希望另從一種學術面向的技術應援與發展合理友善的設計原則，來探討人權團體在使用應用大數據上可能面臨的挑戰與機會。

但除了上述二種方式外，作為一個頂尖的學術研究，當然得比其它倡議型、訓練型的數據使用機構來點不一樣的東西，故紐約大學研究團體還加了一道心理測試：透過對於多組隨機觀眾的實驗設計，了解在同一類數據資料底下，是否其用圖象式呈現會比非圖象式呈現更較說服打動的效果；又，欺瞞數據所作出來扭曲的視覺化結果，又將如何影響觀者對於這些訊息的解讀與詮釋？(其實這一段我讀不太懂其研究過程與推導出來的結論)。總言之，這篇文章指出了目前人權團體在處理數據圖像化面臨的主要問題可能是人員本身仍欠缺對於數據識讀能力以及當前仍未發展出系統化的知識研究來把數據應用在人權工作推展，而數據資料收集的問責與倫理、視覺化成品到底能有多少態度、行政與政策改變的效果等等，也都是有待持續觀察研究的課題。

讀後心得：第一份手冊文件仍是在徵詢意見回饋的初稿階段，其編排的層次於我讀起來似乎有點混亂，㧓不太到某些部份與前後段內容之間的連貫性，偶而有一種突兀違和感，本文試圖作出重點摘要整理的努力，也似乎是事倍功半，有關閱讀文脈順暢的問題或許能在稍後的正式發佈版本上得到改善解決。而回到初心，到底讀了這本指南能否能人權工作者在面對數位數據資料的處理與應用上能夠多一點謹慎與自覺意識呢？我認為可能稍有所幫助，但效果恐怕還一時看不出來。但近日這幾篇筆記與閱讀報告之分享，其實不正反應數位數據資料在人權工作使用上日漸受到重視，創立各式操作示範的必要與急迫？

日前讀到Witness 實驗室宣佈他們將投入一個調查分折近年來網路上對於LGBTQ同志（社群）進行仇恨攻擊歧視表達的影像資料研究計畫。從目前其部落格上所揭示的研究動機、方法與範圍,反推過來大大協助我理解了原來這本手冊所試圖整理的某個方法之一，就是以wintness這個擅長於使用影像進行社會運動倡議的組織，正在摸索（或者已經正式常規化）的一套處理數位數據資料與結果應用。

witness for data on transphobic violence