2022年3月30日 星期三

大學圖書館如何保護數據(data)及科學自由(scientific freedom)

數據追蹤(Data tracking)是許多企業認為有利可圖的商業模式,但這其中隱藏著一些危險,數據的保護(data protection)及科學研究的自由(freedom of science and research)需要被注意,圖書館及圖書館員可於此扮演重要的角色。


Julia Reda來自德國非營利組織Society for Civil Rights (GFF),長期關注版權及數據保護相關議題,在此篇訪問中,Julia Reda談到圖書館及數位基礎建設(digital infrastructures)在數據追蹤這個複雜議題中所扮演的角色。


Q1 During the recent online conference #vBib21, you gave a presentation on “Tracking Science: Consequences for Data Protection and Scientific Freedom” (German). Why is this topic also relevant to libraries?

在線上會議 #vBib21中,您的演講主題是“Tracking Science: Consequences for Data Protection and Scientific Freedom” (German),為什麼這個主題與圖書館有關係呢?


A1:科學出版社買了許多負責科學產業不同面向工作的軟體公司,從可以處理紀錄實驗室測量結果到評估研究品質的各種軟體及公司。商業公司建立了完整的服務架構,是缺乏資金的圖書館無法全面提供的服務。一但與公共利益相關的研究在這些商業平台上進行,商業公司可以輕易取得與研究者相關的高度敏感資料,有害於研究者的隱私及科學獨立性,圖書館必須反對這個發展趨勢(take a stand against this trend)。


Q2 How is scientific freedom threatened when major publishing houses track the surfing and search habits of individual scientists?

當主要出版社開始追蹤科學家的瀏覽及檢索習慣之後,可能對科學自由(scientific freedom)造成的危害是?


A2:如果科學商業公司將使用者使用資料的紀錄,例如閱讀及下載文獻等資料賣給政府,則當當權政府想要限制特定學科領域的發展,則研究者可能變成政府觀察、制裁的目標,科學自由、研究者的獨立性等就會被阻礙。


Q3 In the scientific ecosystem, libraries often advocate Open Science, for example by operating their own Open Access repositories or by negotiating Open Access-friendly contracts with publishers. What pitfalls are lurking here in relation to tracking and scientific freedom?

圖書館會藉由開放取用典藏庫(Open Access repositories)或是與出版社協議開放取用合約來倡議開放科學,您覺得這其中有潛伏與數據追蹤和科學自由相關的陷阱(pitfall)嗎?


A3:圖書館應該以機構內建立的機構典藏庫等基礎建設為主,倚賴綠色開放取用策略,而不是依賴商業公司的系統。與商業公司協議的出版合約會有造成機構負擔的高額出版成本(例如APC),也是將使用者的使用習慣、瀏覽數據等拱手給了出版社。大學及圖書館應該盡力避免這些合約,並且將資金投注在機構內出版及典藏等基礎設施上。


Q4 In your presentation you called upon libraries to get involved in the debate and campaign for data protection. What can libraries and digital infrastructure institutions do in practice?

在您的演講中呼籲圖書館應該參與數據保護的倡議活動,圖書館實際上可以做些什麼呢?

A4:除了在與出版社協商合約時需要牢記的具體建議外,圖書館聯盟和高等教育機構的管理層必須公開聲援受到科學追蹤(science tracking)影響的研究人員。可以做的事情包含拒絕使用評估研究質量的偽科學量化指標(pseudo-scientific quantitative metrics)、加入並宣傳「停止追踪科學(Stop Tracking Science)」的請願活動或德國心理學會關於科學追蹤的聲明等。

保護及提供服務:研究資料服務發展路徑圖的制定

研究資料管理(Research Data Management)變得越來越重要,不只是因為資料量成長速度及複雜度增加,也是因為法規管理者對資料的要求規範變多,例如歐盟提出的一般資料保護規定GDPR。許多研究資金資助單位開始制定研究資料相關政策政策,研究資料也漸漸被視為大學的重要資產(asset);資料共享更在研究流程中扮演重要的角色。

Covid-19疫情肆虐之下,學者跟研究者必須在家工作的情況下,做研究的方式有了革命性的改變,讓大眾對研究資料和研究軟體的使用更為聚焦及重視,於此同時,機構及圖書館提供研究者的服務也必須跟著改變。

原文是牛津大學在2019年11月到2020年11月之間與外部單位合作提供機構內RDM服務設計及評估後(RDM review),根據評估結果建立後續服務路徑圖(road map)的經驗分享。

根據評估與相關利益者的建議,牛津大學發展路徑圖時的考量有以下幾點:

1. 路徑圖應該包含可以被不同群眾理解的多層次面向(granularity)資訊。

2. 不論是在評估期間或是之後,路徑圖應該是易於編輯的動態文件。

3. 路徑圖應該包含標準化領域與類別,以利實施階段可以流程化追蹤。

4. 責任應同時分配到監督(個人)和實施(個人和/或團體)兩種


牛津大學未來幾年RDM服務發展路徑圖,目前路徑圖是由機構的研究資訊管理與科技小組委員會(Research Information Management and Technology Sub-Committee)管理:




經過評估程序及路徑圖的制定,牛津大學提出幾項建議給未來有志提升研究資料管理服務的機構:


1. 確保高層級單位的支持 (Secure high-level sponsorship)

2. 透過多重諮詢,優先考量與學術社群的連結,確保研究者的需求 (Prioritize engagement with the academic community)

3. 確保RDM的最新發展 (Recognize the cross-cutting nature of RDM)

4. 確保中央與不同層級之間提供支援服務時各自的角色定位 (Acknowledge the respective roles of central and distributed support services)

5. 了解及接受不同學科領域對於資料分享的文化差異 (Understand and embrace different disciplinary cultures for data sharing)

6. 準備好隨時適應不斷改變的環境 (Be prepared to adapt to changing circumstances)

7. 在規劃及預算編排上要實際一點 (Be realistic about institutional planning and budgeting timelines)

8. 認知服務設計實踐的過程跟達成目標是一樣重要的 (Recognize that the journey is as important as the destination)


閱讀詳細的評估及路徑圖設計內容請見:

To protect and to serve: developing a road map for research data management services