發布日期:2024年1月27日
最後更新:2024年1月27日 00:48
點擊次數:260
「SRDA學術調查研究資料庫」長期蒐集、管理、保存、開放、共享與再利用實證調查資料,為學界提供了寶貴且重要的實證資料二次使用(secondary use)服務。
為提供實證資料共享再利用服務,發揮實證資料庫的價值與影響力,促進跨領域整合與加值應用,SRDA與核心資料庫團隊密切合作,以實踐FAIR(Findable、Accessible、Interoperable、Reusable)原則管理和共享資料,合力推動實證資料之公開與再利用。
實證資料核心資料庫服務機制
Service1 資料寄存前諮詢>> 2~8 weeks >>
首先,SRDA需取得所有權人或著作權所屬機構同意授權,將資料提供予SRDA重製、保管及開放,並與實證資料庫團隊就「資料寄存」項目進行初步討論。這包括說明線上寄存流程和除了調查執行報告/研究成果報告、原始數據資料檔案之外,還需提供的基本項目(如調查問卷、相關說明文件等),以及如何準備提交資料。
此外,若資料含有隱私、敏感資訊或可識別個資,則進一步討論資料開放的方式(公共版、標準版、限制版)或設定資料取用限制,將使用對象限定在較嚴格的會員申請審查方式外,亦提供限制性資料遠距服務(Remote)或現場使用(Onsite)供作選擇。
Service2 資料寄存協助與協調>> 2~4 weeks >>
協助實證資料之寄存、檢查寄存項目內容,為資料管理與開放共享預作準備,並進行追蹤與溝通協調。
Service3 隱私資料識別風險評估>> 1~2 weeks >>
首要檢查資料中是否有涉及個資、隱私資訊,以確認資料是否有公開揭露的問題,其目的在於確保受訪者隱私沒有被揭露的風險。
Service4 資料寄存後諮詢>> 0~4 weeks >>
與實證資料庫團隊討論隱私資料識別風險評估的結果、採用何者去識別化處理或轉換技術,讓資料不再具有直接或間接識別性;並向其取得任何缺漏的文件或檔案,以補齊資料文件不足之處。
Service5 資料管理與品質控管>> 2~20 weeks >>
依標準作業程序進行資料整理與檢核,提供給使用者的資訊足夠讓其瞭解資料是如何產生、及各個數值代表的意義,準確且完整的描述說明可以確保以後開啟檔案時,能清楚理解檔案內容。
.高品質的資料整理檢核程序
1.隱私資料去識別化,檢查資料中是否含有可識別受訪者身分的資訊,若有,則進行刪除或轉換。
2.檢查資料檔/欄位定義程式中所有變項名稱(variable name)、變項說明 (variable label)、選項數值說明(value label)、格式及欄位是否相互符合,並編輯整理明確且完整的變項說明、選項數值說明及遺漏值定義。
3.專屬資料檢核項目:
(1) 不合理值檢核
檢查各變項的次數分配結果,是否出現問卷選項以外的不合理值。
(2) 邏輯檢核
就題目和答案間的邏輯關係加以檢驗:包含跳續答題之「不該答而答」及「該答而未答」檢核;回答複選題者,至少勾選一個選項及「無反應選項」(如不知道、拒答、都沒有)不應與其他選項一同出現;以及偏好次序題(如最喜歡、次喜歡等)的題目間不應有選項重複勾選情形。
(3) 核對調查執行報告/研究成果報告次數分配數據一致性。
(4) 透過檢核、資料修正或敘明資料確認無法修正的處理方式,確保資料品質。
4.轉置多種常用的數據資料格式。對於長期保存而言,標準、開放且廣泛可長久讀取的檔案格式,包括CSV、ASCII;短期資料處理檔案格式,如統計軟體系統檔SPSS、STATA等。
5.整理參考文件,如:問卷、計畫成果報告、資料使用說明(user guide)等,製作統一的釋出檔案格式。
.建置完整詮釋資料(metadata)欄位
SRDA採用DDI國際標準的XML格式,建置完整且結構化的詮釋資料欄位。DDI是一套用於描述社會、行為和經濟科學資料的詮釋資料(Metadata)標準。透過OAI-PMH收集Metadata,以進行資料共享。
.提供永久有效的DOI數位物件連結
為每一筆實證調查資料註冊唯一且永久有效的數位物件識別碼(Digital Object Identifier,DOI)。
.協助生成可分析的英文資料檔(有英文問卷者)
為增加調查資料被國外學者使用的機會,對於有提供英文問卷的計畫,SRDA協助製作英文資料檔、英文版資料使用說明及相關英文文件,供使用者查詢、分析與下載。
Service6 資料開放共享>> 1 day >>
.發布資料公開資訊
於SRDA網頁發布資料開放最新訊息,對外公開調查資料檔與資料相關文件。
.實證資料專屬網頁介紹
優化網頁內容的編排設計,在視覺上更具吸引力,並增強版面的可讀性與易讀性,清楚呈現每筆資料的詮釋資料、對應的問卷變項以及收藏資料等功能。
Service7 資料使用支援服務>> ongoing >>
.資料使用諮詢
提供SRDA會員資料使用諮詢服務,主動回覆使用者對於資料提出的問題,建立諮詢資料庫,讓資料知識持續累積。
.資料改版支援
協助資料更新修正、改版釋出作業,按最新版資料重新註冊DOI,版本編號由「1」更新為「2」,例如:https://doi.org/10.6141/TW-SRDA-D00216-2,並公告說明歷次改版內容。
.彈性化資料使用管理
調查資料依檔案涵蓋資訊的敏感程度,開放資料版本控制,分為公共版、會員版及限制版。只要在符合SRDA會員資格的有效期間內,即可隨時上網查詢,或下載公共版、會員版資料;若欲使用限制版資料,則須依各資料規定提出申請審核,並採取遠距使用或現場使用進行資料分析。
Service8 資料再利用>> ongoing >>
.資料著作收集
SRDA蒐集應用實證調查資料所發表的著作書目,包括期刊論文、會議論文、學位論文、專書、專書的專章等,採用Python爬蟲技術自動化蒐集國內外文獻資料庫與網路資源,並與實證資料庫團隊以共同協作的方式建置與取用著作書目資料,透過實踐行動與回饋機制,深化研究成果。
.資料使用統計
可視實證資料庫團隊需求,定期提供資料使用者下載統計報告供參,並透過永久有效的數位物件識別碼(DOI)追蹤調查資料被引用使用的情況。
.會員整合性管理(API串接會員資料)
將使用者的各種用戶身份(蒐藏/下載資料、資料著作作者、資料寄存者)整合於同一個使用者ID之下,便於了解完整的使用者行為。
.數據多元應用與呈現(視覺化線上分析、資料串連平台模組服務)
建置完整標準化的metadata資料、透過資料庫串連的技術,與國際數據資料網絡接軌,SRDA Harvested Dataverse可用於跨國性的資料查詢,提高資料的曝光度,進一步提升實證資料庫團隊學術著作與成就之國際聲譽,創造更多學術交流的機會。
More news