資料整理程序

發布日期:Aug. 5, 2024
最後更新:Aug. 5, 2024, 9:02 a.m.
點擊次數:542


學術調查研究資料庫(Survey Research Data Archive,下稱SRDA)自1994年成立以來,一直積極蒐集臺灣重要的調查資料,並使其能夠有效的被再利用,進而對學術社群有所貢獻。為求確保資料是以負責、完整的方式保存、管理與開放,對於資料從蒐集到開放的整段過程,SRDA整理如下圖「資料整理程序」,說明從資料入庫至開放階段,SRDA所提供的支援服務項目、流程和所需時間,協助研究人員及資料使用者更深入地了解SRDA於調查資料管理的工作流程。

 

1、資料整理程序

 

一、資料寄存諮詢與協助(工作時間:2~4週)

 

首先,SRDA典藏的所有調查資料皆需取得資料著作權人、其所屬機構同意授權,將資料提供予SRDA重製、保管及開放。目前能以線上寄存及紙本掛號寄送兩種方式提供授權書。資料寄存的內容除了原始資料檔案、調查執行或研究成果報告之外,還需提供基本相關文件項目(如調查問卷、相關說明文件等),在準備提交資料的過程中,如有不清楚之處,SRDA皆有準備操作範例或FAQ網頁供查詢。

 

二、隱私資料識別風險評估及寄存後諮詢(工作時間:2~4週)

 

若資料含有隱私、敏感資訊,可向SRDA工作同仁進一步諮詢,討論資料分級開放的方式(公共版、標準版、限制版)或設定資料取用限制,將使用對象限定在較嚴格的會員申請審查方式,同時亦提供限制性資料遠距服務(Remote)或現場使用(Onsite)供作選擇。

資料寄存後,首要檢查資料中是否有涉及個資、隱私資訊,以確認資料是否有公開揭露的問題,其目的在於確保受訪者隱私沒有被揭露的風險。評估資料隱私結果並選擇採用何種去識別化處理或轉換技術後,讓資料不再具有直接或間接識別性;並向寄存者取得任何缺漏的文件或檔案,以補齊資料文件不足之處。

 

三、資料管理與品質控管 (工作時間:2~20週)

 

為確保提供給使用者的資訊足夠讓其瞭解資料是如何產生、及各個數值代表的意義,準確且完整的描述說明可以確保以後開啟檔案時,能清楚理解檔案內容。我們所採取的作業程序包括:

 

  1. 高品質的資料整理檢核程序。
  2. 隱私資料處理,確保去識別化,刪除或轉換敏感資訊。
  3. 欄位一致性檢查,確保變項名稱、變項說明、選項數值說明、格式和欄位相互一致。
  4. 執行資料檢核,包括不合理值檢查和邏輯檢核,並核對調查執行報告和研究成果報告的次數分配數據。
  5. 轉換多種數據格式,包括CSVASCIISPSSSTATA
  6. 整理參考文件,如問卷和資料使用說明。
  7. 建置完整詮釋資料(metadata)欄位,採用DDI國際標準 XML格式,建置完整且結構化的詮釋資料欄位,促進資料共享。
  8. 提供永久有效的數位物件連結DOI Digital Object Identifier),為每一筆調查資料註冊唯一且永久有效的數位物件識別碼。
  9. 協助生成可分析的英文資料檔,特別是針對提供英文問卷的計畫,SRDA協助製作英文資料檔、英文版資料使用說明和相關英文文件,以增加調查資料被國外研究者使用的機會。

 

四、資料開放共享(工作時間:2~4週)

 

為致力於讓資料開放共享變得簡單易懂,SRDA網頁將上即時發佈有關資料開放的最新消息,讓大眾能夠迅速瞭解有關調查資料檔和相關文件的資訊。

 

五、資料使用支援服務(工作時間:持續)

 

為確保資料能夠有效地被研究人員使用,提供了幾項重要的資料使用支援服務:

 

  1. 資料使用諮詢:SRDA協助解決會員對於資料的任何問題,於網頁上建立諮詢資料管道,以及時處理使用者對於資料相關問題。
  2. 資料改版支援:協助資料更新、修正,根據最新版本重新註冊DOI,並公告說明歷次改版內容,以便版本追蹤。
  3. 彈性化資料使用管理:SRDA根據資料的敏感程度進行分級,包括公共版、會員版和限制版。會員可以在資格有效期內自由存取公共版和會員版資料。如果需要使用限制版資料,則透過相關規定提交申請進行審核,並可以選擇遠距或現場方式進行資料分析。

 

六、資料再利用(工作時間:持續)

 

著重於將學術調查資料庫的價值最大化,讓更多的研究者受益。以下是有關提升資料再利用的相關資訊:

 

  1. 資料著作收集:SRDA利用Python爬蟲技術主動蒐集與使用資料出版相關著作,包括期刊論文、會議論文、學位論文、專書和專書章節等,並與大型學術調查計畫團隊以共同協作的方式建置著作書目資料,透過實踐行動與回饋機制,深化研究成果。
  2. 資料使用統計:定期檢視資料使用者下載統計情形,並透過永久有效的數位物件識別碼(DOI)追蹤調查資料被引用的情況,以檢視國內相關研究現況。
  3. 會員整合:整合使用者的不同身份(如資料使用者、著作作者和資料提供者),便於了解完整的使用者行為。
  4. 資料多元應用與國際化:SRDA按國際標準建立的metadata資料,利用資料庫串連技術,與國際數據資料網絡接軌,可於SRDA Harvard Dataverse平台查詢,提高資料的國際能見度,促進更多的學術交流機會。

 

整體而言,SRDA透過一系列符合國際資料治理規範要求的流程和步驟,讓研究人員可以在這個框架下安全使用實證資料,創新研究成果。與此同時,開放資料科學的重要性已成為國際學術研究的發展主軸,各國紛紛建立研究資料基礎設施,讓研究者能夠應用此設施為社會帶來實質效益。


回最新消息


More news

消息附圖
SRDA資料取得步驟

Sept. 13, 2024

SRDA收錄來自各大專校院、研究機構進行的學術研究調查計畫…...More

消息附圖
SRDA優化的資料查詢與瀏覽功能

July 23, 2024

  SRDA自1994年成立以來,收錄超過…...More

消息附圖
資料管理共享:實踐FAIR原則

Jan. 27, 2024

學術調查研究資料庫(Survey Research Dat…...More

Center for Survey Research, RCHSS, Academia Sinica
No.128, Sec. 2, Academia Rd., Nangang Dist., Taipei City 115201, Taiwan
Tel: 886-2-27871829
Email: srda@gate.sinica.edu.tw
Copyright © 2024 Survey Research Data Archive All rights reserved. Privacy and Security Policy
本網站使用 Cookies 以便為您提供更優質的使用體驗,若您點選「我知道」或繼續瀏覽本網站,即代表您同意本網站的隱私權政策