資料整理程序

發布日期:Aug. 5, 2024
最後更新:Aug. 5, 2024, 9:02 a.m.
點擊次數:31


學術調查研究資料庫(Survey Research Data Archive,下稱SRDA)自1994年成立以來,一直積極蒐集臺灣重要的調查資料,並使其能夠有效的被再利用,進而對學術社群有所貢獻。為求確保資料是以負責、完整的方式保存、管理與開放,對於資料從蒐集到開放的整段過程,SRDA整理如下圖「資料整理程序」,說明從資料入庫至開放階段,SRDA所提供的支援服務項目、流程和所需時間,協助研究人員及資料使用者更深入地了解SRDA於調查資料管理的工作流程。

 

1、資料整理程序

 

一、資料寄存諮詢與協助(工作時間:2~4週)

 

首先,SRDA典藏的所有調查資料皆需取得資料著作權人、其所屬機構同意授權,將資料提供予SRDA重製、保管及開放。目前能以線上寄存及紙本掛號寄送兩種方式提供授權書。資料寄存的內容除了原始資料檔案、調查執行或研究成果報告之外,還需提供基本相關文件項目(如調查問卷、相關說明文件等),在準備提交資料的過程中,如有不清楚之處,SRDA皆有準備操作範例或FAQ網頁供查詢。

 

二、隱私資料識別風險評估及寄存後諮詢(工作時間:2~4週)

 

若資料含有隱私、敏感資訊,可向SRDA工作同仁進一步諮詢,討論資料分級開放的方式(公共版、標準版、限制版)或設定資料取用限制,將使用對象限定在較嚴格的會員申請審查方式,同時亦提供限制性資料遠距服務(Remote)或現場使用(Onsite)供作選擇。

資料寄存後,首要檢查資料中是否有涉及個資、隱私資訊,以確認資料是否有公開揭露的問題,其目的在於確保受訪者隱私沒有被揭露的風險。評估資料隱私結果並選擇採用何種去識別化處理或轉換技術後,讓資料不再具有直接或間接識別性;並向寄存者取得任何缺漏的文件或檔案,以補齊資料文件不足之處。

 

三、資料管理與品質控管 (工作時間:2~20週)

 

為確保提供給使用者的資訊足夠讓其瞭解資料是如何產生、及各個數值代表的意義,準確且完整的描述說明可以確保以後開啟檔案時,能清楚理解檔案內容。我們所採取的作業程序包括:

 

  1. 高品質的資料整理檢核程序。
  2. 隱私資料處理,確保去識別化,刪除或轉換敏感資訊。
  3. 欄位一致性檢查,確保變項名稱、變項說明、選項數值說明、格式和欄位相互一致。
  4. 執行資料檢核,包括不合理值檢查和邏輯檢核,並核對調查執行報告和研究成果報告的次數分配數據。
  5. 轉換多種數據格式,包括CSVASCIISPSSSTATA
  6. 整理參考文件,如問卷和資料使用說明。
  7. 建置完整詮釋資料(metadata)欄位,採用DDI國際標準 XML格式,建置完整且結構化的詮釋資料欄位,促進資料共享。
  8. 提供永久有效的數位物件連結DOI Digital Object Identifier),為每一筆調查資料註冊唯一且永久有效的數位物件識別碼。
  9. 協助生成可分析的英文資料檔,特別是針對提供英文問卷的計畫,SRDA協助製作英文資料檔、英文版資料使用說明和相關英文文件,以增加調查資料被國外研究者使用的機會。

 

四、資料開放共享(工作時間:2~4週)

 

為致力於讓資料開放共享變得簡單易懂,SRDA網頁將上即時發佈有關資料開放的最新消息,讓大眾能夠迅速瞭解有關調查資料檔和相關文件的資訊。

 

五、資料使用支援服務(工作時間:持續)

 

為確保資料能夠有效地被研究人員使用,提供了幾項重要的資料使用支援服務:

 

  1. 資料使用諮詢:SRDA協助解決會員對於資料的任何問題,於網頁上建立諮詢資料管道,以及時處理使用者對於資料相關問題。
  2. 資料改版支援:協助資料更新、修正,根據最新版本重新註冊DOI,並公告說明歷次改版內容,以便版本追蹤。
  3. 彈性化資料使用管理:SRDA根據資料的敏感程度進行分級,包括公共版、會員版和限制版。會員可以在資格有效期內自由存取公共版和會員版資料。如果需要使用限制版資料,則透過相關規定提交申請進行審核,並可以選擇遠距或現場方式進行資料分析。

 

六、資料再利用(工作時間:持續)

 

著重於將學術調查資料庫的價值最大化,讓更多的研究者受益。以下是有關提升資料再利用的相關資訊:

 

  1. 資料著作收集:SRDA利用Python爬蟲技術主動蒐集與使用資料出版相關著作,包括期刊論文、會議論文、學位論文、專書和專書章節等,並與大型學術調查計畫團隊以共同協作的方式建置著作書目資料,透過實踐行動與回饋機制,深化研究成果。
  2. 資料使用統計:定期檢視資料使用者下載統計情形,並透過永久有效的數位物件識別碼(DOI)追蹤調查資料被引用的情況,以檢視國內相關研究現況。
  3. 會員整合:整合使用者的不同身份(如資料使用者、著作作者和資料提供者),便於了解完整的使用者行為。
  4. 資料多元應用與國際化:SRDA按國際標準建立的metadata資料,利用資料庫串連技術,與國際數據資料網絡接軌,可於SRDA Harvard Dataverse平台查詢,提高資料的國際能見度,促進更多的學術交流機會。

 

整體而言,SRDA透過一系列符合國際資料治理規範要求的流程和步驟,讓研究人員可以在這個框架下安全使用實證資料,創新研究成果。與此同時,開放資料科學的重要性已成為國際學術研究的發展主軸,各國紛紛建立研究資料基礎設施,讓研究者能夠應用此設施為社會帶來實質效益。


回最新消息


More news

消息附圖
SRDA資料取得步驟

Sept. 13, 2024

SRDA收錄來自各大專校院、研究機構進行的學術研究調查計畫…...More

消息附圖
SRDA優化的資料查詢與瀏覽功能

July 23, 2024

  SRDA自1994年成立以來,收錄超過…...More

消息附圖
資料管理共享

Jan. 27, 2024

學術調查研究資料庫(Survey Research Dat…...More

Center for Survey Research, RCHSS, Academia Sinica
No.128, Sec. 2, Academia Rd., Nangang Dist., Taipei City 115201, Taiwan
Tel: 886-2-27871829
Email: srda@gate.sinica.edu.tw
Copyright © 2024 Survey Research Data Archive All rights reserved. Privacy and Security Policy
本網站使用 Cookies 以便為您提供更優質的使用體驗,若您點選「我知道」或繼續瀏覽本網站,即代表您同意本網站的隱私權政策