複習回顧
小試身手,回憶一下這節學到的概念吧! |
-
為什麼最好要清理你的資料呢?
-
讓它們盡可能的方便使用
-
達到你對資料品質的目標
-
資料應該由使用者自己清,而非提供者
-
-
如何建構自己資料清理的工作流呢?
-
自己工作,只有自己最了解資料集
-
詢問你的專家同事們
-
以機構的等級切入,對焦建立資料品質的工作流
-
-
下列何者是最好的:
-
預防錯誤發生
-
盡速更正你在資料集、資料庫中找到的錯誤
-
不清理錯誤但將它們記錄下來,因此使用你資料的人們可以知道錯誤在哪裡
-
-
資料品質是誰的責任?
-
記錄此筆資料的人
-
資料抄寫員
-
資料庫管理者
-
所有參與到資料管理的人
-
用你資料的人
-
GBIF
-
-
下列哪些工具可以用來清理你的資料?
-
Excel 和其他 spreadsheets的管理工具
-
OpenRefine
-
你的資料庫軟體
-
線上工具,如:Scientific Names Resolver 、 Google Maps
-