複習回顧

小試身手,回憶一下這節學到的概念吧!
  1. 為什麼最好要清理你的資料呢?

    • 讓它們盡可能的方便使用

    • 達到你對資料品質的目標

    • 資料應該由使用者自己清,而非提供者

  2. 如何建構自己資料清理的工作流呢?

    • 自己工作,只有自己最了解資料集

    • 詢問你的專家同事們

    • 以機構的等級切入,對焦建立資料品質的工作流

  3. 下列何者是最好的:

    • 預防錯誤發生

    • 盡速更正你在資料集、資料庫中找到的錯誤

    • 不清理錯誤但將它們記錄下來,因此使用你資料的人們可以知道錯誤在哪裡

  4. 資料品質是誰的責任?

    • 記錄此筆資料的人

    • 資料抄寫員

    • 資料庫管理者

    • 所有參與到資料管理的人

    • 用你資料的人

    • GBIF

  5. 下列哪些工具可以用來清理你的資料?

    • Excel 和其他 spreadsheets的管理工具

    • OpenRefine

    • 你的資料庫軟體

    • 線上工具,如:Scientific Names Resolver 、 Google Maps