資料數位化流程

在這部介紹資料數位化流程的影片中(07:20),定義了以數位影像來將自然歷史館藏物件數位化的 五個階段,而這幾個階段也能較容易地應用在其他的生物多樣性資料來源上。若您無法觀看嵌入在課程頁面上的影片,可以點此下載 download 並在電腦上觀賞。 (MP4 - 26.8 MB)
正如同影片中強調,數位化協議(digitization protocols)會隨組織而異,故確保採用的是被同意、記錄、且受到認可的協議是至關重要的。

在工作坊中,我們並不會教資料數位化本身,因為它很容易就變成長達一周的課程內容;相反地,我們會專注在關於生物多樣性資料獲取的基礎介紹上。雖說如此,由於我們知道仍有許多夥伴對此感興趣,所以仍想提供給一些關於資料數位化的相關學習資源給你們。

組織資料數位化的方法有很多種,一開始可能讓人感到不知從何下手。記住重要的一點是,在大多數他人的數位化案例中,很可能就有著和你們打算數位化的同類型標本、物件。在這個練習中,我們會介紹一些實際的資料數位化流程資源,藉此幫助你們上路,這些練習也會成為未來工作坊中選擇、修改、評估工作流程的基礎。

這過程中的步驟可能包含:

  • 數位化前預先管理、分層:這包含數位化前的資料準備工作,諸如:將資料指定獨一無二的辨識碼,這將幫助資料集引用時不會出錯,並讓所有衍生資訊保存在一起。

  • 影像擷取:這包含了一定程度的事先規畫,除了影像擷取本身外(如:工作程序的定義、硬體的選擇),亦包括影像如何在何處被儲存與處理。

  • 影像加工:包含品質控制、版本轉換…​等等。

  • 數位資料獲取:資料數位化程序的核心,包含如何獲取資料庫中的關鍵資訊。影片中強調,雖然鍵盤最常見的輸入資訊方法,但越來越多的機構正轉向使用進階的資料輸入科技。

  • 進行地理參考:地理資訊對生物多樣性分析非常重要,因此資料數位化專案都應盡可能地去萃取出更加正確的理資訊。

整合數位化生物館藏(Integrated Digitized Biocollections, iDigBio) (iDigBio) 是美國聯邦自然資源局下生物多樣性館藏進階數位化(United States National Resource for Advancing Digitization of Biodiversity Collections) (ADBC) 的協調中心單位。iDigBio它們領導著全國範圍的工作規模,藉以讓數百萬計的生物樣本能以標準的數位格式提供給科學研究社群、政府單位、學生、教育者、及社會大眾。他們同時也有製作幾支討論資料數位化流程的影片。

若你想更了解不同樣本類型的特定工作流程,你可能也會對iDigBio系列的其他影片感興趣: