電 話:19922276669
座 機:023-67865146
網 址:m.chi-sheri.com
郵 箱:dwhz@leadingcq.com
地 址:重慶市江北嘴中央商務區(qū)金融城3號T2棟2702
近年來檔案數字化工作在各級檔案館廣泛展開,由此產生大量的數字檔案。圍繞數字檔案長期有效保存的論述也是林林總總,這些數字檔案的保管和利用逐漸成為檔案業(yè)界關注的焦點。但是,隨著計算機網絡技術的飛速發(fā)展,互聯(lián)網2.0的推出,大數據、云計算等新事物的出現,上一代的數據管理方式,尤其是那種以脫機載體為主體的數據保管方式被發(fā)現的問題越來越多。數字檔案長期保存的要求與計算機設備隔代不兼容的矛盾依舊突出,鎖定既定的設備制定一系列保管措施的做法一直無法化解這對矛盾,數據丟失的風險依然存在。
一、脫機載體長久保存的技術風險
目前檔案館數字化工作一般都委托給專業(yè)公司,數字化以后的掃描件一是掛接到應用系統(tǒng)的數據存放區(qū)域,二是刻錄到光盤。由于數據量很大,交付的光盤數量也多,一般都要上千張,加之有的檔案館為了保險起見,往往要求專業(yè)公司刻錄3~4套備份盤,光盤的數量隨之增加幾倍,這對檔案館而言,實際上增加了管理負擔。因為存放的光盤不僅僅是立放在庫房的柜子里就相安無事,而是需要定期進行可讀性檢測,長期沒有檢測的光盤不能保證光盤中的數據是否可讀,而光盤逐一檢測又是一件費時費力的工作。
二、檔案館計算機機房及信息系統(tǒng)正常運行的管理風險
隨著數字化工作的快速推進,檔案館數據量的急劇增大,一方面檔案查詢效率不斷提高,另一方面管理風險也不斷增加。為了合理部署數據存儲設備和安全因素,檔案館的信息資源的存放有在線、近線和離線三種方式,同時又不時有新增數據導入和離線數據導出。這種數據操作有的通過程序驅動相應設備自動完成,有的依靠機房管理人員手動操作。無論自動還是手動操作數據,在缺乏校驗機制的情況下,數據出錯的風險依然存在。
檔案館計算機機房的各項設備,包括應用服務器、數據服務器、數據備份設備、網絡交換機、不間斷電源、空調設備以及各類安全設施的正常運轉,才能保障檔案信息系統(tǒng)的正常運行。
計算機機房的設備管理和數據管理,一是需要管理人員具備相應的技術能力,二是責任心,三是管理措施保障。
現行機房建設的運維安全措施一般都有替代功能,某一設備發(fā)生故障,備用的設備會接替運行。如果有的檔案館沒有這種安全措施,服務器崩潰影響檔案館正常工作的風險是很高的,嚴重的可導致數據丟失。
雖然發(fā)生火災、地震或恐怖襲擊等極端情況的概率很小,萬一真的遇有極端情況發(fā)生,對目前一些檔案館也可能是致命的。盡管這些檔案館采用了異地備份,通過移動硬盤甚至光盤將所有的數據下載,并送至結對的檔案館存放,以備極端情況出現以后進行數據恢復。但是這些脫機數據并未經過有效性檢測,也沒有進行數據復原測試,這些數據能否復原還是個懸念。
常見的數據管理風險是在數據手動導入或通過應用系統(tǒng)導入、導出、刪除操作中出現數據丟失和數據冗余,造成目錄數據庫和實體檔案不能一一對應,長期操作錯誤的積累將導致檔案利用的查全率和查準率下降,庫房實體檔案數量統(tǒng)計出現偏差。
應用軟件系統(tǒng)的風險是取決于能否選對軟件公司,低質量的應用軟件故障率很高,直接影響日常工作。一旦軟件公司撤離或倒閉,應用軟件系統(tǒng)不得不廢棄。同時與應用系統(tǒng)鏈接的數據庫以及全文信息需要遷移到新系統(tǒng)時,又可能由于加密等原因,使得后續(xù)軟件公司無法接手這些數據,造成數據廢棄。
三、建立風險應對機制和檔案信息資源保管體系
建立風險應對機制是為了避免管理風險和技術風險,掃描件沒有復雜的元數據羈絆,其數據的格式、應用系統(tǒng)的數據調用以及運行環(huán)境是可控的。檔案館在開展數字化工作之前就可以進行數據規(guī)劃,確定數據長期保存和利用方式,對未來可能出現的技術風險進行評估。
1.建立數據規(guī)劃及實施方案
數據規(guī)劃就要考慮檔案館可能產生的數據總量,每年的增量,數據的訪問量,數據的格式以及數據在線、近線和離線存放的規(guī)則。如果沒有數據規(guī)劃,配置的存儲設備或離線存儲的載體過于冗余,結果不僅是浪費,而且還可能產生以為多備份幾套就會保險的心理,而疏于管理。
沒有數據規(guī)劃的設備配置是盲目的,例如某一檔案館數據總量不足1T B,數字化開展后每年的增量也不超過1T B,數字化的數據除了磁帶、移動硬盤、同時備份幾套光盤之外,又配置了20T B的磁盤陣列,這顯然很不合理。根據檔案館數據量測算,這個磁盤陣列的容量可以用20年,而磁盤陣列價格下降速度很快,所以沒必要過早地預留大的存儲空間。另外,大型網絡數據庫的使用、操作系統(tǒng)、W E B服務器、應用系統(tǒng)和硬件服務器的維護,需要購買相應的服務。
數據規(guī)劃的實施方案是對數據安全的一種操作規(guī)定,包括數據全備、增備、異地備份的操作要求和檢測要求,使檔案館管理人員對數據安全能夠完全自主掌控。數據規(guī)劃應依靠專業(yè)咨詢公司幫助完成,其中包含了數據總量預測、數據存儲方式、數據備份策略、數據安全防范措施、數據遷移方法和突發(fā)極端事件的應對預案。
2.采用技術手段進行事故干擾和報警
在以往發(fā)生服務器故障造成數據丟失的事件,并非缺少備份措施和管理制度,往往是因很多備份設備無人值守,自動執(zhí)行備份,由于電壓、電流不穩(wěn)定或備份軟件的問題難免發(fā)生錯誤,管理人員直到服務器出了故障,數據庫重新安裝,導入備份數據時,才發(fā)現數據有問題,但為時已晚。
將機房所有運行設備,包括數據備份都連上監(jiān)管系統(tǒng),只要一發(fā)生故障就及時采取相應措施并通過短信報警,使管理人員及時趕來檢查、處理,避免造成更大的傷害。例如,檢測系統(tǒng)發(fā)現空調停止運轉,機房溫度達到一個臨界點,立即關閉服務器等設備,并發(fā)出報警短信。
3.從宏觀層面設計檔案信息資源長久保存方案
全國各級檔案館開展的數字化工作產生的信息量已經極其巨大,目前這種各自為政的保管模式隱含了諸多風險。當前社會信息化已經到了大數據時代,各種相應的計算機技術和存儲設備也是日新月異,云計算這種在線分布式數據存儲方式已經在很多行業(yè)應用。如何利用這些新技術解決檔案數字化產生的巨量數據長久保存問題,是否建立一個檔案云,這是需要檔案行政主管部門牽頭研究的項目。在一定的行政區(qū)域中建立一個檔案數據中心,將分散的資源、分散的投入集中在一起,通過強大的技術力量、優(yōu)越的設備條件和先進的管理方式,使得數字資源能夠有效保存。
數字化是建設檔案信息資源體系的必經之路,從宏觀層面決策新技術的應用是規(guī)避風險的途徑。