檔案的最小單位是文件的件(頁)數(shù),建立文件級目錄數(shù)據(jù)庫是一項基礎(chǔ)性工作,建立完整、準(zhǔn)確的文件級目錄數(shù)據(jù)庫,可以有效地利用計算機(jī)實(shí)現(xiàn)檔案以件(頁)為基本單位的管理,提高檔案的查全率、查準(zhǔn)率。一個高質(zhì)量的數(shù)據(jù)庫中的數(shù)字信息至少要達(dá)到四項質(zhì)量標(biāo)準(zhǔn),即數(shù)據(jù)的準(zhǔn)確性,數(shù)據(jù)項目和內(nèi)容的完整性,數(shù)據(jù)的規(guī)范性和數(shù)據(jù)的穩(wěn)定性。為此,應(yīng)首先制定目錄數(shù)據(jù)庫數(shù)據(jù)規(guī)范,包括數(shù)據(jù)字段長度、字段類型、字段內(nèi)容要求(值域)等。目錄數(shù)據(jù)庫數(shù)據(jù)規(guī)范的制定應(yīng)符合《檔案著錄規(guī)則》(DA/T18)對檔案著錄的要求。在紙質(zhì)檔案目錄準(zhǔn)備與目錄數(shù)據(jù)庫建設(shè)工作中均應(yīng)嚴(yán)格遵守。
選擇數(shù)據(jù)庫時應(yīng)考慮建立在計算機(jī)環(huán)境下,能夠有效、準(zhǔn)確、完整、安全,并可以上網(wǎng)利用的格式,且此格式可轉(zhuǎn)換為通用數(shù)據(jù)格式,以便于數(shù)據(jù)交換。如:在目錄建庫時可以選擇能直接或間接通過XML文件格式進(jìn)行數(shù)據(jù)交換的數(shù)據(jù)庫類型。
科學(xué)合理地設(shè)計數(shù)據(jù)庫結(jié)構(gòu)應(yīng)包括確定檔案目錄的著錄項、必輸項和選輸項、字段類型、長度和值域范圍等內(nèi)容。數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計還應(yīng)特別注意保持檔案的內(nèi)在聯(lián)系,有利于紙質(zhì)檔案數(shù)字化成果的管理和利用。
檔案保管機(jī)構(gòu)的檔案來自各個立檔單位,檔案目錄等檢索工具是由文檔等人員在檔案管理規(guī)范標(biāo)準(zhǔn)指導(dǎo)下形成的。但是,由于文檔人員變動頻繁、檔案業(yè)務(wù)指導(dǎo)面多線長,加之個別文件形成時的先天不足或是檔案整理工作的缺失給檔案著錄帶來諸多問題。因此,在進(jìn)行目錄數(shù)據(jù)錄入前,如確有必要,可以結(jié)合實(shí)際拋開原有的紙質(zhì)檔案案卷目錄、文件目錄,依據(jù)整理糾正后的檔案實(shí)體,按照《檔案著錄規(guī)則》的要求據(jù)實(shí)著錄,把題名不反映主題、目錄與實(shí)體不符等一系列問題一并處理。
按照檔案著錄的結(jié)果進(jìn)行文件目錄及案卷目錄數(shù)據(jù)的規(guī)范輸入。此外,還應(yīng)將紙質(zhì)檔案數(shù)字化前處理工作中對紙質(zhì)檔案目錄進(jìn)行修改、補(bǔ)充的備注結(jié)果一并錄入數(shù)據(jù)庫,形成準(zhǔn)確、完整的目錄數(shù)據(jù)。
目錄數(shù)據(jù)的規(guī)范錄入應(yīng)滿足四方面需要:
一是準(zhǔn)確,各著錄項數(shù)據(jù)輸入準(zhǔn)確,符合檔案著錄要求。可以采用單機(jī)或雙機(jī)錄入目錄數(shù)據(jù),通過人工校對或軟件自動校對錄入結(jié)果,以確保目錄數(shù)據(jù)錄入的準(zhǔn)確性。為有效降低出錯率,推薦采用雙機(jī)錄入的方法提高數(shù)據(jù)質(zhì)量。
二是完整,文件題名、責(zé)任者、時間等必輸項無遺漏,并能夠滿足檔案檢索的需要。
三是檔案出庫、前處理、掃描等數(shù)字化加工階段利用的字段無遺漏。
四是數(shù)據(jù)錄入、校對、質(zhì)檢、驗收、交接等標(biāo)明責(zé)任的字段自動生成。
采用計算機(jī)自動校對與人工校對相結(jié)合的方式,對目錄數(shù)據(jù)的質(zhì)量進(jìn)行檢查,包括著錄項目的完整性、著錄內(nèi)容的規(guī)范性和準(zhǔn)確性等。發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)及時進(jìn)行修改或重錄。
為確保數(shù)據(jù)錄人質(zhì)量,目錄數(shù)據(jù)的檢查可以全宗的一個或多個目錄為單元,對條目數(shù)量及其著錄項內(nèi)容的準(zhǔn)確性進(jìn)行逐條、逐項檢查。
能夠采用計算機(jī)自動檢驗的項目應(yīng)采用計算機(jī)自動檢驗的方式進(jìn)行100%檢驗,檢驗合格率應(yīng)為100%。對于無法用計算機(jī)自動檢驗的項目,可根據(jù)情況以件或卷為單位采用抽檢的方式進(jìn)行人工檢驗。
檢查完成后,填寫《數(shù)據(jù)錄入工作單》,示例見表:
文章來源:《紙質(zhì)檔案數(shù)字化的流程與方法》