綜合檔案數(shù)字化制作系統(tǒng)簡(jiǎn)介
V 7.X
【 PDF格式】
隨著國(guó)家對(duì)紙質(zhì)檔案保管、利用的重視力度逐漸增大,每年國(guó)家投入到用于紙質(zhì)檔案材料保管的費(fèi)用也在逐年遞增(包括庫(kù)房、防潮、防火、防蟲(chóng)以及紙質(zhì)檔案的數(shù)字化加工等費(fèi)用),由此衍生了紙質(zhì)檔案數(shù)字化加工這個(gè)行業(yè)。作為檔案行業(yè)基礎(chǔ)上衍生的檔案數(shù)字化加工行業(yè),其特點(diǎn)是在傳統(tǒng)勞動(dòng)密集型行業(yè)基礎(chǔ)上,引入檔案行業(yè)相關(guān)知識(shí)和技術(shù),專門服務(wù)于檔案行業(yè)大批量紙質(zhì)檔案的電子化轉(zhuǎn)換工作。其產(chǎn)生與存在是社會(huì)生產(chǎn)力發(fā)展的必然結(jié)果。隨著和平年代社會(huì)的快速發(fā)展與進(jìn)步,由此產(chǎn)生了大量紙質(zhì)材料作為歷史依據(jù)被歸檔保存,然而現(xiàn)有編制的檔案管理人員數(shù)量極其有限,除了日常實(shí)體檔案的保管之外,根本無(wú)力于電子檔案的收集、采集與轉(zhuǎn)換。因此,為了滿足檔案信息化建設(shè)的需要,需要大量的外部的專業(yè)團(tuán)隊(duì)介入,以最短的時(shí)間、最低的成本投入,來(lái)完成紙質(zhì)檔案的電子化轉(zhuǎn)換工作,從而更好的提高通過(guò)電子檔案快速查詢、利用所帶來(lái)的效率,“至下而上”更進(jìn)一步促進(jìn)社會(huì)生產(chǎn)力的高速發(fā)展。
紙質(zhì)檔案數(shù)字化加工行業(yè)特點(diǎn):
屬于勞動(dòng)密集型行業(yè),故先從組成人員的角度來(lái)看:
1、 數(shù)字化加工人員年齡普遍較低(入世不深、便于管理)。
2、 數(shù)字化加工人員文化程度相對(duì)不高(對(duì)檔案信息的敏感度不高,降低信息安全隱患)。
3、 數(shù)字化加工人員計(jì)算機(jī)水平有限(人員培養(yǎng)需要消耗成本)。
4、 數(shù)字化加工人員流動(dòng)性極大(管理層面、安全層面存在風(fēng)險(xiǎn))。
從市場(chǎng)角度來(lái)看:
1、 社會(huì)需求量很大(檔案保管編制人員有限)。
2、 社會(huì)需求量在逐年遞增(社會(huì)生產(chǎn)力高速發(fā)展的必然結(jié)果)。
3、 可持續(xù)性較強(qiáng)(光柵圖像的電子檔案是實(shí)體檔案的快照,具有相對(duì)同等的法律效應(yīng))。
4、 市場(chǎng)競(jìng)爭(zhēng)越來(lái)越激烈(進(jìn)入門坎較低,加工團(tuán)隊(duì)日益俱增)。
從管理及成本角度來(lái)看:
1、 加工團(tuán)隊(duì)越來(lái)越專業(yè)(經(jīng)過(guò)了多個(gè)項(xiàng)目的經(jīng)驗(yàn)積累)。
2、 加工成本逐漸降低,從而抵消通貨膨脹所帶來(lái)的利潤(rùn)貶值(團(tuán)隊(duì)存在的基礎(chǔ))。
3、 團(tuán)隊(duì)管理、建設(shè)的新思路層出不窮(一人一管法,沒(méi)有太多可復(fù)制的東西)。
從技術(shù)角度來(lái)看:
1、 檔案專業(yè)知識(shí)日積月累(檔案行業(yè)是一個(gè)“包容”的行業(yè),多多少少都會(huì)涉及到各個(gè)行業(yè)的專業(yè)知識(shí)。比如搞訴訟檔案加工,就要清楚有了“送達(dá)回證”意味著可以封卷了)。
2、 軟件技術(shù)水平逐漸提高(涉足各行業(yè)的業(yè)務(wù)檔案越來(lái)越多)。
3、 電子檔案信息安全問(wèn)題迫在眉睫(泄密99%發(fā)生在信息保存和利用這個(gè)環(huán)節(jié),屬于電子檔案管理軟件系統(tǒng)平臺(tái),在信息安全方面的設(shè)計(jì)問(wèn)題。與有無(wú)保密安全資質(zhì)沒(méi)有太大關(guān)系,只是某些同行公司在商業(yè)競(jìng)標(biāo)中設(shè)置的門坎而已,只要企業(yè)注冊(cè)資本夠幾千萬(wàn)都可以搞到,所以并不安全。美國(guó)五角大樓的機(jī)密檔案,頻頻泄密在哪個(gè)環(huán)節(jié)~o~大家都清楚)。
綜上分析,檔案數(shù)字化行業(yè)作為一個(gè)新興行業(yè),其發(fā)展速度之快已遠(yuǎn)遠(yuǎn)超出預(yù)料。其成本投入及利潤(rùn)空間,將與一些傳統(tǒng)行業(yè)平齊甚至趕超(如鋼鐵、石油、冶金等行業(yè)的利潤(rùn)比例,不一定比檔案數(shù)字化行業(yè)高,因此有大批量的房地產(chǎn)開(kāi)發(fā)商轉(zhuǎn)型)。
通過(guò)上面對(duì)檔案數(shù)字化加工行業(yè)現(xiàn)狀的分析,檔案數(shù)字化加工行業(yè)需要一套簡(jiǎn)單、高效、安全的管理與技術(shù)作支撐,在保質(zhì)、保量的完成加工任務(wù)的同時(shí),來(lái)降低成本損耗,提高利潤(rùn)空間。我們圍繞著這個(gè)目的,同時(shí)結(jié)合十幾年的項(xiàng)目經(jīng)驗(yàn),逐漸完善起來(lái)了一套專門用于紙質(zhì)檔案數(shù)字化加工制作的工具軟件產(chǎn)品《綜合檔案加工制作系統(tǒng)》。其軟件特點(diǎn)如下:
1、 設(shè)計(jì)輕巧,便于安裝攜帶
由于檔案數(shù)字化項(xiàng)目的不定時(shí)、不定點(diǎn)、不定人數(shù)的不確定性,因此要求軟件可以快速?gòu)?fù)制、安裝到位,即便只有一個(gè)人也可以立即展開(kāi)工作。(Win7下需要以管理員身份安裝)。
2、 操作簡(jiǎn)單,便于快速上手
由于數(shù)字化加工人員信息化程度不高,因此,在軟件運(yùn)行與使用方面,將復(fù)雜的操作與配置隱藏在“后面”。初次接觸的操作人員可以快速上手、進(jìn)入狀態(tài),而把復(fù)雜的操作及配置,留到后續(xù)的加工過(guò)程中逐步學(xué)習(xí)(循序漸進(jìn)、由淺入深)。如此一來(lái),所有加工人員經(jīng)過(guò)一個(gè)項(xiàng)目后,都有可能成為項(xiàng)目管理人員,來(lái)帶隊(duì)做下一個(gè)項(xiàng)目。這樣將大大減少人員培養(yǎng)的成本,同時(shí)也降低了由于人員流動(dòng)所帶來(lái)的損失。
3、 結(jié)構(gòu)設(shè)計(jì)靈活,適于多種類型檔案
隨著社會(huì)生產(chǎn)力的高速發(fā)展,新興行業(yè)、產(chǎn)業(yè)層出不窮,檔案類別千變?nèi)f化(已經(jīng)不僅僅局限于國(guó)檔局定義的七大門類)。因此,要完成不同類型檔案的數(shù)字化加工任務(wù),需要面對(duì)不同類型檔案的目錄及層次結(jié)構(gòu)(或同時(shí)面對(duì)多種檔案門類結(jié)構(gòu))。故需要軟件可以隨時(shí)修改或更新數(shù)據(jù)庫(kù)字段組成結(jié)構(gòu),以此來(lái)滿足不同項(xiàng)目、不同門類檔案的數(shù)字化加工需求。
4、 批處理能力強(qiáng)大,減少人工耗時(shí)
面對(duì)海量的電子圖像數(shù)據(jù)及著錄的條目數(shù)據(jù),如果全部加工過(guò)程完全由人員逐個(gè)、逐條、逐頁(yè)的手工完成,何談效率。因此,系統(tǒng)提供了大部分完全可以由計(jì)算機(jī)自動(dòng)完成的批處理操作(如圖像的轉(zhuǎn)換合成、條目數(shù)據(jù)批量導(dǎo)入導(dǎo)出的方式來(lái)“合庫(kù)”等等),而加工人員只需把精力放在批處理前后數(shù)據(jù)的準(zhǔn)確性對(duì)比上。
5、 按國(guó)家標(biāo)準(zhǔn)執(zhí)行,降低跑偏幾率
沒(méi)有規(guī)矩不成方圓,檔案數(shù)字化加工行業(yè)亦是如此。國(guó)家檔案局(包括中央檔案館)通過(guò)多年的實(shí)踐和研究,總結(jié)并頒布了紙質(zhì)檔案數(shù)字化加工的技術(shù)規(guī)范,可以說(shuō)是“非?茖W(xué),很有遠(yuǎn)見(jiàn)”。因此,軟件系統(tǒng)完全按照標(biāo)準(zhǔn)中的規(guī)范來(lái)設(shè)計(jì),在實(shí)際實(shí)施過(guò)程中,在技術(shù)層面上防止用戶因?yàn)椤芭芷倍斐傻木薮髶p失。(很多地方檔案館還在掃描多頁(yè)TIFF,并沒(méi)有原始掃描數(shù)據(jù)的概念,更何談原始數(shù)據(jù)備份,如果災(zāi)難出現(xiàn),后果很難預(yù)料。同一份材料,掃描生成的多頁(yè)TIFF文件與PDF文件,哪個(gè)占用的磁盤空間大,哪個(gè)可以加密碼?同一頁(yè)紙,掃描生成的真彩色單頁(yè)TIFF文件與JPG文件,哪個(gè)占用的磁盤空間大?采購(gòu)磁盤存儲(chǔ)硬件需要多花出多少錢?)
6、 自動(dòng)查錯(cuò)糾錯(cuò),提高加工質(zhì)量
“只要是人參與的工作,就一定會(huì)存在出錯(cuò)可能”這個(gè)命題是真命題。在數(shù)字化加工過(guò)程中,有誰(shuí)會(huì)說(shuō)他們一定不會(huì)出錯(cuò)。既然是這樣,何不在軟件設(shè)計(jì)之初,就把它考慮進(jìn)去。讓軟件為其自動(dòng)的判別錯(cuò)誤,甚至糾正錯(cuò)誤,把人員解放出來(lái)。當(dāng)然,計(jì)算機(jī)不是萬(wàn)能的,需要人工干預(yù)的地方也很多,但整體上可以減少人員的大部分工作量(傳統(tǒng)方式的人工查錯(cuò),會(huì)有遺漏,而計(jì)算機(jī)一旦設(shè)置好規(guī)則,則不存在這個(gè)問(wèn)題)。同時(shí),通過(guò)軟件自動(dòng)批處理操作,加大了質(zhì)檢力度,從而保障最終掛接應(yīng)用的數(shù)據(jù)更加準(zhǔn)確(直到目前為止,有哪家單位敢確信,自己的檔案管理系統(tǒng)中掛接的加工數(shù)據(jù)一定沒(méi)問(wèn)題)。
7、 備份數(shù)據(jù)加密,減少安全隱患
國(guó)家檔案局頒布的標(biāo)準(zhǔn)中,只是規(guī)定了加工后的原始數(shù)據(jù)要進(jìn)行備份(包括光盤、硬盤備份),但沒(méi)有要求備份在磁盤中的圖像數(shù)據(jù)是否進(jìn)行加密。設(shè)想一下,如果單位因?yàn)榘峒遥獗P遺失了怎么辦?在檔案進(jìn)館或數(shù)據(jù)報(bào)送過(guò)程中,備份磁盤丟失了怎么辦?被網(wǎng)絡(luò)黑客非法復(fù)制怎么辦?因此,在某些特殊情況下,我們需要把掃描的圖像數(shù)據(jù)進(jìn)行加密,增加一層安全措施。當(dāng)然,在檔案圖像數(shù)據(jù)加密過(guò)程中,要考慮到主要的兩個(gè)因素。一是加密前后文件的磁盤存儲(chǔ)空間不變(即空間沒(méi)有變大)。二是加密單個(gè)圖像文件的時(shí)間,幾乎等于保存該圖像數(shù)據(jù)到文件的時(shí)間(即時(shí)間沒(méi)有多少延遲,本系統(tǒng)初步統(tǒng)計(jì)1小時(shí)加解密10萬(wàn)頁(yè),CPU運(yùn)算速度也要考慮進(jìn)去)。
8、 免費(fèi)復(fù)制升級(jí),便于傳播推廣
通過(guò)廣泛的收集并匯總?cè)珖?guó)各地?cái)?shù)字化團(tuán)隊(duì)遇到的技術(shù)問(wèn)題,將解決方案設(shè)計(jì)到加工軟件之中,從而實(shí)現(xiàn)軟件功能的更新與升級(jí),并將升級(jí)后的加工軟件發(fā)布于網(wǎng)絡(luò),大家又可以免費(fèi)下載使用。如此循環(huán),可以實(shí)現(xiàn)檔案數(shù)字化技術(shù)的提高、普及與推廣,從而保障檔案數(shù)字化行業(yè)的健康、高效、快速的發(fā)展,這也是我們每一個(gè)檔案人的愿望。
前面提到的是檔案數(shù)字化加工軟件的設(shè)計(jì)初衷、理念及愿望,接下來(lái)了解一下軟件具有哪些功能及技術(shù)特點(diǎn)。
1、檔案掃描模塊
 特點(diǎn):
- 通過(guò)快捷鍵操作,快速選擇掃描圖像的顏色、分辨率和文件存儲(chǔ)格式。
- 通過(guò)文件列表可以實(shí)時(shí)的監(jiān)控掃描的圖像是否完整和連續(xù)。
- 通過(guò)圖像預(yù)覽窗口查看掃描圖像的質(zhì)量。
- 用戶可以隨時(shí)自定義操作快捷鍵,以便于提高掃描速度。
- 所有操作完全可以由鍵盤操作控制來(lái)完成,無(wú)需太多鼠標(biāo)干預(yù)。
- 通過(guò)文件加前綴或后綴名區(qū)分拼圖文件,按字母順序排序。
- 通過(guò)自定義掃描框架,使掃描儀設(shè)備只掃描選中框架區(qū)域。
- 通過(guò)掃描快捷鍵或菜單,指定掃描后文件的所在位置(F5、F6、F7鍵)。
- 自動(dòng)獲取掃描儀硬件支持的功能信息(CAP),便于檢查掃描儀對(duì)Twain的支持力度。
- 通過(guò)在文件列表中選中文件,來(lái)執(zhí)行文件刪除或批量重命名等操作。
- 支持三種文件存儲(chǔ)模式(本地磁盤、FTP服務(wù)器端、檔案數(shù)字化服務(wù)器端),來(lái)存放掃描文件,完全內(nèi)存中壓縮,沒(méi)有本地臨時(shí)文件存儲(chǔ)。

【操作過(guò)程】只需兩步。根據(jù)紙張上是否存在紅頭、紅章,先按下F2或F4鍵,來(lái)選擇指定的顏色類型、文件格式。然后,按下F5(或F6、F7)鍵啟動(dòng)掃描過(guò)程。
2、圖像處理模塊
 特點(diǎn):
- 通過(guò)文件夾列表,快速選中文件存放目錄,同時(shí)打開(kāi)圖像文件。
- 只要檔案圖像信息被用戶處理過(guò),系統(tǒng)會(huì)自動(dòng)保存圖像信息。
- 圖像優(yōu)化處理過(guò)程,可由鍵盤和鼠標(biāo)的組合操作來(lái)完成。
- 自動(dòng)化處理操作,可大大減少了每一頁(yè)電子檔案的處理時(shí)間。
- 用戶可以隨時(shí)自定義操作快捷鍵,以便于提高圖像處理速度。
- 真彩色圖像糾偏后,圖像內(nèi)容及邊界不再存在“鋸齒”現(xiàn)象。
- 支持通過(guò)掩碼圖像處理及合成技術(shù),來(lái)實(shí)現(xiàn)當(dāng)前圖像的高清化處理。
- 通過(guò)在文件列表中選中文件,來(lái)執(zhí)行文件刪除或批量重命名等操作。
- 支持三種文件存儲(chǔ)模式(本地磁盤、FTP服務(wù)器端、檔案數(shù)字化服務(wù)器端),來(lái)獲取及保存文件數(shù)據(jù)。完全內(nèi)存中壓縮/解壓縮,沒(méi)有本地臨時(shí)文件存儲(chǔ)。
3、干部檔案圖像高清處理模塊
 特點(diǎn):
- 雙路徑下文件存儲(chǔ)。目標(biāo)路徑下存放高清處理后的圖像文件。
- 同步移動(dòng)、同步縮放,便于高清處理前后圖像的比對(duì)。
- 支持圖像底色替換。用戶可以指定任意顏色為圖像的背景色。
- 支持局部高清處理。用戶可選中圖像中某個(gè)區(qū)域,然后對(duì)該區(qū)域圖像進(jìn)行清晰化處理。
- 支持掩碼圖像合成。對(duì)某些小斑點(diǎn)較多的彩色圖像,可以通過(guò)對(duì)其掩碼圖自動(dòng)去斑點(diǎn),然后再合成方式,來(lái)實(shí)現(xiàn)圖像的清晰化處理。

【備注】如果來(lái)源圖像為黑白二值圖像(非真彩色圖),軟件會(huì)自動(dòng)將其轉(zhuǎn)換為真彩色圖像,然后再進(jìn)行清晰化處理。
4、工程圖紙拼接模塊
 特點(diǎn):
- 用戶可以添加多個(gè)拼接圖像碎片,沒(méi)有數(shù)量限制。
- 支持底層畫布尺寸調(diào)整。用戶可隨時(shí)根據(jù)碎片數(shù)量來(lái)調(diào)整畫布的大小。
- 仿PhotoShop軟件的圖像旋轉(zhuǎn)任意角度操作方式。
- 拼接后保存圖像,旋轉(zhuǎn)的碎片圖像邊界無(wú)“鋸齒”現(xiàn)象。
- 支持拼接碎片定位。通過(guò)選中縮略圖中的碎片圖像,來(lái)定位畫布上的實(shí)際拼接碎片。
- 支持碎片圖像透明合成,多圖像層間疊加圖像透明合成。

5、圖像文件批處理模塊
 特點(diǎn):
- 用戶指定文件存放的來(lái)源及目標(biāo)根路徑,系統(tǒng)會(huì)自動(dòng)完成海量文件數(shù)據(jù)的批處理操作。
- 動(dòng)態(tài)顯示處理結(jié)果,便于用戶發(fā)現(xiàn)問(wèn)題。
- 支持批處理多線程任務(wù)的停止(終止)操作。
- 處理結(jié)果列表可導(dǎo)出到文本文件,以便于用戶及時(shí)的改錯(cuò)。

6、檔案門類維護(hù)模塊
 特點(diǎn):
- 系統(tǒng)內(nèi)置了全國(guó)各檔案館通用的檔案門類數(shù)據(jù)庫(kù)結(jié)構(gòu)模板。用戶通過(guò)選擇檔案門類結(jié)構(gòu)模板庫(kù)的方式來(lái)創(chuàng)建檔案門類。然后,在各門類結(jié)構(gòu)基礎(chǔ)上,簡(jiǎn)單修改數(shù)據(jù)庫(kù)字段結(jié)構(gòu)。
- 支持多種檔案門類的創(chuàng)建、修改和維護(hù)功能。
- 采用分層目錄結(jié)構(gòu),建立檔案門類與其對(duì)應(yīng)的檔案目錄表間的層次關(guān)系。
- 采用表格方式列舉出檔案目錄庫(kù)的字段組成結(jié)構(gòu)。用戶可直接進(jìn)行修改,改后立即生效。
- 支持檔案門類結(jié)構(gòu)的導(dǎo)入和導(dǎo)出功能,方便用戶移植檔案門類結(jié)構(gòu),統(tǒng)一所有條目著錄終端的數(shù)據(jù)庫(kù)結(jié)構(gòu)。
【備注】在導(dǎo)出的門類結(jié)構(gòu)文件中包含用戶設(shè)置的檔號(hào)規(guī)則信息。
7、檔案目錄著錄模塊
 特點(diǎn):
- 各層目錄之間的層次結(jié)構(gòu)清晰,出錯(cuò)幾率大大降低。
- 支持多種檔案門類同時(shí)著錄。用戶隨時(shí)可以選擇準(zhǔn)備著錄的檔案門類。
- 著錄方式為表格方式,數(shù)據(jù)著錄操作比較直觀。
- 著錄數(shù)據(jù)時(shí)可以完全使用鍵盤進(jìn)行操作,著錄速度很快。
- 數(shù)據(jù)字典的關(guān)聯(lián),用戶經(jīng)常著錄的內(nèi)容可以存于字典之中,再次著錄時(shí)只需選擇即可。
- 隱藏?zé)o需著錄字段(或內(nèi)容完全相同的字段),使著錄界面變得十分簡(jiǎn)潔、重點(diǎn)突出,降低出錯(cuò)幾率。
- 自動(dòng)填充字段內(nèi)容。用戶可以指定某一列的填充內(nèi)容,由系統(tǒng)來(lái)完成填充操作(其填充的內(nèi)容可以是連續(xù)遞增的數(shù)字,或內(nèi)容相同的文本)。
- 自動(dòng)生成或批量更新“歸檔號(hào)”。著錄完畢的條目數(shù)據(jù),符合檔案管理軟件掛接要求。
- 級(jí)聯(lián)字段自動(dòng)填充。用戶可以定義卷內(nèi)目錄中的某個(gè)字段,與案卷目錄中某個(gè)字段的數(shù)據(jù)內(nèi)容相同,以此來(lái)建立對(duì)應(yīng)關(guān)系,稱這兩個(gè)字段是級(jí)聯(lián)字段。在著錄過(guò)程中,系統(tǒng)自動(dòng)提取案卷目錄中級(jí)聯(lián)字段的數(shù)據(jù)內(nèi)容,然后填充到卷內(nèi)目錄中與之關(guān)聯(lián)的字段中。
- 支持多字段列排序,方便著錄人員觀察條目之間的順序關(guān)系。
- 支持Excel、Access文件數(shù)據(jù)的導(dǎo)入與導(dǎo)出,方便數(shù)據(jù)遷移、匯總及階段性備份工作。
- 支持從系統(tǒng)粘貼板中復(fù)制或粘貼條目數(shù)據(jù)?梢栽贓xcel文件中選中一塊區(qū)域復(fù)制,然后到著錄條目的末尾行,粘貼從Excel中復(fù)制的數(shù)據(jù)。或?qū)⑦x中的條目數(shù)據(jù)行復(fù)制,粘貼到Excel文件的單元格中。
- 支持組合條件查詢方式的打印操作。同時(shí)也可以選中多條記錄行,直接進(jìn)行打印。
- 允許用戶自定義打印表單。用戶可以自行設(shè)計(jì)打印表單樣式。

8、打印模板設(shè)計(jì)模塊
 特點(diǎn):
- 操作直觀,通過(guò)鼠標(biāo)拖放圖元來(lái)改變生成表單的樣式效果。
- 通過(guò)可編輯圖元綁定數(shù)據(jù)庫(kù)字段的方式,加載檔案目錄數(shù)據(jù)。
- 支持表單和表格兩種類型模板的創(chuàng)建與設(shè)計(jì)。
- 支持打印模板的導(dǎo)入和導(dǎo)出,以便于打印表單樣式的統(tǒng)一。
9、數(shù)據(jù)校對(duì)掛接模塊
 特點(diǎn):
- 支持多檔案門類數(shù)據(jù)校對(duì)。系統(tǒng)為每個(gè)檔案門類,單獨(dú)提供校對(duì)配置信息的數(shù)據(jù)庫(kù)存儲(chǔ)。
- 原文與條目的對(duì)應(yīng)關(guān)系比較直觀。用戶可以選擇原文目錄,來(lái)查看匹配的數(shù)據(jù)條目,或通過(guò)選擇條目來(lái)查看匹配的原文。
- 原文圖像內(nèi)容級(jí)校對(duì)。用戶可以點(diǎn)擊文件列表中的文件,來(lái)打開(kāi)瀏覽掃描原文。通過(guò)原文中的內(nèi)容,來(lái)判斷匹配的條錄記錄是否著錄正確。
- 系統(tǒng)輔助自動(dòng)校對(duì)。系統(tǒng)隱藏了復(fù)雜的檢測(cè)校對(duì)過(guò)程,用戶只需根據(jù)實(shí)際的操作邏輯,選擇相應(yīng)的操作按鈕,即可自動(dòng)完成校對(duì)任務(wù)。
- 以錯(cuò)誤列表方式顯示校對(duì)結(jié)果。用戶可以選中列表中的錯(cuò)誤記錄,定位到原文或檔案目錄上,分析鑒別錯(cuò)誤原因,及時(shí)糾正錯(cuò)誤。
- 采用“原文表”方式存儲(chǔ)掛接后條目。系統(tǒng)完成自動(dòng)掛接操作后,會(huì)在數(shù)據(jù)庫(kù)的原文表中產(chǎn)生掛接原文記錄。在后續(xù)的數(shù)據(jù)備份(光盤制作)制作完畢后,導(dǎo)出的光盤Access數(shù)據(jù)庫(kù)中包含有中文字段的原文表,其主鍵字段為卷內(nèi)級(jí)檔號(hào)(或文件級(jí)檔號(hào))。
- 系統(tǒng)單獨(dú)為每個(gè)檔案門類的原文路徑設(shè)置及檔案路徑規(guī)則配置進(jìn)行保存。并且不同的數(shù)據(jù)類型(原始數(shù)據(jù)或成品數(shù)據(jù))分別進(jìn)行保存。以此來(lái)保障各檔案門類、各種數(shù)據(jù)類型,在校對(duì)時(shí)不會(huì)產(chǎn)生數(shù)據(jù)來(lái)源混亂現(xiàn)象。
10、檔案數(shù)據(jù)備份模塊
 特點(diǎn):
- 支持多檔案門類數(shù)據(jù)備份操作。用戶可為不同檔案門類創(chuàng)建數(shù)據(jù)備份信息集。
- 支持三種類型光盤描述符:VCD、DVD、自定義類型。其中自定義類型的光盤描述符,可用來(lái)創(chuàng)建硬盤數(shù)據(jù)備份包(可以是幾十個(gè)GB)。
- 每個(gè)檔案門類下可以創(chuàng)建多個(gè)不同類型的光盤描述符。
- 支持兩種類型數(shù)據(jù)的備份,原始數(shù)據(jù)和成品數(shù)據(jù)。
- 無(wú)需指定備份數(shù)據(jù)的硬盤存放信息。不論是原始數(shù)據(jù)的備份工作,還是成品數(shù)據(jù)的備份工作。其文件存放于磁盤路徑信息及路徑規(guī)則設(shè)置情況,是在數(shù)據(jù)校對(duì)模塊中指定的,并保存到數(shù)據(jù)庫(kù)字段中。因此在實(shí)際的數(shù)據(jù)備份操作中,用戶無(wú)需關(guān)心數(shù)據(jù)的來(lái)源情況。
- 通過(guò)向已經(jīng)定義的光盤包(光盤描述符)中,移入移出檔案條目數(shù)據(jù)的方式,來(lái)完成備份數(shù)據(jù)包的邏輯劃分過(guò)程。
- 以標(biāo)尺方式顯示數(shù)據(jù)容量。在實(shí)際劃分備份數(shù)據(jù)包時(shí),用戶可以通過(guò)觀察標(biāo)尺上顯示的容量刻度,來(lái)判斷是否需要再添加條目數(shù)據(jù),還是移出一部份條目數(shù)據(jù)。
- 支持加密備份數(shù)據(jù)。備份數(shù)據(jù)加密是原文圖像級(jí)加密,而非數(shù)據(jù)庫(kù)條目級(jí)加密。也就是說(shuō),系統(tǒng)會(huì)對(duì)每一頁(yè)掃描圖像文件的內(nèi)容進(jìn)行加密,而在實(shí)際瀏覽時(shí),輸入正確密鑰才能解密瀏覽圖像文件的內(nèi)容。此加密操作只針對(duì)原始掃描圖像(單頁(yè)TIFF和JPG),而成品數(shù)據(jù)(多頁(yè)TIFF和PDF)不支持加密。
- 即時(shí)備份,延遲制作。就是說(shuō)用戶可以隨時(shí)創(chuàng)建數(shù)據(jù)備份包(創(chuàng)建光盤描述符,添加條目數(shù)據(jù)),軟件系統(tǒng)是在邏輯上對(duì)用戶劃分的數(shù)據(jù)備份包進(jìn)行保存,而非實(shí)際原文在磁盤上的存儲(chǔ)。當(dāng)需要制作成備份數(shù)據(jù)包時(shí),系統(tǒng)會(huì)根據(jù)用戶指定的磁盤路徑,創(chuàng)建并復(fù)制檔案文件及數(shù)據(jù)庫(kù)條目到該磁盤路徑下。

【備注】只有在數(shù)據(jù)校對(duì)模塊中進(jìn)行了“自動(dòng)掛接”操作后,才能在光盤數(shù)據(jù)備份中獲取到實(shí)際數(shù)據(jù)磁盤容量。才能實(shí)際制作過(guò)程中,復(fù)制原文到目標(biāo)文件夾下。
11、檔案數(shù)據(jù)備份模塊
 特點(diǎn):
- 可脫離軟件環(huán)境,在光盤上單獨(dú)運(yùn)行。無(wú)需安裝檔案數(shù)字化系統(tǒng)或其它軟件。
- 可以直接查詢、定位檔案條目數(shù)據(jù)。光盤瀏覽器程序支持組合條件查詢檔案條目數(shù)據(jù)。
- 支持PDF文件的直接瀏覽。無(wú)需安裝Adobe PDF Reader,光盤瀏覽器程序可直接加載PDF文件格式的檔案數(shù)據(jù)。
- 支持瀏覽加密后的圖像數(shù)據(jù)。用戶只要輸入一次正確的數(shù)據(jù)加密密鑰,便可以瀏覽全部的加密的掃描原文。
- 支持自解密批處理過(guò)程。光盤瀏覽器程序,可以自動(dòng)批量解密光盤中的圖像文件,到本地的磁盤文件夾下,用戶只需輸入正確的解密密鑰。
- 與檔案管理系統(tǒng)軟件無(wú)縫連接。光盤數(shù)據(jù)庫(kù)中包含中文字段的檔案目錄及原文表,并且以檔號(hào)作為主鍵字段,關(guān)聯(lián)各個(gè)層次的數(shù)據(jù)庫(kù)表集。在實(shí)際掛接到檔案管理軟件的過(guò)程中,對(duì)于專業(yè)的技術(shù)人員而言,只需要一兩條SQL語(yǔ)句,便可以完成全部的掛接操作。最后,將檔案圖像文件復(fù)制到本地磁盤上,檔案軟件指定的文件夾下即可。
【備注】采用專門的“原文表”方式,來(lái)存放掛接原文記錄的數(shù)據(jù)庫(kù)設(shè)計(jì),是當(dāng)今檔案管理軟件設(shè)計(jì)中比較通用的方式,此種方式優(yōu)勢(shì)很多(具體技術(shù)問(wèn)題,可以去查資料)。如果您的檔案管理系統(tǒng)(或平臺(tái)),不是采用這種方式掛接掃描原文,建議您可以去升級(jí)檔案管理軟件了。
12、檔案路徑
如果說(shuō)唯一可以描述一條無(wú)重復(fù)檔案條目的關(guān)鍵字段是“檔號(hào)”,則唯一可以描述一件電子檔案圖像文件無(wú)重復(fù)存放的則是其文件夾名。那么存放掃描原文的文件夾有哪些特點(diǎn)?接著分析一下。
磁盤文件存放的路徑組成形式:盤符+文件夾名+文件名。例如“C:\AAA\001.jpg”,表示盤符=“C:”、文件夾=“AAA”、文件名=“001.jpg”。由于文件夾可以多層,比如“C:\AAA\BBB\CCC\001.jpg”,則文件夾=“AAA\BBB\CCC\”。
在此基礎(chǔ)之上,如果把文件夾邏輯上劃分為兩種類型,分別為“絕對(duì)路徑”文件夾和“檔案路徑”文件夾。那么上例中的路徑可以變化為“C:\掃描原文\2013\Y\005\001.jpg”,其中,絕對(duì)路徑文件夾=“掃描原文\”,檔案路徑文件夾=“2013\Y\005\”。
如此設(shè)計(jì)之后,我們的掃描原文存放的磁盤路徑,可以隨意更改盤符和絕對(duì)路徑文件夾,其下檔案路徑文件夾的結(jié)構(gòu)不會(huì)發(fā)生任何變化。只要結(jié)構(gòu)化后檔案路徑文件夾,確保其不會(huì)發(fā)生重復(fù)即可。為避免文件夾重復(fù)(互相覆蓋)最簡(jiǎn)單的方法,就是使用數(shù)據(jù)庫(kù)中的檔號(hào)作為文件夾名。條目不重復(fù),文件夾名也不會(huì)重復(fù)。上例中可以變換為這樣的“C:\掃描原文\2013-Y-005\001.jpg”。到此,原文檔案存放的磁盤路徑,可以在邏輯上劃分出檔案路徑。
檔號(hào)是如何生成的?是根據(jù)檔號(hào)規(guī)則,從數(shù)據(jù)庫(kù)字段中提取出數(shù)據(jù),經(jīng)過(guò)與“分隔符”的順序組合而產(chǎn)生的。只要確定數(shù)據(jù)庫(kù)中組成檔號(hào)的字段存在數(shù)據(jù)內(nèi)容,則檔號(hào)就有會(huì)產(chǎn)生并存在。
既然檔號(hào)可以這樣產(chǎn)生,那么檔案路徑是否也可以如此方式產(chǎn)生?答案是肯定的。上例中可以變換為這樣的“C:\掃描原文\2013\Y\005\001.jpg”。檔案路徑=“2013\Y\005\”。舉一反三,檔案路徑的產(chǎn)生規(guī)則與檔號(hào)的生成規(guī)則可以不同。如此,檔案路徑便具有了自主的獨(dú)立性,同時(shí)又具有了可規(guī)則化配置的特點(diǎn)(數(shù)據(jù)校對(duì)模塊中的檔案路徑規(guī)則設(shè)置,就是充分利用這一點(diǎn),來(lái)實(shí)現(xiàn)軟件自動(dòng)校對(duì)條目和原文)。
檔案路徑:是根據(jù)檔案條目字段的數(shù)據(jù)內(nèi)容,在指定“絕對(duì)路徑”文件夾下產(chǎn)生的“相對(duì)路徑”分層文件夾。是描述一件電子檔案圖像文件的無(wú)重復(fù)的唯一存在。
檔案路徑的理解,貫穿于整個(gè)檔案數(shù)字化加工軟件系統(tǒng),是區(qū)別于其它文字材料掃描的主要原因。從檔案掃描開(kāi)始,到數(shù)據(jù)校對(duì)掛接,都離不開(kāi)對(duì)檔案路徑概念的理解。因此,花較長(zhǎng)的篇幅來(lái)描述檔案路徑的概念。
如果說(shuō)歸檔號(hào)是目錄級(jí)檔案管理系統(tǒng)軟件應(yīng)用的必然條件,那么檔案路徑則是基于掃描原文級(jí)采集、加工、轉(zhuǎn)換合成乃至管理利用的必然條件。當(dāng)然有人會(huì)說(shuō),我們用檔號(hào)直接作為文件夾名(或用64位數(shù)字編碼作為文件夾名絕對(duì)不重復(fù)),也可以實(shí)現(xiàn)數(shù)字化加工的全部過(guò)程,沒(méi)錯(cuò)“坐家”說(shuō)得對(duì)(但如果要考慮到采集、轉(zhuǎn)換的效率,及人員操作出錯(cuò)誤的幾率,及人員改錯(cuò)的成本。那么幾百萬(wàn)頁(yè)的掃描加工下來(lái),看看誰(shuí)的成本最低就一目了然了)。從檔案路徑組合成檔號(hào),很容易且很準(zhǔn)確。但要將檔號(hào)拆分成檔案路徑,較費(fèi)時(shí)且存在拆分錯(cuò)誤(如K1?2005.001和2005-Y-001—017)。
檔案數(shù)字化加工軟件,在保證加工質(zhì)量的前提下,最大限度的降低人工成本,提高個(gè)體在單位時(shí)間內(nèi)的生產(chǎn)效率,降低出錯(cuò)幾率,減少改錯(cuò)成本,從而降低項(xiàng)目整體的加工成本、提高項(xiàng)目的利潤(rùn)率。這是本軟件系統(tǒng)開(kāi)發(fā)初衷,而非技術(shù)上的“炫酷”。
歡迎廣大檔案數(shù)字化加工團(tuán)隊(duì)用戶,提出更好的建議、更有創(chuàng)意的新思路,我們可以洽談與合作。 |