工序一 逐頁點算版面,發現問題如缺頁、塗污、裁邊等情況,記錄並反饋,以便補充數據。
工序二 掃描版面,根據報紙情況,採用300dpi進行黑白、灰度、彩色掃描,然後對版面進行切割及鏈接﹐以方便檢索。
工序三 數據校對,對已經掃描的報紙文章,逐篇進行自動識別,再採用「雙錄雙校」工藝加以人工校對,發現錯字及時更正。錯誤率要求控制在萬分之三以內。
工序四 製作標引,為方便分類查找,對版面名稱、版次、標題、作者、發表時間、廣告內容和分類等進行標引。
工序五 對1997年以後報紙已有的電子版數據進行格式轉換及補充缺失數據。
|