現代資訊科技是以人工智慧、量子資訊、行動通訊、物聯網、區塊鏈、大資料為代表的新一代資訊科技透過和傳統檔案管理不斷碰撞、交叉、融合,形成技術應用過程中的火花、成果和動能。
在當前市場環境下,資訊產業成為世界各國,特別是發達國家競相投資,發展性的產生部門。資訊科技的廣泛應用使資訊的重要生產要素和戰略資源的作用得以發揮,資訊科技也代表著當今先進生產力的發展方向,使人們能更高效地進行資源最佳化配置,從而推動傳統服務和生產不斷升級,提高社會執行效率。
暢飛揚大資料檢測研究中心專注於電子檔案、檔案資料和圖文影象的識別與檢測的研究及服務。
日前暢飛揚大資料檢測研究中心釋出《2021年檔案數字化後的質量檢測行業報告》,資料顯示,其2021年服務檢測的8000萬張/幅影像中,影象明暗度合格率僅為77%,影象曝光合格率也僅為80%。
分析顯示其主要原因是供應商在數字化作業過程中,缺乏及時檢查和質量把控,追求效率,也缺少相應的質量管控工具,人為的檢查難以做到肉眼長時間保證良好的狀態。在掃描器長時間的運轉作業過程中,產生振動致使數值發生偏差等因素。
1、資料重複複製率
質量檢測結果較為嚴重的是資料重複複製率竟高達15%!在利益和效率的驅使下,個別缺乏責任感的外包服務商或崗位工作人員將資料複製充數,這種以追求數量而不顧及質量的做法,在目前普遍採用人工抽檢模式下,給業主方及外包服務商在資料質量方面埋下了諸多隱患。
對於業主方而言,日後在資料管理及利用方面,造成區域性資料缺失錯亂,以致後續還需投入經費重新補做,給職能管理部門的政績形象造成負面影響;對於外包服務商而言,因數字化加工過程質量管控不夠及時嚴謹,導致最後業主方驗收質量不達標,工人工資發了質量問題依然存在最後兜底的還是企業,大大增加了企業人工成本和延長專案工期。
2、影像傾斜合格率和影像裁剪合格率
影像傾斜合格率和影像裁剪合格率為91%及92%。中標服務企業在數字化過程中,作業的裝置在所難免的發生顛簸,質量檢查崗位人員也無法張張頁頁檢查到位,裁剪崗位人員對裁剪值和分辨數值難以統一把握,完全憑個人主觀判斷,致使後期驗收過程中不達標和返工,來回地辦理領取搬運原始資料核對、修正等工作,也相應增加了相關方的管理投入和成本支出。
報告顯示在影像倒置率的檢測中合格率達到99.9%。在2021年檢測服務中,從8000萬張/幅的影像中檢測出來的倒置影像有八萬張/幅以上。分析認為,發生這種錯誤的主要原因是:中標服務企業在整理數字化過程之中,未對檔案進行逐一排查,按規範和流程操作,一味追求快速成件的做法所致。
3、資料統計準確率
綜合質量檢測反映出資料統計準確率僅為95%。在海量資料中,對各種型別檔案和幅/張以及條目要做到百分百的清算不是一件容易的事。一方面也體現出一些檔案服務企業在為業主方服務的過程中存在將數量調高調整的存在,抱有業主方是在驗收時以抽檢方式,不可能全部抽檢到的僥倖心理。也使得業主方遭受經濟損失和後續資料利用及管理上都存在一定混亂錯誤。
4、資料邏輯準確率
檢測分析結果顯示,檔案資料邏輯規則準確率為93%,涉密檔案、敏感資訊等內容的篩查篩出1%的檔案涉及秘密和敏感資訊內容。結果顯示邏輯規則發生錯誤主要是“張冠李戴”,漏錄和錯錄及少錄等原因。面對龐大的電子資料檔案有清末民初以及新中國成立以來的檔案檔案。
5、資料安全性
檔案局/館以及政府各部門管理檔案的專職人員少,專業的編研人手不足,且工作量大,難以從海量的原始文件中逐一審閱排查哪一些是涉密檔案,在原來保管條件有限下,普通檔案與涉密檔案混搭存放管理等多種因素造成的原因。檢測報告顯示八千萬張/幅的檢測數量中涉及秘密及敏感資訊的就高達80000張/幅以上。有些秘密檔案甚至是絕密檔案尚未解密,若是洩密將是嚴重後果!
△暢飛揚“暢影雲檢”機器人
暢影雲檢6大優勢
01
幅面統計:按幅面大小統計數量並自動折算,及時掌握階段數字化成果數量,方便進度管理。
02
影像檢測:支援圖片數量、圖片明亮度、容量合規性、解析度正確性、格式合規性等多項檢測、可按需點選檢測項,無人值守模式下,自動檢測作業。
03
檢測報告模板自定義:可根據不同的使用者物件及特定元素要求,自定義輸出檢測報告模板,更具針對性地呈現檢測結果。
04
資料批次修正:針對檢測結果,直接定位問題資料所在路徑,快速修正,批次處理問題資料直至達標。
05
密級檢測及內容篩查:支援對掃描件及目錄資料內容進行密級檢測,對特定敏感內容進行篩查標識。
06
智慧化檢測:自動盲檢篩查黑邊、偏斜影象,高效自動核查數字化成果資料掛接準確性、完整性、規範性,快速定位資料錯誤頁面。
近年來隨著數字化城市的推進,從事檔案數字化企業猶如雨後春筍爆發式增長,但行業亦是參差不齊。一些企業在缺少技術與專業服務能力的情況下,一味追求效率和效益,導致檔案數字化成果問題百出;一些業主方和檔案服務企業缺乏有效的管控和專業的管理隊伍,在後期日常管理和利用上也是發現數據缺失,混亂等諸多問題。
基於上述情況,暢飛揚大資料檢測研究中心和暢影雲檢檔案資料智檢儲存機器人在其檢測服務中得出上述結論。
——深圳市暢飛揚大資料檢測研究中心首席資料研究員 楊楊