三門網站建設百度搜一搜
本發(fā)明涉及了一種基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng)及方法,該系統(tǒng)的發(fā)票信息采集單元采集發(fā)票圖片信息數(shù)據(jù),OCR圖像識別單元基于OCR圖像識別技術并結合人工智能深度學習算法對發(fā)票圖片信息數(shù)據(jù)進行識別讀取以獲得OCR圖像識別結果,發(fā)票信息驗證處理單元對OCR圖像識別結果的發(fā)票類型進行鑒別并在鑒別結果為增值稅發(fā)票時自動調用稅務局增值稅發(fā)票真?zhèn)尾轵炂脚_進行真?zhèn)尾轵?#xff0c;發(fā)票信息存儲管理單元存儲鑒別結果為非增值稅發(fā)票的OCR圖像識別結果同時將查驗結果為真的增值稅發(fā)票的OCR圖像識別結果進行重復歸集核查后進行相應存儲,發(fā)票信息分類展示單元對發(fā)票信息數(shù)據(jù)進行分類展示處理,綜合地實現(xiàn)發(fā)票信息數(shù)據(jù)的采集、識別、查驗、處理與存儲的全過程。
1 .一種基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于,包括依次連接的發(fā)票信息采集單元、OCR圖像識別單元、發(fā)票信息驗證處理單元、發(fā)票信息存儲管理單元和發(fā)票信息分類展示單元,所述發(fā)票信息采集單元采集發(fā)票圖片信息數(shù)據(jù),所述OCR圖像識別單元基于OCR圖像識別技術并結合人工智能深度學習算法對所述發(fā)票圖片信息數(shù)據(jù)進行識別讀取以獲得OCR圖像識別結果,所述發(fā)票信息驗證處理單元對所述OCR圖像識別結果的發(fā)票類型進行鑒別并在鑒別結果為增值稅發(fā)票時自動調用稅務局增值稅發(fā)票真?zhèn)尾轵炂脚_進行真?zhèn)尾轵?#xff0c;所述發(fā)票信息存儲管理單元存儲鑒別結果為非增值稅發(fā)票的OCR圖像識別結果同時將查驗結果為真的增值稅發(fā)票的OCR圖像識別結果進行重復歸集核查后進行相應存儲,所述發(fā)票信息分類展示單元對所述發(fā)票信息存儲管理單元存儲的發(fā)票信息數(shù)據(jù)進行分類展示處理。
2.根據(jù)權利要求1所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于,所
述發(fā)票信息驗證處理單元包括互相連接的發(fā)票類型鑒定模塊和發(fā)票信息查驗模塊,所述發(fā)票類型鑒定模塊連接在所述OCR圖像識別單元和所述發(fā)票信息存儲管理單元之間,所述發(fā)票信息查驗模塊一端遠程連接至稅務局增值稅發(fā)票真?zhèn)尾轵炂脚_同時另一端與所述發(fā)票信息存儲管理單元相連,所述發(fā)票類型鑒定模塊對所述OCR圖像識別結果的發(fā)票類型進行鑒別并在鑒別結果為非增值稅發(fā)票時發(fā)送至發(fā)票信息存儲管理單元存儲,在鑒別為增值稅發(fā)票時發(fā)送至發(fā)票信息查驗模塊,所述發(fā)票信息查驗模塊在所述發(fā)票類型鑒定模塊的鑒別結果為增值稅發(fā)票時自動調用稅務局增值稅發(fā)票真?zhèn)尾轵炂脚_進行真?zhèn)尾轵灢⒃诓轵灋檎鏁r發(fā)送至發(fā)票信息存儲管理單元進行重復歸集核查和相應存儲。
3.根據(jù)權利要求2所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于,所述發(fā)票信息存儲管理單元包括相互連接的發(fā)票信息重復歸集核查模塊和發(fā)票信息數(shù)據(jù)庫, 所述發(fā)票信息重復歸集核查模塊與發(fā)票信息查驗模塊相連,所述發(fā)票信息數(shù)據(jù)庫連接于所述發(fā)票類型鑒定模塊和所述發(fā)票信息分類展示單元之間,發(fā)票信息重復歸集核查模塊接收查驗結果為真的增值稅發(fā)票的OCR圖像識別結果進行重復歸集核查,所述發(fā)票信息數(shù)據(jù)庫接收鑒別結果為非增值稅發(fā)票的OCR圖像識別結果直接進行存儲同時接收重復歸集核查結果為未重復的增值稅發(fā)票的OCR圖像識別結果進行存儲。
4 .根據(jù)權利要求1-3之一所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于,所述OCR圖像識別單元結合卷積神經網絡深度學習算法、循環(huán)神經網絡深度學習算法以及時序分類算法對發(fā)票圖片信息數(shù)據(jù)進行識別讀取以獲得OCR圖像識別結果。
5.根據(jù)權利要求4所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于, 所述OCR圖像識別結果為json格式的結構化信息數(shù)據(jù)。
6.根據(jù)權利要求5所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于, 所述發(fā)票類型鑒定模塊基于發(fā)票代碼和/或發(fā)票號碼并結合稅務局官方的發(fā)票類型判斷規(guī)則對所述OCR圖像識別結果的發(fā)票類型進行鑒別。
7 .根據(jù)權利要求6所述的基于OCR圖像識別技術的發(fā)票采集管理系統(tǒng),其特征在于,所述發(fā)票信息采集單元包括但不限于基于移動端和/或PC端通過拍照上傳、相冊上傳以及圖庫上傳的方式進行發(fā)票信息采集。
8.一種基于OCR圖像識別技術的發(fā)票采集管理方法,其特征在于,所述方法在采集發(fā)票圖片信息數(shù)據(jù)后利用OCR圖像識別技術結合人工智能深度學習算法對所述發(fā)票圖片信息數(shù)據(jù)進行識別讀取以獲得OCR圖像識別結果,再對所述OCR圖像識別結果的發(fā)票類型進行鑒別,在鑒別結果為增值稅發(fā)票時自動調用稅務局增值稅發(fā)票真?zhèn)尾轵炂脚_進行真?zhèn)尾轵?#xff0c; 當查驗結果為真時再對相應的增值稅發(fā)票的OCR圖像識別結果進行重復歸集核查,并在核查結果為未重復時將OCR圖像識別結果進行相應存儲;或,在鑒別結果為非增值稅發(fā)票時, 對非增值稅發(fā)票的OCR圖像識別結果直接進行存儲;然后對發(fā)票信息數(shù)據(jù)進行分類展示處理。
9.根據(jù)權利要求8所述的基于OCR圖像識別技術的發(fā)票采集管理方法,其特征在于, 所述方法在采集發(fā)票圖片信息數(shù)據(jù)后利用OCR圖像識別技術結合卷積神經網絡深度學習算法、循環(huán)神經網絡深度學習算法以及時序分類算法對發(fā)票圖片信息數(shù)據(jù)進行識別讀取以獲得OCR圖像識別結果。