在信創(chuàng)背景下,金融機(jī)構(gòu)系統(tǒng)遷移面臨一個現(xiàn)實,底層硬件體系多樣化,例如C86+DCU、ARM+昇騰等。如果上層應(yīng)用軟件(如核心業(yè)務(wù)系統(tǒng)中的OCR識別引擎)每次適配一種新硬件,就需要開發(fā)和維護(hù)一個獨立的軟件版本。
這會直接導(dǎo)致以下問題:
●開發(fā)成本激增: 每適配一種硬件組合,都意味著一次獨立的開發(fā)、測試和部署流程。
●運(yùn)維成本失控: 運(yùn)維團(tuán)隊需要同時維護(hù)多個軟件版本,版本管理混亂,排查問題異常困難,人力成本和系統(tǒng)風(fēng)險上升。
●投資無法延續(xù): 當(dāng)?shù)讓佑布俅紊墦Q代時,之前的軟件投資很可能作廢,需要推倒重來,造成資源浪費。
一個原生適配、統(tǒng)一架構(gòu)的平臺是解決上述問題的關(guān)鍵。例如易道博識的智能文檔處理平臺(簡稱DeepIDP),它的核心價值在于,從軟件底層就完成了對所有主流國產(chǎn)化硬件的適配。

1. 如何降低維護(hù)成本?
僅需一套軟件版本: 運(yùn)維團(tuán)隊只需要面對一個統(tǒng)一的軟件架構(gòu)。無論底層是哪種國產(chǎn)芯片或服務(wù)器,上層的AI能力和應(yīng)用都是一致的,告別版本混亂。例如, 某銀行的核心系統(tǒng)同時在ARM和C86兩種架構(gòu)的服務(wù)器上運(yùn)行。通過統(tǒng)一平臺,他們部署的是同一套DeepIDP軟件,開發(fā)和運(yùn)維團(tuán)隊無需再為不同架構(gòu)維護(hù)兩套代碼,人力成本降低了至少50%。
2. 如何保障投資的連續(xù)性?
平滑遷移: 統(tǒng)一架構(gòu)確保了AI能力的投資是可延續(xù)、可擴(kuò)展的。未來即使信創(chuàng)硬件再次迭代,上層的智能應(yīng)用也無需重構(gòu),可以平滑遷移,保護(hù)了前期的IT投資。
金融業(yè)務(wù)涉及的文檔類型極其復(fù)雜,從版式固定的身份證、發(fā)票,到版式千變?nèi)f化的業(yè)務(wù)申請單、對賬單。單一模型難以勝任所有場景。
一個常見的誤區(qū)是認(rèn)為一個強(qiáng)大的大模型就能解決所有問題。 實際上,最高效的策略是“大小模型協(xié)同”。

●專用小模型:處理高頻、標(biāo)準(zhǔn)文檔
任務(wù): 識別身份證、銀行卡、發(fā)票、車票等版式固定的文檔。
優(yōu)勢: 速度極快、精度極高、資源占用小,最適合處理業(yè)務(wù)流程中出現(xiàn)頻率最高的標(biāo)準(zhǔn)化單據(jù)。
●大模型:處理非標(biāo)、長尾文檔
任務(wù): 識別各類申請單、合同、對賬單、醫(yī)療單據(jù)等版式不固定、字段靈活的復(fù)雜文檔。
優(yōu)勢:
■靈活抽?。?僅需通過提示詞(Prompt)告知模型需要抽取的字段(如“抽取合同中的甲方和簽約日期”),即可從任意版式中提取信息。
■金融領(lǐng)域優(yōu)化: 經(jīng)過金融行業(yè)數(shù)據(jù)二次訓(xùn)練的大模型,能更精準(zhǔn)地理解復(fù)雜表格和上下文,抽取精度更高。
■數(shù)據(jù)可溯源: 這是保障業(yè)務(wù)可信度的關(guān)鍵。平臺能將抽取的每一個字段(如JSON結(jié)果中的一個數(shù)值)精確關(guān)聯(lián)回原始影像的具體坐標(biāo)位置,方便人工核驗和審計。
僅僅提取出數(shù)據(jù)是不夠的,核心是要讓AI能力融入業(yè)務(wù),實現(xiàn)端到端的自動化。
1. 如何讓AI智能體(Agent)按需調(diào)用? 易道博識智能文檔處理平臺提供一系列“AI原子能力”(如文檔分割、分類、各類識別模型等),讓智能體可以像調(diào)用工具一樣靈活使用。
例如:財務(wù)報銷審核Agent
○分割與分類: Agent首先調(diào)用“圖像分割”與“文檔分類”能力,將一疊報銷單據(jù)自動拆分,并識別出哪些是發(fā)票,哪些是報銷申請單。
○分發(fā)與抽?。?接著,Agent將發(fā)票分發(fā)給“小模型”快速提取金額、日期;將報銷申請單分發(fā)給“大模型”抽取報銷事由、部門等信息。
○推理與決策: 最后,Agent利用大模型的推理能力,結(jié)合企業(yè)財務(wù)規(guī)則(如報銷金額是否超標(biāo)),自動輸出“審核通過”或“駁回”的結(jié)論。

問題1:這套OCR識別系統(tǒng)支持哪些具體的國產(chǎn)硬件和操作系統(tǒng)?
回答: 易道博識智能文檔處理平臺從底層架構(gòu)原生適配主流國產(chǎn)化硬件,全面兼容C86+DCU、ARM+昇騰等多種信創(chuàng)體系,并支持麒麟、統(tǒng)信等國產(chǎn)操作系統(tǒng)。其核心優(yōu)勢在于,無論底層硬件如何組合,提供給上層應(yīng)用的都是統(tǒng)一、穩(wěn)定的服務(wù)接口。
問題2:大模型處理金融行業(yè)復(fù)雜表格的精度如何?
回答: 精度主要通過兩方面保證:首先,智能文檔處理平臺選用的大模型是經(jīng)過海量金融行業(yè)特有文檔(如復(fù)雜對賬單、年報、招股書等)進(jìn)行二次訓(xùn)練和微調(diào)的,使其能更深刻地理解金融領(lǐng)域的上下文和版式。其次,其強(qiáng)大的溯源能力可以將每個抽取結(jié)果精準(zhǔn)定位回原文,極大地方便了人工核驗,形成了一個“AI處理+人工校驗”的質(zhì)量閉環(huán)。