近年來,銀行業務發展對信息科技的依賴程度日益增加,為滿足不斷增長的業務規模與不斷發展變化的業務需求,各商業銀行持續加大業務系統的建設與改造力度,逐步實現關鍵業務數據的總行集中管理。但是,數據統一處理同時也造成了數據量的急劇膨脹,給數據的管理和維護帶來諸多問題。

大數據時代海量冷數據如何存儲?文思海輝·金融基于業界先進的Hadoop技術框架,利用其分布式存儲和計算能力,構建了大數據環境下的新一代海量歷史數據存儲平臺。通過歷史數據平臺的建設,為業務人員提供更長時間段的歷史數據在線服務,快速對接上層多種主流的數據挖掘、數據分析及可視化產品,如:SAS、R Studio、Tableau、SmartBI、D3JS等,深度開發歷史數據,創造全新的商業價值。

該平臺全方位覆蓋銀行企業內外部、多樣異構的海量數據存儲,提供歷史數據快速檢索查詢功能,提高公檢法、非現場審計等應用的查詢效率,支持長時間跨度歷史數據的高性能查詢,最終實現“核心減負”。

文思海輝·金融海量歷史數據存儲平臺主要提供兩類數據服務,包括歷史數據查詢類服務及歷史數據接口類服務。

歷史數據查詢類服務:

以HBASE為存儲,以銀行內部ESB總線為信息載體,實現柜面終端歷史數據查詢服務;以通用JDBC數據驅動,訪問HADOOP中的HIVE數據,實現WEB界面的人機交互;以WEB界面發起查詢,訪問HBASE中的加工結果,將數據查詢展示給業務查詢人員,并提供分頁展示和數據接口下載。

歷史數據接口類服務:

數據接口服務重點針對非日常特殊數據接口需求,以及系統測試或系統新上線對歷史數據初始化的需求。

文思海輝·金融海量歷史數據平臺總體架構如下:

該系統主要功能包括:

  • l全量數據存儲(實現離線數據全量匯總入庫,提供統一格式存儲);
  • l統一格式查詢(形成統一的數據資源查詢接口,支持多種格式數據查詢);
  • l模型化數據分析(針對特定業務場景,提煉分析模型,實現預加工、預處理相關全量數據,并輸出分析結果)。

    系統關鍵業務價值體現在:

  • l提供海量數據存儲管理服務;
  • l提供跨長時間段數據查詢服務;
  • l統一客戶體驗(統一存儲管理、統一數據格式、集中數據服務);
  • l多種查詢方式(支持單筆或批量查詢);
  • l數據服務低延時、高可用。

    文思海輝·金融歷史數據平臺方案創新點在于幫助銀行企業實現歷史數據線上化,提高業務辦理效率,提升客戶服務質量,滿足未來增量交易數據的持續沉淀。具有低成本、高效率、易擴展三大特點,有效解決了海量數據存儲及利用問題,降低數據存儲的整體擁有成本(TcO),提高整體系統性能,提高數據存儲靈活性。

    文思海輝·金融海量歷史數據存儲平臺未來還將實現:

  • l自動化數據分級存儲技術

    根據數據的重要性、訪問頻率、保留時間、容量、性能等指標,將數據采取不同的存儲方式分別存儲在不同性能的存儲設備上,通過分級存儲管理實現數據客體在存儲設備之間的自動遷移。

  • l實現數據分級管理機制

    參考數據分類和數據價值模型,按照數據分類和數據價值,建立數據分級存儲管理機制,旨在將業務數據按照數據分類和數據價值級別存儲到相應級別的存儲設備,實現數據的分級分層存儲和管理。

  • l完善海量數據生命周期管理策略和流程

通過數據分級機制,建立銀行數據存儲服務目錄,為業務系統和數據提供不同級別的存儲服務。

通過存儲服務目錄和數據分級管理模型的映射,為不同級別的業務數據創建相應的數據生命周期管理策略和流程,實現業務數據生命周期各個階段在不同級別存儲設備間的自動遷移直至回收,并實現業務數據在生命周期的各個階段的不同級別的存儲服務。

文思海輝·金融海量歷史數據存儲平臺通過對數據的存儲、處理、建模、查詢、分析的方式,幫助企業制定完善的歷史數據歸檔管理機制,制定統一的歷史數據保存策略,構建全行集中統一的歷史數據處理平臺。