圖數(shù)據(jù)庫、圖計(jì)算、圖中臺(tái)都是用圖論的方式去構(gòu)造實(shí)體間關(guān)聯(lián)的網(wǎng)絡(luò)。其中,實(shí)體用頂點(diǎn)來表達(dá),而實(shí)體間的關(guān)系用邊來表達(dá)。圖數(shù)據(jù)庫的這種簡潔、自由、高維、100%還原世界的數(shù)據(jù)建模的方式讓實(shí)體間的關(guān)聯(lián)關(guān)系的計(jì)算比基于二維表和 SQL 查詢模式的關(guān)系型數(shù)據(jù)庫高效成千上萬倍。
新的業(yè)務(wù)場景和市場對(duì)于數(shù)據(jù)間的關(guān)聯(lián)分析、深度下鉆、科學(xué)計(jì)量、多維度分析與數(shù)據(jù)價(jià)值抽取有著剛性的需求——這些剛需需要基于實(shí)時(shí)圖計(jì)算的技術(shù)、產(chǎn)品和方案來滿足。
近二十年以來,全球 IT 市場上涌現(xiàn)出了十多家圖數(shù)據(jù)庫服務(wù)商,從傳統(tǒng)的非常學(xué)術(shù)化的 RDF(資源定義框架)模式圖到更新銳的 LPG(標(biāo)簽屬性圖)或?qū)傩詧D,還有那些在傳統(tǒng)的 SQL 數(shù)據(jù)庫或 NoSQL 數(shù)據(jù)庫上搭建的各種多模(非原生圖)數(shù)據(jù)庫解決方案,例如 Oracle PGX Graph、HBase+JanusGraph 等方案。
大多數(shù)圖解決方案,在進(jìn)行類似于表連接的操作時(shí)或許可以獲得比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(例如 Oracle 或 Mysql)高出指數(shù)級(jí)(例如 5—1000 倍)的性能提升,但是它們?cè)诿鎸?duì)深度的搜索、關(guān)聯(lián)、計(jì)算或高并發(fā)、實(shí)時(shí)決策場景時(shí)任然會(huì)遇到巨大的挑戰(zhàn)(換言之,在深度數(shù)據(jù)挖掘與計(jì)算場景中,要比關(guān)系型數(shù)據(jù)庫、數(shù)倉有百萬倍以上的計(jì)算性能提升才有可能做到實(shí)時(shí)性)。
作為前沿科技的圖計(jì)算技術(shù)在近十年已歷經(jīng)四代演進(jìn),第一代例如 JanusGraph,第二代例如 Neo4j、第三代例如 TigerGraph,第四代例如嬴圖——尤其在金融級(jí)環(huán)境中的應(yīng)用,無論是性能、功能亦或是用戶體驗(yàn)均得到指數(shù)級(jí)的增強(qiáng)和突破。
帶著這些問題,我們先來明確一些概念,厘清這些概念對(duì)于去偽存真意義重大。無論是數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖泊還是數(shù)據(jù)中臺(tái)、計(jì)算引擎,性能一定是第一公民,性能低下的系統(tǒng)沒有可能作為業(yè)務(wù)支撐系統(tǒng)長期存在,然而,在以關(guān)系型數(shù)據(jù)庫為主體的數(shù)據(jù)庫市場中,存儲(chǔ)引擎才是一等公民,計(jì)算只是二等公民(如果讀者對(duì)于那些隨處可見的效率低下、靈活性差、可解釋性差、開發(fā)周期漫長的 SQL 存儲(chǔ)過程心有余悸的話)—— 在越來越多的業(yè)務(wù)場景中,圍繞著 SQL 理念而構(gòu)建的系統(tǒng)變成了阻礙業(yè)務(wù)前進(jìn)的最大障礙!這也是為什么 SQL 或關(guān)系型數(shù)據(jù)庫、數(shù)倉、數(shù)湖終將會(huì)消亡的底層邏輯。
我們知道,所有真正意義上的高性能系統(tǒng)(HPC/S 即高性能計(jì)算與存儲(chǔ))的共通之處必有以下三條:
- 計(jì)算:高并發(fā)計(jì)算的能力(HPC)
- 存儲(chǔ):內(nèi)存與外存的綜合優(yōu)化利用(HPS)
- 網(wǎng)絡(luò):高吞吐、低延遲系統(tǒng)(HPN)
它們有著重要性主次先后的順序,計(jì)算能力解決后再解決存儲(chǔ)的問題,最后再解決網(wǎng)絡(luò)的問題。當(dāng)然,計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)也是云計(jì)算的三要素,它們各自都可能會(huì)對(duì)應(yīng)著業(yè)務(wù)需求中的某些邏輯。但是,沒有任何一個(gè)高性能的數(shù)據(jù)庫級(jí)別的系統(tǒng)可以在不充分釋放算力的條件下實(shí)現(xiàn)高性能!任何一個(gè)鼓吹分布式但是在任一實(shí)例上不能做到充分并發(fā)的圖數(shù)據(jù)庫系統(tǒng)都是浪費(fèi)資源且無法創(chuàng)造真正、可持續(xù)的商業(yè)價(jià)值!
嬴圖創(chuàng)新性的發(fā)明,并在最嚴(yán)苛的金融級(jí)商用場景(高并發(fā)、低延遲)中成功的使用了如下技術(shù):
- High-Density Parallel Graph Computing(高密度并發(fā)圖計(jì)算)
- LinearScalable Graph Computing(線性可擴(kuò)展圖計(jì)算能力)
- Ultra-Deep Graph Traversal(超深度圖遍歷能力)
- Dynamic Graph Pruning(動(dòng)態(tài)圖剪枝)
這些新技術(shù)的運(yùn)用為企業(yè)所帶來的直接收益就是:
- TCO 的有效降低(達(dá) 70%)
- 實(shí)施交付速度的大幅提升(交付周期縮短達(dá) 80%)
- 優(yōu)質(zhì)的用戶體驗(yàn)(整個(gè)系統(tǒng)的易用性、可用性、穩(wěn)定性)

對(duì)于圖數(shù)據(jù)庫系統(tǒng)而言,嬴圖創(chuàng)新性地使用了高密度并發(fā)圖計(jì)算基礎(chǔ)架構(gòu)、高并發(fā)、低延遲、支持遞歸查詢數(shù)據(jù)結(jié)構(gòu),并對(duì)全部圖上的操作、查詢、計(jì)算和圖算法進(jìn)行了并行化改造,相比原生的串行化的圖算法,實(shí)現(xiàn)了指數(shù)級(jí)的性能提升這與優(yōu)化和互聯(lián)網(wǎng)企業(yè)所構(gòu)建的常見的 Web 中心式的分布式系統(tǒng)非常不同,Web 是無狀態(tài)的,但是圖的計(jì)算是有狀態(tài)的,圖計(jì)算更多的是“長鏈交易”的查詢與計(jì)算,這個(gè)與互聯(lián)網(wǎng)常見的“秒殺”系統(tǒng)背后的“短鏈交易”的查詢與計(jì)算的設(shè)計(jì)與實(shí)現(xiàn)有很大的差異。
低效的、錯(cuò)誤的分布式系統(tǒng)設(shè)計(jì)會(huì)有如下特征:
- 系統(tǒng)的整體性能因水平分布的實(shí)例間的通信量指數(shù)級(jí)上升而導(dǎo)致性能的指數(shù)級(jí)下降,甚至(集群)完全不可用;
- 集群的并發(fā)規(guī)模具象到單個(gè)實(shí)例的并發(fā)規(guī)模很低,或者說計(jì)算密度太低而導(dǎo)致的底層硬件資源的大幅浪費(fèi)。
以上兩點(diǎn),恰恰就是嬴圖極力規(guī)避并解決的核心問題!
- Shared-Nothing 架構(gòu),任意集群節(jié)點(diǎn)(實(shí)例)的下線不會(huì)造成整個(gè)集群無法工作;
- HTAP 架構(gòu),在一個(gè)水平分布式集群內(nèi)融合了 OLTP+OLAP 的數(shù)據(jù)(業(yè)務(wù))處理能力;
- 充分的對(duì)底層硬件,例如 X86 CPU 的高密度并發(fā)算力的釋放,同時(shí)支持 ARM 架構(gòu)。
- 面向圖的整體性而設(shè)計(jì)的線性可擴(kuò)展的系統(tǒng)架構(gòu);
- 在圖上實(shí)現(xiàn)的深度搜索的能力;
- 動(dòng)態(tài)剪枝的能力:在圖上計(jì)算的時(shí)候,例如深度圖遍歷不會(huì)導(dǎo)致性能下降,甚至可以實(shí)現(xiàn)性能提升——例如通過動(dòng)態(tài)的圖上剪枝來實(shí)現(xiàn)指數(shù)級(jí)的性能提升;
- CAP 集群實(shí)現(xiàn):保證集群的可用性、分區(qū)與數(shù)據(jù)一致性(最終一致性)。

嬴圖HTAP Cluster - 集群架構(gòu)示意圖
數(shù)據(jù)批量導(dǎo)入、動(dòng)態(tài)更新、點(diǎn)、邊查詢、過濾查詢、路徑查詢、模板查詢、K鄰查詢、實(shí)時(shí)圖算法、全圖算法、圖嵌入(圖神經(jīng)網(wǎng)絡(luò)計(jì)算)…… 嬴圖完成了全維度、一系列的性能指標(biāo)測試與壓力測試,尤其在對(duì)時(shí)效性、安全性、海量數(shù)據(jù)處理能力等要求更高的金融級(jí)商業(yè)場景應(yīng)用中,嬴圖以穩(wěn)定性、易用性、可集成性、功能性的多方性能優(yōu)勢領(lǐng)先于其他同類產(chǎn)品性能(評(píng)測結(jié)果對(duì)比如下圖所示)。
