(圖為:費馬科技CEO洪春濤)
DoNews 3月9日消息(記者 向密) 說起大數(shù)據(jù)和云計算,人們幾乎耳熟能詳。但若提到圖計算,了解的可能寥寥無幾。
事實上,作為最近幾年迅速發(fā)展的新技術,圖計算技術目前在金融、工業(yè)、互聯(lián)網(wǎng)等多個領域已有廣泛應用,尤其在金融反洗錢、發(fā)欺詐領域。而意識到圖計算技術重要性的大型企業(yè),也紛紛加大對圖計算領域的投入。
費馬科技CEO洪春濤在接受DoNews專訪時表示,大數(shù)據(jù)實質(zhì)上是把很多數(shù)據(jù)聚攏到一起。按照傳統(tǒng)方式收集的數(shù)據(jù),一般來說都是以二維表的形式進行存儲,類似Excel里二維導航由列到行的方式。當人們?nèi)コ橄?、去計算的時候,也是按照這種形式去思考。
不過,現(xiàn)實當中有一些數(shù)據(jù),不太方便用這種方式來抽象,比如說社交網(wǎng)絡,誰關注了誰,誰跟誰是好朋友等。事實上,它更像一張網(wǎng)絡一樣的東西,有著很多的節(jié)點,并不適合用二維數(shù)據(jù)方式進行處理。存在形式的不同,促使了抽象和計算方式的改變,推動了圖計算技術的發(fā)展。
那么,何為圖計算?圖的英文名字叫Graph,是用于表示對象之間關聯(lián)關系的一種抽象數(shù)據(jù)結(jié)構(gòu),使用頂點和邊進行描述。而圖計算,便是以圖作為數(shù)據(jù)模型來表達問題并予以解決的這一過程。最近被市場炒得火熱的知識圖譜,就是圖計算的一種。
洪春濤介紹,對于圖計算技術的研究,最早可追溯至20世紀四五十年代。但圖計算逐漸進入人們視野,則是因2010年谷歌發(fā)布的一篇圖計算論文引起。隨著新技術和新業(yè)務的推動,目前圖計算技術已進入臨近爆發(fā)的前夜。
相比2003年左右發(fā)展起來的大數(shù)據(jù),圖計算處理的最大難點在于數(shù)據(jù)處理的不規(guī)整。由于大數(shù)據(jù)處理的是很規(guī)整的數(shù)據(jù),因此處理起來相當高效。而圖計算這種網(wǎng)絡數(shù)據(jù),由于很不規(guī)整,因此處理起來非常吃力,在處理億級以上的海量數(shù)據(jù)時尤其如此。
不過,圖計算卻是天然的存在,具有廣闊的應用前景。洪春濤預計,圖計算的市場容量可能為云計算的10%,即高達千億規(guī)模?;蛟S,這也是眾多初創(chuàng)者,紛紛進入這一領域淘金的原因之一。
深耕圖計算的清華博士團
北京費馬科技有限公司成立于2016年,由畢業(yè)于清華大學的多名博士在清華教授的支持下聯(lián)合組建,是一家專注于圖數(shù)據(jù)技術,為企業(yè)提供高性能圖數(shù)據(jù)存儲及分析平臺的國家高新技術企業(yè),其核心成員涵蓋大數(shù)據(jù)、圖計算、并行計算、機器學習等領域科學家。
(圖為:費馬科技高管團隊)
技術硬核是費馬科技創(chuàng)業(yè)團隊的標簽之一。據(jù)費馬科技官網(wǎng)介紹,在公司成立之前,CEO洪春濤已在分布式計算、并行計算、圖數(shù)據(jù)庫、圖計算和大數(shù)據(jù)領域深耕15年。他曾在清華博士期間編寫了世界上第一個開源分布式C++圖計算系統(tǒng),也曾在加入微軟亞洲研究院的6年中,主導設計了微軟下一代大數(shù)據(jù)平臺和分布式機器學習平臺,協(xié)助Bing搜索團隊實現(xiàn)早期原型設計,以及創(chuàng)立開源深度學習平臺mxnet等。
創(chuàng)始團隊的另一成員,現(xiàn)任費馬科技CTO的朱曉偉,曾在業(yè)界頂級會議發(fā)表多篇學術論文。他開發(fā)了最快的圖計算軟件平臺Gemini,作為圖數(shù)據(jù)領域的標桿被引用上百次,填補了國內(nèi)圖數(shù)據(jù)及圖計算領域的空白。
現(xiàn)任公司聯(lián)合創(chuàng)始人的李愷威,是公司的另一位技術大牛。專注于高性能計算、GPU加速領域的他,曾在2015年率領清華團隊連獲世界三大超級計算機比賽的總冠軍。
此外,創(chuàng)業(yè)團隊成員還包括“神威·太湖之光”Graph500作者林恒,國內(nèi)計算機領域的頂級專家、現(xiàn)為清華大學博導的陳文光教授,以及曾供職于交通部海事局和著名通訊設備商朗訊的VP崔明生等。其中,林恒博士基于“太湖之光”研發(fā)的“神圖”系統(tǒng)是世界上規(guī)模最大的圖計算系統(tǒng),能在36秒內(nèi)處理多達70萬億邊的超大規(guī)模圖數(shù)據(jù)。
如今,這些技術精英都匯聚在費馬科技的旗下。在費馬科技現(xiàn)有18人的初創(chuàng)團隊中,有13人是與技術相關的高級人才。
打造核心競爭力
在洪春濤看來,匯聚一流團隊、打造一流產(chǎn)品并獲得客戶認可才是打造核心競爭力的關鍵。三年多的創(chuàng)業(yè)中,憑借硬核技術,公司收獲了工商銀行、西門子、國家電網(wǎng)和京東金融等在內(nèi)的大型To B企業(yè)典型客戶。
據(jù)洪春濤介紹,目前費馬科技聚焦的領域主要是圖計算領域的底層系統(tǒng)。在效率、資源的利用率和可用性比競品都要好,是費馬科技產(chǎn)品持續(xù)發(fā)力的關鍵點。
效率對于一個產(chǎn)品到底有多重要?洪春濤舉了一個例子。
“我們的競品大約比競品快100倍。這對用戶是一個很顯著的差別。對實時系統(tǒng)來說,它往往就意味著能不能做到實時響應。實時系統(tǒng)一般要求是響應時間不超過50毫秒。比如我們做個網(wǎng)上轉(zhuǎn)賬,50毫秒系統(tǒng)就應該做過。那么假設有一個請求,用我們的系統(tǒng)來做需要50毫秒,用其它產(chǎn)品可能就需要5秒甚至更多。這時候就會出現(xiàn)明顯的差別:一個是“立等可取”,另一個就有明顯的等待時間。對于非實時系統(tǒng),100倍的性能差別往往就是“能做”和“不能做”的區(qū)別了?!焙榇簼f道。
以反洗錢為例,洪春濤解釋,對于銀行來說,一般都是每天跑一次。如果用費馬科技的系統(tǒng),可能在1個小時就跑完了,第二天可以過來看下報告。“但如果用其他系統(tǒng)的話,它可能需要100個小時甚至200小時,這需要一個星期以后才能發(fā)現(xiàn)這個問題。而此時,嫌疑人可能都已經(jīng)跑掉了?!?/p>
進一步豐富應用場景
(圖為:費馬科技產(chǎn)品圖)
據(jù)介紹,費馬科技核心產(chǎn)品為費馬LightGraph圖數(shù)據(jù)庫產(chǎn)品和費馬PandaGraph圖計算產(chǎn)品,具備萬億級別的圖數(shù)據(jù)分析能力,實現(xiàn)千萬頂點每秒的查詢速度,提供超過25個內(nèi)置圖分析算法,同時可與Hadoop大數(shù)據(jù)平臺無縫結(jié)合,是超大規(guī)模數(shù)據(jù)關聯(lián)分析的絕佳平臺。
洪春濤表示,公司業(yè)務剛剛開始發(fā)力,未來希望能將業(yè)務領域再往前推進一步。除了要涵蓋現(xiàn)在需求量大的金融行業(yè),費馬科技的業(yè)務領域還將拓展至工業(yè)領域、網(wǎng)絡安全以及公共安全等領域,進一步豐富圖技術的應用場景。
據(jù)其透露,2020年,費馬科技除了在技術團隊進行必要的擴容之外,代理商和銷售團隊擴容也在有序進行當中。
此前,費馬科技已在2016年獲得了天使輪融資并在2018年3月完成來自京東金融的A輪融資。而在未來,洪春濤希望能進一步借助資本的力量,將技術優(yōu)勢保持領先地位。
“在未來圖計算領域的千億市場中,可能是一到兩家獨大,數(shù)十家共存的模式?!碑斦劶拔磥硎袌龈偁幐窬謺r,洪春濤表示。(完)