2021-02-04 1198
随著(zhe)萬億級數據時代到(dào)來,如何在海量數據中靈活地檢索、統計和分析,充分挖掘數據價值,是擺在大數據行業(yè)從(cóng)業(yè)者面前的一(yī)道難題,也是一(yī)個(gè)新的機(jī)會(huì)。
據IDC報(bào)告,2018年(nián)全球數據總量為(wèi)32ZB,到(dào)2025年(nián)将增至175ZB。信息量的爆發式增長(cháng),市(shì)場對數據庫服務的需求也在不斷提升。相(xiàng)應地,國(guó)内數據庫市(shì)場持續向好,其在2019年(nián)的市(shì)場規模達到(dào)133.4億元,預測未來3年(nián)還(hái)将保持15%左右的高(gāo)速增長(cháng)态勢。
在可預見(jiàn)的市(shì)場前景下(xià),有一(yī)批懷揣著(zhe)技(jì)術(shù)和理想的行業(yè)從(cóng)業(yè)者循勢登上(shàng)了舞台,孫雪平帶領的創業(yè)團隊就(jiù)是其中的典型代表。
彼時,市(shì)面上(shàng)能(néng)同時兼顧海量數據實時檢索與分析的産品還(hái)很少。“業(yè)内不乏有多(duō)年(nián)大數據行業(yè)經驗的團隊,但能(néng)真正沉下(xià)來專注底層研發的企業(yè)不多(duō)。”而孫雪平的團隊恰好具備底層技(jì)術(shù)特質,便順勢于2018年(nián)注冊成立了南京氫聊軟件技術有限公司(以下(xià)簡稱“錄信數軟”)。
大數據時代下(xià)的國(guó)産數據庫
錄信數軟緻力于研發大數據檢索分析型數據庫軟件(jiàn),公司自(zì)主研發的錄信檢索分析型數據庫“LSQL”及“LXDB”,主要應用于萬億級别數據的OLAP(聯機(jī)分析處理)場景,當前已在公安、交通(tōng)交警、軍隊、汽車等領域樹立典型落地案例。
由于産品性能(néng)優勢顯著,錄信數軟在行業(yè)内開(kāi)始嶄露頭角,并引起了投資機(jī)構的關注。2020年(nián)疫情期間,錄信數軟獲得凱風創投的種子輪投資。在同年(nián)9月(yuè)的第六屆“i創杯”互聯網創新創業(yè)大賽決賽中,錄信數軟從(cóng)百強項目中脫穎而出,奪得了大賽三等獎。
孫雪平透露,2020年(nián)度,疫情很大程度上(shàng)耽擱了公司項目的實施與交付,錄信數軟實際上(shàng)隻用了半年(nián)左右的時間,便完成了原定全年(nián)的1000萬元的營收計劃任務。
駐場半年(nián),啃下(xià)第一(yī)單
自(zì)2018年(nián)以來,孫雪平團隊始終為(wèi)做高(gāo)性能(néng)的“檢索分析型通(tōng)用數據庫”而忙碌著(zhe)。“專注OLAP(聯機(jī)分析處理)、針對海量數據檢索分析”是團隊關于場景的最初構想。在此基礎上(shàng),錄信數軟推出了第一(yī)代數據庫産品“LSQL” ,并試圖在運營商領域落地。
然而,像大部分創業(yè)者一(yī)樣,孫雪平及團隊的首次探索并不順利。
從(cóng)數據規模角度,擁有海量大數據的運營商場景比較符合産品定位,但在錄信軟件(jiàn)早期的産品架構上(shàng),沒有很好地兼顧到(dào)高(gāo)并發層面的場景應用,實際落地并沒有達到(dào)預期。
“解決這個(gè)問題還(hái)得回到(dào)技(jì)術(shù)本身,好在這是我們的長(cháng)處。” 孫雪平介紹,公司核心團隊來自(zì)于阿裡(lǐ)、騰訊、烽火、華為(wèi)等企業(yè),骨幹技(jì)術(shù)人員(yuán)均具有多(duō)年(nián)産品研發經驗。其中,CTO母延年(nián)曾參與及主導了支付寶黃金策的海狗、阿裡(lǐ)開(kāi)源項目MDRILL(多(duō)維分析)、騰訊的Hermes(每天千億總量萬億)等項目,有數十個(gè)萬億級、幾百個(gè)千億級别的項目設計與實施經驗。
與此同時,孫雪平觀察到(dào),高(gāo)并發與實時更新應用場景有著(zhe)廣闊的市(shì)場需求,于是團隊繼續打磨——基于底層技(jì)術(shù)優化系統性能(néng)。
2018年(nián)底,團隊迎來了第一(yī)個(gè)客戶:一(yī)家來自(zì)公共安全行業(yè)核心解決方案提供商。
這家企業(yè)服務于公安、政務、海關、監察等機(jī)構,随著(zhe)業(yè)務量和數據量的激增,公司使用的開(kāi)源數據庫開(kāi)始頻繁出現問題,查詢跑不動、跑死機(jī)是常事(shì)。
“痛點很明确。” 孫雪平表示,擁有超海量數據的情報(bào)系統應用普遍存在這樣的問題,這意味著(zhe)該細分領域仍有著(zhe)廣闊待開(kāi)拓空間。
任何企業(yè)應用新的技(jì)術(shù)都會(huì)比較謹慎,合作的這家企業(yè)同樣如此。為(wèi)此,孫雪平和同伴在客戶對面租了共享空間,開(kāi)始了為(wèi)期半年(nián)的駐場測試。
根據用戶需求,錄信數軟提供了一(yī)套定制化的解決方案。
經過長(cháng)時間磨合、以及産品的不斷改進,團隊收獲了客戶的信任。更重要的是,在服務客戶的過程中,團隊也沉澱了較強的交付能(néng)力。而後,産品的平均交付落地周期也從(cóng)半年(nián)縮短至1-3個(gè)月(yuè)。
目前,公司已與多(duō)家軟件(jiàn)集成商或獨立軟件(jiàn)開(kāi)發商達成合作,共同服務于政府、公安和軍隊等官方機(jī)構。2020年(nián),公司完成了1000萬的營收。
“索引+大數據”探索不同業(yè)務場景
2013年(nián)“棱鏡門(mén)”事(shì)件(jiàn)發生(shēng)後,我國(guó)開(kāi)始推動“國(guó)産數據庫”的搭建。大批大數據創業(yè)者于此時湧現,有的基于業(yè)務、有的專注底層研發。
大浪淘沙後,國(guó)内數據庫行業(yè)已形成三大“派系”:一(yī)是阿裡(lǐ)、騰訊、華為(wèi)等這樣的通(tōng)信及互聯網巨頭;二是以武漢達夢、南(nán)大通(tōng)用、人大金倉等為(wèi)代表的“高(gāo)校派”;三是以錄信數軟為(wèi)代表的創業(yè)“新秀”們——出身于互聯網大廠、有深厚的技(jì)術(shù)積累。
“錄信數軟的底層技(jì)術(shù)以索引見(jiàn)長(cháng),通(tōng)過研發大數據場景下(xià)的各類索引來滿足不同的業(yè)務需求,這也是我們的技(jì)術(shù)壁壘所在” 。
孫雪平以交通(tōng)監控大數據為(wèi)案例進行了相(xiàng)關介紹:“城(chéng)市(shì)中24小(xiǎo)時各路(lù)口車輛通(tōng)行的數據量很龐大,數據彙總到(dào)錄信數軟的數據庫後, 系統會(huì)針對車輛型号、顔色、地理位置及行駛時間等多(duō)個(gè)時空維度的信息建立符合數據分布模式的索引,從(cóng)而能(néng)在套牌車鑒别、同行車分析等需要數據關聯碰撞的業(yè)務場景下(xià)實現秒(miǎo)級響應”。
且錄信數軟的數據庫在超大規模數據量下(xià)針對單維和多(duō)維的檢索統計均可達到(dào)秒(miǎo)級。她接著(zhe)舉例,“一(yī)座城(chéng)市(shì)一(yī)天内記錄同一(yī)車型的數據量非常大,在排查涉事(shì)車輛時,在目擊者隻看(kàn)到(dào)車型的情況下(xià),系統可呈現該車型不同色系及車況特征數據統計,無論什麽條件(jiàn)的組合檢索都能(néng)秒(miǎo)級響應,快速返回結果有助于思維連貫性,激發辦案人員(yuán)聯想到(dào)其他查詢條件(jiàn),這樣一(yī)步步分析探索,直到(dào)鎖定目标車輛。”在交通(tōng)緝查中,能(néng)減少辦案人員(yuán)的決策時間,極大提升了辦案效率。
據了解,錄信數軟産品性能(néng)優勢主要體現在三個(gè)方面:
一(yī)是對海量數據的處理。目前商用的最大單集群數據規模數十萬億,節點數達千台,可支持最高(gāo)50PB的數據總量;
二是幫助客戶節省成本。在大多(duō)數業(yè)務場景下(xià),往往需要将擅長(cháng)不同方向的多(duō)套系統組合使用,而錄信數軟隻需維護一(yī)套系統和一(yī)份數據。由此,整體維護成本、數據存儲成本可相(xiàng)應減少60%-70%;
三是高(gāo)效便捷的使用體驗。系統使用标準SQL語言、提供标準JDBC和HTTP接口,降低(dī)了學習和使用難度。
“人無我有,人有我更優”
随著(zhe)5G的商用化進程推進,數據洪流時代正加速到(dào)來,這也将加速傳統行業(yè)數字化轉型,國(guó)産數據庫業(yè)務或将迎來“爆發”。
縱觀行業(yè)的發展情況,較早進入賽道的錄信數軟有著(zhe)一(yī)定的先發優勢。
而在産品角度,錄信軟件(jiàn)堅持“人無我有,人有我更優”。孫雪平表示:“面對海量數據檢索分析場景時,能(néng)把全文檢索、關聯查詢、統計分析都做好的産品極少,但我們能(néng)做到(dào),且單項性能(néng)也不比其他專門(mén)産品差”。
這得益于錄信數軟在産品性能(néng)打磨上(shàng)的孜孜不倦。團隊平均每90天更新一(yī)個(gè)版本,以最新的産品功能(néng)帶給用戶及合作夥伴更好的體驗。“如果客戶看(kàn)重性能(néng)指标,我們更有優勢” 。
作為(wèi)一(yī)家注重研發投入的技(jì)術(shù)型公司,錄信數軟自(zì)主研發步伐也從(cóng)未慢(màn)下(xià)。2020年(nián)4月(yuè),錄信數軟著(zhe)手研發第二代數據庫産品“LXDB”,在LSQL的基礎上(shàng),對數據的實時更新以及高(gāo)并發檢索統計場景有了更好的支持。孫雪平透露,目前該款産品處于内測階段,争取年(nián)内在運營商和金融行業(yè)探索合适的場景落地。
錄信 LXDB技(jì)術(shù)生(shēng)态定位
值得一(yī)提的是,這筆研發資金正好來自(zì)凱風創投的種子輪融資。除了對技(jì)術(shù)及團隊的認可,更特别的“緣分”在于該機(jī)構合夥人系情報(bào)系統出身,雙方在行業(yè)認知及産品邏輯上(shàng)達成“默契”。
成立兩年(nián)多(duō)以來,錄信數軟從(cóng)最初的“兩人轉”擴大至當前的20人團隊,支撐起上(shàng)百個(gè)項目。之所以産生(shēng)較高(gāo)的人均産出比,離不開(kāi)團隊的務實。
錄信數軟團隊成員(yuán)(部分)團建合影
“我們隻有做好産品, 才能(néng)不負客戶的信任,這是一(yī)份沉甸甸的使命。”在孫雪平眼裡(lǐ),她沒有雷軍、馬雲等大佬那樣波瀾壯闊的創業(yè)故事(shì),與成千上(shàng)萬普通(tōng)創業(yè)者一(yī)樣,平凡而又(yòu)倔強著(zhe)。
創業(yè)前期,大多(duō)數企業(yè)不得不囿于團隊規模及資金。對此,孫雪平始終保持清晰的認知:“得卯足勁先做好一(yī)個(gè)場景、一(yī)個(gè)行業(yè)”。
今年(nián),錄信數軟将繼續在大數據檢索分析垂直領域優化産品;在服務客戶方面,也将繼續與更懂(dǒng)業(yè)務的行業(yè)集成商合作。
“對于有巨大需求的檢索分析型數據庫市(shì)場,一(yī)家獨大不是好事(shì),國(guó)内需要更多(duō)人投入到(dào)基礎研發領域。”孫雪平平靜(jìng)的語氣中帶著(zhe)些許堅定。
她和團隊走的這條路(lù)注定充滿艱辛,而機(jī)會(huì)或許也隐藏其中。
上(shàng)一(yī)篇:錄信數軟活動分享:大數據助力人車互聯
下(xià)一(yī)篇:IT168專訪錄信數軟CTO母延年(nián):希望以後提到(dào)Lucene除了ES還(hái)能(néng)想到(dào)錄信