近期,工業和信息化部等八部門聯合印發《物聯網新型基礎設施建設三年行動計劃(2021—2023年)》,明確到2023年底,在國內主要城市初步建成物聯網新型基礎設施,物聯網連接數突破20億。這一數字背后,意味著更加龐大的數據規模。在物流領域同樣如此,隨著行業的發展,無論車聯網規模還是不同規模物流中心內智能設備的接入量都在大幅增加。面對隨之而來的具有時效性強、實時數據量大等特點的海量數據,如何實現高效的數據存儲和處理至關重要。
基(ji)于此,各種涵蓋(gai)數(shu)(shu)(shu)(shu)據(ju)采集、存儲、查詢(xun)、分析和(he)計算等功能的物聯網數(shu)(shu)(shu)(shu)據(ju)平臺開始(shi)不斷涌現,北(bei)京(jing)濤(tao)思(si)數(shu)(shu)(shu)(shu)據(ju)科技有(you)限(xian)公司(以下(xia)簡稱“濤(tao)思(si)數(shu)(shu)(shu)(shu)據(ju)”)便是其中(zhong)之(zhi)一。但是,不走尋常路(lu)的濤(tao)思(si)數(shu)(shu)(shu)(shu)據(ju),不僅(jin)摒棄(qi)傳統基(ji)于Hadoop生態的搭建(jian)方式,推出專為時序空間(jian)大數(shu)(shu)(shu)(shu)據(ju)設計的時序數(shu)(shu)(shu)(shu)據(ju)庫(ku)平臺,更是以開源的方式,突破行(xing)業傳統思(si)維,開創了一條大膽創新探(tan)索之(zhi)路(lu),成為時序數(shu)(shu)(shu)(shu)據(ju)領域炙手(shou)可熱的標桿企業。

活(huo)力四射的濤(tao)思數據團隊
與濤思(si)數(shu)據(ju)創始(shi)(shi)人陶(tao)建(jian)輝(hui)的(de)(de)(de)初(chu)次會面(mian),剛(gang)好在一(yi)場大雪之后。突然(ran)而至的(de)(de)(de)大雪一(yi)夜之間便褪去了北京絢麗多彩的(de)(de)(de)秋色,但雪后碧藍的(de)(de)(de)天空,光禿的(de)(de)(de)樹枝(zhi),與濤思(si)數(shu)據(ju)所在的(de)(de)(de)望(wang)京CBD設計別(bie)致的(de)(de)(de)建(jian)筑群相互映襯著,倒(dao)也具有(you)(you)別(bie)樣(yang)的(de)(de)(de)美。大自然(ran)總是(shi)充滿神秘莫測(ce)的(de)(de)(de)變化,而對于軟件(jian)行業(ye)(ye)(ye)出身(shen)的(de)(de)(de)陶(tao)建(jian)輝(hui)來(lai)說,最熟悉的(de)(de)(de)卻莫過于變化。軟件(jian)行業(ye)(ye)(ye)可(ke)以說是(shi)技術更新換代速度最快的(de)(de)(de)行業(ye)(ye)(ye)之一(yi),就拿App來(lai)說,其平(ping)均壽命大概(gai)只有(you)(you)10個(ge)月。想做一(yi)款“長命”的(de)(de)(de)基(ji)礎(chu)性軟件(jian)產品的(de)(de)(de)念頭,很久(jiu)之前就開始(shi)(shi)在陶(tao)建(jian)輝(hui)的(de)(de)(de)腦(nao)中萌生。最終(zhong),兩(liang)方面(mian)的(de)(de)(de)原因堅定了他(ta)的(de)(de)(de)信念。
一是蓬勃的市場需求。隨著互聯網的發展,特別是通訊成本的急劇下降,各式各樣的數據被采集并發送到云端,數據量呈現爆炸式地增長。“10年前,你很難想象,幾乎每輛車、每臺設備都在源源不斷地產生數據;現在,這一切都在發生;未來,這一趨勢還將加速。工業領域在傳統的實時監控技術上,各種大數據分析技術、特別是人工智能技術,讓采集的大數據產生了巨大的商業價值,催生了一個前所未有的市場。”他表示。
二(er)是(shi)技(ji)(ji)術(shu)(shu)的(de)相對(dui)(dui)(dui)落后(hou)。他(ta)進(jin)一(yi)步(bu)分享道:“相對(dui)(dui)(dui)于(yu)數據(ju)(ju)量的(de)快速(su)增長(chang),數據(ju)(ju)處理(li)的(de)技(ji)(ji)術(shu)(shu)卻相對(dui)(dui)(dui)落后(hou)。雖然市場上已經有從存儲、計(ji)算到分析較(jiao)為完整的(de)大(da)數據(ju)(ju)處理(li)框架,包(bao)括各種免費開(kai)源系統(tong),但需(xu)要(yao)耗費大(da)量的(de)存儲空間和計(ji)算資源。一(yi)個運營商光存儲查詢半年的(de)上網記(ji)錄就(jiu)需(xu)要(yao)使用數千臺(tai)服務(wu)器,而且(qie)還需(xu)要(yao)不斷擴容。因此(ci)海量數據(ju)(ju)的(de)增長(chang)對(dui)(dui)(dui)技(ji)(ji)術(shu)(shu)提出(chu)了更大(da)的(de)挑戰,也(ye)給我們這些(xie)技(ji)(ji)術(shu)(shu)極客們提供了一(yi)個巨大(da)的(de)機會。”
如何彌補現有技術的缺陷,充分滿足龐大的市場需求,成為陶建輝接下來要考慮的重點。在對整個物聯網和大數據生態進行研究后,他發現,通用大數據方案通常會將開源的Kafka、Redis、HBase、MongoDB、Cassandra等大數據軟件拼裝起來,利用集群來處理海量數據。因涉及多種系統,開發效率低、運行效率差、運維復雜、應用推向市場慢等問題頻發。對于數據采集量巨大的物聯網、工業互聯網等行業,傳統的通用大數據方案更加難以為繼。而通過存儲結構的優化則可以大大提升性能。海量時序空間數據處理(從采集、存儲、查詢、計算到分析)無疑是個巨大的機會。正是在此背景之下,2017年6月濤思數據正式成立,隨后,物聯網大數據平臺TDengine應運而生。
“作為(wei)一(yi)款(kuan)基礎性軟(ruan)件(jian),TDengine就(jiu)好(hao)比一(yi)塊(kuai)小小的(de)磚頭,無(wu)論整個軟(ruan)件(jian)世界如何變(bian)化,迭代,若干年(nian)后它依(yi)然(ran)(ran)可以發揮價值,如此我便很知足了。”陶建輝笑著(zhu)補充道。盡(jin)管濤(tao)思數(shu)據(ju)成立(li)已經(jing)4年(nian)多了,但在回憶公司創(chuang)立(li)過(guo)程時,他的(de)臉上依(yi)然(ran)(ran)滿是似乎創(chuang)業者初期(qi)才有的(de)激情與(yu)昂揚(yang)。

濤思數據自 2017 年成立以來獲獎無數
TDengine定位是物(wu)聯(lian)網大數據(ju)平(ping)臺,即時(shi)序數據(ju)處(chu)理(li)平(ping)臺,其核心是將時(shi)序數據(ju)實時(shi)數據(ju)和歷史數據(ju)操(cao)作合一透明,同時(shi)具(ju)備緩(huan)存、數據(ju)訂(ding)閱、流(liu)式計算、消息隊列等功能,為物(wu)聯(lian)網數據(ju)處(chu)理(li)提供全棧解(jie)決方案(an)。

TDengine 時序數據處理平臺
所謂時(shi)序數據(ju)(ju),即帶(dai)時(shi)間標(biao)簽的(de)(de)數據(ju)(ju),指(zhi)按照時(shi)間的(de)(de)順(shun)序變化、時(shi)間序列化的(de)(de)數據(ju)(ju)。陶(tao)建輝通過對物(wu)聯網、工業互(hu)聯網數據(ju)(ju)進行調研,總結出這類數據(ju)(ju)的(de)(de)十大特征(zheng):
(1)所(suo)有采集的數據(ju)都是時序的;
(2)數據(ju)都是(shi)結構化的;
(3)一個采集(ji)點(dian)的數(shu)據(ju)源是唯一的;
(4)數(shu)據很少(shao)有更新或刪除操(cao)作(zuo);
(5)數據一般是按到期日期來刪除的(de);
(6)數據以寫操作(zuo)為主,讀操作(zuo)為輔;
(7)數據流量平穩,可以較為準確的計算(suan);
(8)數據都(dou)有統(tong)計、聚合(he)等(deng)實時計算操作;
(9)數據一定是(shi)指(zhi)(zhi)定時(shi)間(jian)段(duan)和指(zhi)(zhi)定區(qu)域查(cha)找的(de);
(10)數(shu)據(ju)量巨大,一(yi)天的數(shu)據(ju)量就(jiu)超過100億(yi)條。
針對這(zhe)些特點,TDengine定義了創(chuang)新的(de)時(shi)序數(shu)據(ju)(ju)存儲結構,通過無鎖設計和(he)(he)多核技術讓數(shu)據(ju)(ju)插(cha)入(ru)和(he)(he)讀出的(de)速(su)度比現有通用數(shu)據(ju)(ju)庫高(gao)出10倍以上。除(chu)此之(zhi)外,濤思(si)數(shu)據(ju)(ju)還賦予了TDengine兩個核心技術創(chuang)新點,分(fen)(fen)別是“一(yi)個數(shu)據(ju)(ju)采集點一(yi)張表(biao)”以及“超級(ji)表(biao)”,保證TDengine插(cha)入(ru)和(he)(he)查詢效率(lv)最優化,同(tong)時(shi)便于進行聚合查詢、多維分(fen)(fen)析。
除(chu)了在(zai)(zai)(zai)產品性能(neng)、性價比上不(bu)斷提升,TDengine能(neng)夠形(xing)成(cheng)更(geng)加(jia)廣泛的(de)(de)(de)影響,還在(zai)(zai)(zai)于(yu)陶建輝(hui)一個大膽的(de)(de)(de)決定——開(kai)源(yuan)。這(zhe)一舉動在(zai)(zai)(zai)國外軟件(jian)市(shi)場尚不(bu)足為奇,但在(zai)(zai)(zai)相對保守的(de)(de)(de)國內(nei)市(shi)場來說,無疑反響強烈(lie)。TDengine自2019年(nian)7月(yue)正式宣布開(kai)源(yuan),2020年(nian)8月(yue),宣布將集群版本開(kai)源(yuan)以來,所獲成(cheng)績喜(xi)人,在(zai)(zai)(zai)開(kai)源(yuan)社區GitHub(世界上最大的(de)(de)(de)代(dai)碼托管平臺)已收獲17k Stars。在(zai)(zai)(zai)資本市(shi)場,濤思數據也備受關注,近(jin)兩年(nian)已經先后獲得近(jin)千萬美(mei)元(yuan)的(de)(de)(de)Pre-A輪融(rong)資、1000多萬美(mei)元(yuan)的(de)(de)(de)A輪融(rong)資以及4700萬美(mei)元(yuan)的(de)(de)(de)B輪融(rong)資。
在陶建輝(hui)看(kan)來,開源是(shi)(shi)(shi)中(zhong)(zhong)國(guo)(guo)(guo)軟(ruan)(ruan)件(jian)走(zou)向世(shi)界的(de)(de)(de)(de)(de)(de)最(zui)好(hao)捷徑。在目前的(de)(de)(de)(de)(de)(de)這些(xie)成(cheng)(cheng)績之(zhi)外,陶建輝(hui)內心始終有(you)(you)一(yi)個堅(jian)定(ding)的(de)(de)(de)(de)(de)(de)目標——做時序數(shu)據領域(yu)的(de)(de)(de)(de)(de)(de)全球第一(yi)。“在基礎軟(ruan)(ruan)件(jian)領域(yu),無論操作系統、數(shu)據庫(ku)、軟(ruan)(ruan)件(jian)開發工(gong)具還(huan)是(shi)(shi)(shi)現(xian)在的(de)(de)(de)(de)(de)(de)大(da)數(shu)據處理平臺,幾乎都(dou)是(shi)(shi)(shi)美國(guo)(guo)(guo)公(gong)司的(de)(de)(de)(de)(de)(de)天下。在基礎軟(ruan)(ruan)件(jian)領域(yu)占有(you)(you)一(yi)席之(zhi)地,是(shi)(shi)(shi)我們所(suo)有(you)(you)IT人(ren)的(de)(de)(de)(de)(de)(de)夢(meng)想(xiang),更(geng)是(shi)(shi)(shi)一(yi)個國(guo)(guo)(guo)家科(ke)技實力(li)的(de)(de)(de)(de)(de)(de)象征。”談及中(zhong)(zhong)國(guo)(guo)(guo)軟(ruan)(ruan)件(jian)的(de)(de)(de)(de)(de)(de)現(xian)狀(zhuang)他略顯(xian)遺憾,但是(shi)(shi)(shi)隨即恢復了對于未來發展的(de)(de)(de)(de)(de)(de)信心,“中(zhong)(zhong)國(guo)(guo)(guo)擁有(you)(you)全球最(zui)大(da)的(de)(de)(de)(de)(de)(de)數(shu)據市場(chang),其采集的(de)(de)(de)(de)(de)(de)數(shu)據量和場(chang)景(jing)之(zhi)多(duo)已(yi)經超過美國(guo)(guo)(guo)。在中(zhong)(zhong)國(guo)(guo)(guo)市場(chang)成(cheng)(cheng)功的(de)(de)(de)(de)(de)(de)大(da)數(shu)據產品,一(yi)定(ding)會被(bei)全球市場(chang)所(suo)接納。”
開源不僅為濤(tao)思數據帶來(lai)了巨(ju)大的(de)成(cheng)功,為行業(ye)做(zuo)出了很好(hao)的(de)表(biao)率;對于中國(guo)軟件人才的(de)培養來(lai)說(shuo),也具有非常(chang)積極(ji)的(de)意義。
陶建(jian)輝表示,高(gao)校學(xue)(xue)生(sheng)(sheng)往(wang)往(wang)在跟導師做項(xiang)目(mu)時才能夠接觸(chu)到(dao)源(yuan)(yuan)(yuan)代碼(ma),而各類(lei)開(kai)(kai)放平臺上的(de)開(kai)(kai)源(yuan)(yuan)(yuan)軟件(jian)也非常有限,但是(shi)隨(sui)著TDengine的(de)開(kai)(kai)源(yuan)(yuan)(yuan),學(xue)(xue)生(sheng)(sheng)可以免費接觸(chu)到(dao)無數源(yuan)(yuan)(yuan)代碼(ma),這(zhe)無疑是(shi)最好的(de)學(xue)(xue)習機會(hui)和資(zi)源(yuan)(yuan)(yuan),會(hui)對中國(guo)軟件(jian)整體水平的(de)提高(gao)起(qi)到(dao)積極的(de)促進作用。為了促進大(da)學(xue)(xue)生(sheng)(sheng)對開(kai)(kai)源(yuan)(yuan)(yuan)的(de)認(ren)識和理(li)解,陶建(jian)輝先后(hou)在清(qing)華大(da)學(xue)(xue)、復旦大(da)學(xue)(xue)、重慶大(da)學(xue)(xue)、西(xi)南大(da)學(xue)(xue)、北(bei)京大(da)學(xue)(xue)、中國(guo)人民(min)大(da)學(xue)(xue)、北(bei)京郵(you)電大(da)學(xue)(xue)和中國(guo)科學(xue)(xue)技術大(da)學(xue)(xue)等20多個高(gao)校,分(fen)享 TDengine的(de)核心技術,開(kai)(kai)源(yuan)(yuan)(yuan)背后(hou)的(de)思考,鼓(gu)勵大(da)學(xue)(xue)生(sheng)(sheng)積極參與到(dao)開(kai)(kai)源(yuan)(yuan)(yuan)建(jian)設中來。
值(zhi)得一(yi)提(ti)的(de)是,對于程序(xu)員(yuan)來說,他們往(wang)(wang)往(wang)(wang)是默(mo)默(mo)地(di)改變著大家(jia)生(sheng)活的(de)一(yi)群人,隨著軟(ruan)件的(de)開(kai)源,他們從產品背(bei)后開(kai)始(shi)走出來,和更廣泛的(de)人群有(you)了(le)交流和互動(dong),在(zai)相(xiang)互促進之下,不僅可以進一(yi)步提(ti)升專業能力(li),用代碼打造屬于自己的(de)“名片”,同(tong)樣也有(you)利于行業整體水平(ping)的(de)提(ti)高。這(zhe)些在(zai)陶建輝(hui)眼(yan)中(zhong),都是比企(qi)業成(cheng)功更加有(you)意義(yi)、有(you)價值(zhi)的(de)事情。
時序數(shu)據(ju)的(de)(de)處(chu)理,是一切數(shu)字化、智能化的(de)(de)基(ji)礎。在(zai)TDengine廣(guang)泛(fan)的(de)(de)服務(wu)領(ling)域(yu)中,物流(liu)(liu)是非常(chang)重(zhong)要的(de)(de)部分(fen)。并且隨著物流(liu)(liu)行業(ye)的(de)(de)快速發(fa)展(zhan)、自動駕駛(shi)等技術的(de)(de)升(sheng)級(ji)和愈加廣(guang)泛(fan)的(de)(de)應用,對時序數(shu)據(ju)處(chu)理的(de)(de)需(xu)求也在(zai)不斷擴大。
“在(zai)(zai)物(wu)流(liu)領域(yu)最典型的(de)(de)(de)(de)(de)應用(yong)(yong)如物(wu)流(liu)車輛(liang)的(de)(de)(de)(de)(de)實時(shi)位置(zhi)和運行(xing)(xing)軌(gui)跡數(shu)(shu)(shu)(shu)據(ju),以(yi)及(ji)物(wu)流(liu)機器(qi)人、穿梭(suo)車等(deng)(deng)(deng)移動(dong)裝(zhuang)備的(de)(de)(de)(de)(de)位置(zhi)、電池狀態,以(yi)及(ji)路徑規劃、環境監(jian)測(ce)、軌(gui)跡追蹤等(deng)(deng)(deng)等(deng)(deng)(deng)數(shu)(shu)(shu)(shu)據(ju),通過(guo)TDengine,我們可(ke)以(yi)實現(xian)用(yong)(yong)更小(xiao)的(de)(de)(de)(de)(de)空間存(cun)儲(chu)更加海量的(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)據(ju),同時(shi)在(zai)(zai)最短的(de)(de)(de)(de)(de)時(shi)間,將用(yong)(yong)戶(hu)需要的(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)據(ju)進(jin)行(xing)(xing)調用(yong)(yong),以(yi)及(ji)分(fen)析計算(suan)等(deng)(deng)(deng),為(wei)其(qi)他更多功能的(de)(de)(de)(de)(de)實現(xian)提供支撐。”他針對TDengine在(zai)(zai)物(wu)流(liu)領域(yu)的(de)(de)(de)(de)(de)應用(yong)(yong)進(jin)行(xing)(xing)了說明(ming),并進(jin)一步舉例,國內某快(kuai)遞巨(ju)頭旗(qi)下互(hu)聯(lian)網科技(ji)公司(si),由于其(qi)原來采用(yong)(yong)的(de)(de)(de)(de)(de)時(shi)序數(shu)(shu)(shu)(shu)據(ju)庫OpenTSDB性能較差、占用(yong)(yong)存(cun)儲(chu)空間多、對大跨度(du)高頻(pin)詞的(de)(de)(de)(de)(de)查詢(xun)支持(chi)不(bu)夠等(deng)(deng)(deng)原因,將目光轉向了TDengine,在(zai)(zai)將大數(shu)(shu)(shu)(shu)據(ju)監(jian)控平(ping)臺遷移到TDengine之后,其(qi)所需服務(wu)器(qi)從(cong)之前的(de)(de)(de)(de)(de)21臺減少到3臺。此(ci)外(wai),TDengine在(zai)(zai)部署、寫入速度(du)、查詢(xun)速度(du)、存(cun)儲(chu)效率、緩存(cun)、流(liu)式計算(suan)等(deng)(deng)(deng)方面均凸顯出明(ming)顯的(de)(de)(de)(de)(de)優勢。此(ci)外(wai),如在(zai)(zai)煙草等(deng)(deng)(deng)行(xing)(xing)業(ye),隨著企業(ye)業(ye)務(wu)的(de)(de)(de)(de)(de)發展(zhan),生產中需要監(jian)測(ce)的(de)(de)(de)(de)(de)指標(biao)從(cong)幾萬個增加到幾十萬甚(shen)至百萬個以(yi)上,TDengine的(de)(de)(de)(de)(de)應用(yong)(yong)有(you)利于企業(ye)提升(sheng)數(shu)(shu)(shu)(shu)據(ju)存(cun)取效率、打破傳統數(shu)(shu)(shu)(shu)據(ju)孤島(dao)、提升(sheng)數(shu)(shu)(shu)(shu)據(ju)有(you)效利用(yong)(yong)率。
“技(ji)術(shu)是濤思(si)數據的立身之本,通過技(ji)術(shu)創新潛心(xin)研發極致的產品,讓技(ji)術(shu)創造價值是我們努(nu)力的方向。”在(zai)整個交流過程(cheng)中,從(cong)(cong)他(ta)(ta)不時(shi)爽朗的笑聲中,聽得出他(ta)(ta)對(dui)濤思(si)數據未來發展的極大(da)信(xin)心(xin);從(cong)(cong)他(ta)(ta)始終富有激(ji)情(qing)且面帶(dai)微笑的臉上,也看得出他(ta)(ta)對(dui)手中事業的熱(re)愛。“一(yi)般來說(shuo),程(cheng)序員的黃金年齡(ling)是25~35歲,像我這樣50歲還在(zai)寫代(dai)碼(ma)的程(cheng)序員已經是稀(xi)有動物了。”陶建(jian)輝(hui)自(zi)嘲到,“但是,我還會繼續(xu)寫,寫一(yi)輩(bei)子。”陶建(jian)輝(hui)站在(zai)大(da)大(da)的落地窗前,窗外視野開闊,陽光正好。