大數(shù)據(jù) 發(fā)表時(shí)間:2018/5/15 12:33:08??作者:sxds??
大數(shù)據(jù) 發(fā)表時(shí)間:2018/5/15 12:33:08??作者:sxds??
伴隨傳感器采集的數(shù)據(jù)越來(lái)越多,IoT領(lǐng)域越來(lái)越多的參數(shù)被納入考慮的范疇,數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系持續(xù)增強(qiáng),而這些新型關(guān)聯(lián)關(guān)系,將會(huì)激發(fā)全新的模型和視野。
數(shù)據(jù)分析是一種探索活動(dòng),陳廣乾通過(guò)多年的教訓(xùn)和經(jīng)驗(yàn)總結(jié),形成了一套工業(yè)大數(shù)據(jù)在企業(yè)落地的邏輯與方法。
他在海爾時(shí)就主導(dǎo)大數(shù)據(jù)相關(guān)項(xiàng)目,并且知道不是所有的數(shù)據(jù)都是大數(shù)據(jù)。社會(huì)數(shù)據(jù)早就有,質(zhì)量數(shù)據(jù)也早就有,關(guān)鍵是這堆數(shù)據(jù)里,能否通過(guò)分析深度數(shù)據(jù),形成新的數(shù)據(jù)模型,來(lái)實(shí)現(xiàn)新的價(jià)值組合?利用這些綜合的算法分析,找出什么樣企業(yè)、什么樣的數(shù)據(jù),適合什么樣的模型,是他做工業(yè)大數(shù)據(jù)分析的一個(gè)基本方法論。
他首先解決的是工業(yè)數(shù)據(jù)難于理解的問(wèn)題。工業(yè)對(duì)象的系統(tǒng)性明顯,復(fù)雜程度高,對(duì)數(shù)據(jù)分析的質(zhì)量要求高。而深入理解各個(gè)工業(yè),則要花費(fèi)太長(zhǎng)時(shí)間。
他在和清華、北大等大數(shù)據(jù)領(lǐng)域的博士溝通時(shí)了解到,雖然博士們對(duì)數(shù)據(jù)算法有很深的研究,但是卻找不到數(shù)據(jù)后面的業(yè)務(wù)含義,原因是他們欠缺業(yè)務(wù)模型訓(xùn)練。而業(yè)務(wù)模型訓(xùn)練是非常重要的,它是具體行業(yè)問(wèn)題的“解鈴人”。
接著,將業(yè)務(wù)模型建立起來(lái)以后再做算法,算法形成后,回過(guò)頭來(lái)檢測(cè)與實(shí)際業(yè)務(wù)需求的差別。實(shí)施的過(guò)程本就是不斷調(diào)整的過(guò)程,不斷訓(xùn)練模型,一直到這個(gè)模型能解決業(yè)務(wù)問(wèn)題,能產(chǎn)生實(shí)際效果,形成一個(gè)閉環(huán)的循環(huán)。
以陳廣乾帶領(lǐng)團(tuán)隊(duì)完成的工程機(jī)械大數(shù)據(jù)項(xiàng)目為例,根據(jù)下面他們繪制的工程機(jī)械經(jīng)銷商業(yè)務(wù)全景圖,利用工業(yè)大數(shù)據(jù)分析,他們完成了代表性企業(yè)的運(yùn)營(yíng)優(yōu)化任務(wù),最終的項(xiàng)目績(jī)效相當(dāng)亮眼:
項(xiàng)目成功預(yù)測(cè)工程機(jī)械老客戶6億元的潛在金額流失,其中重度流失2.8億元,中度流失2.3億元,潛度流失0.9億元。
項(xiàng)目成功挖掘工程機(jī)械新客戶8.2億元銷售機(jī)會(huì),其中大型機(jī)2.2億元,中型機(jī)3.5億元,小型機(jī)2.5億元。
基于銷售網(wǎng)格,項(xiàng)目全面支持1,000名現(xiàn)有員工實(shí)現(xiàn)20億元的債權(quán)逾期管控。
所以這是基于前端的用戶標(biāo)簽如:相似性、消費(fèi)行為的聚類性、分群性來(lái)做算法,這是基于算法模型。
專供工業(yè)大數(shù)據(jù)的時(shí)序數(shù)據(jù)庫(kù)
在工業(yè)大數(shù)據(jù)存儲(chǔ)領(lǐng)域,除了傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)以外,還有一種類型的數(shù)據(jù)庫(kù)是非常必要和實(shí)用,就是時(shí)序數(shù)據(jù)庫(kù),工控領(lǐng)域也稱其為實(shí)時(shí)數(shù)據(jù)庫(kù)。
由于IoT領(lǐng)域幾乎全部傳感數(shù)據(jù)和控制數(shù)據(jù)都是時(shí)序數(shù)據(jù),陶建輝總結(jié)了工業(yè)大數(shù)據(jù)的時(shí)序空間特性。
時(shí)序數(shù)據(jù)庫(kù)并不單單只是一個(gè)數(shù)據(jù)庫(kù),而是一個(gè)系統(tǒng),包括對(duì)各類工業(yè)接口的數(shù)據(jù)采集、壓縮、存儲(chǔ)、檢索、實(shí)時(shí)計(jì)算,基于監(jiān)測(cè)數(shù)據(jù)的反饋及控制功能等。
時(shí)序數(shù)據(jù)庫(kù)的出現(xiàn),主要是為了解決關(guān)系型數(shù)據(jù)庫(kù)不太擅長(zhǎng)的領(lǐng)域,包括:
1、海量數(shù)據(jù)的實(shí)時(shí)讀寫操作:工業(yè)監(jiān)控?cái)?shù)據(jù)要求采集速度和響應(yīng)速度均是毫秒級(jí)的,一個(gè)大型企業(yè)幾萬(wàn)甚至幾十萬(wàn)監(jiān)測(cè)點(diǎn)都是常有的事情,這么大容量的高頻數(shù)據(jù),如果用關(guān)系數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ),很難進(jìn)行每秒幾十萬(wàn)次的數(shù)據(jù)的讀寫操作。
2、大容量數(shù)據(jù)的存儲(chǔ):由于數(shù)據(jù)采集是海量的監(jiān)控?cái)?shù)據(jù),如果用傳統(tǒng)數(shù)據(jù)庫(kù)存儲(chǔ),將會(huì)占用大量空間。如用關(guān)系數(shù)據(jù)庫(kù)保存10,000個(gè)監(jiān)測(cè)點(diǎn),每個(gè)監(jiān)測(cè)點(diǎn)每秒鐘采集一次雙精度數(shù)的數(shù)據(jù),需要5-6TB空間,如果考慮其它因素再建立索引,則需15-20TB空間。時(shí)序數(shù)據(jù)庫(kù)采用專門的壓縮算法,存儲(chǔ)量能夠縮小到1/40,因此只需500GB的空間就能有效存儲(chǔ)。
3、集成了工業(yè)接口的數(shù)據(jù)采集:工業(yè)通訊、傳輸?shù)膮f(xié)議種類繁多,時(shí)序數(shù)據(jù)庫(kù)一般都集成了大量的工業(yè)協(xié)議接口,可以對(duì)各種類型的工業(yè)協(xié)議進(jìn)行解析和傳輸。
具備流式計(jì)算能力的工業(yè)大數(shù)據(jù)平臺(tái)在2017年前后漸熱,出現(xiàn)了大量的開(kāi)源和商業(yè)產(chǎn)品。
陶建輝抓住上述開(kāi)源大數(shù)據(jù)平臺(tái)在物聯(lián)網(wǎng)大數(shù)據(jù)處理上性能價(jià)格比低下的問(wèn)題,開(kāi)發(fā)了專業(yè)高效的時(shí)序數(shù)據(jù)引擎TDengine,大幅降低應(yīng)用開(kāi)發(fā)難度和成本,縮短應(yīng)用推向市場(chǎng)的時(shí)間。
TDengine正在高鐵項(xiàng)目上進(jìn)行測(cè)試,替代原有的MySQL,大幅提升了數(shù)據(jù)分析的時(shí)效性。
工控領(lǐng)域市場(chǎng)份額最大的實(shí)時(shí)數(shù)據(jù)庫(kù)是美國(guó)OSIsoft公司的PI System,因其在物聯(lián)網(wǎng)領(lǐng)域的前瞻布局,2017年獲得了軟銀的投資。在2018年5月初,OSIsoft公司一年一度的用戶大會(huì)中,PI System不僅進(jìn)行了全新升級(jí),提供機(jī)器學(xué)習(xí)能力,同時(shí)支持邊緣和云端運(yùn)算,還正在嘗試與區(qū)塊鏈的結(jié)合應(yīng)用。
工業(yè)大數(shù)據(jù)之工控大數(shù)據(jù)
我認(rèn)為工控大數(shù)據(jù)是工業(yè)大數(shù)據(jù)中非常特殊的一類,因此單獨(dú)進(jìn)行闡述。
制造業(yè)領(lǐng)域的生產(chǎn)相關(guān)數(shù)據(jù),我們姑且把它稱為工控大數(shù)據(jù),雖然它并不符合通常意義上大數(shù)據(jù)的標(biāo)準(zhǔn),但仍舊可以借鑒互聯(lián)網(wǎng)大數(shù)據(jù)的技術(shù),創(chuàng)造嶄新價(jià)值。
來(lái)自GE統(tǒng)計(jì),現(xiàn)在工業(yè)企業(yè)內(nèi)部由機(jī)器產(chǎn)生的數(shù)據(jù)量是非常龐大的,以TB來(lái)計(jì)。由于前期很多技術(shù)原因,以及對(duì)數(shù)據(jù)采集不夠重視,我們并沒(méi)有充分利用這些數(shù)據(jù),利用率不到2%。如何提升工控大數(shù)據(jù)的利用率,關(guān)系到智能化水平,這是工業(yè)企業(yè)面臨的最大挑戰(zhàn)和難題之一。
如果給出詳細(xì)定義,工控大數(shù)據(jù)是指在工業(yè)領(lǐng)域的工廠內(nèi)部,通過(guò)傳感器等物聯(lián)網(wǎng)技術(shù)進(jìn)行數(shù)據(jù)采集、傳輸?shù)脕?lái)的數(shù)據(jù),由于數(shù)據(jù)量巨大,傳統(tǒng)的信息技術(shù)已無(wú)法對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行處理、分析、展示,而在傳統(tǒng)工業(yè)信息化技術(shù)的基礎(chǔ)上借鑒了互聯(lián)網(wǎng)大數(shù)據(jù)的技術(shù),提出的新型的基于數(shù)據(jù)驅(qū)動(dòng)的工業(yè)信息化技術(shù)及其應(yīng)用。
工控大數(shù)據(jù)尤其注重?cái)?shù)據(jù)質(zhì)量,怎樣才能把工控大數(shù)據(jù)的質(zhì)量控制好?郭朝暉的經(jīng)驗(yàn)告訴我們,如果一項(xiàng)數(shù)據(jù)不與業(yè)務(wù)結(jié)合,數(shù)據(jù)出多少問(wèn)題都沒(méi)人知道。所以工控大數(shù)據(jù),必須首先讓這些數(shù)據(jù)“有用”。數(shù)據(jù)有用了,數(shù)據(jù)質(zhì)量才會(huì)持續(xù)改進(jìn),數(shù)據(jù)質(zhì)量高了,才有被利用的基礎(chǔ),推動(dòng)智能化才劃算。
漢慕會(huì)展(上海)有限公司隸屬勵(lì)展國(guó)際博覽的全資子公司主要負(fù)責(zé)亞洲區(qū)展覽及會(huì)議組織、策劃、主辦和承辦各類國(guó)際性大型展覽會(huì)、博覽會(huì)、學(xué)術(shù)交流等活動(dòng)的專業(yè)會(huì)展單位。
悅頓體育照明品牌創(chuàng)始人,20年來(lái)專注于各級(jí)各類體育運(yùn)動(dòng)場(chǎng)館的專業(yè)化照明!點(diǎn)亮精彩,照亮運(yùn)動(dòng)!有需要的朋友攜手合作!賬號(hào)為微信號(hào),運(yùn)動(dòng)健康,你我共享!
基于家族經(jīng)銷商生意,自身作為經(jīng)銷商業(yè)主,從事商品經(jīng)銷行業(yè)二十余年,期間在數(shù)個(gè)著名企業(yè)兼任業(yè)務(wù)經(jīng)理及培訓(xùn)師等職。