工業(yè)大數(shù)據(jù)是工業(yè)領(lǐng)域相關(guān)數(shù)據(jù)集的總稱(chēng),是工業(yè)互聯(lián)網(wǎng)的核心,是智能制造的關(guān)鍵。工業(yè)大數(shù)據(jù)分析技術(shù)作為工業(yè)大數(shù)據(jù)的核心技術(shù)之一,是工業(yè)智能化發(fā)展的重要基礎(chǔ)和關(guān)鍵支撐。為此,在工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟的指導(dǎo)下,工業(yè)大數(shù)據(jù)特設(shè)組主持編寫(xiě)了這本《工業(yè)大數(shù)據(jù)分析指南》。
本書(shū)旨在對(duì)通用的工業(yè)大數(shù)據(jù)分析方法和分析流程進(jìn)行歸納總結(jié),對(duì)其關(guān)鍵共性進(jìn)行辨識(shí)、抽象和提升,而非針對(duì)某一特定行業(yè)、企業(yè)或產(chǎn)品進(jìn)行闡述。本書(shū)更加關(guān)注于方法論而非某些具體的技術(shù),因此具有更加廣泛的通用性和相對(duì)普遍的指導(dǎo)意義。
本書(shū)共分為9章,第1章首先論述了工業(yè)大數(shù)據(jù)分析的概念、特殊性以及常見(jiàn)的問(wèn)題;第2章提出了工業(yè)大數(shù)據(jù)分析框架,簡(jiǎn)要介紹了CRISP-DM模型,并針對(duì)模型落地的難點(diǎn)和模型使用的指導(dǎo)思想展開(kāi)討論;從第3章到第8章,依次對(duì)業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、模型驗(yàn)證與評(píng)估、模型部署這6個(gè)CRISP-DM模型的基本步驟進(jìn)行了詳細(xì)的闡述,從需求分析到目標(biāo)評(píng)估,從數(shù)據(jù)來(lái)源到數(shù)據(jù)分類(lèi),從數(shù)據(jù)預(yù)處理到建模過(guò)程,從模型驗(yàn)證到部署問(wèn)題處理,對(duì)每一個(gè)步驟中的原理方法、分析過(guò)程、處理方式、問(wèn)題排除等都一一進(jìn)行了講解和說(shuō)明;最后,第9章對(duì)工業(yè)大數(shù)據(jù)分析的未來(lái)發(fā)展進(jìn)行了展望。
本書(shū)由工業(yè)大數(shù)據(jù)特設(shè)組組長(zhǎng)單位清華大學(xué)牽頭編寫(xiě),在編寫(xiě)過(guò)程中得到了工信部領(lǐng)導(dǎo)的悉心指導(dǎo)和相關(guān)單位的有力支撐。特別感謝清華大學(xué)孫家廣院士、工信部信軟司謝少鋒司長(zhǎng)等給予的全面指導(dǎo)。同時(shí),北京工業(yè)大數(shù)據(jù)創(chuàng)新中心的李三華、田春華,清華大學(xué)的任艮全、徐哲、強(qiáng)逍等在本書(shū)的編寫(xiě)階段也給予了無(wú)私的幫助,在此表示誠(chéng)摯的謝意。
工業(yè)大數(shù)據(jù)作為新興概念,其數(shù)據(jù)分析的原則、手段、方法和流程還很模糊,對(duì)海量數(shù)據(jù)的挖掘、分析和處理等技術(shù)仍在不斷的發(fā)展和進(jìn)步,由于作者自身的能力和水平有限,本書(shū)不可避免的存在諸多的缺點(diǎn)和不足,期待各位讀者能夠積極發(fā)現(xiàn)問(wèn)題,并予以批評(píng)指正。