大數(shù)據(jù)模型與數(shù)據(jù)挖掘應(yīng)用實(shí)戰(zhàn)
編輯日期 2018-06-04 閱讀次數(shù):805 次
培訓(xùn)地點(diǎn)
北京
上海
深圳
培訓(xùn)時(shí)間
5月
18-19
7月
15-16
9月
2-3
本課程全國(guó)常年開(kāi)班,如部分地區(qū)課程已結(jié)束或有其他培訓(xùn)時(shí)間要求,請(qǐng)致電:400-676-1955咨詢(xún)近期培訓(xùn)信息!此課程也可以供企業(yè)做內(nèi)訓(xùn),歡迎咨詢(xún)!
培訓(xùn)地點(diǎn) |
北京 |
上海 |
深圳 |
培訓(xùn)時(shí)間 |
5月 18-19 |
7月 15-16 |
9月 2-3 |
【課程目標(biāo)】
本數(shù)據(jù)分析與挖掘系列課程包括三個(gè)等級(jí)的課程:
1、 基礎(chǔ)課程,專(zhuān)注于經(jīng)營(yíng)數(shù)據(jù)的統(tǒng)計(jì)與數(shù)據(jù)分析,適合于一般業(yè)務(wù)部門(mén)要求的數(shù)據(jù)統(tǒng)計(jì)與分析,內(nèi)容系統(tǒng)且全面,由淺入深,使用工具為Excel 2010版本以上。
2、 中級(jí)課程,專(zhuān)注于行業(yè)數(shù)據(jù)分析與數(shù)據(jù)挖掘,適合于數(shù)據(jù)分析部、業(yè)務(wù)支撐部等對(duì)數(shù)據(jù)分析與挖掘要求較高的部門(mén),使用專(zhuān)業(yè)數(shù)據(jù)分析與挖掘工具SPSS v19版本以上。
3、 高級(jí)課程,專(zhuān)注于較深入的數(shù)據(jù)挖掘技術(shù),包括挖掘模型原理介紹,數(shù)據(jù)建模,挖掘算法,適合于大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)及數(shù)據(jù)分析專(zhuān)業(yè)人士,需要有一定的數(shù)學(xué)基礎(chǔ)(統(tǒng)計(jì)與概率),使用數(shù)據(jù)流挖掘工具Modeler 14.1版本以上。
本課程為高級(jí)課程,面向數(shù)據(jù)分析部等專(zhuān)門(mén)負(fù)責(zé)數(shù)據(jù)分析與挖掘的人士。
本課程培訓(xùn)覆蓋以下內(nèi)容:
1、 數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程。
2、 數(shù)據(jù)挖掘探索性分析。
3、 數(shù)據(jù)挖掘模型原理。
本課程從實(shí)際的電信運(yùn)營(yíng)商的業(yè)務(wù)需求出發(fā),對(duì)數(shù)據(jù)分析及數(shù)據(jù)挖掘技術(shù)進(jìn)行了全面的介紹,通過(guò)大量的操作演練,幫助學(xué)員掌握數(shù)據(jù)分析和數(shù)據(jù)挖掘的思路、方法、工具,從大量的企業(yè)經(jīng)營(yíng)數(shù)據(jù)中進(jìn)行分析,發(fā)現(xiàn)業(yè)務(wù)運(yùn)作規(guī)律,進(jìn)行客戶(hù)洞察,挖掘客戶(hù)行為特點(diǎn),消費(fèi)行為,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo),幫助運(yùn)營(yíng)團(tuán)隊(duì)深入理解業(yè)務(wù)運(yùn)作,以達(dá)到提升學(xué)員的數(shù)據(jù)綜合分析能力,支撐運(yùn)營(yíng)決策的目的。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、 掌握數(shù)據(jù)挖掘的基本過(guò)程和步驟。
2、 掌握數(shù)據(jù)挖掘的預(yù)處理方法,探索數(shù)據(jù)間的相關(guān)性,為建模打下基礎(chǔ)。
3、 理解數(shù)據(jù)挖掘的常見(jiàn)模型,原理及適用場(chǎng)景。
4、 熟練掌握Modeler基本操作,能利用Modeler進(jìn)行數(shù)據(jù)挖掘。
【培訓(xùn)特色】
基礎(chǔ)知識(shí)精講 + 案例演練 + 實(shí)際業(yè)務(wù)問(wèn)題分析 + SPSS實(shí)際操作
本課程突出數(shù)據(jù)挖掘的實(shí)際應(yīng)用,結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),從實(shí)際問(wèn)題入手,引出相關(guān)知識(shí),進(jìn)行大數(shù)據(jù)的收集與處理;探索數(shù)據(jù)之間的規(guī)律及關(guān)聯(lián)性,幫助學(xué)員掌握系統(tǒng)的數(shù)據(jù)預(yù)處理方法;介紹常用的模型,訓(xùn)練模型,并優(yōu)化模型,以達(dá)到更好的分析結(jié)果。
【培訓(xùn)對(duì)象】
業(yè)務(wù)支撐、網(wǎng)絡(luò)中心、IT系統(tǒng)部、數(shù)據(jù)分析部等對(duì)業(yè)務(wù)數(shù)據(jù)分析有較高要求的相關(guān)專(zhuān)業(yè)人員。
【課程時(shí)長(zhǎng)】
系統(tǒng)學(xué)習(xí)2天
【學(xué)員要求】
1、 每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。
2、 便攜機(jī)中事先安裝好SPSS modeler v14.1版本以上軟件。
注:講師可以提供試用版本軟件及分析數(shù)據(jù)源。
【課程費(fèi)用及證書(shū)】
費(fèi)用:5800元/人,包含:培訓(xùn)費(fèi)、教材費(fèi)、場(chǎng)地費(fèi)、證書(shū)費(fèi)、午餐茶點(diǎn)、稅費(fèi)等。
證書(shū):培訓(xùn)后授發(fā)個(gè)人培訓(xùn)證書(shū)。
【課程大綱】
第一部分:數(shù)據(jù)挖掘基礎(chǔ)知識(shí)(基礎(chǔ),決定你的高度)
1、 數(shù)據(jù)挖掘工具簡(jiǎn)介
? EXCEL規(guī)劃求解(數(shù)據(jù)建模工具)
? SAS統(tǒng)計(jì)分析系統(tǒng)
? SPSS統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案
2、 數(shù)據(jù)挖掘概述
案例:宜家IKE如何通過(guò)數(shù)據(jù)挖掘來(lái)降低營(yíng)銷(xiāo)成本提升利潤(rùn)?
3、 數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)
? 商業(yè)理解
? 數(shù)據(jù)準(zhǔn)備
? 數(shù)據(jù)理解
? 模型建立
? 模型評(píng)估
? 模型應(yīng)用
案例:通信客戶(hù)流失分析及預(yù)警模型
4、 數(shù)據(jù)建模示例
案例:客戶(hù)匹配度建模—找到你的準(zhǔn)客戶(hù)
第二部分:數(shù)據(jù)理解與數(shù)據(jù)準(zhǔn)備(Modeler實(shí)操)
1、 數(shù)據(jù)挖掘處理的一般過(guò)程
? 數(shù)據(jù)源à數(shù)據(jù)理解à數(shù)據(jù)準(zhǔn)備à探索分析à數(shù)據(jù)建模à模型評(píng)估
2、 數(shù)據(jù)讀入
? 讀入文本文件
? 讀入Excel電子表格
? 讀入SPSS格式文件
? 讀入數(shù)據(jù)庫(kù)數(shù)據(jù)
3、 數(shù)據(jù)集成
? 變量合并(增加變量)
? 數(shù)據(jù)追加(添加記錄)
4、 數(shù)據(jù)理解
? 取值范圍限定
? 重復(fù)數(shù)據(jù)處理
? 缺失值處理
? 無(wú)效值處理
? 離群點(diǎn)和極端值的修正
? 數(shù)據(jù)質(zhì)量評(píng)估
5、 數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)處理
? 數(shù)據(jù)篩選:數(shù)據(jù)抽樣/選擇(減少樣本數(shù)量)
? 數(shù)據(jù)精簡(jiǎn):數(shù)據(jù)分段/離散化(減少變量的取值)
? 數(shù)據(jù)平衡:正反樣本比例均衡
? 其它:排序、分類(lèi)匯總
6、 數(shù)據(jù)準(zhǔn)備:變量處理
? 變量變換:原變量值更新
? 變量派生:生成新的變量
? 變量精簡(jiǎn):降維,減少變量個(gè)數(shù)
7、 基本分析
? 單變量:數(shù)據(jù)基本描述分析
? 雙變量:相關(guān)性分析
? 變量精簡(jiǎn):特征選擇、因子分析
8、 特征選擇
? 特征選擇方法:選擇重要變量,剔除不重要的變量
? 從變量本身考慮
? 從輸入變量與目標(biāo)變量的相關(guān)性考慮
9、 因子分析(主成分分析)
? 因子分析的原理
? 因子個(gè)數(shù)如何選擇
? 如何解讀因子含義
案例:提取影響電信客戶(hù)流失的主成分分析
第三部分:因素影響分析(特征重要性分析)
問(wèn)題:如何判斷一個(gè)因素對(duì)另一個(gè)因素有影響?
比如營(yíng)銷(xiāo)費(fèi)用是否會(huì)影響銷(xiāo)售額?產(chǎn)品價(jià)格是否會(huì)影響銷(xiāo)量?產(chǎn)品的陳列位置是否會(huì)影響銷(xiāo)量?
1、 常用特征重要性分析的方法
? 特征選擇(減少變量個(gè)數(shù)):相關(guān)分析、方差分析、卡方檢驗(yàn)
? 因子分析(減少變量個(gè)數(shù)):主成分分析
? 確定變量個(gè)數(shù)參考表
2、 相關(guān)分析(數(shù)值+數(shù)值,相關(guān)程度計(jì)算)
問(wèn)題:這兩個(gè)屬性是否會(huì)相互影響?影響程度大嗎?
? 相關(guān)分析概述
? 相關(guān)系數(shù)計(jì)算公式
? 相關(guān)性假設(shè)檢驗(yàn)
案例:通信基本費(fèi)用與開(kāi)通月數(shù)的相關(guān)分析
3、 方差分析(分類(lèi)+數(shù)值,影響因素分析)
問(wèn)題:哪些才是影響銷(xiāo)量的關(guān)鍵因素?
? 方差分析原理
? 方差分析的步驟
? 方差分析適用場(chǎng)景
案例:開(kāi)通月數(shù)對(duì)客戶(hù)流失的影響分析
4、 列聯(lián)分析(分類(lèi)+分類(lèi),影響因素分析)
? 列聯(lián)表的原理
? 卡方檢驗(yàn)的步驟
? 列聯(lián)表分析的適用場(chǎng)景
案例:套餐類(lèi)型對(duì)對(duì)客戶(hù)流失的影響分析
第四部分:分類(lèi)預(yù)測(cè)模型分析
1、 分類(lèi)概述
? 分類(lèi)的基本過(guò)程
? 常見(jiàn)分類(lèi)預(yù)測(cè)模型
2、 邏輯回歸分析模型
問(wèn)題:如果評(píng)估用戶(hù)是否購(gòu)買(mǎi)產(chǎn)品的概率?
? 邏輯回歸分析
? 邏輯回歸的原理
案例:客戶(hù)購(gòu)買(mǎi)預(yù)測(cè)分析(二元邏輯回歸)
3、 決策樹(shù)分類(lèi)
問(wèn)題:如何提取客戶(hù)流失者、拖欠貨款者的特征?如何預(yù)測(cè)其流失的概率?
? 決策樹(shù)分類(lèi)的原理
? 決策樹(shù)的三個(gè)關(guān)鍵問(wèn)題
? 決策樹(shù)算法
? 如何評(píng)估分類(lèi)模型的性能(查準(zhǔn)率、查全率)
案例:識(shí)別銀行欠貨風(fēng)險(xiǎn),提取欠貨者的特征
案例:客戶(hù)流失預(yù)警與客戶(hù)挽留模型
4、 神經(jīng)網(wǎng)絡(luò)
? 神經(jīng)網(wǎng)絡(luò)概述
? 神經(jīng)元工作原理
? 神經(jīng)網(wǎng)絡(luò)的建立步驟
? B-P反向傳播網(wǎng)絡(luò)(MLP)
? 徑向基函數(shù)網(wǎng)絡(luò)(RBF)
5、 支持向量機(jī)
? SVM基本原理
? 維災(zāi)難與核函數(shù)
6、 樸素貝葉斯分類(lèi)
? 條件概率
? 樸素貝葉斯
? TAN貝葉斯網(wǎng)絡(luò)
? 馬爾科夫毯網(wǎng)絡(luò)
第五部分:市場(chǎng)細(xì)分與客戶(hù)細(xì)分
1、 客戶(hù)細(xì)分常用方法
2、 聚類(lèi)分析(Clustering)
問(wèn)題:如何對(duì)市場(chǎng)進(jìn)行細(xì)分?如何提取客戶(hù)特征,從而對(duì)產(chǎn)品進(jìn)行市場(chǎng)定位?
? 聚類(lèi)方法原理介紹
? 聚類(lèi)方法適用場(chǎng)景
? 如何細(xì)分客戶(hù)群,并提取出客戶(hù)群的特征?
? K均值聚類(lèi)(快速聚類(lèi))
? 兩步聚類(lèi)
案例:移動(dòng)三大品牌細(xì)分市場(chǎng)合適嗎?
演練:寶潔公司如何選擇新產(chǎn)品試銷(xiāo)區(qū)域?
3、 RFM模型分析
? RFM模型,更深入了解你的客戶(hù)價(jià)值
? RFM模型與市場(chǎng)策略
? RFM模型與活躍度
案例:淘寶客戶(hù)價(jià)值評(píng)估與促銷(xiāo)名單
第六部分:其他市場(chǎng)營(yíng)銷(xiāo)分析方法
1、 關(guān)聯(lián)分析(Association)
問(wèn)題:購(gòu)買(mǎi)面包的人是否也會(huì)購(gòu)買(mǎi)牛奶?他們同時(shí)購(gòu)買(mǎi)哪些產(chǎn)品?
? 關(guān)聯(lián)規(guī)則原理介紹
? 關(guān)聯(lián)規(guī)則適用場(chǎng)景:交叉銷(xiāo)售、捆綁營(yíng)銷(xiāo)、產(chǎn)品布局
案例:超市商品交叉銷(xiāo)售與布局優(yōu)化(關(guān)聯(lián)分析)
結(jié)束:課程總結(jié)與問(wèn)題答疑。
【講師簡(jiǎn)介】
傅老師
華為系大數(shù)據(jù)巨匠,計(jì)算機(jī)軟件與理論碩士研究生(研究方向:數(shù)據(jù)挖掘、搜索引擎)。在華為工作十年,數(shù)篇國(guó)家專(zhuān)利,曾在英國(guó)、日本、荷蘭等國(guó)做項(xiàng)目,對(duì)歐洲、日本的電信市場(chǎng)有比較深的了解。
傅老師專(zhuān)注于大數(shù)據(jù)分析與挖掘等應(yīng)用技術(shù),以及大數(shù)據(jù)系統(tǒng)部署解決方案。旨在將大數(shù)據(jù)的數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)建模應(yīng)用于行業(yè)及商業(yè)領(lǐng)域,解決行業(yè)實(shí)際的問(wèn)題。將大數(shù)據(jù)應(yīng)用于運(yùn)營(yíng)決策,幫助企業(yè)提升運(yùn)營(yíng)決策能力;應(yīng)用于市場(chǎng)營(yíng)銷(xiāo),通過(guò)大數(shù)據(jù)營(yíng)銷(xiāo),解決營(yíng)銷(xiāo)中的用戶(hù)群細(xì)分,產(chǎn)品定位,精準(zhǔn)營(yíng)銷(xiāo),精準(zhǔn)促銷(xiāo)等實(shí)際問(wèn)題,提升營(yíng)銷(xiāo)效果,節(jié)省營(yíng)銷(xiāo)費(fèi)用,以及市場(chǎng)預(yù)測(cè)、用戶(hù)行為預(yù)測(cè)等。
傅老師目前致力于將大數(shù)據(jù)技術(shù)應(yīng)用于通信、金融、航空、電商、互聯(lián)網(wǎng)等領(lǐng)域。傅老師的課程特色是實(shí)戰(zhàn)性強(qiáng)!實(shí)現(xiàn)“業(yè)務(wù)問(wèn)題+分析思路+分析方法/分析模型+分析工具+結(jié)果應(yīng)用”融為一體。即,結(jié)合清晰的業(yè)務(wù)場(chǎng)景(明確目的),分解為具體的數(shù)據(jù)問(wèn)題(分析思路),選擇最合適的方法(分析方法),深入淺出的理論講解(分析模型),使用簡(jiǎn)單實(shí)用的工具操作(分析工具),實(shí)現(xiàn)分析結(jié)果到業(yè)務(wù)策略的落地。