CDA數(shù)據(jù)分析師認(rèn)證之?dāng)?shù)據(jù) 挖掘?qū)崙?zhàn)培訓(xùn)課程簡(jiǎn)介
我要報(bào)名編輯日期 2018-06-13 閱讀次數(shù):442 次
【課程目標(biāo)】
CDA(Certified Data Analyst)全稱“注冊(cè)數(shù)據(jù)分析師”,由“CERTIFIED DATA ANALYST INSTITUTE(CDA數(shù)據(jù)分析師協(xié)會(huì))”發(fā)起成立的職業(yè)簡(jiǎn)稱,旨在培養(yǎng)正規(guī)化、科學(xué)化的數(shù)據(jù)分析人才隊(duì)伍,進(jìn)一步提升數(shù)據(jù)分析師的職業(yè)素養(yǎng)與能力水平,促進(jìn)數(shù)據(jù)分析行業(yè)的高質(zhì)量持續(xù)快速發(fā)展。CDA數(shù)據(jù)分析師面向商業(yè)職場(chǎng)數(shù)據(jù)分析,分為三個(gè)等級(jí),在國(guó)內(nèi)由人大經(jīng)濟(jì)論壇主辦資格考試,通過考試者可以獲得CDA協(xié)會(huì)頒發(fā)的數(shù)據(jù)分析師資格證書,此證書代表數(shù)據(jù)分析師人才技能水平,為企業(yè)事業(yè)單位選拔本課程為CDA II(建模分析師)課程培訓(xùn)大綱。
本課程基于CDA的認(rèn)證知識(shí)要求,圍繞商業(yè)問題,介紹了數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程,數(shù)據(jù)預(yù)處理,數(shù)據(jù)挖掘方法,數(shù)據(jù)挖掘模型,模型評(píng)估,模型參數(shù)優(yōu)化,等等,使得學(xué)員掌握數(shù)據(jù)挖掘的方法、模型、工具。
通過本課程的學(xué)習(xí),達(dá)到如下目的:
1、 了解數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本知識(shí),理解大數(shù)據(jù)思維方式。
2、 掌握數(shù)據(jù)挖掘的基本過程和步驟,掌握數(shù)據(jù)挖掘的思路和框架。
3、 能夠理解分析模型原理,掌握模型應(yīng)用場(chǎng)景,能夠利用模型解決復(fù)雜的商業(yè)問題。
4、 掌握常用的數(shù)據(jù)模型,能夠根據(jù)商業(yè)問題選擇合適的分析模型。
5、 熟悉SPSS基本操作,掌握分析操作,能夠解讀分析結(jié)果,并轉(zhuǎn)化為業(yè)務(wù)策略。
【培訓(xùn)對(duì)象】
本課程為參加CDA II(建模分析師)認(rèn)證的數(shù)據(jù)分析與數(shù)據(jù)挖掘人員,為數(shù)據(jù)挖掘高級(jí)班,要求有數(shù)學(xué)基礎(chǔ),掌握概率論和統(tǒng)計(jì)理論基礎(chǔ),有數(shù)據(jù)分析經(jīng)驗(yàn)。
適合于如下人員:數(shù)據(jù)分析師、大數(shù)據(jù)系統(tǒng)研發(fā)人員、大數(shù)據(jù)系統(tǒng)架構(gòu)師、業(yè)務(wù)支撐部等對(duì)業(yè)務(wù)數(shù)據(jù)分析與挖掘有專業(yè)要求的相關(guān)人員。
【學(xué)員要求】
每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。
便攜機(jī)中事先安裝好Excel 2013軟件。
便攜機(jī)中事先安裝好SPSS v19軟件。
注:講師可以提供試用版本軟件及分析數(shù)據(jù)源。
【授課方式】
基礎(chǔ)知識(shí)精講 + 案例講解 + 操作演練 + 實(shí)際業(yè)務(wù)問題分析 + SPSS實(shí)際操作
本課程突出數(shù)據(jù)挖掘的實(shí)際應(yīng)用,結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),從實(shí)際問題入手,引出相關(guān)知識(shí),進(jìn)行大數(shù)據(jù)的收集與處理;引導(dǎo)學(xué)員思考,構(gòu)建分析模型,進(jìn)行數(shù)據(jù)分析與挖掘,以及數(shù)據(jù)呈現(xiàn)與解讀,全過程演練操作,以達(dá)到提升學(xué)員的數(shù)據(jù)綜合分析能力,支撐運(yùn)營(yíng)決策的目的。
【培訓(xùn)時(shí)長(zhǎng)】
4-5天
【課程大綱】
第一部分:數(shù)據(jù)集基礎(chǔ)知識(shí)(了解你的數(shù)據(jù)集)
數(shù)據(jù)集概述
數(shù)據(jù)集的類型
數(shù)據(jù)集屬性的類型
標(biāo)稱
序數(shù)
度量
數(shù)據(jù)質(zhì)量三要素
準(zhǔn)確性
完整性
一致性
數(shù)據(jù)預(yù)處理的內(nèi)容
數(shù)據(jù)清理(缺失值、離群值的處理方法)
數(shù)據(jù)歸約(維災(zāi)難、維歸約、主成分分析)
特征子集選擇
特征創(chuàng)建/屬性構(gòu)造
數(shù)據(jù)離散化和二元化
屬性/變量轉(zhuǎn)換
數(shù)據(jù)探索性分析
統(tǒng)計(jì)匯總
可視化
演練:描述性分析(頻數(shù)、描述、探索、分類匯總)
第二部分:數(shù)據(jù)挖掘流程(基礎(chǔ),決定你的高度)
數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)
商業(yè)理解
數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)理解
模型建立
模型評(píng)估
模型應(yīng)用
案例:4G終端營(yíng)銷項(xiàng)目挖掘過程分析
案例:客戶匹配度模型—數(shù)據(jù)建模
常用數(shù)據(jù)統(tǒng)計(jì)指標(biāo)
集中程度:均值、中位數(shù)、眾數(shù)
離開程度:方差、標(biāo)準(zhǔn)差、極差
分布趨勢(shì):偏度、峰度
理解分布:正態(tài)分布、T分布、F分布
SPSS基本操作(預(yù)處理)
數(shù)據(jù)導(dǎo)入
數(shù)據(jù)排序(排序個(gè)案)
重復(fù)數(shù)據(jù)處理(標(biāo)識(shí)重復(fù)個(gè)案)
缺失值處理(替換缺失值)
生成新變量(計(jì)算變量、重新編碼)
數(shù)據(jù)分組(分類匯總)
數(shù)據(jù)合并(合并文件)
演練:SPSS基本操作
第三部分:數(shù)據(jù)挖掘?qū)崙?zhàn)篇
參數(shù)檢驗(yàn)分析(樣本均值檢驗(yàn))
商業(yè)問題:如何驗(yàn)證營(yíng)銷效果的有效性?
參數(shù)檢驗(yàn)概述
單樣本T檢驗(yàn)
兩獨(dú)立樣本T檢驗(yàn)
兩配對(duì)樣本T檢驗(yàn)
參數(shù)檢驗(yàn)原理以及步驟
參數(shù)檢驗(yàn)適用場(chǎng)景
案例:電信運(yùn)營(yíng)商的ARPU值評(píng)估分析(單樣本)
案例:信用卡消費(fèi)金額評(píng)估分析(單樣本)
案例:營(yíng)銷方式與產(chǎn)品銷量的影響分析(兩獨(dú)立樣本)
案例:吸煙與膽固醇升高的分析(兩獨(dú)立樣本)
案例:營(yíng)銷方式有效性評(píng)估(兩配對(duì)樣本)
案例:減肥效果評(píng)估(兩配對(duì)樣本)
非參數(shù)檢驗(yàn)分析(樣本分布檢驗(yàn))
商業(yè)問題:這些屬性數(shù)據(jù)的分布情況如何?如何從數(shù)據(jù)分布中看出問題?
非參數(shù)檢驗(yàn)概述
單樣本檢驗(yàn)
兩獨(dú)立樣本檢驗(yàn)
兩相關(guān)樣本檢驗(yàn)
兩配對(duì)樣本檢驗(yàn)
非參數(shù)檢驗(yàn)原理
卡方檢驗(yàn)、二項(xiàng)分布、游程檢驗(yàn)的原理及適用場(chǎng)景
案例:死亡分布檢驗(yàn)(單樣本-卡方檢驗(yàn))
案例:產(chǎn)品合格率檢驗(yàn)(單樣本-二項(xiàng)分布)
案例:身高分布差異檢驗(yàn)(單樣本-KS檢驗(yàn))
案例:設(shè)備正常工作檢驗(yàn)(單樣本-隨機(jī)分布)
案例:制造工藝差異檢驗(yàn)(兩獨(dú)立樣本-MW檢驗(yàn))
案例:訓(xùn)練新方法有效性檢驗(yàn)(兩配對(duì)樣本-符號(hào)/秩檢驗(yàn))
案例:促銷方式效果檢驗(yàn)(多相關(guān)樣本-Friedman檢驗(yàn))
案例:客戶滿意度差異檢驗(yàn)(多相關(guān)樣本-Cochran Q檢驗(yàn))
案例:評(píng)委評(píng)判黑幕檢驗(yàn)(多相關(guān)樣本-Kendall W檢驗(yàn))
相關(guān)分析(相關(guān)程度計(jì)算)
商業(yè)問題:這兩個(gè)屬性是否會(huì)相互影響?影響程度大嗎?
相關(guān)分析概述
計(jì)算相關(guān)系數(shù)的三個(gè)公式
案例:家庭生活開支的相關(guān)分析(Pearson簡(jiǎn)單相關(guān)系數(shù))
案例:營(yíng)銷費(fèi)用與銷售額的相關(guān)分析
案例:哪些因素與汽車銷量有相關(guān)性
案例:腰圍與體重的相關(guān)分析(偏相關(guān)分析)
方差分析(影響因素分析)
商業(yè)問題:哪些才是影響銷量的關(guān)鍵因素?
方差分析原理
方差分析的步驟
方差分析適用場(chǎng)景
如何解讀方差分析結(jié)果
案例:終端陳列位置對(duì)終端銷量的影響分析(單因素)
案例:廣告形式、地區(qū)對(duì)銷量的影響因素分析(多因素)
案例:2015年大學(xué)生工資與父母職業(yè)的關(guān)系
案例:飼料對(duì)生豬體重的影響分析(協(xié)方差分析)
回歸分析(預(yù)測(cè)分析)
商業(yè)問題:如何預(yù)測(cè)未來的銷售量(定量分析)?
回歸分析概述及適用場(chǎng)景
回歸分析的檢驗(yàn)過程
如何選擇最優(yōu)回歸模型
解讀回歸分析結(jié)果
案例:推廣費(fèi)用、辦公費(fèi)用與銷售額的關(guān)系(線性回歸)
案例:人均現(xiàn)金消費(fèi)支出對(duì)人均食品消費(fèi)支出的影響(曲線回歸)
帶分類變量的回歸分析
比如,如何預(yù)測(cè)隨著季節(jié)性變化的銷量情況
案例:?jiǎn)T工工齡、性別與終端銷售的關(guān)系分析
案例:產(chǎn)品銷量的季節(jié)性變化預(yù)測(cè)
邏輯回歸分析(預(yù)測(cè)分析)
商業(yè)問題:如果評(píng)估用戶購(gòu)買某產(chǎn)品的概率?
邏輯回歸分析原理
邏輯回歸分析的適用場(chǎng)景
案例:客戶購(gòu)買預(yù)測(cè)分析(二元邏輯回歸)
案例:品牌選擇預(yù)測(cè)分析(多項(xiàng)邏輯回歸)
時(shí)間序列分析(預(yù)測(cè)分析)
商業(yè)問題:隨著時(shí)間變化,未來的銷量變化趨勢(shì)如何?
時(shí)序分析概述
移動(dòng)平均MA模型
指數(shù)平滑ES模型
自回歸滑動(dòng)平均ARIMA模型
季節(jié)分解模型
時(shí)序分析適用場(chǎng)景
案例:汽車銷量預(yù)測(cè)分析(指數(shù)平滑)
案例:上交所指數(shù)收益率預(yù)測(cè)分析(ARIMA)
案例:服裝銷售數(shù)據(jù)季節(jié)性趨勢(shì)預(yù)測(cè)分析(季節(jié)分解)
第四部分:高級(jí)數(shù)據(jù)挖掘方法
聚類分析(Clustering)
商業(yè)問題:我們的客戶有幾類?各類特征是什么?
聚類方法原理介紹
聚類方法適用場(chǎng)景
系統(tǒng)聚類(層次聚類)算法原理
如何判定聚類類別數(shù)量
案例:數(shù)據(jù)聚類分析--小康指數(shù)劃分(Q型聚類)
案例:變量聚類分析--裁判標(biāo)準(zhǔn)一致性分析(R型聚類)
K均值聚類(快速聚類)算法原理
案例:移動(dòng)三大品牌細(xì)分市場(chǎng)合適嗎?
案例:如何評(píng)選優(yōu)秀員工(固定聚類中心)
演練:如何選擇新產(chǎn)品試銷地點(diǎn)?
決策樹分類分析(Classification)
商業(yè)問題:這類客戶有什么特征?有什么潛在銷售機(jī)會(huì)?
決策樹原理介紹
構(gòu)建決策樹的三個(gè)關(guān)鍵問題
如何選擇屬性來構(gòu)建節(jié)點(diǎn)
如何分裂變量
修剪決策樹
選擇優(yōu)屬性
熵、基尼索引、分類錯(cuò)誤
屬性劃分增益
如何分裂變量
多元?jiǎng)澐峙c二元?jiǎng)澐?/span>
連續(xù)變量離散化(優(yōu)劃分點(diǎn))
修剪決策樹
剪枝原則
預(yù)剪枝與后剪枝
如何評(píng)估分類性能
案例:銀行低信用客戶特征分析(決策樹分類)
基于規(guī)則的分類
基于規(guī)則分類原理介紹
評(píng)估規(guī)則的質(zhì)量
構(gòu)建分類規(guī)則:順序覆蓋法
規(guī)則增長(zhǎng)策略
最近鄰分類
樸素貝葉斯分類
貝葉斯分類原理
計(jì)算類別屬性的條件概率
估計(jì)連續(xù)屬性的條件概率
預(yù)測(cè)分類概率(計(jì)算概率)
案例:評(píng)估銀行用戶拖欠貨款的概率
人工神經(jīng)網(wǎng)絡(luò)(ANN)
神經(jīng)網(wǎng)絡(luò)基本原理
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
ANN關(guān)鍵問題
MLP與RBF
案例:評(píng)估銀行用戶拖欠貨款的概率
判別分析
判別分析原理
距離判別法
典型判別法
貝葉斯判別法
案例:MBA學(xué)生錄取判別分析
案例:上市公司類別評(píng)估
關(guān)聯(lián)分析(Association)
商業(yè)問題:購(gòu)買A產(chǎn)品的顧客還常常要購(gòu)買其他什么產(chǎn)品?
關(guān)聯(lián)規(guī)則原理介紹
關(guān)聯(lián)規(guī)則的兩個(gè)關(guān)鍵參數(shù)
支持度
置信度
Apriori算法介紹
FP-Growth算法介紹
關(guān)聯(lián)規(guī)則適用場(chǎng)景
案例:商品套餐設(shè)計(jì)、商品交叉銷售(關(guān)聯(lián)分析)
客戶價(jià)值評(píng)估RFM模型
商業(yè)問題:如何評(píng)估客戶的價(jià)值?不同價(jià)值客戶的營(yíng)銷策略有什么區(qū)別?
RFM模型介紹
RFM模型用戶分類與業(yè)務(wù)策略
RFM與客戶活躍度分析
案例:客戶價(jià)值如何評(píng)估(什么才是VIP用戶)
案例:如何選擇促銷用戶(響應(yīng)模型與促銷)
案例:回頭客用戶特征分析(決策樹分析)
主成分分析
主成分分析方法介紹
主成分分析基本思想
主成分分析步驟
案例:評(píng)估汽車購(gòu)買者關(guān)注的哪些因素
第五部分:統(tǒng)計(jì)圖表篇(看圖說話)
柱狀圖/線圖/餅圖/高低圖/箱圖/散點(diǎn)圖/直方圖
圖形的表達(dá)及適用場(chǎng)景
案例:各種圖形繪制
實(shí)戰(zhàn)1:客戶流失預(yù)警與客戶挽留之真實(shí)數(shù)據(jù)分析實(shí)踐
實(shí)戰(zhàn)2:銀行信用風(fēng)險(xiǎn)分析
結(jié)束:課程總結(jié)與問題答疑。