課程大綱:

2010/07/17 (星期六) Day I 早上

資料採礦觀念導入與意義說明

何謂資料採礦(資料探勘)?

資料採礦的應用(資料探勘)

完善的資料採礦計畫開始-CRISP DM

Clementine-資料採礦平台綜覽

Clementine之基本操作說明

串流-建置Data Mining的開始

DIY 輔助說明

商業理解階段

專案管理

資料理解階段-資料存取

存取各種資料格式-Flat FileEXCELSPSSSAS

存取資料庫

使用者輸入

資料類型定義

欄位方向定義

資料理解階段-資料檢視

資料檢視與資料稽核

類別與數值資料之資料分布

遺漏值的處理-各種插補的方法

資料理解階段-圖形檢視

各式繪圖功能-PlotMultiplotDistributionHistogramCollection

自動依欄位尺度繪圖-圖表版樣本選擇器(Graphboard)

觀察資料依時間之趨勢走向-時間繪圖(Time Plot)

欄位間關係強弱之了解-網絡圖與導引式(Directed)之網絡圖

2010/07/17 (星期六)  Day I 下午

資料準備階段-資料列(record)的處理

CLEM(Clementine Language for Expression Manipulation)

選擇適合之觀察值-選擇(Select)節點

整併觀察值-合併(Merge)、附加(Append)、聚集(Aggregate)與排序(Sort)

多樣化的抽樣方法-抽樣節點(Sample)

放大目標族群輪廓-處理稀有事件之平衡抽樣(Balance)節點

消除重複資料-相異(Distinct)節點

互動式繪圖功能-產生資料準備節點

資料準備階段-資料欄位(field)的處理

新增欄位及計算處理-導引(Derive)及填入(Filler)節點

塑模前的訓練與測試資料切割-切割區(Partition)節點

分割連續資料與重新再分類-分割(Binning)與再分類(Reclassify)節點

過濾欄位與調整欄位順序-過濾(Filter)與欄位重序(Field Reorder)節點

架構欄位值為新欄位變數-設成旗標(SetToFlag)與重組(Restructure)節點

快速完成RFM分析-RFM聚集節點與RFM分析節點

塑模Clementine 的塑模方法

資料採礦的各種塑模方法-關聯、分類、分群、估計、預測

應用時機與說明

塑模前的資料欄位縮減-Feature SelectionPCA/Factor

異常值之偵測與處理-Anormaly

2010/07/18 (星期日) Day II 早上

塑模-關聯規則

常見的關聯規則分析應用

關聯規則之各類模型使用時機與功能比較

GRI模型之應用及操作說明

APIORI模型之應用及操作說明

CARMA模型之應用及操作說明

考慮序列出現先後順序之關聯規則模型-SEQUENCE模型之應用及操作說明

關聯規則中的遺漏值處理

塑模分類模型

常見的分類模型分析應用

決策樹模型(CHAIDC&RTQUESTC5.0)之應用、比較及操作說明

Logistic Regression之應用及操作說明

Discriminant Analysis之應用及操作說明

SVM模型之應用及操作說明

Bayesian Networks之應用及操作說明

塑模分群模型

常見的分群模型分析應用

各分群模型之使用時機與功能比較

K-Means模型之應用及操作說明

Two-Step模型之應用及操作說明

Kohonen模型之應用及操作說明

塑模估計模型

常見的估計模型分析應用

Regression模型之應用及操作說明

Neural Network模型之應用及操作說明

存活資料之估計-Cox Regression模型之應用及操作說明

塑模預測模型

時間數列預測模型之說明

分析前之時間設定與模型設定

建置時間數列模型之流程-識別、估計、診斷、預測

Exponential SmoothingARIMA模型

專家建模(Expert Modeler)

考慮預測變數之時間數列模型建置

外部事件之衡量與預測-中介事件分析

2010/07/18 (星期日)  Day II 下午

塑模-自動建模

數值型模型之自動建模-Numeric Predictor節點之使用

二分類模型之自動建模-Binary Classifier節點之使用

塑模-其它

混合模型之使用時機與運用

多模型之總效果整合-整體(Ensemble)節點之使用時機與運用

評估階段-比較多個模型

確認預測分析結果-分析(Analysis)節點

模型預測分析結果與成本、投資報酬投入之比較-評估圖形(Evaluation)節點

部署階段

分析資料輸出-各種格式資料之輸出與載入資料庫

分析報告輸出-報告(Report)節點之運用

 

應用實例演練

 

 

 

主辦單位:鼎茂統計諮詢中心

活動網址:http://spss999.tingmao.com.tw

洽詢專線:04-2221138127 周小姐

roven5712 發表在 痞客邦 PIXNET 留言(2) 人氣()


留言列表 (2)

發表留言
  • 小白
  • 閒來無聊逛逛blog~~跟您打聲招呼~~
  • 感謝
    歡迎經常來指教

    roven5712 於 2010/06/11 09:59 回覆

  • keeplin
  • 版主您好
    由於敝人做的研究有關data mining
    但是今年暑假鼎茂公司沒有再開課
    因此
    敝人無法去上課
    但是對於data mining還有許多疑惑
    因此想跟版大是否可以跟您要上課內容
    非常感謝您

    敝人目前就讀研究所
    做的剛好跟data mining有關
    所以非常需要看教材
    我不會亂流檔案出去

    不知道您方便寄教材給敝人?
    h34560@gmail.com
    謝謝您
  • 你好:非常抱歉關於您的需要,因為這一門課程在去年並沒有開課,所以所有的資料都還是在講師身上,我這裡其實也沒有,不過最近我知道台灣析數(也就是IBM的台灣經銷商)有在舉辦這類的課程或研習,你可以上她們的網站去看看,或許有機會跟她們連絡一下,祝福你喔!

    roven5712 於 2011/08/26 09:21 回覆

【 X 關閉 】

【PIXNET 痞客邦】國外旅遊調查
您是我們挑選到的讀者!

填完問卷將有機會獲得心動好禮哦(注意:關閉此視窗將不再出現)

立即填寫取消