第1章 數(shù)據(jù)挖掘概念
1.1 數(shù)據(jù)挖掘概述
1.1.1 什么是數(shù)據(jù)挖掘
1.1.2 數(shù)據(jù)挖掘常用算法概述
1.1.3 數(shù)據(jù)挖掘常用工具概述
1.2 數(shù)據(jù)探索
1.2.1 數(shù)據(jù)概述
1.2.2 數(shù)據(jù)質量
1.2.3 數(shù)據(jù)預處理
1.3 數(shù)據(jù)挖掘的應用
1.3.1 數(shù)據(jù)挖掘現(xiàn)狀及發(fā)展趨勢
1.3.2 數(shù)據(jù)挖掘需要解決的問題
1.3.3 數(shù)據(jù)挖掘的應用場景
1.4 作業(yè)與練習
參考文獻
第2章 分類
2.1 分類概述
2.1.1 分類的基本概念
2.1.2 解決分類問題的一般方法
2.1.3 決策樹
案例:Web機器人檢測
2.1.4 模型的過分擬合
2.2 貝葉斯決策與分類器
2.2.1 規(guī)則分類器
2.2.2 分類中貝葉斯定理的應用
2.2.3 分類中樸素貝葉斯的應用
2.3 支持向量機
2.3.1 最大邊緣超平面
2.3.2 線性支持向量機SVM
2.3.3 非線性支持向量機SVM
2.4 分類在實際場景中的應用案例
案例一:如何解決文章主題關鍵字與搜索引擎關鍵字帶來的檢索結果差異
案例二:甄別新金融交易方式的欺詐行為
案例三:在線廣告推薦中的分類
2.5 作業(yè)與練習
參考文獻
第3章 聚類
3.1 聚類概述
3.1.1 聚類的基本概念
3.1.2 聚類算法
3.2 聚合分析方法
3.2.1 歐氏距離
3.2.2 聚合過程
3.2.3 聚類樹
3.2.4 聚合分析方法應用例子
3.3 聚類在實際場景中的應用案例
3.4 聚類的實現(xiàn)例子
3.5 作業(yè)與練習
參考文獻
第4章 關聯(lián)規(guī)則
4.1 關聯(lián)規(guī)則概述
4.1.1 經典案例導入
4.1.2 關聯(lián)規(guī)則的基本概念和定義
4.1.3 關聯(lián)規(guī)則的分類
4.2 關聯(lián)規(guī)則的挖掘過程
4.2.1 知識回顧
4.2.2 頻繁項集產生
4.2.3 強關聯(lián)規(guī)則
4.2.4 關聯(lián)規(guī)則評價標準
4.3 關聯(lián)規(guī)則的Apriori算法
4.3.1 知識回顧
4.3.2 Apriori算法的核心思想
4.3.3 Apriori算法描述
4.3.4 Apriori算法評價
4.3.5 Apriori算法改進
4.4 關聯(lián)規(guī)則的FP-growth算法
4.4.1 構建FP樹
4.4.2 從FP樹中挖掘頻繁項集
4.5 實戰(zhàn):關聯(lián)規(guī)則挖掘實例
4.5.1 關聯(lián)規(guī)則挖掘技術在國內外的應用現(xiàn)狀
4.5.2 關聯(lián)規(guī)則應用實例
4.5.3 關聯(lián)規(guī)則在大型超市中應用的步驟
4.6 作業(yè)與練習
參考文獻
第5章 綜合實戰(zhàn)—日志的挖掘與應用
5.1 日志概念
5.1.1 日志是什么
5.1.2 日志能做什么
5.2 日志處理
5.2.1 產生日志
5.2.2 傳輸日志
5.2.3 存儲日志
5.2.4 分析日志
5.2.5 日志規(guī)范與標準
5.3 日志分析原理及工具
5.3.1 日志分析原理
5.3.2 日志分析工具
5.3.3 日志分析系統(tǒng)規(guī)劃建設
5.4 日志挖掘應用
5.4.1 安全運維
5.4.2 系統(tǒng)健康分析
5.4.3 用戶行為分析
5.4.4 業(yè)務分析設計
5.5 日志分析挖掘實例
5.6 作業(yè)與練習
參考文獻
第6章 數(shù)據(jù)挖掘應用案例
6.1 電力行業(yè)采用聚類方法進行主變油溫分析
6.1.1 需求背景及采用的大數(shù)據(jù)分析方法
6.1.2 大數(shù)據(jù)分析方法的實現(xiàn)過程
6.1.3 大數(shù)據(jù)分析方法的實現(xiàn)結果
6.2 銀行信貸評價
6.2.1 簡介
6.2.2 神經網(wǎng)絡模型
6.2.3 實證檢驗
6.3 指數(shù)預測
6.3.1 金融時間序列概況
6.3.2 小波消噪
6.3.3 向量機
6.3.4 指數(shù)預測
6.4 客戶分群的精準智能營銷
6.4.1 挖掘目標
6.4.2 分析方法和過程
6.4.3 建模仿真
6.5 使用WEKA進行房屋定價
6.6 作業(yè)與練習
參考文獻
附錄A 大數(shù)據(jù)和人工智能實驗環(huán)境
附錄B Hadoop環(huán)境要求
附錄C 名詞解釋