久久人人做人人妻人人玩精品hd,精品国产成人av在线,好姑娘在线视频免费观看 ,含羞草电影免费看韩国,果冻传媒一区

當(dāng)前位置 : 首頁  圖書 正文

數(shù)據(jù)科學(xué):理論、方法與R語言實(shí)踐簡(jiǎn)介,目錄書摘

2020-04-30 17:25 來源:京東 作者:京東
r語言實(shí)踐
數(shù)據(jù)科學(xué):理論、方法與R語言實(shí)踐
暫無報(bào)價(jià)
100+評(píng)論 100%好評(píng)
內(nèi)容簡(jiǎn)介:  本書從實(shí)用的角度較為全面地展現(xiàn)了數(shù)據(jù)科學(xué)的主要內(nèi)容,并結(jié)合大量的實(shí)際項(xiàng)目案例,利用R語言詳細(xì)地講解了數(shù)據(jù)項(xiàng)目的開發(fā)過程和關(guān)鍵技術(shù)。本書包括三個(gè)部分共11章的內(nèi)容,主要介紹了數(shù)據(jù)科學(xué)項(xiàng)目的處理過程、選擇合適的建模方法,也討論了bagging算法、隨機(jī)森林、廣義加性模型、核和支持向量機(jī)等高級(jí)建模方法。此外,還討論了文檔編制和結(jié)果部署,以及如何向組織內(nèi)不同的受眾展現(xiàn)項(xiàng)目結(jié)果。本書適合作為高等院校高年級(jí)本科生和研究生及從事數(shù)據(jù)管理與分析工程技術(shù)人員的主要參考書。
目錄:譯者序
序言
前言
第一部分 數(shù)據(jù)科學(xué)引論
第1章 數(shù)據(jù)科學(xué)處理過程2
1.1 數(shù)據(jù)科學(xué)項(xiàng)目中的角色2
1.2 數(shù)據(jù)科學(xué)項(xiàng)目的階段4
1.2.1 制定目標(biāo)5
1.2.2 收集和管理數(shù)據(jù)5
1.2.3 建立模型7
1.2.4 模型評(píng)價(jià)和批判8
1.2.5 展現(xiàn)和編制文檔9
1.2.6 模型部署和維護(hù)10
1.3 設(shè)定預(yù)期11
1.4 小結(jié)12
第2章 向R加載數(shù)據(jù)14
2.1 運(yùn)用文件中的數(shù)據(jù)14
2.1.1 在源自文件或URL的良結(jié)構(gòu)數(shù)據(jù)上使用R15
2.1.2 在欠結(jié)構(gòu)數(shù)據(jù)上使用R17
2.2 在關(guān)系數(shù)據(jù)庫(kù)上使用R19
2.2.1 一個(gè)生產(chǎn)規(guī)模的示例20
2.2.2 從數(shù)據(jù)庫(kù)向R系統(tǒng)加載數(shù)據(jù)23
2.2.3 處理PUMS數(shù)據(jù)25
2.3 小結(jié)28
第3章 探索數(shù)據(jù)29
3.1 使用概要統(tǒng)計(jì)方法發(fā)現(xiàn)問題30
3.2 用圖形和可視化方法發(fā)現(xiàn)問題34
3.2.1 可視化檢測(cè)單變量的分布35
3.2.2 可視化檢測(cè)兩個(gè)變量間的關(guān)系42
3.3 小結(jié)51
第4章 管理數(shù)據(jù)52
4.1 清洗數(shù)據(jù)52
4.1.1 處理缺失值52
4.1.2 數(shù)據(jù)轉(zhuǎn)換56
4.2 為建模和驗(yàn)證采樣61
4.2.1 測(cè)試集和訓(xùn)練集的劃分61
4.2.2 創(chuàng)建一個(gè)樣本組列62
4.2.3 記錄分組63
4.2.4 數(shù)據(jù)溯源63
4.3 小結(jié)63
第二部分 建模方法
第5章 選擇和評(píng)價(jià)模型66
5.1 將業(yè)務(wù)問題映射到機(jī)器學(xué)習(xí)任務(wù)67
5.1.1 解決分類問題67
5.1.2 解決打分問題68
5.1.3 目標(biāo)未知情況下的處理69
5.1.4 問題到方法的映射71
5.2 模型評(píng)價(jià)71
5.2.1 分類模型的評(píng)價(jià)72
5.2.2 打分模型的評(píng)價(jià)76
5.2.3 概率模型的評(píng)價(jià)78
5.2.4 排名模型的評(píng)價(jià)82
5.2.5 聚類模型的評(píng)價(jià)82
5.3 模型驗(yàn)證84
5.3.1 常見的模型問題的識(shí)別 84
5.3.2 模型可靠性的量化85
5.3.3 模型質(zhì)量的保證86
5.4 小結(jié)88
第6章 記憶化方法89
6.1 KDD和KDD Cup 200989
6.2 構(gòu)建單變量模型91
6.2.1 使用類別型特征92
6.2.2 使用數(shù)值型特征94
6.2.3 使用交叉驗(yàn)證估計(jì)過擬合的影響96
6.3 構(gòu)建多變量模型97
6.3.1 變量選擇97
6.3.2 使用決策樹99
6.3.3 使用最近鄰方法102
6.3.4 使用樸素貝葉斯105
6.4 小結(jié)108
第7章 線性回歸與邏輯斯諦回歸110
7.1 使用線性回歸110
7.1.1 理解線性回歸110
7.1.2 構(gòu)建線性回歸模型113
7.1.3 預(yù)測(cè)114
7.1.4 發(fā)現(xiàn)關(guān)系并抽取建議117
7.1.5 解讀模型概要并刻畫系數(shù)質(zhì)量118
7.1.6 線性回歸要點(diǎn)122
7.2 使用邏輯斯諦回歸123
7.2.1 理解邏輯斯諦回歸123
7.2.2 構(gòu)建邏輯斯諦回歸模型124
7.2.3 預(yù)測(cè)125
7.2.4 從邏輯斯諦回歸模型中發(fā)現(xiàn)關(guān)系并抽取建議129
7.2.5 解讀模型概要并刻畫系數(shù)130
7.2.6 邏輯斯諦回歸要點(diǎn)136
7.3 小結(jié)137
第8章 無監(jiān)督方法138
8.1 聚類分析138
8.1.1 距離139
8.1.2 準(zhǔn)備數(shù)據(jù) 140
8.1.3 使用hclust()進(jìn)行層次聚類142
8.1.4 k-均值算法150
8.1.5 分派新的點(diǎn)到簇154
8.1.6 聚類要點(diǎn)156
8.2 關(guān)聯(lián)規(guī)則156
8.2.1 關(guān)聯(lián)規(guī)則概述156
8.2.2 問題舉例157
8.2.3 使用arules程序包挖掘關(guān)聯(lián)規(guī)則158
8.2.4 關(guān)聯(lián)規(guī)則要點(diǎn)165
8.3 小結(jié)165
第9章 高級(jí)方法探索166
9.1 使用bagging和隨機(jī)森林方法減少訓(xùn)練方差167
9.1.1 使用bagging方法改進(jìn)預(yù)測(cè)167
9.1.2 使用隨機(jī)森林方法進(jìn)一步改進(jìn)預(yù)測(cè)170
9.1.3 bagging和隨機(jī)森林方法要點(diǎn)173
9.2 使用廣義加性模型學(xué)習(xí)非單調(diào)關(guān)系173
9.2.1 理解GAM174
9.2.2 一維回歸示例174
9.2.3 提取非線性關(guān)系178
9.2.4 在真實(shí)數(shù)據(jù)上使用GAM179
9.2.5 使用GAM實(shí)現(xiàn)邏輯斯諦回歸182
9.2.6 GAM要點(diǎn)183
9.3 使用核方法提高數(shù)據(jù)可分性183
9.3.1 理解核函數(shù)184
9.3.2 在問題中使用顯式核函數(shù)187
9.3.3 核方法要點(diǎn)190
9.4 使用SVM對(duì)復(fù)雜的決策邊界建模190
9.4.1 理解支持向量機(jī)190
9.4.2 在人工示例數(shù)據(jù)中使用SVM192
9.4.3 在真實(shí)數(shù)據(jù)中使用SVM195
9.4.4 支持向量機(jī)要點(diǎn)197
9.5 小結(jié)197
第三部分 結(jié)果交付
第10章 文檔編制和部署200
10.1 buzz數(shù)據(jù)集200
10.2 使用knitr產(chǎn)生里程碑文檔202
10.2.1 knitr是什么202
10.2.2 knitr 技術(shù)詳解204
10.2.3 使用knitr編寫buzz數(shù)據(jù)文檔205
10.3 在運(yùn)行時(shí)文檔編制中使用注釋和版本控制208
10.3.1 編寫有效注釋208
10.3.2 使用版本控制記錄歷史209
10.3.3 使用版本控制探索項(xiàng)目213
10.3.4 使用版本控制分享工作217
10.4 模型部署220
10.4.1 將模型部署為R HTTP服務(wù)220
10.4.2 按照輸出部署模型222
10.4.3 要點(diǎn)223
10.5 小結(jié)224
第11章 有效的結(jié)果展現(xiàn)226
11.1 將結(jié)果展現(xiàn)給項(xiàng)目出資方227
11.1.1 概述項(xiàng)目目標(biāo)228
11.1.2 陳述項(xiàng)目結(jié)果229
11.1.3 補(bǔ)充細(xì)節(jié)230
11.1.4 提出建議并討論未來工作231
11.1.5 向項(xiàng)目出資方展現(xiàn)的要點(diǎn)232
11.2 向最終用戶展現(xiàn)模型232
11.2.1 概述項(xiàng)目目標(biāo)232
11.2.2 展現(xiàn)模型如何融入用戶的工作流程233
11.2.3 展現(xiàn)如何使用模型235
11.2.4 向最終用戶展現(xiàn)的要點(diǎn)236
11.3 向其他數(shù)據(jù)科學(xué)家展現(xiàn)你的工作236
11.3.1 介紹問題236
11.3.2 討論相關(guān)工作237
11.3.3 討論你的方法238
11.3.4 討論結(jié)果和未來工作239
11.3.5 向其他數(shù)據(jù)科學(xué)家展現(xiàn)的要點(diǎn)240
11.4 小結(jié)240
附錄A 使用R和其他工具241
附錄B 重要的統(tǒng)計(jì)學(xué)概念263
附錄C 更多的工具和值得探索的思路292
參考文獻(xiàn)297
索引299
熱門推薦文章
相關(guān)優(yōu)評(píng)榜
品類齊全,輕松購(gòu)物 多倉(cāng)直發(fā),極速配送 正品行貨,精致服務(wù) 天天低價(jià),暢選無憂
購(gòu)物指南
購(gòu)物流程
會(huì)員介紹
生活旅行/團(tuán)購(gòu)
常見問題
大家電
聯(lián)系客服
配送方式
上門自提
211限時(shí)達(dá)
配送服務(wù)查詢
配送費(fèi)收取標(biāo)準(zhǔn)
海外配送
支付方式
貨到付款
在線支付
分期付款
郵局匯款
公司轉(zhuǎn)賬
售后服務(wù)
售后政策
價(jià)格保護(hù)
退款說明
返修/退換貨
取消訂單
特色服務(wù)
奪寶島
DIY裝機(jī)
延保服務(wù)
京東E卡
京東通信
京東JD+