Python是信息管理與信息系統(tǒng)、電子商務等信息管理類本科學生進行數(shù)據(jù)分析所需要掌握的基礎性語言和分析工具,是未來學生掌握大數(shù)據(jù)分析技術的學習基礎。本書共分12章,著重講述Python語言和數(shù)據(jù)分析工具包的應用。
第1章主要介紹Python的發(fā)展歷史、特點、集成開發(fā)環(huán)境、內置模塊、幫助的使用等內容; 第2章主要介紹Python語言的基礎知識; 第3章主要介紹Python中的常用數(shù)據(jù)結構,包括序列、字典、集合等,以及函數(shù)的定義和調用等; 第4章主要介紹Python中類、對象和方法的相關內容; 第5章主要介紹Python進行數(shù)據(jù)分析常用的NumPy、Pandas、Matplotlib、SciPy和Scikitlearn等基礎庫內容; 第6章主要介紹網(wǎng)絡數(shù)據(jù)獲取的HTML和XML兩種網(wǎng)頁組織形式,以及urllib和BeautifulSoup4兩個模塊內容; 第7章主要介紹文件的操作; 第8章主要介紹數(shù)據(jù)可視化,以及使用Python繪制圖表的知識; 第9章主要介紹利用Python進行數(shù)據(jù)庫應用開發(fā); 第10、11章主要介紹Python機器學習的基本概念以及有監(jiān)督、無監(jiān)督學習算法的原理; 第12章主要介紹Python在地理空間分析上的應用。本書中的代碼均在Python 3.5中測試通過。
本書一方面?zhèn)戎貙ython數(shù)據(jù)分析基礎知識的講解,另一方面注重Python數(shù)據(jù)處理方法的應用。本書適合作為計算機科學與技術專業(yè)學生學習數(shù)據(jù)分析的入門教材,也適合作為Python愛好者的參考書。
目錄
第1章Python簡介
1.1Python語言的發(fā)展史
1.1.1Python語言的特點
1.1.2Python 2與Python 3的區(qū)別
1.2Python的環(huán)境搭建
1.3開始使用Python IDLE
1.3.1交互方式
1.3.2Python的集成開發(fā)環(huán)境
1.4Eclipse+PyDev的安裝
1.5代碼風格
1.6使用幫助
本章小結
習題
第2章Python語言基礎知識
2.1標識符與變量
2.1.1標識符
2.1.2變量
2.2數(shù)據(jù)類型及運算
2.2.1數(shù)據(jù)類型
2.2.2運算符和表達式
2.3分支結構控制語句
2.3.1if語句
2.3.2ifelse語句
2.3.3ifelifelse語句
2.4循環(huán)語句
2.4.1循環(huán)結構控制語句
2.4.2循環(huán)嵌套控制語句
2.4.3break語句和continue語句
2.4.4range()函數(shù)
2.5常見的Python函數(shù)
本章小結
習題
第3章數(shù)據(jù)結構與函數(shù)設計
3.1序列
3.1.1列表
3.1.2元組
3.1.3字符串
3.1.4列表與元組之間的轉換
3.2字典
3.2.1創(chuàng)建字典
3.2.2字典的方法
3.2.3列表、元組與字典之間的轉換
3.3集合
3.3.1集合的創(chuàng)建
3.3.2集合的運算
3.3.3集合的方法
3.4函數(shù)的定義
3.4.1函數(shù)的調用
3.4.2形參與實參
3.4.3函數(shù)的返回
3.4.4位置參數(shù)
3.4.5默認參數(shù)與關鍵字參數(shù)
3.4.6可變長度參數(shù)
本章小結
習題
第4章類與對象
4.1面向對象
4.1.1面向對象編程
4.1.2類的抽象與封裝
4.2認識Python中的類、對象和方法
4.2.1類的定義與創(chuàng)建
4.2.2構造函數(shù)
4.3類的屬性
4.3.1類屬性和實例屬性
4.3.2公有屬性和私有屬性
4.4類的方法
4.4.1類方法的調用
4.4.2類方法的分類
4.4.3析構函數(shù)
4.5類的繼承
4.5.1父類與子類
4.5.2繼承的語法
4.5.3多重繼承
4.5.4運算符的重載
4.6類的組合
4.7類的異常處理
4.7.1異常
4.7.2Python中的異常類
4.7.3捕獲與處理異常
4.7.4自定義異常類
4.7.5with語句
4.7.6斷言
本章小結
習題
案例
第5章Python數(shù)據(jù)分析基礎庫
5.1NumPy
5.1.1ndarray的數(shù)據(jù)類型
5.1.2數(shù)組和標量之間的運算
5.1.3索引和切片
5.1.4數(shù)組轉置和軸對換
5.1.5利用數(shù)組進行數(shù)據(jù)處理
5.1.6數(shù)學和統(tǒng)計方法
5.2Pandas
5.2.1Pandas數(shù)據(jù)結構
5.2.2Pandas文件操作
5.2.3數(shù)據(jù)處理
5.2.4層次化索引
5.2.5分級順序
5.2.6使用DataFrame的列
5.3Matplotlib
5.3.1figure和subplot
5.3.2調整subplot周圍的間距
5.3.3顏色、標記和線型
5.3.4刻度標簽和圖例
5.3.5添加圖例
5.3.6將圖表保存到文件
5.4SciPy
5.5Scikitlearn
本章小結
習題
第6章網(wǎng)絡數(shù)據(jù)的獲取
6.1網(wǎng)頁數(shù)據(jù)的組織形式
6.1.1HTML
6.1.2HTML元素
6.1.3HTML屬性
6.2XML
6.2.1XML的結構和語法
6.2.2XML元素和屬性
6.3利用urllib處理HTTP
6.4利用BeautifulSoup4解析HTML文檔
6.4.1BeautifulSoup4中的對象
6.4.2遍歷文檔樹
6.4.3搜索文檔樹
本章小結
習題
第7章文件操作
7.1文件的打開和關閉
7.1.1打開文件
7.1.2關閉文件
7.2讀寫文件
7.2.1從文件讀取數(shù)據(jù)
7.2.2向文件寫入數(shù)據(jù)
7.3文件對話框
7.3.1基于win32ui構建文件對話框
7.3.2基于tkFileDialog構建文件對話框
7.4應用實例: 文本文件的操作
本章小結
習題
第8章Python數(shù)據(jù)可視化
8.1數(shù)據(jù)可視化概念框架
8.1.1數(shù)據(jù)可視化簡介
8.1.2數(shù)據(jù)可視化常用圖表
8.1.3Python數(shù)據(jù)可視化環(huán)境準備
8.2繪制圖表
8.2.1Matplotlib API入門
8.2.2創(chuàng)建圖表
8.2.3圖表定制
8.2.4保存圖表
8.3更多高級圖表及定制
8.3.1樣式
8.3.2subplot子區(qū)
8.3.3圖表顏色和填充
8.3.4動畫
本章小結
習題
第9章數(shù)據(jù)庫應用開發(fā)
9.1Python與數(shù)據(jù)庫
9.1.1數(shù)據(jù)庫簡介
9.1.2Python數(shù)據(jù)庫工作環(huán)境
9.2本地數(shù)據(jù)庫SQLite
9.2.1SQLite簡介
9.2.2Python內置的sqlite3模塊
9.3關系型數(shù)據(jù)庫
9.3.1關系型數(shù)據(jù)庫基本操作與SQL
9.3.2操作MySQL
9.4非關系型數(shù)據(jù)庫
9.4.1NoSQL介紹
9.4.2MongoDB
9.4.3PyMongo: MongoDB和Python
習題
第10章機器學習——有監(jiān)督學習
10.1機器學習簡介
10.2Python機器學習庫Scikitlearn
10.3有監(jiān)督學習
10.3.1線性回歸
10.3.2Logistic回歸分類器
10.3.3樸素貝葉斯分類器
10.3.4支持向量機
10.3.5KNN算法
10.3.6決策樹
本章小結
習題
第11章機器學習——無監(jiān)督學習
11.1無監(jiān)督學習
11.2聚類
11.2.1相異度
11.2.2KMeans算法
11.2.3DBSCAN算法
11.3關聯(lián)規(guī)則
11.3.1關聯(lián)分析
11.3.2Apriori算法
11.3.3FPgrowth算法
本章小結
習題
第12章Python地理空間分析
12.1地理空間分析簡介
12.1.1地理空間分析的基本概念
12.1.2地理空間分析與Python
12.2地理空間數(shù)據(jù)
12.2.1數(shù)據(jù)格式概覽
12.2.2數(shù)據(jù)特征
12.2.3矢量數(shù)據(jù)
12.2.4柵格數(shù)據(jù)
12.3Python地理空間分析工具
12.3.1GeoJSON
12.3.2GDAL和OGR
12.3.3PyShp
12.3.4PIL
12.3.5GeoPandas
12.4Python分析矢量數(shù)據(jù)
12.4.1訪問矢量數(shù)據(jù)
12.4.2Shapefile文件操作
12.4.3空間查詢
12.4.4疊加分析
12.5Python與遙感
12.5.1訪問影像文件
12.5.2影像裁剪
12.5.3重采樣
12.5.4影像分類
12.6“五水共治”資源地理空間分析綜合應用
本章小結
習題