久久人人做人人妻人人玩精品hd,精品国产成人av在线,好姑娘在线视频免费观看 ,含羞草电影免费看韩国,果冻传媒一区

當前位置 : 首頁  圖書 正文

智能搜索引擎技術簡介,目錄書摘

2019-10-21 19:00 來源:京東 作者:京東
搜索引擎
智能搜索引擎技術
暫無報價
10評論 100%好評
編輯推薦:
內(nèi)容簡介:  《智能搜索引擎技術》以當前搜索引擎主流技術為基礎,密切關注前沿技術發(fā)展趨勢,結合當前人工智能和自然語言技術的發(fā)展,以深入淺出的形式介紹一套完整的大數(shù)據(jù)時代背景下的智能搜索引擎的關鍵技術。
  《智能搜索引擎技術》在吸取國內(nèi)外經(jīng)典教材優(yōu)點的基礎上,廣泛搜集合適的實例,通過實例從多個視角對智能搜索引擎的核心技術進行全面介紹,加深讀者對關鍵概念和核心技術的理解。
  《智能搜索引擎技術》還對開源軟件進行了介紹,將技術理論與應用范例結合。
  《智能搜索引擎技術》共分為10章,通過采用循序漸進的組織方式對搜索引擎的各個組成部分和核心技術進行了介紹。第1章引言,對搜索引擎進行了簡要概述,介紹了搜索引擎與信息檢索的關系,搜索引擎的歷史、分類及基本架構。第2章信息采集,主要圍繞搜索系統(tǒng)的核心——網(wǎng)絡爬蟲進行介紹。第3章文本處理,對搜索引擎的文本處理功能進行了介紹,包括文本信息的提取、自然語言中的統(tǒng)計語言模型、中英文分詞技術、網(wǎng)頁去重算法等。第4章搜索引擎索引構建,主要介紹搜索引擎的索引系統(tǒng),包括倒排索引、建立索引的方式、索引的更新策略、分布式索引及索引壓縮算法。第5章基于文本內(nèi)容的檢索模型,對搜索引擎的檢索模型進行了介紹,包括傳統(tǒng)的檢索模型,如布爾模型、向量空間模型、概率檢索模型和基于統(tǒng)計語言建模的檢索模型,以及基于機器學習的排序模型。第6章基于鏈接的檢索模型,主要對基于鏈接的檢索模型和針對鏈接作弊的反作弊模型進行了介紹。第7章查詢處理與結果展示,主要對查詢條件的糾正與過濾、查詢處理與展示的技術進行了介紹。第8章相關反饋與查詢擴展,主要對圍繞著相關反饋和查詢擴展的各項技術進行了介紹,通過采用相關反饋和查詢擴展的技術理解用戶的查詢意圖。第9章分類與聚類,主要介紹了在智能搜索引擎中用到的各種機器學習算法。第10章基于知識圖譜的搜索引擎,對未來搜索引擎的發(fā)展方向——基于知識圖譜的智能搜索引擎進行了介紹,包括知識圖譜的構建流程、構建中的信息抽取、知識融合、知識表示與推理等關鍵技術及其在搜索引擎中的應用。
  《智能搜索引擎技術》適用于數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)及其計算機相關專業(yè)的本科生或研究生以及從事該領域研究的人員。
  通過對《智能搜索引擎技術》的閱讀,可以使讀者對智能搜索引擎的相關知識有一個基本的了解,并為將來開展研究工作打下堅實的基礎。
作者簡介:
目錄:第1章 引言
1.1 信息檢索與搜索引擎
1.2 搜索引擎的歷史
1.3 搜索引擎的分類
1.4 搜索引擎的基本架構
1.4.1 主要性能需求
1.4.2 總體架構
1.5 搜索引擎的主要組件及其功能
1.5.1 網(wǎng)絡爬蟲
1.5.2 解析器
1.5.3 索引器
1.5.4 檢索器
1.5.5 用戶交互接口
1.6 開源搜索引擎
本章小結
習題

第2章 信息采集
2.1 網(wǎng)絡爬蟲的概述
2.1.1 網(wǎng)絡爬蟲的功能特點
2.1.2 網(wǎng)絡爬蟲通用架構
2.1.3 網(wǎng)絡爬蟲分類
2.2 分布式網(wǎng)絡爬蟲架構
2.2.1 主從分布式結構爬蟲(master-slave)
2.2.2 對等分布式結構爬蟲(peer to peer)
2.3 信息采集涉及的協(xié)議
2.3.1 URL規(guī)范和HTTP協(xié)議
2.3.2 User Agent
2.3.3 Robots協(xié)議
2.4 頁面遍歷
2.4.1 寬度優(yōu)先遍歷策略
2.4.2 深度優(yōu)先遍歷策略
2.4.3 重要度優(yōu)先遍歷策略
2.5 頁面更新
2.5.1 網(wǎng)頁更新策略
2.5.2 爬蟲更新方式
2.6 深網(wǎng)抓取
2.7 開源網(wǎng)絡爬蟲
本章小結
習題

第3章 文本處理
3.1 文本信息提取
3.1.1 網(wǎng)頁數(shù)據(jù)獲取
3.1.2 非網(wǎng)頁的數(shù)據(jù)獲取
3.2 統(tǒng)計語言模型
3.2.1 N元模型(N-gram)的基本概念
3.2.2 數(shù)據(jù)平滑方法
3.3 英文分詞
3.3.1 詞素切分
3.3.2 詞干提取
3.3.3 去除停用詞3.4 中文分詞
3.4.1 中文分詞概述
3.4.2 基于詞典的機械分詞法
3.4.3 基于統(tǒng)計的分詞法
3.4.4 分詞粒度
3.5 網(wǎng)頁去重
3.5.1 通用去重算法流程
3.5.2 Shingling算法
3.5.3 SimHash算法
本章小結
習題

第4章 搜索引擎索引構建
4.1 倒排索引
4.1.1 倒排索引基礎
4.1.2 詞典結構
4.1.3 倒排表結構
4.2 建立索引方式
4.2.1 基于內(nèi)存的索引構建
4.2.2 基于排序的索引建立
4.2.3 基于合并法的索引構建
4.3 索引更新
4.4 分布式索引
4.4.1 數(shù)據(jù)劃分
4.4.2 冗余和容錯
4.4.3 Elastic Search的分布式索引
4.5 索引壓縮
4.5.1 評價壓縮算法的指標
4.5.2 Delta編碼(D-Gaps)
4.5.3 無參數(shù)間距壓縮編碼
4.5.4 參數(shù)間距壓縮
4.5.5 高查詢性能的編碼
本章小結
習題

第5章 基于文本內(nèi)容的檢索模型
5.1 檢索模型概述
5.2 布爾模型
5.3 向量空間模型
5.3.1 文本表示
5.3.2 查詢相關度計算
5.4 概率檢索模型
5.4.1 概率檢索模型概述
5.4.2 二元獨立模型(binary independent model)
5.4.3 BM25模型
5.4.4 BM25F模型
5.5 基于統(tǒng)計語言建模的檢索模型
5.6 機器學習排序
5.6.1 機器學習排序概述
5.6.2 單文檔方法(pointwise approach)
5.6.3 文檔對方法(pairwise approach)
5.6.4 文檔列表方法(listwise approach)5.7 檢索質(zhì)量評價標準
5.7.1 準確率和召回率
5.7.2 前k個文檔的查準率(P@k)
5.7.3 平均查準率均值(mean average precision,MAP)
5.7.4 NDCG(normalize DCC)
本章小結
習題

第6章 基于鏈接的檢索模型
6.1 Web圖
6.2 Page Rank算法
6.2.1 基于簡單模型的Page Rank算法
6.2.2 基于隨機沖浪模型的Page Rank算法
6.2.3 主題敏感的Page Rank
6.3 HITS算法
6.3.1 HITS算法基本思想
6.3.2 HITS算法流程
6.3.3 HITS的優(yōu)勢與缺陷
6.4 SALAS算法
6.5 通用鏈接反作弊方法
6.5.1 鏈接作弊方法
6.5.2 反鏈接作弊思路
6.5.3 經(jīng)典鏈接反作弊算法
本章小結
習題

第7章 查詢處理與結果展示
7.1 查詢糾錯
7.1.1 查詢糾錯概述
7.1.2 英文糾錯
7.2 搜索智能提示
7.3 不安全信息過濾
7.4 查詢處理
7.4.1 “一次一文檔”
7.4.2 “一次一詞”
7.5 結果展示
7.5.1 頁面摘要
7.5.2 查詢結果聚類
7.6 查詢緩存機制
本章小結
習題

第8章 相關反饋與查詢擴展
8.1 相關反饋框架
8.2 顯式相關反饋
8.2.1 Rocchio相關反饋算法
8.2.2 概率相關反饋
8.2.3 相關反饋策略的評價
8.3 偽相關反饋
8.4 隱式反饋
8.5 查詢擴展
本章小結
習題

第9章 分類與聚類
9.1 文本分類
9.1.1 文本分類框架
9.1.2 貝葉斯文檔分類
9.1.3 支持向量機
9.1.4 特征選擇
9.1.5 評價
9.2 聚類
9.2.1 劃分聚類
9.2.2 層次聚類
9.2.3 評價
本章小結
習題

第10章 基于知識圖譜的搜索引擎
10.1 概述
10.2 知識圖譜的數(shù)據(jù)獲取
10.3 信息抽取
10.3.1 實體抽取
10.3.2 關系抽取
10.3.3 屬性抽取
10.4 知識融合
10.4.1 實體對齊
10.4.2 實體歧義分析
10.5 知識表示與知識推理
10.5.1 知識表示
10.5.2 知識推理
10.6 基于知識圖譜的智能搜索引擎
10.6.1 基于知識圖譜的搜索結構
10.6.2 查詢理解
10.6.3 自動問答
本章小結
習題

參考文獻
熱門推薦文章
相關優(yōu)評榜
品類齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務 天天低價,暢選無憂
購物指南
購物流程
會員介紹
生活旅行/團購
常見問題
大家電
聯(lián)系客服
配送方式
上門自提
211限時達
配送服務查詢
配送費收取標準
海外配送
支付方式
貨到付款
在線支付
分期付款
郵局匯款
公司轉(zhuǎn)賬
售后服務
售后政策
價格保護
退款說明
返修/退換貨
取消訂單
特色服務
奪寶島
DIY裝機
延保服務
京東E卡
京東通信
京東JD+