本書是暢銷書升級版,向讀者提供了一套完整的大數(shù)據(jù)時代背景下的搜索引擎解決方案,詳盡地介紹了搜索引擎的技術(shù)架構(gòu)、算法體系及取得的成果,并以模塊化的方式進行組織。本書著重介紹了機器學(xué)習(xí)在搜索引擎中的應(yīng)用,包括中文分詞、聚類、分類等核心的機器學(xué)習(xí)算法,并結(jié)合示例加以介紹和分析,使讀者可以更好地理解機器學(xué)習(xí)在搜索引擎中的價值;同時,闡述了大數(shù)據(jù)給搜索引擎帶來的新特性,結(jié)合目前大數(shù)據(jù)分析的主流工具,在搜索引擎中構(gòu)建知識圖譜,以及進行日志反饋學(xué)習(xí),可以使得搜索引擎更加智能。本書不僅適合作為互聯(lián)網(wǎng)行業(yè)從業(yè)者的技術(shù)參考書,也適合作為搜索引擎愛好者的參考讀物。
劉凡平,碩士,畢業(yè)于中國科學(xué)技術(shù)大學(xué)軟件系統(tǒng)設(shè)計專業(yè)。曾任職微軟亞太研發(fā)集團、百度(中國)有限公司?,F(xiàn)任薇問(北京)科技有限公司首席技術(shù)官,負責(zé)搜索引擎技術(shù)與大數(shù)據(jù)人工智能平臺研發(fā)工作。擅長搜索引擎、大數(shù)據(jù)分析、分布式計算等相關(guān)研發(fā)工作,是Iveely開源搜索引擎的主要貢獻者之一。