<內容簡介>
大數據演算法是大數據得以有效應用的基礎,也是有志於從事大數據以及相關領域工作必須學習的課程。本書由從事大數據研究的專家撰寫,系統地介紹了大數據演算法設計與分析的理論、方法和技術。本書其分為10章,第1童概述大數據演算法,第2章介紹時間亞線性演算法,第3章介紹空間亞線性演算法,第4章概述外存演算法,第5章介紹大數據外存查找結構,第6章講授外存圖數據演算法,第7章概述MapReduce演算法,第8章通過一系列例子講授MapReduce演算法,第9章介紹超越MapReduce的演算法設計方法,第10章討論眾包演算法。
王宏志編著的《大數據演算法》適合作為電腦科學、大數據等專業本科生、研究生教材,也可供從事大數據相關工作的工程技術人員參考。
<章節目錄>
前言
第1章 緒論
1.1 大數據概述
1.1.1 什麼是大數據
1.1.2 無處不在的大數據
1.1.3 大數據的特點
1.1.4 大數據的應用
1.2 大數據演算法
1.2.1 大數據上求解問題的過程
1.2.2 大數據演算法的定義
1.2.3 大數據的特點與大數據演算法
1.2.4 大數據演算法的難度
1.2.5 大數據演算法的應用
1.3 大數據演算法設計與分析
1.3.1 大數據演算法設計技術
1.3.2 大數據演算法分析技術
1.4 本書的內容
習題
第2章 時間亞線性演算法
2.1 時間亞線性演算法概述
2.1.1 平面圖直徑問題的亞線性演算法
2.1.2 排序鏈表搜索的亞線性演算法
2.1.3 兩個多邊形交集問題的多項式時間演算法
2.2 最小生成樹代價估計
2.2.1 連通分量個數估計演算法
2.2.2 最小生成樹代價估計演算法
2.3 時間亞線性判定演算法概述
2.4 數組有序的判定演算法
2.5 串相等判定演算法
習題
第3章 空間亞線性演算法
3.1 空間亞線性演算法概述
3.2 水庫抽樣
3.3 尋找頻繁元素的非隨機演算法
3.3.1 頻繁元素的精確解
3.3.2 頻繁元素的Misra-Gries演算法
3.4 估算不同元素的數量
3.4.1 基本演算法
3.4.2 改進演算法
3.5 尋找頻繁元素的隨機演算法
3.5.1 略圖法
3.5.2 計數-最小略圖
3.6 估計頻率矩
3.6.1 頻率矩的AMS估計演算法
3.6.2 基於拔河略圖的頻率矩估計
3.6.3 使用穩定分佈估計範數
習題
第4章 外存演算法概述
4.1 外存存儲結構與外存演算法概述
4.2 外存演算法示例:外存排序演算法
4.2.1 外存歸併排序演算法
4.2.2 外存多路快速排序演算法
4.2.3 外存計算的下界
4.3 外存數據結構示例:外存搜索樹
習題
第5章 外存查找結構
5.1 B樹
5.2 加權平衡B樹
5.3 持久B樹
5.4 緩存樹
5.5 KDB樹
5.6 0樹
習題
第6章 外存圖數據演算法
6.1 線性表排名及其應用
6.1.1 線性表排名問題
6.1.2 歐拉迴路
6.1.3 父子關係判定
6.1.4 前序計數
6.1.5 計算子樹大小
6.2 時間前向處理方法
6.2.1 DAG形式邏輯表達式計算問題
6.2.2 最大獨立集合演算法
6.3 縮圖法
6.3.1 基於縮圖法的圖連通分量計算半外存演算法
6.3.2 基於縮圖法的圖連通分量計算全外存演算法
6.3.3 最小生成樹演算法
6.4 廣度優先搜索和深度優先
搜索