內容簡介
本書第一版曾經榮獲Jolt Productivity Award大獎
挖掘隱藏在Twitter、Facebook、LinkedIn、Instagram與GitHub等熱門社群網站中的豐富數據。本書提供Python範例程式、Jupyter notebook與Docker檔可供練習。您可以從本書中,學到如何從社群媒體中挖掘各種寶貴的資料,像是某個人的人脈網路、現在的熱門話題,這些鄉民或網軍來自何方。
每個章節都是一個可以獨立閱讀學習的主題,分別介紹不同的資料探勘技術以及應用在不同的社群網站,同時還涵蓋了部落格與電子郵件。這個版本還額外增加了一個專門探討Instagram的章節。
.對社群網站有更加深入的了解
.提供打包好的Docker檔,可以直接執行本書的範例
.所有範例檔案皆可自本書專屬的Github儲存庫上取得
.學習如何使用簡單好用的Python工具來分析您取得的資料
.介紹先進的資料挖掘技術,如TF-IDF、餘弦相似性、搭配分析、圖像識別等等
.學習如何使用簡單好用的Python工具來分析您取得的資料
.利用XHTML Friends Network探索微格(microformat)中的社交聯繫
.應用TF-IDF、餘弦相似性、搭配分析、文件摘要、小組辨識等先進探勘技術
.使用Python與JavaScript套件完成資料視覺化
挖掘隱藏在Twitter、Facebook、LinkedIn、Instagram與GitHub等熱門社群網站中的豐富數據。本書提供Python範例程式、Jupyter notebook與Docker檔可供練習。您可以從本書中,學到如何從社群媒體中挖掘各種寶貴的資料,像是某個人的人脈網路、現在的熱門話題,這些鄉民或網軍來自何方。
每個章節都是一個可以獨立閱讀學習的主題,分別介紹不同的資料探勘技術以及應用在不同的社群網站,同時還涵蓋了部落格與電子郵件。這個版本還額外增加了一個專門探討Instagram的章節。
.對社群網站有更加深入的了解
.提供打包好的Docker檔,可以直接執行本書的範例
.所有範例檔案皆可自本書專屬的Github儲存庫上取得
.學習如何使用簡單好用的Python工具來分析您取得的資料
.介紹先進的資料挖掘技術,如TF-IDF、餘弦相似性、搭配分析、圖像識別等等
.學習如何使用簡單好用的Python工具來分析您取得的資料
.利用XHTML Friends Network探索微格(microformat)中的社交聯繫
.應用TF-IDF、餘弦相似性、搭配分析、文件摘要、小組辨識等先進探勘技術
.使用Python與JavaScript套件完成資料視覺化
作者簡介
Matthew Russell (@ptwobrussell)
Built Technologies的首席技術官,帶領團隊解決各種難題。
Mikhail Klassen(@ MikhailKlassen)
Paladin AI的首席資料科學家與創辦人之一。Paladin AI是一家位於加拿大的航太科技新創公司,致力於運用資料挖掘與機器學習技術開發下一代的飛行員訓練解決方案。
Built Technologies的首席技術官,帶領團隊解決各種難題。
Mikhail Klassen(@ MikhailKlassen)
Paladin AI的首席資料科學家與創辦人之一。Paladin AI是一家位於加拿大的航太科技新創公司,致力於運用資料挖掘與機器學習技術開發下一代的飛行員訓練解決方案。
內容目錄
前言
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
ISBN: 9789865026035