圖書總覽

字級:
小字級
中字級
大字級

雲端&區塊鏈必備技能-Hadoop-大數據高效處理實戰範典


作者:譚磊、范磊 編著
出版日期:2020/02/06
語言:繁體中文
書號:O1O2001
ISBN:9789863797999
裝訂:平裝
定價:540 元

商品特色

◆ 好用、可靠、可擴充的大規模資料儲存和分析系統

◆ 結合Spark高效且快速進行巨量數據處理

◆ 分散式系統容錯率高,當軟硬體出錯後系統都能繼續執行

內容簡介

本書主要特點:

1. 全面實用地論述了從實際應用中分析出的資料採擷和Hadoop 相關概念和技術。

2. 用實際案例為使用者介紹Hadoop,而不只是在理論層面。

3. 詳解Hadoop 相關領域最新的技術和商業應用大數據應用的動態變化。

 

本書並非以教科書式概念作為架構,而是藉由一些真實可靠的案例範示呈現,說解在各種場景下如何應用Hadoop。本書能幫助讀者開闊眼界和找到方法,知道如何分析實際商業場景及業務問題,構建基於Hadoop大數據系統,透過使用數據管理及運用,對公司業務經營帶來直接效益。當然對於學生、教師和有志於從業大數據處理、分析與應用的人員來說,也是一本實用教材。

目錄

01 大數據概念的老調重彈

1.1 網際網路和物聯網上的資料

1.2 資料能為我們做的事

1.3 資料採擷中的一些基本概念

1.4 資料倉儲

1.5 不包含在本書中的內容

1.6 這本書都講些什麼

 

02 Hadoop的前世今生

2.1 Google的計算架構

2.2 Hadoop的誕生

2.3 Hadoop的今天

2.4 Hadoop大事記

 

03 等於大數據的Hadoop

3.1 Hadoop理念

3.2 Hadoop核心基礎架構

3.3 Hadoop上的各種其他元件

3.4 Spark和Hadoop

 

04 Hadoop的價值

4.1 大數據時代需要新的架構

4.2 Hadoop能解決的問題

4.3 去IOE

4.4 7種最常見的Hadoop和Spark專案

 

05 Hadoop系統速成

5.1 Hadoop系統架設速成

5.2 在雲端上執行Hadoop

5.3 Hadoop資訊大全

 

06 資料倉儲和Hadoop

6.1 大數據時代的資料系統設計

6.2 傳統資料倉儲的瓶頸

6.3 Hadoop是解決資料倉儲瓶頸的方法

6.4 以Hadoop和Spark為基礎的資料倉儲解決方案

 

07 在不同應用環境下的Hadoop

7.1 在儲存密集型環境中的Hadoop

7.2 在網路密集型環境中的Hadoop

7.3 在運算密集型環境中的Hadoop

7.4 Hadoop平台的比較和選擇

 

08 Hadoop在網際網路公司的應用

8.1 Hadoop在騰訊

8.2 Hadoop在Facebook的應用

8.3 金山的Hadoop

8.4 迅雷公司對Hadoop的應用

 

09 Hadoop和企業應用之一

9.1 Hadoop和電信業者

9.2 Hadoop和公用事業

9.3 Hadoop和「智慧工商」

9.4 Hadoop和政務雲

 

10 Hadoop與「衣食住行」中的「食」和「行」

10.1 Hadoop和「食」

10.2 Hadoop和「行」

 

11 Hadoop和企業應用之三

11.1 Hadoop和金融

11.2 Hadoop和醫療

11.3 Hadoop和物流

11.4 Hadoop和媒體

 

12 特殊場景下的Hadoop系統

12.1 Hadoop和即時系統

12.2 Hadoop平台的一些特殊場景實現

 

13 Hadoop系統的挑戰和應對

13.1 Hadoop系統使用須知

13.2 Hadoop平台風險點預估

13.3 Hadoop平台硬體故障的應對機制

13.4 Hadoop平台如何真正做到高可用性

13.5 Hadoop平台安全性和隱私性的應對機制

 

14 Hadoop的未來

14.1 Hadoop未來的發展趨勢

14.2 Hadoop和區塊鏈

 

A 專業詞彙表

B 參考文獻

C 參考網站一覽

D HDFS 命令列列表

作者簡介

譚磊

復旦大學電腦學士,美國杜克大學電腦碩士,NABA北美區塊鏈協會聯合創始人。在美國微軟服務超過13年,在搜索、互聯網廣告、資料採擷、電子商務等方面有豐富的經驗,是互聯網技術領域資深專家。

 

范磊

前英特爾亞太區大數據總監,知名大數據專家,星環科技聯合創始人兼CEO。

TOP