圖書總覽

字級:
小字級
中字級
大字級

大數據分析處理:Spark技術、應用與性能優質化

作者:Spark亞太研究院 王家林
出版日期:2016/02/20
語言:繁體中文
書號:HB1605
ISBN:9789863756231
裝訂:平裝
定價:750 元

相關檔案: 相關下載

內容簡介

Hadoop時代來臨之後,雖然已經建立了完整的生態圈,包括儲存、運算,叢集管理以及NoSQL/RDMS等,但這拼圖的最後一個缺角,卻是讓Hadoop人員搥胸頓足的即時處理。Spark的出現,不是淘汰Hadoop,而是讓這個Ecosystem更加完整。
Spark完整的語法、支援Hadoop的MapReduce,再加上特殊的架構以及自有的查詢語言,讓整個大數據圈為之震憾,也打破了Hadoop保持的大數據處理紀錄。如果你是Hadoop的使用者,這本書是你一定要深深研讀,如果你是大數據的新手,這也是你入門的最好選擇。

本書特色

  • 完全從企業處理大數據夜霧場景的角度出發,利用實際範例的程式碼來組織內容,從零起步,不用任何基礎。
  • 全書利用Spark框架中核心程式碼解析,掌握Spark實用開發技術,輕鬆駕馭Spark核心和子框架
  • 於網站附彩色程式碼圖檔供讀者下載、參考

作者簡介

本書作者王家林在Spark、Hadoop、Android 等方面有豐富的原始程式開發、實務和效能最佳化經驗,徹底研究了Spark 從0.5 到1.1 共18 個版本的Spark 原始程式。
他是Hadoop 原始程式級專家,曾負責某知名公司的類別Hadoop 架構開發工作,專注於提供Hadoop 整合式解決方案,同時也是雲端運算分散式大數據處理的最早實作者之一。

目錄

ch01 Spark程式設計模型
ch02 建置Spark分散式叢集
ch03 Spark開發環境及其測試
ch04 Spark RDD與程式設計API實戰
ch05 Spark執行模式深入解析
ch06 Spark核心解析
ch07 GraphX大規模圖型計算與圖型擷取實戰
ch08 Spark SQL原理與實戰
ch09 Machine Learning on spark
ch10 Tachyon檔案系統
ch11 Spark Streaming原理與實戰
ch12 Spark多語言程式設計
ch13 R語言的分散式程式設計之SparkR
ch14 Spark效能最佳化和最佳做法
ch15 Spark原始程式解析
附錄A 動手實戰Scala三部曲

TOP