hadoop權威指南第四版中文版電子書 pdf版本 最新更新|軟件分類|軟件專題|手機版|論壇轉貼|軟件發布

您當前所在位置:卡迪夫城水晶宫教程下載程序開發 → hadoop權威指南第四版中文版電子書 pdf版本

水晶宫vs卡迪夫城:hadoop權威指南第四版中文版電子書 pdf版本

卡迪夫城水晶宫 www.skeiir.com.cn hadoop權威指南第4版下載|

hadoop權威指南第四版中文版電子書

版本

  • 軟件大?。?span itemprop="fileSize">8.6M
  • 軟件語言:中文
  • 軟件類型:國產軟件/程序開發
  • 軟件授權:免費軟件
  • 更新時間:2017-10-30 15:49
  • 軟件等級:4星
  • 應用平臺:WinXP, Win7, Win8, Win10
  • 軟件官網:

軟件介紹人氣軟件精品推薦相關文章網友評論下載地址

小編為您推薦: hadoop權威指南 hadoop 電子圖書

hadoop權威指南第4版是一款針對于Hadoop發展現狀和應用進行詳細的分析講解,由淺入深全方位介紹了Hadoop,并通過海量數據分析儲存,更加清晰了解集群安裝運維,高性能的分析平臺和海量數據處理?;隊?a href="//www.skeiir.com.cn/" target="_blank">IT貓撲下載使用。

hadoop權威指南第四版中文版pdf介紹

Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。

用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力進行高速運算和存儲。

Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據。

hadoop權威指南第4版

hadoop權威指南第四版作者簡介

Tom White,數學王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會成員之一。全球知名云計算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學數學學士學位和利茲大學科學哲學碩士學位。

hadoop權威指南第四版電子書第三章免費部分閱讀

第3章 Hadoop分布式文件系統

當數據集的大小超過一臺獨立的物理計算機的存儲能力時,就有必要對它進行分區(partition)并存儲到若干臺單獨的計算機上。管理網絡中跨多臺計算機存儲的文件系統稱為分布式文件系統(distributed filesystem)。該系統架構于網絡之上,勢必會引入網絡編程的復雜性,因此分布式文件系統比普通磁盤文件系統更為復雜。例如,使文件系統能夠容忍節點故障且不丟失任何數據,就是一個極大的挑戰。

Hadoop自帶一個稱為HDFS的分布式文件系統,即HadoopDistributed Filesystem。在非正式文檔或舊文檔以及配置文件中,有時也簡稱為DFS,它們是一回事兒。HDFS是Hadoop的旗艦級文件系統,也是本章的重點,但實際上Hadoop是一個綜合性的文件系統抽象,因此接下來我們將了解將Hadoop與其他存儲系統集成的途徑,例如本地文件系統和Amazon S3系統。

3.1 HDFS的設計

HDFS以流式數據訪問模式來存儲超大文件,運行于商用硬件集群上。①讓我們仔細看看下面的描述。

* 超大文件 “超大文件”在這里指具有幾百MB、幾百GB甚至幾百TB大小的文件。目前已經有存儲PB級數據的Hadoop 集群了。②

* 流式數據訪問 HDFS的構建思路是這樣的:一次寫入、多次讀取是最高效的訪問模式。數據集通常由數據源生成或從數據源復制而來,接著長時間在此數據集上進行各種分析。每次分析都將涉及該數據集的大部分數據甚至全部,因此讀取整個數據集的時間延遲比讀取第一條記錄的時間延遲更重要。

* 商用硬件 Hadoop并不需要運行在昂貴且高可靠的硬件上。它是設計運行在商用硬件(在各種零售店都能買到的普通硬件③)的集群上的,因此至少對于龐大的集群來說,節點故障的幾率還是非常高的。HDFS遇到上述故障時,被設計成能夠繼續運行且不讓用戶察覺到明顯的中斷。

同樣,那些不適合在HDFS上運行的應用也值得研究。目前HDFS對某些應用領域并不適合,不過以后可能會有所改進。

IT貓撲小編推薦

準備好釋放數據的強大潛能了嗎?借助于這本本書,你將學習如何使用ApacheHadoop構建和維護穩定性高、伸縮性強的分布式系統。本書是為程序員寫的,可幫助他們分析任何大小的數據集。本書同時也是為管理員寫的,幫助他們了解如何設置和運行Hadoop集群。

hadoop權威指南第四版中文版pdf未出,暫提供英文原版閱讀。

更多>>軟件截圖

推薦軟件

其他版本下載

精品推薦

相關文章

下載地址Android版iPhone版Mac版iPad版

  • hadoop權威指南第四版中文版電子書 pdf版本

    查看所有評論>>網友評論

    發表評論

    (您的評論需要經過審核才能顯示) 網友粉絲QQ群號:203046401

    查看所有0條評論>>

    更多>>猜你喜歡