国产99久久精品_欧美日本韩国一区二区_激情小说综合网_欧美一级二级视频_午夜av电影_日本久久精品视频

最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當前位置: 首頁 - 科技 - 知識百科 - 正文

What’snewinSpark1.2.0

來源:懂視網 責編:小采 時間:2020-11-09 15:25:18
文檔

What’snewinSpark1.2.0

WhatsnewinSpark1.2.0:1.2.0 was released on 12/18, 2014 在2014年5月30日發布了Spark 1.0 和9月11日發布了Spark1.1.后,Spark 1.2 終于在12月18日發布。作為1.X時代的第三個release,它有什么重要更新呢? 1.Spark Core:性能和易用性的改進 對于超大規模的Shu
推薦度:
導讀WhatsnewinSpark1.2.0:1.2.0 was released on 12/18, 2014 在2014年5月30日發布了Spark 1.0 和9月11日發布了Spark1.1.后,Spark 1.2 終于在12月18日發布。作為1.X時代的第三個release,它有什么重要更新呢? 1.Spark Core:性能和易用性的改進 對于超大規模的Shu

1.2.0 was released on 12/18, 2014 在2014年5月30日發布了Spark 1.0 和9月11日發布了Spark1.1.后,Spark 1.2 終于在12月18日發布。作為1.X時代的第三個release,它有什么重要更新呢? 1.Spark Core:性能和易用性的改進 對于超大規模的Shuffle,Spark Core

1.2.0 was released on 12/18, 2014

在2014年5月30日發布了Spark 1.0 和9月11日發布了Spark1.1.后,Spark 1.2 終于在12月18日發布。作為1.X時代的第三個release,它有什么重要更新呢?

1. Spark Core:性能和易用性的改進

對于超大規模的Shuffle,Spark Core在性能和穩定性方面做了兩個重要的更新:

一) Communication Manager使用Netty實現

在1.1 之前,對于Shuffle的結果回傳,有兩種方式,對于較小的結果,直接使用akka的消息傳遞機制;對于較大的結果,則采用BlockManager。采用BlockManager是不錯的設計,可以避免Driver占用過多的內存而OOM并且減少了GC的風險。但是,BlockManger的處理是低效的:它先從Disk中將結果讀取到kernel的buffer,然后到用戶空間的buffer,然后又到了kernel的send buffer,這期間有多次的內存拷貝和kernel space到user space的切換代價。著不單單是占用了JVM的不必要的內存,而且還增加了GC的頻率。不過,使用FileChannel.transferTo,可以做到zero copy。具體可見http://www.ibm.com/developerworks/library/j-zerocopy/

其中一種實現就是Netty,1.2中,使用Netty 重寫了Communication Manager。實際上,在org.apache.spark.network.netty中已經實現了netty得網絡模塊,但是由于不完善而這個選項默認是沒有打開的。

而且,使用Netty已經是默認的了。spark.shuffle.blockTransferService 已經從1.1的nio變成1.2 中新增的netty了。關于這個PR的詳情可見 https://issues.apache.org/jira/browse/SPARK-2468

二) Shuffle的默認機制從hashbased 轉化為sort based

MapReduce被人詬病之一就是不管sort是否必要,都需要排序。Spark在1.1之前,都是hash based Shuffle。但是hash based會占用大量的內存,當然了在內存不夠用時,也會spill到disk,然后最后再做一次merge。對于比較大的數據集,因為有disk IO,因此性能也會有所下降。Shuffle的性能的好壞可以說直接影響整個job的性能也不為過。在1.1的時候,引入了sort based shuffle。在1.2的時候,這個已經能夠成熟并且成為默認的選項:

spark.shuffle.manager 從hash 變為sort。

并且從作者Reynold Xin的測試來看,sort 在速度和內存使用方面優于hash:“sort-based shuffle has lower memory usage and seems to outperformhash-based in almost all of our testing.”

2. MLlib: 擴充了Python API

3. Spark Streaming:實現了基于WriteAhead Log(WAL)的HA,避免因為Driver異常退出導致的數據丟失

4. GraphX: 性能和API的改進(alpha)

Spark 1.2 是來自60多家企業,學校等研究機構的172位貢獻者的一次重要發布。從Contributor的數量看,Spark社區依然是最活躍的開源社區之一。

從Spark的歷次更新都可以看出,快速迭代是互聯網的王道。Spark發展到現在,雖然依然有這樣的那樣的問題,但是依靠不斷的迭代,各大廠商的支持和各位contributor的不斷付出,相信社區會持續快速發展。雖然商業軟件可能幾年前就已經解決了這些問題,商業軟件可能在某個應用場景已經有了最佳的實現。但是互聯網的稟賦就在于不求最優,只求合適。而且對于各個中小型的互聯網公司來說,場景不斷在變,需要一個自己可以掌控的架構,隨著自身的發展不斷的在這個架構上做快速的迭代。而Spark,或許就是這個適合大家的架構。

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

What’snewinSpark1.2.0

WhatsnewinSpark1.2.0:1.2.0 was released on 12/18, 2014 在2014年5月30日發布了Spark 1.0 和9月11日發布了Spark1.1.后,Spark 1.2 終于在12月18日發布。作為1.X時代的第三個release,它有什么重要更新呢? 1.Spark Core:性能和易用性的改進 對于超大規模的Shu
推薦度:
標簽: Windows new what
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top
主站蜘蛛池模板: 欧美亚洲免费 | 日韩成人免费在线 | 香港经典a毛片免费观看…伊人色综合久久 | 久久精品国产一区二区 | 九九久久精品国产 | 欧美一区二区高清 | 亚洲第一导航 | 欧洲日韩 | 日本一区二区三区免费在线观看 | 国产精品亚洲综合一区 | 亚洲一区二区久久 | 日本不卡一区二区三区 最新 | 国产成人+综合亚洲+天堂 | 国产欧美精品区一区二区三区 | 真人一级一级毛片免费观看 | 国产一区二区三区欧美精品 | 国产精品视频一区二区三区 | 成人欧美一区二区三区视频 | 国产国语在线播放视频 | 国产一二区视频 | 夜夜操网| 欧美日韩国产va另类试看 | 欧美日韩在线一区二区三区 | 九九久久亚洲综合久久久 | 欧美日韩精品一区二区三区四区 | 国产区免费在线观看 | 国产成人精品免费视频大全可播放的 | 国产精品…在线观看 | 伊人精品国产 | 国产在线视欧美亚综合 | 日韩一区二区三区在线视频 | 五十路夫妻| 日韩中文在线观看 | 阿v精品一区二区三区 | 亚洲欧洲国产成人综合一本 | 成人一级毛片 | 国产资源在线播放 | 美日韩在线视频 | 亚洲精品制服丝袜二区 | 四虎影视永久在线 | 亚洲香蕉久久综合网 |