當你打開該網頁時,相信你的第一反應肯定是懷疑的,一個小小的程序員怎么可能成為數據庫專家,但是內心也有一點期盼的成分存在,就像買彩票一樣,明知道中500萬的概率幾乎為零,可是還是會去買。前DataStax工程師,Platfora的聯合創始人,SriSatish Ambati描
當你打開該網頁時,相信你的第一反應肯定是懷疑的,一個小小的程序員怎么可能成為數據庫專家,但是內心也有一點期盼的成分存在,就像買彩票一樣,明知道中500萬的概率幾乎為零,可是還是會去買。前DataStax工程師,Platfora的聯合創始人,SriSatish Ambati描繪了一幅宏偉的藍圖,讓大數據從晦澀難懂的“黑魔法”變成像小孩子的“過家家”游戲那樣簡單,無論成功與否, Ambati勇氣可嘉,態度值得所有的程序員學習。喬布斯不正是把一個個不可能變成了現實嗎?
不過令人遺憾的是,0xdata的數據庫產品還在襁褓之中,但是0xdata對做大規模先進的統計分析問題的能力有強大的自信:建立在HDFS上的規模化處理,使用廣為人知的R編程語言,把一切都隱藏在一個簡單的界面之下。
大數據的趨勢正在悄然發生改變,把大數據從晦澀難懂的“黑魔法”變成”小兒科“,似乎已經不再是一個難以企及的夢想!0xdata正是推動這項技術發展的最新公司之一。自啟動以來,“hexadata”就凝聚了前DataStax工程師,Platfora的聯合創始人,SriSatish Ambati的心血結晶,現在它試圖融入Hadoop、R語言和谷歌的BigQuery,準備打造“終極版”的統計分析工具。
Oxdata的旗艦產品,被稱之為“H2O”,不錯,就是“水”的意思,它的核心是一個統計分析引擎,它使用Hadoop的分布式文件系統(HDFS)作為其存儲平臺,但是它們的最終目標是像谷歌的BigQuery一樣簡單。H2O的用戶交互是通過一個簡單的網絡搜索和標準R統計分析語法。另外,用戶還可以在Microsoft Excel或RStudio的集成開發環境中使用REST API調用H2O。
Ambati表示,規模化的基礎數據和運行高級分析的復雜性都是需要被隱藏的細節。這和Platfora有相同的理論基礎,但是該公司的聯合創始人Ambati和前任DataStax的同事Ben Werther卻與Platfora的做法截然不同。Platfora試圖通過建立基于Hadoop的下一代用戶體驗來破壞現有的數據倉庫市場,然而0xdata只是試圖改變傳統的統計軟件的用戶交互方式而已。
數據分析產品的負責人Ambati很經典的一句話:“誰都沒有吹牛的權利。但是如果不這樣做,未來將寸步難行。”讓人不禁想到這兩天京東與蘇寧的家電大戰,只能硬著頭皮前進,不能后退,因為后退即是滅亡!
Oxdata把數據處理的速度當做一個重點處理——如何快速處理數據,如何讓用戶迅速得到響應。谷歌搜索讓我們有了可以陸續追問的思想,Ambati認為,數據分析也應該有同樣的經歷。這就是為什么H2O在分析過程中的每一步都提供了近似的結果,而不是等待整個工作運行以后得出計算精確的結果,用戶可以得到一個總體的解決思路,即使完全超出預期范圍,無論是清理工作還是重新開始新工作都會變得更快。
想要在公眾面前得到一個機會,實現H2O“壯志雄心”的諾言,還有很長的一段路要走。但是Ambati表示,雖然產品僅僅是經歷了短短4個月的開發,還沒有一套的完整的算法,但是相信幾個月以后就能初見分曉。他團隊的八位工程師,已經建立了很多很酷的東西,只是現在還需要一個完善的過程,最終才能把代碼變成實際的產品。盡管困難是如此之大,他們毅然決定繼續數據的系統化處理,就是從那一刻起,Ambati和他的團隊也發現了很多的樂趣,“我們與基礎架構生死相隨,不離不棄”Ambati調侃道,“而且我們一大幫人花了很多的時間來學習數學,日子就像回到計算機科學專業學生的那個時代”。(編譯/王鵬,審校/包研)
How 0xdata wants to help everyone become data scientists
后記:Oxdata的H2O目前雖然還是“鏡花水月,空中樓閣”,但是Ambati和他的團隊的精神確實讓人肅然起敬,中國有句老話“有志者,事竟成”,相信只要努力肯定會有收獲。當1985年Microsoft的Windows視窗操作系統發布,就立即取代了以往的命令、代碼系統(Microsoft Disk Operating Systerm,簡稱MS-DOS),立即成就了Microsoft這個龐然大物,讓比爾·蓋茨榮登世界首富的寶座,就是因為Windows簡單簡潔,操作方便,給用戶帶來了更好的操作體驗,現在電腦已經走進千家萬戶,從幾歲的孩子到五六十的老人,都能很快上手進行網上沖浪,這不正是Windows的魅力所在嗎?喬布斯的Ipad風靡全球也正是因為這些原因,因為它讓3歲的孩子都能很快成為“水果忍者”。Ambati的團隊也做著同樣的事情,他們也想讓“觸不可及”的大數據處理變得的簡單如操作Windows一樣,讓每個人都能迅速成為數據庫領域的“專家”,這不正是醞釀著一場新的數據革命嗎?我們也期待H2O的發布,能給大數據帶來一場新的變革!
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com