Hive是基于Hadoop的一個數據倉庫工具,主要用來對數據進行抽取、轉換、加載操作。HiveQL可以將結構化的數據文件映射為一張數據表,允許熟悉SQL的用戶查詢數據,也允許熟悉MapReduce的開發(fā)者開發(fā)自定義的mapper和reducer來處理內建的mapper和 reducer無法完成的復雜的分析工作,相對于Java代碼編寫的MapReduce來說,Hive的優(yōu)勢更加明顯。Hive利用Hadoop的HDFS存儲數據,利用Hadoop的MapReduce執(zhí)行查詢。查看全文>>
在之前的Python培訓?課程中,我們實現(xiàn)了為3D散點圖增加動畫,今天我們講一下basemap安裝方法。在數據可視化中,人們有時需要將采集的數據按照其他地理位置顯示到地圖上,常見于城市人口、飛機航線、礦藏分布等,有助于用戶理解與空間有關的信息。basemap是matplotlib中的地圖工具包查看全文>>
數據發(fā)布與訂閱模型,即所謂的全局配置中心,就是發(fā)布者將需要全局統(tǒng)一管理的數據發(fā)布到Zookeeper節(jié)點上,供訂閱者動態(tài)獲取數據,實現(xiàn)配置信息的集中式管理和動態(tài)更新查看全文>>
自2013年6月百度EFE(ExcellentFrontEnd)數據可視化團隊研發(fā)的ECharts1.0發(fā)布到GitHub網站以來,ECharts一直備受業(yè)界權威的關注并獲得廣泛好評,成為目前成熟且流行的數據可視化圖表工具,被應用到諸多數據可視化的開發(fā)領域。Python作為數據分析領域最受歡迎的語言查看全文>>
程序的編碼風格是一個人編寫程序時表現(xiàn)出來的特點、習慣邏輯思路等。我們在程序開發(fā)時要重視其編寫規(guī)范,程序不僅應該能夠在機器上正確執(zhí)行,還應便于調試、維護及閱讀。下面舉例說明一些編程規(guī)范。查看全文>>
?Python官方網站中可以下載Python解釋器以搭建Python開發(fā)環(huán)境。下面以Windows系統(tǒng)為例演示Python的下載與安裝過程。具體操作步驟如下:查看全文>>