Hadoop集群的部署方式方式分為三種,分別是獨(dú)立模式(Standalone mode)、偽分布式模式(Pseudo-Distributed mode)、完全分布式模式(Cluster mode),具體介紹如下。查看全文>>
對(duì)于每一門編程語(yǔ)言,數(shù)組(Array)都是重要的數(shù)據(jù)結(jié)構(gòu)之一,主要用來(lái)存儲(chǔ)數(shù)據(jù)類型相同的元素。下面,針對(duì)Scala數(shù)組的定義與使用、數(shù)組遍歷以及數(shù)組轉(zhuǎn)換操作進(jìn)行詳細(xì)介紹。查看全文>>
URL是互聯(lián)網(wǎng)上標(biāo)準(zhǔn)資源的地址,互聯(lián)網(wǎng)上每個(gè)文件(即資源)都有一個(gè)唯一的URL,它包含了文件的位置以及瀏覽器處理方式等信息。URL地址由協(xié)議頭、服務(wù)器地址、文件路徑三部分組成。下面就來(lái)介紹下URL這三個(gè)組成部分。查看全文>>
maplotib是一個(gè)由約翰·亨特(John Hunter)等人員開(kāi)發(fā)的、主要用于繪制2D圖表的Python庫(kù),它支持numpy、pandas 的數(shù)據(jù)結(jié)構(gòu),具有豐富的繪制圖表、定制圖表元素(圖例、注釋文本、表格等)或樣式(如顏色、字體、線型等)的功能,可以幫助開(kāi)發(fā)人員輕松獲得高質(zhì)量的圖表。此外,matplotib還可用于繪制一此3D圖表。查看全文>>
網(wǎng)絡(luò)爬蟲,又稱為網(wǎng)頁(yè)蜘蛛、網(wǎng)絡(luò)機(jī)器人,是一種按照一定的規(guī)則,自動(dòng)請(qǐng)求萬(wàn)維網(wǎng)網(wǎng)站并提取網(wǎng)絡(luò)數(shù)據(jù)的程序或腳本。爬蟲具體能做些什么呢?接下來(lái),我們通過(guò)一張圖來(lái)總結(jié)網(wǎng)絡(luò)爬蟲的常用功能查看全文>>
在網(wǎng)絡(luò)傳輸中HTTP協(xié)議非常重要,該協(xié)議規(guī)定了客戶端和服務(wù)器端請(qǐng)求和應(yīng)答的標(biāo)準(zhǔn)HTTP協(xié)議能保證計(jì)算機(jī)正確快速地傳輸超文本文檔,并確定了傳輸文檔中的哪部分,以及哪部分內(nèi)容首先顯示(如文本先于圖形)等。查看全文>>