POSIX規(guī)范制訂了兩種標(biāo)準(zhǔn)的正則表達(dá)式語(yǔ)法,一種是基本正則表達(dá)式,一種擴(kuò)展正則表達(dá)式。這兩中正則表達(dá)式的元字符組成略有不同。本節(jié)來(lái)學(xué)習(xí)基礎(chǔ)正則表達(dá)式元字符。查看全文>>
Spark部署模式分為L(zhǎng)ocal模式(本地單機(jī)模式)和集群模式,在Local模式下,常用于本地開(kāi)發(fā)程序與測(cè)試,而集群模式又分為Standalone模式(集群?jiǎn)螜C(jī)模式)、Yarn模式和Mesos模式,關(guān)于這三種集群模式的相關(guān)介紹具體如下:查看全文>>
本節(jié),我們將詳細(xì)講解使用mongo shell對(duì)集合進(jìn)行創(chuàng)建和刪除操作。創(chuàng)建集合有兩種方式,即顯式創(chuàng)建集合和隱式創(chuàng)建集合,具體語(yǔ)法如下:查看全文>>
爬取網(wǎng)頁(yè),其實(shí)就是通過(guò)URL獲取網(wǎng)頁(yè)信息,這段網(wǎng)頁(yè)信息的實(shí)質(zhì)就是一段附加了JS和CSS的HTML代碼。如果把網(wǎng)頁(yè)比作是一個(gè)人,那么HTML就是它的骨架,JS是它的肌肉,CSS是它的衣服。由此看來(lái),網(wǎng)頁(yè)最重要的數(shù)據(jù)部分是存在于HTML中的。urllib庫(kù)的使用比較簡(jiǎn)單,接下來(lái),我們使用urllib快速爬取一個(gè)網(wǎng)頁(yè),具體代碼如下:查看全文>>
坐標(biāo)軸一般將軸脊作為刻度的載體,在軸脊上顯示刻度標(biāo)簽和刻度線。matplotlib中的坐標(biāo)系默認(rèn)有4個(gè)軸脊,分別是上軸脊、下軸脊、左軸脊和右軸脊,其中上軸脊和右軸脊并不經(jīng)常使用,大多數(shù)情況下可以將上軸脊和右軸脊隱藏。matplotlib中提供了隱藏全部軸脊或部分軸脊的方法。查看全文>>
大數(shù)據(jù)培訓(xùn)課程中經(jīng)常會(huì)講到HDFS,HDFS提供了多種數(shù)據(jù)訪問(wèn)方式,其中,命令行的形式是最簡(jiǎn)單的,同時(shí)也是許多開(kāi)發(fā)者最容易掌握的方式,本節(jié)將針對(duì)HDFS的基本操作進(jìn)行講解。查看全文>>