Python模塊的開頭通常會(huì)定義一個(gè)__all__屬性,該屬性實(shí)際上是一個(gè)元組,該元組中包含的元素決定了在使用from…import 語句導(dǎo)入模塊內(nèi)容時(shí)通配符所包含的內(nèi)容。 如果__all__中只包含模塊的部分內(nèi)容,那么from…import *語句只會(huì)將__all__中包含的部分內(nèi)容導(dǎo)入程序。查看全文>>
break語句用于跳出離它最近一級(jí)的循環(huán),能夠用于for循環(huán)和while循環(huán)中,通常與if語句結(jié)合使用,放在if語句代碼塊中,其格式如下所示。查看全文>>
在數(shù)據(jù)倉庫建設(shè)中,一般會(huì)圍繞著星型模型和雪花模型來設(shè)計(jì)數(shù)據(jù)模型。下面就來介紹一下這兩種數(shù)據(jù)模型。查看全文>>
Scrapy的運(yùn)作流程由引擎控制,其過程如下:(1)引擎向Spiders請求第個(gè)要爬取的URL(s)。(2)引擎從Spiders中獲取到第一個(gè)要爬取的URL,封裝成Request并交給調(diào)度器。(3)引擎向調(diào)度器請求下一個(gè)要爬取的Request。查看全文>>
根據(jù)使用場景,網(wǎng)絡(luò)爬蟲可分為通用爬蟲和聚焦爬蟲兩種。通用爬蟲是捜索引擎抓取系統(tǒng)(Baidu、Google、Yahoo等)的重要組成部分,主要目的是將互聯(lián)網(wǎng)上的網(wǎng)頁下載到本地,形成一個(gè)互聯(lián)網(wǎng)內(nèi)容的鏡像備份。聚焦爬蟲,是“面向特定主題需求”的一種網(wǎng)絡(luò)爬蟲程序。接下來,就對這兩種爬蟲分別進(jìn)行介紹。查看全文>>
NumPy支持比Python更多的數(shù)據(jù)類型。下面介紹一些常用的數(shù)據(jù)類型,以及這些數(shù)據(jù)類型之間的轉(zhuǎn)換。通過“ndarray.dtype”可以創(chuàng)建一個(gè)表示數(shù)據(jù)類型的對象。要想獲取數(shù)據(jù)類型的名稱,則需要訪問name屬性進(jìn)行獲取,示例代碼如下。查看全文>>