前期采集到的數(shù)據(jù),或多或少都存在一些瑕疵和不足,比如數(shù)據(jù)缺失、極端值、數(shù)據(jù)格式不統(tǒng)一等問題。因此,在分析數(shù)據(jù)之前需要對數(shù)據(jù)進行預處理,包括數(shù)據(jù)的清洗、合并、重塑與轉換。Pandas中專門提供了用于數(shù)據(jù)預處理的很多函數(shù)與方法,用于替換異常數(shù)據(jù)、合并數(shù)據(jù)、重塑數(shù)據(jù)。查看全文>>
斐波那契數(shù)列(Fibonacci sequence),又稱黃金分割數(shù)列、因數(shù)學家萊昂納多·斐波那契(Leonardoda Fibonacci)以兔子繁殖為例子而引入,故又稱為“兔子數(shù)列”。查看全文>>
MySQL屬于關系型數(shù)據(jù)庫,Mongodb屬于非關系型數(shù)據(jù)庫,兩者有不同的特點,為什么選擇Mongodb而非MySQL存儲爬蟲數(shù)據(jù)呢?本節(jié)課就對這一問題做詳細解答。查看全文>>
Python中的模塊可分為三類,分別是內(nèi)置模塊、第三方模塊和自定義模塊,相關介紹如下。查看全文>>
Python程序中最常見的錯誤為語法錯誤。語法錯誤又稱為解析錯誤,它是指開發(fā)人員編寫了不符合Python語法格式的代碼所引起的錯誤。含有語法錯誤的程序會拋出異常,無法運行。如下所示為一段包含語法問題的代碼:查看全文>>
程序被執(zhí)行后成為了一個活動的實體,這個實體就是進程。換言之,操作系統(tǒng)調度并執(zhí)行程序,這個“執(zhí)行中的程序”稱為進程。進程是操作系統(tǒng)進行資源分配和調度的基本單位。一般情況下,進程占據(jù)的內(nèi)存空間由控制塊、程序段和數(shù)據(jù)段三個部分組成,各部分的介紹如下。查看全文>>