爬取網頁其實就是通過URL獲取網頁信息,網頁信息的實質是一段添加了JavaScript和CSS的HTML代碼。Python提供了一個抓取網頁信息的第三方模塊requests,requests模塊自稱“HTTP for Humans”,直譯過來的意思是專門為人類而設計的HTTP模塊,該模塊支持發(fā)送請求,也支持獲取響應。查看全文>>
利用json模塊的dumps()函數和loads()函數可以實現Python對象和JSON數據之間的轉換,下面來分別演示兩種函數的用法查看全文>>
程序中與數據相關的操作分為數據的存儲與讀寫。下面將對如何存儲與讀寫不同維度的數據進行講解。1.數據存儲數據通常存儲在文件之中,為了方便后續(xù)的讀寫操作,數據通常需要按照約定的組織方式進行存儲。一維數據呈線性排列,一般用特殊字符分隔,具體示例如下。查看全文>>
Python變量并不是在哪個位置都可以訪問的,具體的訪問權限取決于變量定義的位置,其所處的有效范圍視為變量的作用域。根據作用域的不同,變量可以劃分為局部變量和全局變量。本節(jié)將針對局部變量和全局變量進行詳細地講解。查看全文>>
構建集合的這些對象稱為該集合的元素。例如,成年人集合的每一個元素都是已滿18周歲的人。通常用大寫字母如A、B、S……表示集合,用小寫字母如a、b、c……表示集合的元素。集合中的元素具有3個特征,具體如下。查看全文>>
目前,很多開源框架的繪圖功能都是基于matplotibl實現的,pandas便是其中之一。對于pandas的數據結構來說,直接使用其自身的繪圖功能要比matplotibl更加方便簡單。表9-16中列舉了有關pandas內置數據結構繪制圖形的常用方法。查看全文>>