更新時(shí)間:2022-11-02 來(lái)源:黑馬程序員 瀏覽量:
read_csv()函數(shù)的作用是將CSV文件的數(shù)據(jù)讀取出來(lái),并轉(zhuǎn)換成DataFrame對(duì)象。read_csv()函數(shù)的語(yǔ)法格式如下。
read_csv(filepath_or_buffer,sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)
上述函數(shù)中常用參數(shù)表示的含義如下:
(1)file_or_buffer:表示文件路徑,可以為URL字符串。
(2)sep:指定使用的分隔符,如果不指定默認(rèn)用“,”分隔。
(3)header:指定行數(shù)用來(lái)作為列名,如果讀取的文件中沒(méi)有列名,則默認(rèn)為0,否則設(shè)置為None。
(4)names:用于結(jié)果的列名列表。如果文件不包含標(biāo)題行,則應(yīng)該將該參數(shù)設(shè)置為None。
(5)index_col:用作行索引的列編號(hào)或者列名,如果給定一個(gè)序列,則表示有多個(gè)行索引。
需要注意的是,在讀取文件時(shí),如果傳入的是文件的路徑,而不是文件名,則會(huì)出現(xiàn)報(bào)錯(cuò),具體的解決方法是先切換到該文件的目錄下,使用os模塊獲取該文件的文件名。
接下來(lái),使用read_csv()函數(shù)將存儲(chǔ)在E盤目錄下“itcast.csv”文件的內(nèi)容讀取出來(lái),示例代碼如下。
In [81]: import pandas as pd file = open(r'E:\數(shù)據(jù)分析\itcast.csv') # 讀取指定目錄下的csv格式的文件 file_data=pd.read_csv(file) file_data Out[81]: one_name two_name 0 1 4 1 2 5 2 3 6
Text格式的文件也是比較常見的存儲(chǔ)數(shù)據(jù)的方式,擴(kuò)展名為“.txt”,它與上面提到的CSV文件都屬于文本文件。如果希望讀取Text文件,既可以用前面提到的read_csv()函數(shù),也可以使用read_table()函數(shù)。
什么是Linux系統(tǒng)內(nèi)核?什么是Linux發(fā)行版?
2022-11-01從安裝到實(shí)戰(zhàn) 2022年最全的Linux教程【黑馬程序員】
2022-11-01Python數(shù)據(jù)聚合與分組運(yùn)算:通過(guò)groupby()方法將數(shù)據(jù)拆分成組
2022-11-01Python培訓(xùn):通過(guò)to_numeric()函數(shù)轉(zhuǎn)換數(shù)據(jù)類型
2022-11-01Kafka有幾種消費(fèi)者分區(qū)分配策略?
2022-10-31MySQL中創(chuàng)建觸發(fā)器需要執(zhí)行哪些操作?
2022-10-31