首頁(yè)技術(shù)文章正文

Python大數(shù)據(jù)培訓(xùn):通過(guò)read_csv()函數(shù)讀取CSV文件的數(shù)據(jù)

更新時(shí)間:2022-11-02 來(lái)源:黑馬程序員 瀏覽量:

IT培訓(xùn)班

  read_csv()函數(shù)的作用是將CSV文件的數(shù)據(jù)讀取出來(lái),并轉(zhuǎn)換成DataFrame對(duì)象。read_csv()函數(shù)的語(yǔ)法格式如下。

read_csv(filepath_or_buffer,sep=',', delimiter=None,
         header='infer', names=None, index_col=None, usecols=None,
         squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)

  上述函數(shù)中常用參數(shù)表示的含義如下:

  (1)file_or_buffer:表示文件路徑,可以為URL字符串。

  (2)sep:指定使用的分隔符,如果不指定默認(rèn)用“,”分隔。

  (3)header:指定行數(shù)用來(lái)作為列名,如果讀取的文件中沒(méi)有列名,則默認(rèn)為0,否則設(shè)置為None。

  (4)names:用于結(jié)果的列名列表。如果文件不包含標(biāo)題行,則應(yīng)該將該參數(shù)設(shè)置為None。

  (5)index_col:用作行索引的列編號(hào)或者列名,如果給定一個(gè)序列,則表示有多個(gè)行索引。

  需要注意的是,在讀取文件時(shí),如果傳入的是文件的路徑,而不是文件名,則會(huì)出現(xiàn)報(bào)錯(cuò),具體的解決方法是先切換到該文件的目錄下,使用os模塊獲取該文件的文件名。

  接下來(lái),使用read_csv()函數(shù)將存儲(chǔ)在E盤目錄下“itcast.csv”文件的內(nèi)容讀取出來(lái),示例代碼如下。

In [81]: import pandas as pd
         file = open(r'E:\數(shù)據(jù)分析\itcast.csv')
         # 讀取指定目錄下的csv格式的文件
         file_data=pd.read_csv(file)
         file_data
Out[81]:
            one_name  two_name
    0             1          4
    1             2          5
    2             3          6

  Text格式的文件也是比較常見的存儲(chǔ)數(shù)據(jù)的方式,擴(kuò)展名為“.txt”,它與上面提到的CSV文件都屬于文本文件。如果希望讀取Text文件,既可以用前面提到的read_csv()函數(shù),也可以使用read_table()函數(shù)。

分享到:
在線咨詢 我要報(bào)名
和我們?cè)诰€交談!