- A+
Pandas?是一個(gè)?Python?數(shù)據(jù)分析庫(kù),可以用來(lái)讀取?Excel?文件,Pandas提供了多種讀取Excel文件的方法,本文將給大家分享一些官方推薦的6種方法,代碼示例講解得非常詳細(xì),需要的朋友可以參考下
Pandas提供了多種讀取Excel文件的方法,以下是官方推薦的6種方法:
1. 使用pd.read_excel()函數(shù)
這是最常用的方法,可以讀取Excel文件,并將其轉(zhuǎn)換為Pandas數(shù)據(jù)框。可以指定工作表名和列名的行號(hào)。
1
|
df = pd.read_excel( 'data.xlsx' , sheet_name = 'Sheet1' , header = 0 ) |
'data.xlsx'
是要讀取的Excel文件的文件路徑。sheet_name='Sheet1'
表示要讀取的工作表名為’Sheet1’。如果省略該參數(shù),默認(rèn)讀取第一個(gè)工作表。header=0
表示將文件中的第0行作為列名。如果省略該參數(shù),默認(rèn)將文件中的一行作為列名。
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df
。可以使用df.head()
函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
2. 使用pd.ExcelFile()和parse()函數(shù)
先使用pd.ExcelFile()
函數(shù)創(chuàng)建一個(gè)Excel文件對(duì)象,然后使用parse()
函數(shù)讀取指定的工作表。
1
2
|
xlsx = pd.ExcelFile( 'data.xlsx' ) df = xlsx.parse( 'Sheet1' , header = 0 ) |
- pd.ExcelFile('data.xlsx')創(chuàng)建了一個(gè)Excel文件對(duì)象xlsx,它代表了整個(gè)Excel文件。
- parse('Sheet1', header=0)函數(shù)用于從Excel文件對(duì)象xlsx中讀取指定的工作表。'Sheet1'表示要讀取的工作表名為’Sheet1’,header=0表示將文件中的第0行作為列名。
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df
。可以使用df.head()
函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
3. 使用pd.read_table()函數(shù)
可以讀取Excel中的數(shù)據(jù)表,并指定分隔符(如制表符或逗號(hào))。
1
|
df = pd.read_table( 'data.xlsx' , sheet_name = 'Sheet1' , delimiter = '\t' , header = 0 ) |
'data.xlsx'
是Excel文件的路徑。sheet_name='Sheet1'
表示要讀取的工作表名為’Sheet1’。delimiter='\t'
指定數(shù)據(jù)表中的分隔符為制表符(‘\t’)。header=0
表示將文件中的第0行作為列名。
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df
。可以使用df.head()
函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
4. 使用pd.read_csv()函數(shù)
可以讀取以逗號(hào)分隔的Excel文件,可以指定分隔符、工作表名和列名的行號(hào)。
1
|
df = pd.read_csv( 'data.csv' , sheet_name = 'Sheet1' , delimiter = ',' , header = 0 ) |
'data.xlsx'
是Excel文件的路徑。sheet_name='Sheet1'
表示要讀取的工作表名為’Sheet1’。
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df。可以使用df.head()函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
5. 使用pd.read_html()函數(shù)
可以讀取Excel文件中的HTML表格,并將其轉(zhuǎn)換為Pandas數(shù)據(jù)框。
1
2
|
tables = pd.read_html( 'data.xlsx' , sheet_name = 'Sheet1' ) df = tables[ 0 ] |
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df
。可以使用df.head()
函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
6. 使用pd.DataFrame.from_records()函數(shù)
可以讀取Excel文件中的記錄,并將其轉(zhuǎn)換為Pandas數(shù)據(jù)框。
1
2
|
data = pd.ExcelFile( 'data.xlsx' ).parse( 'Sheet1' ).to_records() df = pd.DataFrame.from_records(data) |
'data.xlsx'
是Excel文件的路徑。sheet_name='Sheet1'
表示要讀取的工作表名為’Sheet1’。
讀取完Excel文件后,將其轉(zhuǎn)換為Pandas數(shù)據(jù)框,并將結(jié)果賦值給變量df
。
可以使用df.head()
函數(shù)查看前幾行數(shù)據(jù),或使用其他Pandas函數(shù)和方法進(jìn)行數(shù)據(jù)處理和分析。
以上是官方推薦的6種讀取Excel文件的方法。根據(jù)具體的需求和Excel文件的格式,選擇適合的方法來(lái)讀取數(shù)據(jù)。
Pandas提供了讀取Excel文件的方法,可以使用read_excel()
函數(shù)來(lái)實(shí)現(xiàn)。以下是讀取Excel文件的方法:
首先,需要確保已經(jīng)安裝了Pandas庫(kù)。可以使用以下命令進(jìn)行安裝:
1
|
pip install pandas |
接下來(lái),導(dǎo)入Pandas庫(kù):
1
|
import pandas as pd |
使用read_excel()
函數(shù)來(lái)讀取Excel文件。該函數(shù)的基本語(yǔ)法如下:
1
|
df = pd.read_excel( '文件路徑' , sheet_name = '工作表名' , header = 行號(hào)) |
- '文件路徑':Excel文件的路徑,可以是相對(duì)路徑或絕對(duì)路徑。
- '工作表名':要讀取的工作表的名稱。如果未指定,默認(rèn)讀取第一個(gè)工作表。
- header:指定要用作列名的行號(hào)。通常,第一行是列名,所以使用0作為行號(hào)。如果Excel文件沒(méi)有行號(hào)作為列名,則可以設(shè)置為None。
以下是一個(gè)完整的示例:
1
2
3
4
5
6
7
|
import pandas as pd # 讀取Excel文件 df = pd.read_excel( 'data.xlsx' , sheet_name = 'Sheet1' , header = 0 ) # 打印數(shù)據(jù)框前幾行 print (df.head()) |
以上代碼將會(huì)讀取名為"data.xlsx"的Excel文件中的"Sheet1"工作表,并將數(shù)據(jù)存儲(chǔ)在名為"df"的數(shù)據(jù)框中。然后,通過(guò)head()
函數(shù)打印數(shù)據(jù)框的前幾行。
通過(guò)上述方法,您可以輕松地使用Pandas讀取Excel文件并進(jìn)行數(shù)據(jù)分析和處理。
以上就是Pandas讀取Excel的六種方法的詳細(xì)內(nèi)容