網(wǎng)站改域名如何做百度優(yōu)化網(wǎng)頁優(yōu)化seo廣州
Pandas是Python中用于數(shù)據(jù)分析的一個強大的庫,它提供了許多功能豐富的函數(shù)。本文介紹其中高頻使用的30個函數(shù)。
read_csv()
: 從CSV文件中讀取數(shù)據(jù)并創(chuàng)建DataFrame對象。
import pandas as pd
df = pd.read_csv('data.csv')
read_excel()
: 從Excel文件中讀取數(shù)據(jù)并創(chuàng)建DataFrame對象。
df = pd.read_excel('data.xlsx')
to_excel()
: 輸出數(shù)據(jù)并保存在新的excel文件中。
df.to_excel('data_output.xlsx')
head()
: 返回前n行數(shù)據(jù)(默認為5)。
print(df.head(5))
tail()
: 返回最后n行數(shù)據(jù)(默認為5)。
print(df.tail(5))
shape
: 返回DataFrame的形狀(行數(shù)和列數(shù))。
rows, cols = df.shape
print(f"Rows: {rows}, Columns: {cols}")
columns
: 返回DataFrame的列名列表。
column_names = df.columns
print(column_names)
index
: 返回DataFrame的索引列表。
index_list = df.index
print(index_list)
describe()
: 生成描述性統(tǒng)計信息,包括計數(shù)、平均值、標準差等。
statistics = df.describe()
print(statistics)
info()
: 返回DataFrame的信息摘要,包括索引、列、非空值數(shù)量和內(nèi)存信息。
print(df.info())
dtypes
: 返回每列的數(shù)據(jù)類型。
data_types = df.dtypes
print(data_types)
drop()
: 刪除指定行或列。
df = df.drop('column_name', axis=1)
sort_values()
: 根據(jù)指定列的值對DataFrame進行排序。
df_sorted = df.sort_values('column_name')
loc[]
: 通過標簽選擇數(shù)據(jù)。
df=pd.DataFrame({'Column1': [1,0,0,0,0,0,2,2], 'Column2': [1,1,0,0,0,0,2,2], 'Column3': [0,0,0,1,0,0,2,2], 'Column4': [1,0,0,1,0,0,2,2]})
df.loc[:,'Column2']
iloc[]
: 通過整數(shù)位置選擇數(shù)據(jù)。
cell_data = df.iloc[1, 2]
at[]
: 選擇單個元素。
element_value = df.at[1, 'Column4']
iat[]
: 選擇單個元素。
element_value = df.iat[1, 2]
isnull()
: 檢查缺失值。
missing_values = df.isnull()
notnull()
: 檢查非缺失值。
non_missing_values = df.notnull()
fillna()
: 填充缺失值。
df_filled = df.fillna(0)
replace()
: 替換值。
df_replaced = df.replace(old_value, new_value)
rename()
: 重命名列名。
df_renamed = df.rename(columns={'old_name': 'new_name'})
set_index()
: 設(shè)置索引列。
df_indexed = df.set_index('column_name')
reset_index()
: 重置索引。
df_reset = df.reset_index()
groupby()
: 根據(jù)指定列對數(shù)據(jù)進行分組。
grouped = df.groupby('column_name')
agg()
: 對分組后的數(shù)據(jù)應(yīng)用聚合函數(shù)。
aggregated = grouped.agg({'column_name': ['sum', 'mean']})
unique()
: 查找該列唯一值。
df=pd.DataFrame({'Column1': [1,0,0,0,0,0,2,2], 'Column2': [1,1,0,0,0,0,2,2], 'Column3': [0,0,0,1,0,0,2,2], 'Column4': [1,0,0,1,0,0,2,2]})
list(df['Column1'].unique())#唯一值是0,1,2
concat()
: 連接兩個或多個DataFrame。
df_concatenated = pd.concat([df1, df2])
merge()
: 合并兩個DataFrame,根據(jù)一個或多個鍵進行連接。
merged_df = pd.merge(df1, df2, on='key')
apply()
: 應(yīng)用函數(shù)至指定行或列。
df['new_column'] = df['column_name'].apply(lambda x: x * 2) # 對列應(yīng)用函數(shù)
以上這些函數(shù)覆蓋了從數(shù)據(jù)加載、預(yù)處理、轉(zhuǎn)換到分析的各個階段。Pandas的強大之處在于其函數(shù)的靈活性和易用性,使得數(shù)據(jù)分析工作變得簡單高效。
關(guān)于Python技術(shù)提升
由于文章篇幅有限,文檔資料內(nèi)容較多,需要這些文檔的朋友,可以加小助手微信免費獲取,【保證100%免費】,中國人不騙中國人。
**(掃碼立即免費領(lǐng)取)**
全套Python學(xué)習(xí)資料分享:
一、Python所有方向的學(xué)習(xí)路線
Python所有方向路線就是把Python常用的技術(shù)點做整理,形成各個領(lǐng)域的知識點匯總,它的用處就在于,你可以按照上面的知識點去找對應(yīng)的學(xué)習(xí)資源,保證自己學(xué)得較為全面。
二、學(xué)習(xí)軟件
工欲善其事必先利其器。學(xué)習(xí)Python常用的開發(fā)軟件都在這里了,還有環(huán)境配置的教程,給大家節(jié)省了很多時間。
三、全套PDF電子書
書籍的好處就在于權(quán)威和體系健全,剛開始學(xué)習(xí)的時候你可以只看視頻或者聽某個人講課,但等你學(xué)完之后,你覺得你掌握了,這時候建議還是得去看一下書籍,看權(quán)威技術(shù)書籍也是每個程序員必經(jīng)之路。
四、入門學(xué)習(xí)視頻全套
我們在看視頻學(xué)習(xí)的時候,不能光動眼動腦不動手,比較科學(xué)的學(xué)習(xí)方法是在理解之后運用它們,這時候練手項目就很適合了。
五、實戰(zhàn)案例
光學(xué)理論是沒用的,要學(xué)會跟著一起敲,要動手實操,才能將自己的所學(xué)運用到實際當中去,這時候可以搞點實戰(zhàn)案例來學(xué)習(xí)。
如有侵權(quán),請聯(lián)系刪除。