Pandas中的DataFrame怎么使用

其他教程   发布日期:2025年03月06日   浏览次数:135

这篇文章主要介绍“Pandas中的DataFrame怎么使用”,在日常操作中,相信很多人在Pandas中的DataFrame怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pandas中的DataFrame怎么使用”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

Pandas是Python中最流行的数据分析和处理工具之一,它提供了一个名为DataFrame的数据结构,可以被认为是一个二维表格或电子表格,其中包含行和列。在本文中,我们将深入探讨Pandas中DataFrame的各种常用的用法,包括创建DataFrame、选择数据、修改数据、数据排序、数据统计、数据合并、数据分组和数据透视表等。

1.创建DataFrame

要创建DataFrame,可以使用Pandas中的DataFrame()函数。下面是一个例子:

  1. import pandas as pd
  2. data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
  3. 'age': [25, 32, 18, 47],
  4. 'gender': ['F', 'M', 'M', 'M']}
  5. df = pd.DataFrame(data)
  6. print(df)

输出:

name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M

2.选择数据

在DataFrame中选择数据有几种方法。可以使用loc[]和iloc[]函数,也可以使用布尔索引。下面是一些例子:

  1. # 使用loc[]函数选择数据
  2. print(df.loc[0]) # 选择第一行
  3. print(df.loc[0:2]) # 选择前三行
  4. print(df.loc[0:2, 'name'])# 选择前三行的name
  5. # 使用iloc[]函数选择数据
  6. print(df.iloc[0]) # 选择第一行
  7. print(df.iloc[0:2]) # 选择前两行
  8. print(df.iloc[0:2, 0]) # 选择前两行的第一列
  9. # 使用布尔索引选择数据
  10. print(df[df['age'] > 30]) # 选择年龄大于30的行

3.修改数据

要修改DataFrame中的数据,可以使用loc[]或iloc[]函数。下面是一个例子:

  1. # 修改数据
  2. df.loc[0, 'age'] = 26
  3. print(df)
  4. # 添加新数据
  5. df.loc[4] = ['Eve', 29, 'F']
  6. print(df)
  7. # 删除数据
  8. df = df.drop(4)
  9. print(df)

4.数据排序

要对DataFrame中的数据进行排序,可以使用sort_values()函数。下面是一个例子:

  1. # 按年龄升序排序
  2. df = df.sort_values('age')
  3. print(df)
  4. # 按年龄降序排序
  5. df = df.sort_values('age', ascending=False)
  6. print(df)

5.数据统计

要对DataFrame中的数据进行统计,可以使用describe()函数和其他函数,例如mean()、median()和std()。下面是一个例子:

  1. # 描述数据
  2. print(df.describe())
  3. # 计算平均年龄
  4. print(df['age'].mean())
  5. # 计算年龄中位数
  6. print(df['age'].median())
  7. # 计算年龄标准差
  8. print(df['age'].std())

6.数据合并

要合并两个DataFrame,可以使用concat()函数。下面是一个例子:

  1. # 创建第二个DataFrame
  2. data2 = {'name': ['Frank', 'Grace'],
  3. 'age': [39, 28],
  4. 'gender': ['M', 'F']}
  5. df2 = pd.DataFrame(data2)
  6. # 合并两个DataFrame
  7. df = pd.concat([df, df2])
  8. print(df)

7.数据分组

要按某些标准对DataFrame中的数据进行分组,可以使用groupby()函数。下面是一个例子:

  1. # 按性别分组并计算平均年龄
  2. print(df.groupby('gender')['age'].mean())

8.数据透视表

要创建数据透视表,可以使用pivot_table()函数。下面是一个例子:

  1. # 创建数据透视表
  2. print(pd.pivot_table(df, values='age', index='gender', columns='name'))

以上就是Pandas中的DataFrame怎么使用的详细内容,更多关于Pandas中的DataFrame怎么使用的资料请关注九品源码其它相关文章!