博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python数据分析:pandas常用函数
阅读量:5763 次
发布时间:2019-06-18

本文共 1089 字,大约阅读时间需要 3 分钟。

pandas是python中的 一个数据处理库,同样在使用的时候我们要先输入import pandas as pd引入。

1.df = pd.read_csv("文件路径"):这是读取csv文件的方法,如果要读取excel或其他文档,都有相应的read函数。

在这里插入图片描述

2.df.dtypes:如果在文件中有字符型数据返回的是object。

在这里插入图片描述

3.df.head(n):将前n行数据显示出来,如果不传入参数则显示前5行数据。

在这里插入图片描述

4.df.tail(n):将后n行数据显示出来,如果不传入参数则显示后5行数据。

在这里插入图片描述

5.df.columns:以列表的形式显示数据表的列名。

6.df.shape:以元组的形式显示表中数据的行数和列数。

7.df.loc[n]:返回索引值为n的行。

8.df.loc[m][n]:返回索引值为m行n列的数据。

在这里插入图片描述

9.df.loc[m:n]:返回索引值为m到n的行。

10.df.loc[[m,n,k]]:返回索引值分别为m,n,k的行。

在这里插入图片描述

11.df["str"]:返回列名为str的这一列。

在这里插入图片描述

12.df.columns.tolist():将列名做成列表。

在这里插入图片描述

13.df["str"]*df["str"]:两列维度相同,则两列的对应位置相乘。

在这里插入图片描述

14.df.sort_values("str",inplace=True,ascending=False):将str一列按照降序排列,且得到的数据替换原数据。inplace表示是否用排序后的数据替代原数据,默认为False,也就是不替换。ascending表示排序的顺序,默认为True,也就是按照升序排列。

在这里插入图片描述

15.judge = pd.isnull(df["str"]):返回bool型值,str这一列的数据是空值返回True,不是空值返回False。

在这里插入图片描述

16.a["judge"]:返回judge为True,也就是缺失的数据,这时再调用len()函数即可求得缺失数据的个数。

在这里插入图片描述

在这里插入图片描述

17.df.pivot_table(index="a",values="b",aggfunc=np.mean):这是一个很重要的函数,将b求平均值,按照a的类别进行分类,第三个参数默认为求平均值。

在这里插入图片描述

18.df.loc[n,"str"]:定位到第n行,列名为str处的数据。

19.sort_res.reset_index(drop=True):将排序后的数据的编号也重新排列,drop指是否丢弃原数据。运行后的结果与14的图对比可以发现,编号已经重新排列了。

在这里插入图片描述

20.df.apply():这是在pandas中的自定义函数的使用方法,括号中传入函数名。

在这里插入图片描述

转载地址:http://zswux.baihongyu.com/

你可能感兴趣的文章
15分钟构建超低成本数据大屏:DataV + DLA
查看>>
jSearch(聚搜) 1.0.0 终于来了
查看>>
盘点2018云计算市场,变化大于需求?
查看>>
极光推送(一)集成
查看>>
MySQL 8.0 压缩包版安装方法
查看>>
@Transient注解输出空间位置属性
查看>>
Ansible-playbook 条件判断when、pause(学习笔记二十三)
查看>>
5种你未必知道的JavaScript和CSS交互的方法(转发)
查看>>
线程进程间通信机制
查看>>
galera mysql 多主复制启动顺序及命令
查看>>
JS prototype 属性
查看>>
中位数性质——数列各个数到中位数的距离和最小
查看>>
WebApp之Meta标签
查看>>
添加Java文档注释
查看>>
Python3批量爬取网页图片
查看>>
iphone-common-codes-ccteam源代码 CCEncoding.m
查看>>
微信公众平台开发(96) 多个功能整合
查看>>
[转]MVC4项目中验证用户登录一个特性就搞定
查看>>
用Perl编写Apache模块续二 - SVN动态鉴权实现SVNAuth 禅道版
查看>>
Android 阴影,圆形的Button
查看>>