图解Pandas教程

阅读量:     Authors: 阳哥

图解Pandas教程

大家好,我是阳哥。

有不少同学跟我提过,看看能不能出一系列Pandas数据处理的教程,之前一直也没来得及弄。

为了大家能够生动、形象的学习 Pandas,阳哥打算制作一系列 《图解Pandas》 的内容,跟大家以动态图片、视频等方式来讲解 Pandas 的基础知识,方便大家快速的掌握这些知识,相信《图解Pandas》会给大家带来一些不一样的视角。

《图解Pandas》的视频内容一般如下:

扫描下面的二维码,关注视频号,可以观看《图解Pandas》已发布的所有视频以及及时推送最新的视频:

《图解Pandas》 系列,是一个不小的工程,预计将会有超过100个视频,现在来说算是一个期货吧,搞不好就是烂尾工程啦,大家的支持就是我持续分享的动力,嘿嘿~~

01 已发布的内容

《图解Pandas》系列包括在微信视频号「Python数据之道」上发布的视频,以及在公众号「Python数据之道」上发布的图文(图文中配套源代码以及在PC端观看的视频)。

《图解Pandas》系列已发布的图文链接以及对应的视频编号,汇总如下:

图文链接 视频号对应编号
《图解Pandas》内容框架介绍 -
图文01-数据结构介绍 001
图文02-创建数据对象 002
图文03-读取和存储Excel文件 003-004
图文04-常见的数据访问 005
图文05-常见的数据运算 006-008
图文06-常见的数学计算 009-010
图文07-常见的数据统计 011-015
图文08-常见的数据筛选 016-028
图文09-常见的缺失值处理 029-034
图文10-数据合并操作 035-047

《图解Pandas》的内容框架如下:

上图中,有图文和视频编号的,是代表已经完成并发布的内容,如“图文06”、“视频026” 等。

02 部分内容介绍

数据结构介绍

DataFrame (中文翻译“数据框”)介绍:

图解数据框轴方向:

DataFrame 与 Series 之间的关联:

创建数据对象

通过列表创建数据框

读取Excel文件

从Excel读取数据时,有时需要跳过数据文件末尾部分数据行:

数据框行列转置

通过 df.T 可以实现数据框的行列转置:

索引位置以及索引值

如何获取 Series 中最小值或最大值对应的索引位置以及索引值。

通过 argmin() 函数来获取最小值对应的索引位置,如红色标注所示,结果为数字 1 ,如下:

通过 idxmin() 函数来获取最小值对应的索引值,如红色标注所示,结果为字母 e ,如下:

缺失值数据填充

可以通过字典的方式,对数据框每列填充不同的常数。

字典的 key 值对应数据框的列索引名称。

这里,对于缺失值,a列填充数字11,b列填充数字22,c列填充数字33,动态图演示如下:

缺失值删除

dropna 函数有一个参数 subset 可以设置,subset 参数表示的是其他轴方向对应的索引标签。

设置 axis=1,此时,subset 里的”a” 指的是行索引标签中的 a 行。这里的操作,表示的是将数据框a行中含有缺失值的数据列进行删除操作。因此,结果中删除了a列和b列。动态图演示如下:

03 专题汇总

考虑到《图解Pandas》系列内容在不断更新过程中,大家可以通过下面的专题来找到最新发布的内容。

同时考虑到,以后如果文章数量较多(比如超过50篇文章),可能在专题中也不好快速的找到所需要的内容,我会以文章汇总的形式,将《图解Pandas》系列的文章进行手动汇总,并形成 图解Pandas汇总 的专题,最新的汇总文章,可以点击下面专题,找到最新的文章即可。


学习 Pandas,最难的还在于坚持,希望《图解Pandas》能给大家带来一些乐趣,一起加油吧!