使用pandas的DataFrame的plot方法绘制图像的实例

使用了pandas的Series方法绘制图像体验之后感觉直接用matplotlib的功能好用了不少,又试用了DataFrame的方法之后发现这个更加人性化。

本章节以及后续章节的源码,当然也可以从我的github下载,在源码中我自己加了一些中文注释。

写代码如下:

这两天没更新,好好反思了一下自己的人生观、价值观和世界观,松懈了两天,也等于给自己打了两针强心剂。与过往做个了断,剩余的时间,去实现自己心中想过但一直搁置的事。

from pandas import Series,DataFrame
from numpy.random import randn
import numpy as np
import matplotlib.pyplot as plt
df = DataFrame(randn(10,5),columns=['A','B','C','D','E'],index = np.arange(0,100,10))
df.plot()
plt.show()

进入正题,主要写数据的可视化库(matplotlib)

程序运行结果如下:

图片 1

图片 2

matplotlib的图像都位于Figure对象中.。

使用DataFrame的plot方法绘制图像会按照数据的每一列绘制一条曲线,参数中的columns就是列的名称而index本来是DataFrame的行名称。图形绘制成功之后还会按照列的名称绘制图例,这个功能确实是比较赞的。如果使用matplotlib的基本绘制功能,图例的添加还需要自己额外处理。看来,数据的规整化不仅仅是为了向量化以及计算加速做准备,而且为数据的可视化提供了不少便捷的方法。

图片 3

以上这篇使用pandas的DataFrame的plot方法绘制图像的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

对于复杂的图形必须将所有的绘图命令存在一个cell里。例如:

您可能感兴趣的文章:

图片 4

“k–“是一个线型选项,用于告诉matplotlib绘制黑色虚线图。那些由fig.add_subplot所返回的对象是AxesSubplot对象,直接调用它们的实例方法就可以在其它空着的格子里面画图了.

图片 5

创建包含subplot网格的figure是一个非常常见的任务。

plt.subplots方法可以创建一个新的Figure,并返回一个含有已创建的subplot对象的NumPy数组。

图片 6

这是非常实用的,因为可以轻松地对axes数组进行索引,就好像是一个二维数组一样,例如axes[0,1]。你还可以通过sharex和sharey指定subplot应该具有相同的X轴或Y轴。在比较相同范围的数据时,这也是非常实用的,否则,matplotlib会自动缩放各图表的界限。

pyplot.subplots的参数:

图片 7

matplotlib会在subplot外围留下一定的边距,并在subplot之间留下一定的间距。利用Figure的subplots_adjust方法可以轻而易举地修改间距。

图片 8

wspace和hspace用于控制宽度和高度的百分比,可以用作subplot之间的间距。

图片 9各subplot之间没有间距

matplotlib的plot函数接受一组X和Y坐标,还可以接受一个表示颜色和线型的字符串缩写。

图片 10

常用的颜色可以使用颜色缩写,你也可以指定颜色码(例如,’#CECECE’)。你可以通过查看plot的文档字符串查看所有线型的合集。

线图可以使用标记强调数据点。标记也可以放到格式字符串中,但标记类型和线型必须放在颜色后面。

图片 11

在线型图中,非实际数据点默认是按线性方式插值的。可以通过drawstyle选项修改。

图片 12不同drawstyle选项的线型图

因为我们传递了label参数到plot,我们可以创建一个plot图例,指明每条使用plt.legend的线。

对于大多数的图表装饰项,其主要实现方式有二:使用过程型的pyplot接口(例如,matplotlib.pyplot)以及更为面向对象的原生matplotlib
API。

pyplot接口的设计目的就是交互式使用,含有诸如xlim、xticks和xticklabels之类的方法。它们分别控制图表的范围、刻度位置、刻度标签等。其使用方式有以下两种:

调用时不带参数,则返回当前的参数值(例如,plt.xlim()返回当前的X轴绘图范围)。

调用时带参数,则设置参数值(例如,plt.xlim会将X轴的范围设置为0到10)。

所有这些方法都是对当前或最近创建的AxesSubplot起作用的。它们各自对应subplot对象上的两个方法,以xlim为例,就是ax.get_xlim和ax.set_xlim。使用subplot的实例方法在处理多个subplot时更清楚一些。

要改变x轴刻度,最简单的办法是使用set_xticks和set_xticklabels。前者告诉matplotlib要将刻度放在数据范围中的哪些位置,默认情况下,这些位置也就是刻度标签。但我们可以通过set_xticklabels将任何其他的值用作标签:

图片 13

等价:

图片 14

在添加subplot的时候传入label参数,在此之后,可以调用ax.legend()或plt.legend()来自动创建图例。

图片 15

legend方法有几个其它的loc位置参数选项,loc告诉matplotlib要将图例放在哪。”best”是不错的选择,因为它会选择最不碍事的位置。要从图例中去除一个或多个元素,不传入label或传入label=’_nolegend_‘即可。

除标准的绘图类型,你可能还希望绘制一些子集的注解,可能是文本、箭头或其他图形等。注解和文字可以通过text、arrow和annotate函数进行添加。text可以将文本绘制在图表的指定坐标,还可以加上一些自定义格式:

图片 16

注解中可以既含有文本也含有箭头。我们根据最近的标准普尔500指数价格(来自Yahoo!Finance)绘制一张曲线图,并标出2008年到2009年金融危机期间的一些重要日期:

图片 17图片 18
2008-2009年金融危机期间的重要日期图片 19

matplotlib有一些表示常见图形的对象。这些对象被称为块。要在图表中添加一个图形,你需要创建一个块对象shp,然后通过ax.add_patch将其添加到subplot中。

图片 20

利用plt.savefig可以将当前图表保存到文件。该方法相当于Figure对象的实例方法savefig。

图片 21Figure.savefig的选项
图片 22

文件类型是通过文件扩展名推断出来的。因此,如果你使用的是.pdf,就会得到一个PDF文件。发布图片时最常用到两个重要的选项是dpi(控制“每英寸点数”分辨率)和bbox_inches(可以剪除当前图表周围的空白部分)

图片 23

savefig并非一定要写入磁盘,也可以写入任何文件型的对象,比如BytesIO:

图片 24

matplotlib自带一些配色方案,以及为生成出版质量的图片而设定的默认配置信息。幸运的是,几乎所有默认行为都能通过一组全局参数进行自定义,它们可以管理图像大小、subplot边距、配色方案、字体大小、网格类型等。一种Python编程方式配置系统的方法是使用rc方法。

rc的第一个参数是希望自定义的对象,如’figure’、’axes’、’xtick’、’ytick’、’grid’、’legend’等。其后可以跟上一系列的关键字参数。一个简单的办法是将这些选项写成一个字典:

图片 25

matplotlib的配置文件matplotlibrc(位于matplotlib/mpl-data目录中)。如果对该文件进行了自定义,并将其放在你自己的.matplotlibrc目录中,则每次使用matplotlib时就会加载该文件。

matplotlib实际上是一种比较低级的工具。要绘制一张图表,你组装一些基本组件就行:数据展示(即图表类型:线型图、柱状图、盒形图、散布图、等值线图等)、图例、标题、刻度标签以及其他注解型信息。

在pandas中,我们有多列数据,还有行和列标签。pandas自身就有内置的方法,用于简化从DataFrame和Series绘制图形。Seaborn简化了许多常见可视类型的创建。

Series和DataFrame都有一个用于生成各类图表的plot方法。默认情况下,它们所生成的是线型图:

图片 26

该Series对象的索引会被传给matplotlib,并用以绘制X轴。可以通过use_index=False禁用该功能。X轴的刻度和界限可以通过xticks和xlim选项进行调节,Y轴就用yticks和ylim。

相关文章