【数据可视化】第四章—— 基于pandas的数据可视化(pandas基本操作)
创始人
2024-03-13 22:50:52
0

图形绘制的代码:链接:https://pan.baidu.com/s/1pgS60sry6XDILIhth8bAvA?pwd=abcd
提取码:abcd

文章目录

  • 1. Pandas库的数据运算
    • 1.1 方法形式的运算
    • 1.2 比较运算法则
    • 1.3 排序
  • 2. 基本统计分析函数
    • 2.1 基本统计分析函数
    • 2.2 累计统计分析函数
    • 2.3 相关分析函数
  • 3. Pandas可视化
    • 3.1 绘制折线图
    • 3.2 绘制柱状图
    • 2.3 绘制直方图
    • 2.4 绘制散点图
    • 2.5 绘制饼图
    • 2.6 面积图
    • 2.7 盒须图


1. Pandas库的数据运算

  • 算数运算根据行列索引,补齐后运算,运算默认产生浮点数
  • 补齐时缺项填充NaN(空值)
  • 二维和一维、一维和零维间为广播运算
  • 采用+_*/符号 进行的二元运算产生新的对象

在这里插入图片描述

1.1 方法形式的运算

在这里插入图片描述
在这里插入图片描述

1.2 比较运算法则

  • 比较运算只能比较相同索引的元素,不进行补齐
  • 二维和一维、一维和零维间为广播运算
  • 采用> < >= <= == !=等符号进行的二元运算产生新布尔对象

在这里插入图片描述
在这里插入图片描述

1.3 排序

sort_index()方法在指定轴上根据索引进行排序,默认升序
在这里插入图片描述
在这里插入图片描述

sort_values()方法在指定轴上根据数值进行排序,默认升序

  • Series.sort_values(axis = 0, ascending = True)

  • DataFrame.sort_values(by, axis = 0, ascending = True)
    by: axis轴上的某个索引或索引列表
    在这里插入图片描述

NaN统一放到排序末尾
在这里插入图片描述

2. 基本统计分析函数

2.1 基本统计分析函数

适用于Series和DataFrame类型
在这里插入图片描述
在这里插入图片描述

适用于Series类型
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2.2 累计统计分析函数

适用于Series和DataFrame类型
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

适用于Series和DataFrame类型,滚动计算(窗口计算)
在这里插入图片描述
在这里插入图片描述

2.3 相关分析函数

两个事物,表示为X和Y,如何判断它们之间的存在相关性?

X增大,Y增大,两个变量正相关
X增大,Y减小,两个变量负相关
X增大,Y不变,两个变量不相关

在这里插入图片描述
协方差>0,X和Y正相关
协方差<0,X和Y负相关
协方差=0,X和Y独立无关

Pearson相关系数
在这里插入图片描述
r的取值范围 [-1,1]

0.8-1.0极强相关
0.6-0.8强相关
0.4-0.6中等强度相关
0.2-0.4弱相关
0.0-0.2极弱相关或不相关

在这里插入图片描述
在这里插入图片描述

3. Pandas可视化

常见的图表类型
在这里插入图片描述
Series的plot方法参数
在这里插入图片描述
DataFrame的plot方法参数
在这里插入图片描述

3.1 绘制折线图

【例】在pandas中使用Series绘制线性图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
s = pd.Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10))
s.plot()
plt.show()

【例】在pandas中使用DataFrame绘制线性图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.randn(10, 4).cumsum(0),columns=['A', 'B', 'C', 'D'],index=np.arange(0, 100, 10))
df.plot()
plt.show()

在这里插入图片描述
在这里插入图片描述

3.2 绘制柱状图

plot.bar()

【例】在pandas中使用Series绘制柱状图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.bar(color='r', alpha=0.7) # 垂直柱状图
plt.show()

【例】在pandas中使用Series中绘制条形图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.barh(color=‘r’, alpha=0.7) # 条形图
plt.show()

【例】在pandas中使用DataFrame绘制柱状图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(4, 4),index=['one', 'two', 'three', 'four'],columns=pd.Index(['A', 'B', 'C', 'D'], name='bar'))
df.plot.bar()
plt.show()

2.3 绘制直方图

plot.hist()

【例】在pandas中绘制直方图,代码如下。

from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy.random import randn
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),}, columns=['a', 'b'])
df.plot.hist(bins=20)
plt.show()

2.4 绘制散点图

plot.scatter()
【例】在pandas中绘制散点图,代码如下。
在这里插入图片描述

2.5 绘制饼图

plot.pie()

【例】在pandas中绘制饼图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.Series(3*np.random.rand(4),index = list('ABCD'))
df.plot.pie(subplots = True)
plt.show()

在这里插入图片描述
在这里插入图片描述

2.6 面积图

plot.area()
【例】在pandas中绘制面积图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.area()
plt.show()

2.7 盒须图

plot.box()

【例】在pandas中绘制盒须图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.box()
plt.show()

相关内容

热门资讯

汽车油箱结构是什么(汽车油箱结... 本篇文章极速百科给大家谈谈汽车油箱结构是什么,以及汽车油箱结构原理图解对应的知识点,希望对各位有所帮...
美国2年期国债收益率上涨15个... 原标题:美国2年期国债收益率上涨15个基点 美国2年期国债收益率上涨15个基...
嵌入式 ADC使用手册完整版 ... 嵌入式 ADC使用手册完整版 (188977万字)💜&#...
重大消息战皇大厅开挂是真的吗... 您好:战皇大厅这款游戏可以开挂,确实是有挂的,需要了解加客服微信【8435338】很多玩家在这款游戏...
盘点十款牵手跑胡子为什么一直... 您好:牵手跑胡子这款游戏可以开挂,确实是有挂的,需要了解加客服微信【8435338】很多玩家在这款游...
senator香烟多少一盒(s... 今天给各位分享senator香烟多少一盒的知识,其中也会对sevebstars香烟进行解释,如果能碰...
终于懂了新荣耀斗牛真的有挂吗... 您好:新荣耀斗牛这款游戏可以开挂,确实是有挂的,需要了解加客服微信8435338】很多玩家在这款游戏...
盘点十款明星麻将到底有没有挂... 您好:明星麻将这款游戏可以开挂,确实是有挂的,需要了解加客服微信【5848499】很多玩家在这款游戏...
总结文章“新道游棋牌有透视挂吗... 您好:新道游棋牌这款游戏可以开挂,确实是有挂的,需要了解加客服微信【7682267】很多玩家在这款游...
终于懂了手机麻将到底有没有挂... 您好:手机麻将这款游戏可以开挂,确实是有挂的,需要了解加客服微信【8435338】很多玩家在这款游戏...