上一篇讲了箱线图基本组成,其中涉及到:
- 5大要数: 最大值,最小值,第一四分位数(Q1),第二四分位数(中位数Median),第三四分位数(Q3) , 平均数(Mean)
- 基于「N+1」, 「N-1」两种四分位数的算法
- 四分位距(IQR)以及上限值,下限值
- 最小观测值,,最大观测值以及异常值(Outliers)
继续阅读之前,我还得强调一下,
最大观测值是除异常值外的最大值,最小观测值是除异常值外的最小值!
今天介绍使用EXCEL画箱线图的其中一种方法---K线图
一. 先介绍下K线图
成人的世界总是绕不开股票,哪怕你压根不玩股票,周边肯定也有很多"韭菜",天天聊大盘,聊K线!好,先认识下K线。
一般K线图
由上图可知,K线图由最高价、开盘价、收盘价、最低价构成,最重要的是外形很像箱线图!
股票么,有涨有跌,而K线图中分别有不同的表示。
涨了!收盘价高于开盘价!
欢欣鼓舞迎大牛
跌了!收盘价低于开盘价!
陷熊市捶胸顿足
看到了吧,红色就是红红火火,冒绿光的就是蔫了吧唧,萎靡不振
参照箱线图,小结一下:
- 箱线图的最大观测值可用K线的最高价代替
- 箱线图的最小观测值可用K线的最低价代替
- 箱线图的第三分位数(Q3)可用开盘价或收盘价代替
- 箱线图的第三分位数(Q1)可用开盘价或收盘价代替
- 原始的K线图无法表示中位数(median),平均数(mean)以及异常值(outliers)
二. 实例操作
1.原始数据/样本数据
图1是某高校10名学生各参加8个科目的期末考试成绩单,据此制作箱线图
图1 学生期末成绩表
2. 数据统计
因为四分位数的算法有「N+1」, 「N-1」两种,如下计算均基于「N-1」;
EXCEL 的函数 "QUARTILE.INC" 以及 "QUARTILE" 都是基于「N-1」;
"QUARTILE.EXC"基于「N+1」
图2 学生成绩统计
算出上限值和下限值,当然异常值也就确定了,图1 标红的数据则是异常值
如图2,这些过程统计值是必须的,举例说明:
<1. Q1[25%]; B27 = QUARTILE(B14:B23,1)
这里"B14:B23"数据区代表10名学生的英语成绩列表, 参数"1"代表第一四分位数
<2. 中位数[Median]; B28 = QUARTILE(B14:B23,2)
参数"2"代表第二四分位数也就是中位数,当然是用函数Median() 效果等效
<3. Q1[75%]; B29 = QUARTILE(B14:B23,3)
参数"3"代表第三四分位数,此外四分位距[IQR] = Q3-Q1
<4. 最大观测值; B34 = MAX(IF(B14:B23<B32,B14:B23))
IF(B14:B23<B32,B14:B23),其中
B32为计算出的英语成绩上限值为108.75,超过这个数则为异常值。这个条件判断语句将返回一个数组,数组中由学生英语成绩中小于108.75的元素组成,操作时注意使用Ctrl + Shift + Enter
因此,表达式MAX(IF(B14:B23<B32,B14:B23))意为找到异常值外的最大值,即最大观测值!
<5. 最小观测值; B35 =MIN(IF(B14:B23>B33,B14:B23))
小于下限值为异常值,异常值外的最小值为最小观察值
3. 数据整理
我们将要先画K线图,确切的说是EXCEL K线图中的 "开盘-最高价-最低价-收盘”类型,当然要想完成这个类型的K线图,数据必须按照这个顺序进行整理。
据此我们将步骤2中的数据整理为图3。
图3 整理后的统计数据
我们前面讲到玩股票的两大状态,要么涨了,要么跌,所以开收盘价不存在绝对高低之分,所以再整理数据的时候,除了按照Q3-最大观测值-最小观测值-Q1之外,当然也可以按照Q1-最大观测值-最小观测值-Q3排序。
绘制如上类型的K线图,只需要4组数据,所以中位数,平均数需要额外假如到图表中。
4. 利用K线图绘制箱线图的基本框架
选择数据 A37:I41>插入所有图表>股价图>“开盘-最高价-最低价-收盘”>确认
得到图表如图4所示
图4 K线图基本框架
5. 图表美化
- 修改标题,删除图例
- 删除Y周主轴线,调整X,Y字体
- 将最大、最小观测值添加标记"-"
- 添加数据标签,移动到合适位置修改标签字体颜色
如图5
图5 格式化K线图
6. 图表中添加中位数,平均数
选中数据源>添加数据系列“平均数”以及“中位数”,并移动到最大观测值和最小观测值之间,图图6
图6 添加&amp;quot;中位数&amp;quot;,&amp;quot;平均数&amp;quot;数据系列
7. 修改数据系列中位数和平均数的标记特性
平均数一般以"x"标识,而中位数则以"—”标识,如图7
图7 添加标记
8. 中位数和平均数添加数据标签,最终我们得到箱线图如图8
图8 完成箱线图的制作
可以看到图8与开篇介绍的箱线图的区别在于,使用K线图制作箱线图少了异常值的标记!
最后,下篇介绍EXCEL制作箱线图的另一种方法!
最最后,觉得有用,点个赞再走哇~~