上图是 sci 文献中的箱形图(box-plot)。箱形图又称为盒须图、盒式图或箱线图,因形状如箱子而得名。箱形图是一种用作显示一组数据分散情况资料的统计图。那么箱形图可以反应哪些数据分散信息呢?
箱形图可以很好的显示数据的离散的分布情况。
如下图所示,箱形图提供了一种只用 5 个点对数据集做简单总结的方式,分别为最大值(maximun value)、最小值 (minimun value)、上四分位数 (75th peroentile)、下四分位数 (25th peroentile) 和中位数 (median)。
此外,在远离最大值或者最小值的地方可能存在异常值,异常值的定义为小于下四分位数-1.5*iqr(上四分位数减去下四分位数的差距)或大于上四分位数 1.5*iqr 的值。一批数据中的异常值值得关注,忽视异常值的存在十分危险,不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。
所谓的分组箱形图,即按性别分组后,又分为 low group 和 high group 两组。(如下图)
现在将使用 graphpad prism 5.0(win7,64 位系统)手把手教你绘制箱形图。
基本箱形图步骤:
step1:打开 graphpad prism 5.0,column,选择 box & whiskers,plot:(whiskers :min to max),create
step2:输入数据,箱形图只需要 y 列:
在 graphs 下 data1 中可以得到数据得到的基本图形:
这样一个基本的箱形图就完成啦!
可能这样的箱形图无法满足很多科研战友的需要,接下来,就进一步教大家绘制分组箱形图。
所谓的分组箱形图,即按性别分组后,又分为 low group 和 high group 两组。(如下图)
分组箱形图步骤:
step1:同上文打开 graphpad prism 5.0,column,选择 box & whiskers,plot:(whiskers :min to max),create,输入数据。
在 graphs 下 data1 中可以得到数据得到的基本图形:
step2:调整间距(点我查看间距调整小技巧)
点击 change 菜单下 add or remove data sets,and change……选项,进入 format graph 界面,选中 data1:c:c,将最底下与前一列数据(b)的 间距由 100% 修改为 200%, 得到如下效果:
step3:更改颜色
双击图形更改 a、c 两列、b、d 两列的边框颜色:
step4:更改横坐标
双击 x 轴进入 format axes 界面,在 all ticks 下将 ticks direction 和 location of numbering/labeling 均选为 none。
使用文本框工具 t 输入 female、male、gender:
step6:绘制分组标识
在 draw 菜单下选择直线,在 female 和 male 中央画一根短线,此时只有 low group 和 high group 两组的标识需要绘制了。
在 draw 菜单下选择圆角矩形,画一个圆角矩形,选中矩形 copy,paste drawing 得到一个一模一样的圆角矩形。
双击矩形分布将两个矩形 color 选为红色和蓝色,ok
使用文本框工具 t 输入 low group 和 high group,有颜色区别的分组箱形图就做好了:
step7:点击 export,选择 tif 格式,resolution (dpi) 选择 600,color model 选择 rgb(millions of colors),导出图片即可: