箱线图(Boxplot),也叫盒须图,是一种常用的统计图表,用于展示数据集的分布情况,特别是数据的集中趋势、离散程度以及异常值。它通过五个数值摘要来概括数据的分布:最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)、最大值。箱线图的主要组成部分包括:

  1. 箱体(Box):由第一四分位数(Q1)和第三四分位数(Q3)之间的区域组成,表示数据的中间50%分布。箱体中间的线是中位数(Q2),表示数据的中间位置。
  2. 须(Whiskers):从箱体延伸出来的线,通常表示数据的最小值和最大值,除去异常值之外。计算方式一般是:最小值和最大值分别为 Q1 - 1.5 * IQRQ3 + 1.5 * IQR,其中IQR是四分位距(Q3 - Q1)。
  3. 异常值(Outliers):位于须之外的点,通常表示超出正常范围的数据值。
  4. 中位数线(Median):箱体内的一条线,表示数据的中位数,通常也称为Q2。

箱线图可以帮助我们直观地看到数据的对称性、分布宽度以及是否存在异常值。

示例:

假设有一组数据:[12, 15, 16, 18, 19, 20, 22, 25, 30, 31, 35]。

绘制出的箱线图中,箱体从16到25,中位数线在20,最小值和最大值分别是12和35,异常值若存在,会标记在箱体外。

如果你有具体的数据或需要帮助绘制箱线图,可以提供数据,我可以为你生成图表!

✍️提及

Python成像质谱流式细胞术病理生理学

https://embed.notionlytics.com/wt/ZXlKM2IzSnJjM0JoWTJWVWNtRmphMlZ5U1dRaU9pSlhiRWhvWlV4VVQxbHNjMlZYV2tKbU9URndaU0lzSW5CaFoyVkpaQ0k2SWpFME16RmhaVGRpT1dFek1qZ3dZMlU1TXprMVkyRXpNbU0zT0RKaE9HSm1JbjA9