2sigma和3sigma的区别
2、sigma和3sigma是统计学中常用的标准差倍数。标准差是用来衡量数据集中的离散程度的统计指标。2sigma表示在正态分布中,约有95%的数据点会落在平均值加减两倍标准差的范围内。换句话说,如果一个数据点的值超过平均值加减两倍标准差的范围,那么它被认为是异常值或者离群值。
而3sigma则表示在正态分布中,约有99.7%的数据点会落在平均值加减三倍标准差的范围内。这意味着如果一个数据点的值超过平均值加减三倍标准差的范围,那么它极有可能是一个异常值。
使用2sigma和3sigma的概念可以帮助我们判断数据点是否偏离了正常的分布范围。在实际应用中,如果我们希望筛选出异常值或者离群值,可以使用3sigma的标准;如果我们只是想了解数据的整体分布情况,可以使用2sigma的标准。
总结起来,2sigma和3sigma的区别在于所包含的数据点的比例和对异常值的敏感程度。3sigma的范围更广,包含了更多的数据点,但也更加敏感于异常值的存在。