中位数:一组数据按顺序排列后位于中间位置的数值。当该组数据中数值个数为奇数时,中位数为中间位置的数值;当该组数据中数值个数为偶数时,中位数为中间位置两个数值的均值。
该组数据中最多有一半的数值小于中位数,也最多有一半的数值大于中位数;因为该组数据中可能有若干数值等于中位数。
方法一:通过判断解决数据个数为奇数、偶数的问题
def descriptive_median_1(list): list = sorted(list) size = len(list) if size % 2 == 0: 判断列表长度为偶数 return (list[size//2] list[size//2-1])/2 else: 判断列表长度为奇数 return list[(size-1)//2] 测试 print(descriptive_median_1([1,3,5,2,3,3,4,5,6,2,2,3,3,1,1,2]))
结果:
3
方法二:通过负索引解决数据个数为奇数、偶数的问题
当数据个数为奇数时,正负索引对应的都是该组数据中间位置的那个数,最终结果为中位数;当数据个数为偶数时,中位数为两个数值的均值,此时正索引对应那两个数值中较大的一个,负索引对应两个数值中较小的一个,最终结果仍然为中位数。
def descriptive_median_2(list): list.sort() half = len(list) // 2 return (list[half] list[~half]) / 2 测试 print(descriptive_median_2([1,3,5,2,3,3,4,5,6,2,2,3,3,1,1,2]))
结果:
3
方法三:调用numpy方法
import numpy as np print(np.median([1,3,5,2,3,3,4,5,6,2,2,3,3,1,1,2]))
结果:
3
list = sorted(list) 或 list.sort() 将数组list进行排序
list[i] 获取数组list中的第i个元素(i从0计数)
a//b 取整除:返回商的整数部分(向下取整)
list[~i] 负索引:获取数据list中倒数第i个元素