代码之家 › 专栏 › 技术社区 › rahs

statistics.mean()vs sum()/len()vs np.average()用于列表列表

python

rahs · 技术社区 · 6 年前

数据:大小相等的列表,必须沿列求平均值才能返回一个平均列表

在python中使用以下两种方法之一平均上述数据是否更快 statistics.mean() 或 sum()/len() 或者将其转换为numpy数组然后使用 np.average() ?

还是没有显著差异?

This question

2 回复 | 直到 6 年前

Dani Mesejo 6 年前

您可以衡量不同方案的绩效。我假设沿着列的比意味着这是按行的。例如,如果你有1000个列表,每个列表的末尾有100个元素,那么你将得到一个平均值为100的列表。

import random
import numpy as np
import statistics
import timeit

data = [[random.random() for _ in range(100)] for _ in range(1000)]


def average(data):
    return np.average(data, axis=0)


def sum_len(data):
    return [sum(l) / len(l) for l in zip(*data)]


def mean(data):
    return [statistics.mean(l) for l in zip(*data)]


if __name__ == "__main__":
    print(timeit.timeit('average(data)', 'from __main__ import data,average', number=10))
    print(timeit.timeit('sum_len(data)', 'from __main__ import data,sum_len', number=10))
    print(timeit.timeit('mean(data)', 'from __main__ import data,mean', number=10))

输出

0.025441123012569733
0.029354612997849472
1.0484535950090503

看来 statistics.mean np.average sum_len 方法和比 np.平均值 总计 .

mmagnuski 6 年前

这可能取决于“行”和“列”中元素的数量(即列表的数量和每个列表中元素的数量),但是只要有10个列表,每个列表就有10个元素,就可以看到numpy的优势:

import numpy as np
from statistics import mean

# construct the data
n_rows = 10
n_columns = 10
data = [np.random.random(n_columns).tolist() for x in range(n_rows)]

# define functions, I take your 'along columns' to mean that
# columns dimention is reduced with mean:
def list_mean(data):
    return [mean(x) for x in data]

def numpy_mean(data):
    return np.asarray(data).mean(axis=1)

# time results with %timeit magic in notebook:
%timeit list_mean(data)
# 528 Âµs Â± 1.78 Âµs per loop (mean Â± std. dev. of 7 runs, 1000 loops each)

%timeit numpy_mean(data)
# 19.7 Âµs Â± 121 ns per loop (mean Â± std. dev. of 7 runs, 100000 loops each)

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

6 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

6 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

6 月前

user29715306 · from_users=和chats=电视节目中的差异

6 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

6 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

6 月前

prayner · 更新嵌套字典包含列表中的项

6 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

6 月前

Dave · 如何在for循环中修改列表值

6 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

6 月前