代码之家 › 专栏 › 技术社区 › elm

基于蒙特卡罗的Pi计算的Python高效矢量化

pi montecarlo vectorization numpy python

elm · 技术社区 · 11 年前

为了近似Pi的值,考虑用随机值填充阵列的这种随机方法,

import random as rd
import numpy as np

def r(_): return rd.random()

def np_pi(n):
    v_r = np.vectorize(r)
    x = v_r(np.zeros(n))
    y = v_r(np.zeros(n))

    return sum (x*x + y*y <= 1) * 4. / n

注意,随机数生成依赖于Python标准库;尽管考虑numpy随机生成,

def np_pi(n):
   x = np.random.random(n)
   y = np.random.random(n)

    return sum (x*x + y*y <= 1) * 4. / n

现在考虑非矢量化方法,

import random as rd

def dart_board():
    x,y = rd.random(), rd.random()
    return (x*x + y*y <= 1)

def pi(n):
    s = sum([dart_board() for _ in range(n)])
    return s * 4. / n

事实证明,非矢量化形式的平均速度比矢量化形式快4倍,例如考虑 n = 5000000 操作系统命令行如下(Python 2.7、Quadcore、8GB RAM、RedHat Linux),

time python pi.py
time python np_pi.py

从而提出如何改进矢量化方法以提高其性能。

1 回复 | 直到 11 年前

Oliver W. 11 年前

您正在调用 python内置 sum ,而不是numpy的矢量化方法 总和 :

import numpy as np
import random as rd

def np_pi(n):
    x = np.random.random(n)
    y = np.random.random(n)

    return (x*x + y*y <= 1).sum()

def dart_board():
    x,y = rd.random(), rd.random()
    return (x*x + y*y <= 1)

def pi(n):
    s = sum([dart_board() for _ in range(n)])

时间结果现在大不相同:

In [12]: %timeit np_pi(10000)
1000 loops, best of 3: 250 us per loop

In [13]: %timeit pi(10000)
100 loops, best of 3: 3.54 ms per loop

我想 总和 在numpy数组上进行迭代而不是使用矢量化例程会导致开销。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

11 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

11 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

11 月前

user29715306 · from_users=和chats=电视节目中的差异

11 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

11 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

11 月前

prayner · 更新嵌套字典包含列表中的项

11 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

11 月前

Dave · 如何在for循环中修改列表值

11 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

11 月前