小赖子的英国生活和资讯

谈并行计算效率中的Ahmdal’s法则 (阿姆达尔定律)

阅读 桌面完整版

Ahmdal’s Law 是并行计算中最简单最有名的公式(阿姆达尔定律). 这个公式是用来理论上估计程序在使用多线程或者多核甚至多台机 同时计算的情况下最大能获得的性能提升.

性能的提升是由改进算法前的时间 比上 改进后的时间, 比如:

其中 T(1) 就是没有并行(或者可以理解为单线程), T(N) 则是使用N个线程或者核或者多台机器同时计算后的时间. 假设一个算法中不能并行的部分所占比重为 B, 那么:

1 – B 则是可以并行所占的比重. 该公式可以通过 来简化 (P 表示可以并行化的比例), 也就是有名的 Ahmdal’s法则(阿姆达尔定律):

性能分析

根据不同的比重 可以大概得出使用并行化(假设N倍提升) 后得到的总体性能提升.

阿姆达尔法 性能分析

把时间花在最重要的事情上

如果上面的图 你还是看不太懂的话 可以看看这个:

阿姆达尔法

看清楚的看到 我们或需要通过并行化来提升整体性能 需要主要花时间在所占整体运行时间多的模块.

已经运行很好的模块就不要去动它了 Click To Tweet

在优化之前需要用性能工具分析一下(Profiler) 这样有助于我们了解哪一块代码是比较耗时间的, 然后我们再来分析如何将该部分代码(瓶颈) 并行或者得到性能提升. 如果一些代码已经工作很好, 而且占用整体运行时间不到10% 那么就不建议把优化这块作为首要的任务. 因为即使你把这块代码提升10倍的性能: 所以能得到的理想整体性能提升也才 (1/(1-0.1+(0.1/10))=1.098. 性价比不高.

更何况 这还是理论性能提升 实际上还得考虑引入并行化带来的其它额外消耗, 比如数据在不同机器的传输, 又或者为了并行化引入的额外代码的消耗 e.g. 准备并行化所需要的数据 划分问题等等.

强烈推荐

微信公众号: 小赖子的英国生活和资讯 JustYYUK

阅读 桌面完整版
Exit mobile version