SPRING算法(二)

用有限体积法求解100万节点的二维拉普拉斯方程,经过一系列的优化,运行时间从7分多钟,缩短到了2分钟以内。目前体会如下:

  1. 基于Krylov子空间的迭代算法是极其高效的算法,甚至不逊色于直接解法!
  2. 缓存的优化是必不可少的,Cache Missing的代价是极其昂贵的!
  3. Intel的CPU进步很多,在主频略低的情况下,Core Duo 2也比Pentium 4快50%以上!
  4. 但是,Intel双核CPU的内存访问还存在很大瓶颈,双核共享内存访问效率是很差的,不知道最新的i7怎么样?
  5. 用OpenMP实现并行计算很舒服,这种基于标签的声明式编程风格很不错,这点是MPI不能比的!

继续优化迭代算法,优化内存访问,单线程的情况下乐观估计可以提高到1分钟以内。

至于多核或多路CPU,嘿嘿!

article-0-0367224C000005DC-715_468x449_popup

今天看到的温馨的图片,一只小睡鼠睡在玫瑰花中,小家伙还要两个月才能醒过来:)

Advertisements
此条目发表在未分类分类目录。将固定链接加入收藏夹。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s