签到

05月06日
尚未签到

共有回帖数 0

    人心难测

    等级:



    续前作:

    http://tieba.baidu.com/p/2513502552
    http://tieba.baidu.com/p/2457130639


    两年前我曾自认为自己把一维FFT(快速傅立叶变换)的实现优化到了极致,效率能够超过fftw3。后来我在本机编译了fftw3再跟自己的实现比较后,发现其实我的实现离最快还差了很远。
    我有兴趣继续优化那个基于分裂基的实现,于是把高中毕业论文定题为“X86架构上具备SIMD优化的快速傅立叶变化实现(Fast Fourier Transform Implementation on X86 Architecture with SIMD Optimization)”。
    去年暑假(2014.8)我花了两周集中于开发这个新的实现,并完成了论文主体。我的新FFT库名为ee-fft,同样托管在github上:https://github.com/Sleepwalking/IB-EE-FFT。这个新的库主要由(内联)汇编写成,用了SSE、SSE2指令集。兼容大部分在2004年之后发布的X86处理器。不过比较遗憾的是,在同等编译条件下(-msse -msse2),ee-fft尽管较上一代有了明显改进,运行效率仍然稍低于fftw3。或许用类似的方法改写到更新的指令集上,能缩短差距。
    论文和源码都可从上述链接获取。这是我自己“照葫芦画瓢”,模仿读过的一些文献的格式,写的第一篇论文;加上没有老师指导,难免会犯些错,甚至是一些低级的英文语法错误,恳请指正。
    http://pan.baidu.com/s/1i3kra1v

    楼主 2015-10-16 13:37 回复

共有回帖数 0
  • 回 帖
  • 表情 图片 视频
  • 发表

登录直线网账号

Copyright © 2010~2015 直线网 版权所有,All Rights Reserved.沪ICP备10039589号 意见反馈 | 关于直线 | 版权声明 | 会员须知