帮忙测试MMX2,SSE2,SSSE3在不同CPU上的性能
dwing吧
全部回复
仅看楼主
level 9
roo_zhou 楼主
我正在写一个用于反交错和IVTC的视频滤镜,其中一个用于计算场间SSD(Sum of Squared Difference)的函数写了MMX2,SSE2,SSSE3三个优化版本。现在需要了解在各种CPU上三个版本各自的性能。下载解压后在cmd中运行SpeedTest.exe即可。打出的数值是处理一对1920x1080帧所需的CPU周期。如果其中某个数值非常大请重新运行一遍。最后把输出的结果和CPU型号发上来就行了。我自己的Athlon 64 X2 1.8G上是SSSE3 ---- N/ASSE2 ----- 7123k cyclesMMX2 ----- 7051k cyclesplain c -- 24883k cycles下载地址(附源码,仅4k)www.namipan.com/d/SpeedTest.7z/f0460bd26d7b850dc73402e546a6aef44a7ab94eaa0e0000
2008年11月10日 13点11分 1
level 0
athlon xp什么都不显示,同第一个版本的ctaacencoder一样
2008年11月10日 14点11分 2
level 0
我的CPU是Athlon 64 X2 4200+.------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7239k cyclesMMX2 ----- 7316k cyclesplain c -- 24815k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7197k cyclesMMX2 ----- 7239k cyclesplain c -- 24760k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7156k cyclesMMX2 ----- 7157k cyclesplain c -- 25211k cycles
2008年11月10日 14点11分 3
level 0
Athlon 64 X2 5000+------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7476k cyclesMMX2 ----- 7263k cyclesplain c -- 25056k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7491k cyclesMMX2 ----- 7331k cyclesplain c -- 25479k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7392k cyclesMMX2 ----- 7200k cyclesplain c -- 25375k cycles========================================Athlon 64 X2 4400+------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7314k cyclesMMX2 ----- 7283k cyclesplain c -- 24851k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7147k cyclesMMX2 ----- 7255k cyclesplain c -- 25033k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7374k cyclesMMX2 ----- 7423k cyclesplain c -- 25344k cycles
2008年11月10日 14点11分 4
level 0
------- Test Results -------SSSE3 ---- N/ASSE2 ----- 7196k cyclesMMX2 ----- 7149k cyclesplain c -- 24569k cycles
2008年11月10日 14点11分 5
level 0
~5楼 是Athlon 64 X2 4400+
2008年11月10日 14点11分 6
level 9
roo_zhou 楼主
看来AMD的U上MMX比SSE2快是普遍现象>2lathlon-xp不支持SSE2? 可能我mmx里不小心用了sse2,检查中...
2008年11月10日 14点11分 7
level 13
E6550(2.33G),测试10次,分别的小值:SSSE3 ---- 4801k cyclesSSE2 ----- 4968k cyclesMMX2 ----- 7757k cyclesplain c -- 22599k cycles
2008年11月11日 01点11分 8
level 0
E2160(1.8G)SSSE3 ---- 4925k cyclesSSE2 ----- 5259k cyclesMMX2 ----- 7990k cyclesplain c -- 22991k cycles
2008年11月11日 04点11分 9
level 0
q6600 3.2G------- Test Results -------SSSE3 ---- 5504k cyclesSSE2 ----- 5579k cyclesMMX2 ----- 8694k cyclesplain c -- 26024k cycles
2008年11月11日 06点11分 10
level 9
roo_zhou 楼主
>2l原因查明,MMX2里用了SSE2指令paddq。我用add和adc代替之后应该可以在athlon-xp和p3上跑了,而且其他CPU上的速度应该能快许多。
2008年11月11日 14点11分 11
level 9
roo_zhou 楼主
实在不好意思,请大家测试新版本,原先SSSE3里错了一个指令(对速度基本无影响),MMX2版本现在可以在athlon-xp和p3上运行,并且速度有明显提升。www.namipan.com/d/c024c05ce64bb90e9bb618800cd9bd348e2d328afa0e0000
2008年11月11日 15点11分 12
level 0
测试结果会跳啊,建议多测几次取均值
2008年11月11日 18点11分 13
level 9
roo_zhou 楼主
还是觉得dwing的方法取最小值比较可靠附上新版本的测试结果Turion 64 X2 1.8GSSSE3 ---- N/ASSE2 ----- 7110k cyclesMMX2 ----- 6854k cyclesplain c -- 24640k cyclesE2160 1.8GSSSE3 ---- N/ASSE2 ----- 7110k cyclesMMX2 ----- 6861k cyclesplain c -- 24640k cycles
2008年11月11日 18点11分 14
level 0
althon xp 1.83g------- Test Results -------SSSE3 ---- N/ASSE2 ----- N/AMMX2 ----- 7450k cyclesplain c -- 33018k cycles怎么没有sse
2008年11月12日 07点11分 15
level 9
roo_zhou 楼主
SSE是浮点指令,我这个算法是整数的
2008年11月12日 12点11分 16
level 1
毒龙1.8,一运行就出错
2008年11月12日 12点11分 17
level 0
>segate请用12楼的新版本。老版本在不支持sse2的CPU上不能运行。
2008年11月12日 13点11分 18
level 1
不好意思,没注意到回帖的内容------- Test Results -------SSSE3 ---- N/ASSE2 ----- N/AMMX2 ----- 8730k cyclesplain c -- 33757k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- N/AMMX2 ----- 9292k cyclesplain c -- 33629k cycles------- Test Results -------SSSE3 ---- N/ASSE2 ----- N/AMMX2 ----- 8555k cyclesplain c -- 33397k cycles
2008年11月12日 14点11分 19
level 13
E6550(2.33G),10次测试,各自最小值:SSSE3 ---- 4495k cyclesSSE2 ----- 4990k cyclesMMX2 ----- 5487k cyclesplain c -- 22588k cycles在T2370笔记本上的结果是这个的2倍左右,不知道是什么原因.
2008年11月13日 01点11分 20
1 2 3 4 尾页