我想在我的ARM Cortex-A9使NEON矢量化,但我得到这个编译输出:
“不是矢量:不支持相关的语句:D.14140_82 = D.14143_77 * D.14141_81”
下面是我的循环:
void my_mul(float32_t * __restrict data1, float32_t * __restrict data2, float32_t * __restrict out){
for(int i=0; i<SIZE*4; i+=1){
out[i] = data1[i]*data2[i];
}
}
在编译使用的选项:
-march=armv7-a -mcpu=cortex-a9 -mfpu=neon -mfloat-abi=softfp -ftree-vectorize -mvectorize-with-neon-quad -ftree-vectorizer-verbose=2
我使用的ARM-Linux的gnueabi(V4.6)编译器 。
需要注意的是该问题仅FLOAT32载体显得非常重要。 如果我在INT32切换, 那么矢量完成 。 也许对于FLOAT32的量化尚不可用...
有没有人有一个想法? 难道我忘了在cmd行或在我的实现的东西吗?
在此先感谢您的帮助。
石膏板