C嵌入彙編之vld1.f32和vst1.f32指令理解

想完成類似與memcpy,使用arm的neon指令完成,第一次代碼 關鍵點 第一點: add %0,%0,#32,表示每次移動32/4=8個float 第二點: subs r0,r0,#1才能改變狀態標誌位,sub不行 第三點: vld1.f32 {d16-d17},[%0:128] add %0,%0,#16   //16=128/32*4,移動%0到第四個位置 與 vld1.f32 {d16-
相關文章
相關標籤/搜索