共用方式為


_mm_permute2_ps

更新:2011 年 3 月

必須有 Visual Studio 2010 SP1。

Microsoft 專有的

產生 XOP XMM 指令 vpermil2ps,從前兩個來源中選取浮點數值,並選擇性歸零。

__m128 _mm_permute2_ps (
   __m128 src1,
   __m128 src2,
   __m128i selector,
   int control
);

參數

  • [in] src1
    128 位元參數,這個參數包含四個 32 位元浮點數值。

  • [in] src2
    128 位元參數,這個參數包含四個 32 位元浮點數值。

  • [in] selector
    128 位元參數,這個參數包含四個 32 位元整數選取器值。

  • [in] control
    32 位元整數參數,這個參數控制決定是否將結果值歸零的方法。

傳回值

128 位元結果 r,這個結果包含四個 32 位元浮點數值。

結果中的每個值若不是零,就是從 src1 與 src2 的八個 32 位元浮點數值中所選取的值。

需求

內建

架構

_mm_permute2_ps

XOP

標頭檔 <intrin.h>

備註

selector 中四個 Doubleword 的每一項都會從來自 src1和 src2 的八個 32 位元浮點數值中的一個結果上選取其對應 Doubleword 的值。 視 control 的值和 selector Doubleword 位元 3 的值而定,將這個值寫入結果之前,可能會以零取代該值。

在 selector 的每個 Doubleword 中,低序位的三個位元會選取 src1 或 src2 的其中一個浮點值,0 到 3 的值表示選取 src1[0] 到 src1[3],而 4 到 7 的值則選取 src2[0] 到 src2[3]

以下會將 selector 中每個 Doubleword 的下一個位元稱為「匹配」位元。 忽略 selector 中每個 Doubleword 的高序位 28 位元。

第四個來源 control 決定結果值會設為 0 的條件。 control 的值必須是 0、1、2 或 3。 如果 control 是 0 或 1,選取的浮點數值會寫入目的地。 如果 control 是 2,則選取的浮點數值會在 selector 中的對應比對位元為 0 時寫入目的地,但是比對位元為 1 時,則寫入零。 如果 control 是 3,則選取的浮點數值會在對應的比對位元為 1 時寫入目的地,但是比對位元為 0 時,則寫入零。

vpermil2ps 指令屬於 XOP 指令家族的一部分。 在使用這個內建之前,您必須先確定處理器支援這個指令。 若要判斷這個指令的硬體支援,請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建,並檢查 CPUInfo[2] (ECX) 的位元 11。 當支援指令時,這個位元為 1,否則為 0。

範例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128 a, b, d;
    __m128i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128_f32[i] = i;
        b.m128_f32[i] = i+4;
    }
    select.m128i_i32[0] = 5;
    select.m128i_i32[1] = 1 + 8; // turn on match bit
    select.m128i_i32[2] = 2;
    select.m128i_i32[3] = 6 + 8; // turn on match bit
    d = _mm_permute2_ps(a, b, select, 0); // just select, don't zero
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 2); // zero if match is 1
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 3); // zero if match is 0
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
}
  

請參閱

參考

__cpuid, __cpuidex

其他資源

_mm256_permute2_ps

_mm_permute2_pd

針對 Visual Studio 2010 SP1 加入的 XOP 內建

變更記錄

日期

記錄

原因

2011 年 3 月

新增此內容。

SP1 功能變更。