更新:2011 年 3 月
必須有 Visual Studio 2010 SP1。
Microsoft 專有的
產生 XOP 指令 vpperm,以選取其前兩個來源中的位元組,並選擇性地將其轉換。
__m128i _mm_perm_epi8 (
__m128i src1,
__m128i src2,
__m128i selector
);
參數
[in] src1
含有十六個位元組的 128 位元參數。[in] src2
含有十六個位元組的 128 位元參數。[in] selector
128 位元參數,這個參數會從 src1和 src2 中選取位元組,並選擇性地選擇要套用至所選位元組的轉換。
傳回值
128 位元結果 r,這個結果包含從 src1和 src2 所選取並選擇性轉換的位元組。
需求
內建 |
架構 |
|---|---|
_mm_perm_epi8 |
XOP |
標頭檔 <intrin.h>
備註
在 selector 的每個位元組中,低序位位元會選取 src1或 src2 中的位元組。 0 到 15 的值會選取 src1 的位元組 0 到 15,而 16 到 31 的值則選取 src2 的位元組 0 到 15。 selector 中每個位元組的高序位位元會決定將何種轉換 (如果有的話) 套用至選取的位元組。
選取器高序位 3 位元的值 |
選擇的轉換 |
|---|---|
000b |
無轉換 |
001b |
反轉 (1 補數) 來源位元組 |
010b |
位元反向來源位元組 |
011b |
位元反向反轉的來源位元組 |
100b |
將結果位元組設定為 0x00 |
101b |
將結果位元組設定為 0xFF |
110b |
複寫來源位元組的最高有效位元 |
111b |
複寫來源位元組的反轉最高有效位元 |
vpperm 指令屬於 XOP 指令家族的一部分。 在使用這個內建之前,您必須先確定處理器支援這個指令。 若要判斷這個指令的硬體支援,請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建,並檢查 CPUInfo[2] (ECX) 的位元 11。 當支援指令時,這個位元為 1,否則為 0。
範例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, b, selector, d;
int i;
for (i = 15; i >= 0; i--) {
a.m128i_u8[i] = i; // 0x0f0e0d0c...
b.m128i_u8[i] = (i << 4) | i; // 0xffeeddcc...
}
selector.m128i_u64[1] = 0xfedcba9876543210ll;
selector.m128i_u64[0] = 0x0011223344556677ll;
d = _mm_perm_epi8(a, b, selector);
printf_s("%016I64x %016I64x\n", d.m128i_u64[1], d.m128i_u64[0]);
}
請參閱
參考
其他資源
針對 Visual Studio 2010 SP1 加入的 XOP 內建
變更記錄
日期 |
記錄 |
原因 |
|---|---|---|
|
2011 年 3 月 |
新增此內容。 |
SP1 功能變更。 |