estrutura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)

Calcula a escala de quantização e os valores de ponto zero necessários para quantificar o InputTensor e aplica essa quantização, gravando o resultado em OutputTensor.

Esse operador usa a equação a seguir para quantificar.

InputMax = Max(InputTensor)
InputMin = Min(InputTensor)

AValue = (A - AZeroPoint) * AScale
BValue = (B - BZeroPoint) * BScale

// For uint8 output, Min = 0, Max = 255
// For int8 output, Min = -128, Max = 127
OutputScale = (InputMax – InputMin) / (Max – Min)

OutputZeroPoint = Min - InputMin / OutputScale

OutputTensor = clamp(round(InputValue / OutputScale) + OutputZeroPoint, Min, Max)

Sintaxe

struct DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC {
  const DML_TENSOR_DESC *InputTensor;
  const DML_TENSOR_DESC *OutputTensor;
  const DML_TENSOR_DESC *OutputScaleTensor;
  const DML_TENSOR_DESC *OutputZeroPointTensor;
};

Membros

InputTensor

Tipo: const DML_TENSOR_DESC*

O tensor que contém as entradas.

OutputTensor

Tipo: const DML_TENSOR_DESC*

O tensor de saída no qual gravar os resultados.

OutputScaleTensor

Tipo: const DML_TENSOR_DESC*

O tensor de saída para gravar o fator de escala de saída para OutputTensor. O número esperado de elementos em OutputScaleTensor é 1.

OutputZeroPointTensor

Tipo: const DML_TENSOR_DESC*

O tensor de saída para gravar o ponto zero de saída para OutputTensor. O número esperado de elementos em OutputZeroPointTensor é 1.

Comentários

Disponibilidade

Esse operador foi introduzido no DML_FEATURE_LEVEL_4_0.

Restrições do Tensor

InputTensor, OutputScaleTensor, OutputTensor e OutputZeroPointTensor devem ter o mesmo DimensionCount.
OutputTensor e OutputZeroPointTensor devem ter o mesmo DataType.

Suporte ao Tensor

Tensor	Tipo	Contagens de dimensões com suporte	Tipos de dados com suporte
InputTensor	Entrada	1 a 8	FLOAT32, FLOAT16
OutputTensor	Saída	1 a 8	INT8, UINT8
OutputScaleTensor	Saída	1 a 8	FLOAT32
OutputZeroPointTensor	Saída	1 a 8	INT8, UINT8

Requisitos

Requisito	Valor
Cliente mínimo com suporte	Windows Build 22000
Servidor mínimo com suporte	Windows Build 22000
Cabeçalho	directml.h

Confira também

DML_ELEMENT_WISE_DEQUANTIZE_LINEAR_OPERATOR_DESC

Feedback

Esta página foi útil?

Last updated on 2024-02-29

Partilhar via

estrutura DML_DYNAMIC_QUANTIZE_LINEAR_OPERATOR_DESC (directml.h)

Sintaxe

Membros

Comentários

Disponibilidade

Restrições do Tensor

Suporte ao Tensor

Requisitos

Confira também

Feedback

Recursos adicionais