Uruchamianie modeli ONNX przy użyciu środowiska uruchomieniowego ONNX uwzględnionego w usłudze Windows ML

Środowisko uruchomieniowe ONNX dostarczane z systemem Windows ML umożliwia aplikacjom lokalne uruchamianie wnioskowania na modelach ONNX.

Tworzenie sesji wnioskowania

Interfejsy API są takie same jak w przypadku bezpośredniego używania środowiska uruchomieniowego ONNX. Aby na przykład utworzyć sesję wnioskowania:

// Create inference session using compiled model
using InferenceSession session = new(compiledModelPath, sessionOptions);

// Create inference session using compiled model
Ort::Session session(env, compiledModelPath.c_str(), sessionOptions);

import onnxruntime as ort
# Create inference session using compiled model
session = ort.InferenceSession(output_model_path, sess_options=options)

Zalecamy przeczytanie dokumentacji środowiska uruchomieniowego ONNX , aby uzyskać więcej informacji na temat używania interfejsów API środowiska uruchomieniowego ONNX w usłudze Windows ML. Kod wnioskowania modelu będzie inny dla każdego modelu.

Kompilowanie modeli

Przed użyciem modelu ONNX w sesji wnioskowania często należy ją skompilować w zoptymalizowaną reprezentację, która może być wydajnie wykonywana na podstawowym sprzęcie urządzenia.

Od wersji ONNX Runtime 1.22 istnieją nowe interfejsy API, które lepiej hermetyzują kroki kompilacji. Więcej szczegółów można znaleźć w dokumentacji kompilowania środowiska uruchomieniowego ONNX (zobacz OrtCompileApi struct).

// Prepare compilation options
OrtModelCompilationOptions compileOptions = new(sessionOptions);
compileOptions.SetInputModelPath(modelPath);
compileOptions.SetOutputModelPath(compiledModelPath);

// Compile the model
compileOptions.CompileModel();

const OrtCompileApi* compileApi = ortApi.GetCompileApi();

// Prepare compilation options
OrtModelCompilationOptions* compileOptions = nullptr;
OrtStatus* status = compileApi->CreateModelCompilationOptionsFromSessionOptions(env, sessionOptions, &compileOptions);
status = compileApi->ModelCompilationOptions_SetInputModelPath(compileOptions, modelPath.c_str());
status = compileApi->ModelCompilationOptions_SetOutputModelPath(compileOptions, compiledModelPath.c_str());

// Compile the model
status = compileApi->CompileModel(env, compileOptions);

// Clean up
compileApi->ReleaseModelCompilationOptions(compileOptions);

input_model_path = "path_to_your_model.onnx"
output_model_path = "path_to_your_compiled_model.onnx"

model_compiler = ort.ModelCompiler(
    options,
    input_model_path,
    embed_compiled_data_into_model=True,
    external_initializers_file_path=None,
)
model_compiler.compile_to_file(output_model_path)
if not os.path.exists(output_model_path):
    # For some EP, there might not be a compilation output.
    # In that case, use the original model directly.
    output_model_path = input_model_path

Note

Kompilacja może potrwać kilka minut. Aby każdy interfejs użytkownika pozostał dynamiczny, rozważ wykonanie tej czynności jako operacji w tle w aplikacji.

Wskazówka

Aby uzyskać optymalną wydajność, skompiluj modele raz i użyj ponownie skompilowanej wersji. Przechowuj skompilowane modele w lokalnym folderze danych aplikacji na potrzeby kolejnych przebiegów. Należy pamiętać, że aktualizacje adresów e-mail lub środowiska uruchomieniowego mogą wymagać ponownego skompilowania.

Zobacz także

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-08-16