Freigeben über


Migrieren Sie zu v3.x des Read OCR Containers

Wenn Sie Version 2 von Azure Vision im Read-OCR-Container von Foundry Tools verwenden, lesen Sie diesen Artikel, um zu erfahren, wie Sie Ihre Anwendung auf die Verwendung von Version 3.x des Containers aktualisieren.

API-Änderungen

Der Container "Read v3.2" verwendet Version 3 der Azure Vision-API und verfügt über die folgenden Endpunkte:

  • /vision/v3.2/read/analyzeResults/{operationId}
  • /vision/v3.2/read/analyze
  • /vision/v3.2/read/syncAnalyze

Ausführliche Informationen zum Aktualisieren Ihrer Anwendungen zur Verwendung von Version 3 der Read-API finden Sie im Azure Vision v3 REST-API-Migrationshandbuch . Synchrone Vorgänge werden nur in Containern unterstützt.

Konfigurationsänderungen

  • ReadEngineConfig:ResultExpirationPeriod wird nicht mehr unterstützt. Der Read OCR-Container verfügt über einen integrierten Cron-Auftrag, der die einer Anforderung zugeordneten Ergebnisse und Metadaten nach 48 Stunden entfernt.
  • Cache:Redis:Configuration wird nicht mehr unterstützt. Der Cache wird in den Containern der Version 3.x nicht verwendet, sodass sie ihn nicht festlegen müssen.

Speicheranforderungen

Die Anforderungen und Empfehlungen basieren auf Benchmarks mit einer einzelnen Anforderung pro Sekunde, wobei ein 523 KB großes Bild eines gescannten Geschäftsbriefs mit 29 Zeilen und insgesamt 803 Zeichen verwendet wird. In der folgenden Tabelle werden die minimalen und empfohlenen Zuordnungen von Ressourcen für jeden OCR-Container für das Lesen beschrieben:

Behälter Mindestwert Empfohlen
Lesen Sie 3.2 30.04.2022 4 Kerne, 8 GB Arbeitsspeicher 8 Kerne, 16 GB Arbeitsspeicher

Jeder Kern muss eine Geschwindigkeit von mindestens 2,6 GHz aufweisen.

Kern und Arbeitsspeicher entsprechen den Einstellungen --cpus und --memory, die von Docker als Bestandteil des run-Befehls verwendet werden.

Speicherimplementierungen

Hinweis

MongoDB wird in 3.x-Versionen des Containers nicht mehr unterstützt. Stattdessen unterstützen die Container Azure Storage-und Offlinedateisysteme.

Implementierung Erforderliche Laufzeitargumente
Dateiebene (Standard) Keine Laufzeitargumente erforderlich. Das /share-Verzeichnis wird verwendet.
Azure Blob Storage:ObjectStore:AzureBlob:ConnectionString={AzureStorageConnectionString}

Warteschlangenimplementierungen

In v3.x des Containers wird RabbitMQ derzeit nicht unterstützt. Folgende Unterstützungsimplementierungen werden unterstützt:

Implementierung Laufzeitargumente Beabsichtigte Verwendung
In-Memory (Standard) Keine Laufzeitargumente erforderlich. Entwickeln und Testen
Azure-Warteschlangen Queue:Azure:ConnectionString={AzureStorageConnectionString} Bereitstellung
RabbitMQ Nicht verfügbar Bereitstellung

Zum Erreichen zusätzlicher Redundanz verwendet der Read v3.x-Container einen Zeitgeber für Sichtbarkeit, um sicherzustellen, dass Anforderungen bei einem Setup mit mehreren Containern auch bei einem Absturz erfolgreich verarbeitet werden können.

Legen Sie den Zeitgeber mit Queue:Azure:QueueVisibilityTimeoutInMilliseconds fest, was die Zeit angibt, in der eine Nachricht nicht sichtbar ist, wenn sie von einem anderen Worker verarbeitet wird. Um redundante Verarbeitung von Seiten zu vermeiden, empfehlen wir, den Timeoutzeitraum auf 120 Sekunden festzulegen. Der Standardwert beträgt 30 Sekunden.

Standardwert Empfohlener Wert
30.000 120000

Nächste Schritte