Verwalten der Kapazität

Abgeschlossen

Um eine Azure KI-Suchlösung zu erstellen, müssen Sie in Ihrem Azure-Abonnement eine Ressource für die Azure KI-Suche erstellen. Abhängig von der Lösung, die Sie erstellen möchten, benötigen Sie möglicherweise auch Azure-Ressourcen für die Datenspeicherung und andere Anwendungsdienste.

Dienstebenen und Kapazitätsverwaltung

Wenn Sie eine Azure AI Search-Ressource erstellen, geben Sie ein Preisniveau an. Der von Ihnen gewählte Tarif bestimmt die Kapazitätsbeschränkungen des Suchdiensts, die für Sie verfügbaren Konfigurationsoptionen sowie die Kosten des Diensts. Die verfügbaren Tarife lauten:

  • Kostenlos (F). Verwenden Sie diesen Tarif, um den Dienst zu erkunden oder die Tutorials in der Produktdokumentation zu testen.
  • Basic (B): Verwenden Sie diesen Tarif für kleine Suchlösungen, die maximal 15 Indizes und 5 GB Indexdaten umfassen.
  • Standard (S): Verwenden Sie diesen Tarif für Lösungen auf Unternehmensniveau. Es gibt mehrere Varianten dieser Ebene, einschließlich S1, S2, S3 und S3HD; die eine zunehmende Kapazität in Bezug auf Indizes und Speicher und S3HD bieten, die für schnelle Leseleistung bei kleineren Indizes optimiert ist.
  • Storage Optimized (L): Verwenden Sie den Tarif „Storage Optimized“ (L1 oder L2), wenn Sie große Indizes erstellen müssen, die mit einer höheren Abfragewartezeit einhergehen.

Hinweis

Das Azure-Portal unterstützt Änderungen zwischen Preisstufen. Sie können die Stufen innerhalb der Beschränkungen der Zielstufe aktualisieren oder herabstufen. Sie können auf Dokumentationen zum Ändern Ihres Preisniveaus verweisen.

Replikate und Partitionen

Je nach gewähltem Tarif können Sie die Skalierbarkeit und Verfügbarkeit Ihrer Lösung optimieren, indem Sie Replikate und Partitionen erstellen.

  • Replikate sind Instanzen des Suchdiensts. Sie können sich diese als Knoten in einem Cluster vorstellen. Wenn Sie die Anzahl der Replikate erhöhen, lässt sich besser sicherstellen, dass die Kapazität ausreicht, um mehrere gleichzeitige Abfrageanforderungen zu verarbeiten, während zur gleichen Zeit Indizierungsvorgänge ausgeführt werden.

  • Mit Partitionen wird ein Index in mehrere Speicherorte unterteilt, sodass Sie E/A-Vorgänge, z. B. das Abfragen oder Neuerstellen eines Index, aufteilen können.

Die von Ihnen konfigurierte Kombination von Replikaten und Partitionen bestimmt die in der Lösung verwendeten Sucheinheiten. Mit anderen Worten: Die Anzahl der Sucheinheiten ist die Anzahl der Replikate multipliziert mit der Anzahl der Partitionen (R x P = SE). Beispielsweise werden für eine Ressource mit vier Replikaten und drei Partitionen 12 Sucheinheiten verwendet.

Tipp

Weitere Informationen zu den Tarifen und der Kapazitätsverwaltung finden Sie in der Dokumentation zur Azure KI-Suche.