Hallo Schönwald, Alexander,
Willkommen bei Microsoft Q&A,
Vielen Dank für die Details und die Screenshots. Sie verdeutlichen die Situation.
Sie machen nichts falsch. GPT-5.1-Kontingenterhöhungen können derzeit nicht beantragt werden, da das Modell noch nicht in das Azure-Self-Service-Kontingentsystem aufgenommen wurde.
Warum wird GPT-5.1 nicht im Formular zur Kontingenterhöhung angezeigt?
Obwohl GPT-5.1 bereits in Azure AI Foundry bereitgestellt werden kann, wurde das Backend für Kontingentanforderungen noch nicht aktualisiert, um dieses Modell in die Liste der „Globalen Standardmodelle von Azure OpenAI“ aufzunehmen.
Diese Lücke tritt gelegentlich auf, wenn neue Modelle in Foundry veröffentlicht werden, bevor die Kontingent-Workflows aktualisiert sind.
Infolgedessen:
GPT-5.1 wird nicht in der Dropdown-Liste für Kontingentanfragen angezeigt.
Kunden können derzeit keine Standardanfrage zur Kontingenterhöhung für dieses Modell stellen.
Dies ist das erwartete Verhalten und kein Konfigurationsproblem Ihrerseits.
GPT-5.1 verwendet ein anderes Skalierungsmodell.
Modelle der GPT-5-Familie nutzen das neue globale automatische Skalierungssystem von Azure anstelle von strikten, festen Kontingenten. Dies umfasst:
Weiche Kontingentdurchsetzung
Automatische Skalierungsdrosselung basierend auf der regionalen Kapazität
Mandantenweite Glättung anstelle von modellbezogenen Obergrenzen
Die in der Dokumentation angegebenen Höchstgrenzen stellen die maximale Kapazität dar, nicht automatisch gewährte Kontingente.
Azure führt derzeit eine einheitliche Kontingentverwaltung für die GPT-5-Familie ein. Bis zum Abschluss dieser Arbeiten sind manuelle Kontingenterhöhungen für GPT-5.1 über das Standardformular nicht möglich.
Was Sie jetzt tun können:
- Erstellen Sie ein Support-Ticket (derzeit der einzige unterstützte Weg).
Bitte erstellen Sie ein Ticket unter:
Dienst: Azure AI Foundry
Problemtyp: Kontingente und Limits
Untertyp: Tokenlimit / Anforderung höherer TPM/RPM-Werte
Bitte geben Sie Folgendes an:
Ihre Abonnement-ID
Region
Modellname: GPT-5.1 (Globaler Standard)
Die benötigten TPM/RPM-Werte
Hinweis: GPT-5.1 wird im Kontingentanforderungsformular nicht angezeigt.
Der Support leitet Ihr Anliegen an das Azure OpenAI-Kapazitätsteam weiter. Dies ist der aktuell für GPT-5.1 erforderliche Workflow.
Den Azure-Entwicklungsteams ist diese Lücke im Portal bereits bekannt.
- Wenn Sie für den Produktivbetrieb eine vorhersehbare und stabile Skalierung benötigen
Wenn Ihre Workload eine konsistente, ungedrosselte Leistung erfordert, können Sie Folgendes anfordern:
Reservierung von Data Zone Standard-Kapazität für GPT-5.1
Geben Sie im Ticket Folgendes an:
„Wir benötigen eine PTU-Kapazitätsreservierung für GPT-5.1 unter Data Zone Standard.“
Diese Option bietet garantierten Durchsatz und vermeidet eine Drosselung bei regionaler Spitzenlast.
Warum Kontingenterhöhungen manchmal widerrufen werden
Kontingenterhöhungen können reduziert oder neu verteilt werden, wenn:
Die reservierte Kapazität nicht konsistent genutzt wird.
Die regionale Nachfrage nach gemeinsam genutzter Kapazität stark ansteigt.
Azure eine Kapazitätsverteilung zwischen Mandanten durchführt.
Dies ist ein Plattformverhalten und steht nicht im Zusammenhang mit Missbrauch durch einen bestimmten Kunden. Die Verwendung von Data Zone Standard-Kapazität verhindert dies.
Weitere Informationen finden Sie hier.
Microsoft foundary - Dokumentation
Azure OpenAI in Microsoft Foundry Models Kontingente und Grenzwerte
Ich hoffe, das hilft Ihnen weiter. Bei weiteren Fragen stehe ich Ihnen gerne zur Verfügung.
Vielen Dank!