次の方法で共有


Model Serving の制限とリージョン

この記事では、Mosaic AI Model Serving の制限および利用可能なリージョンと、サポートされるエンドポイントの種類についてまとめます。

リソースとペイロードの制限

Mosaic AI Model Serving では、信頼性の高いパフォーマンスを確保するために既定の制限事項が適用されます。 これらの制限に関するフィードバックがある場合は、Databricks アカウント チームにお問い合わせください。

次の表は、モデル提供エンドポイントのリソースとペイロードの制限事項をまとめたものです。

特徴量 粒度 制限
ペイロードのサイズ リクエストに応じて 16 MB。 基盤モデル、外部モデル、または AI エージェント サービスを提供するエンドポイントの場合、制限は 4 MB です。
要求/応答サイズ リクエストに応じて 1 MB を超える要求/応答はログに記録されません。
1秒あたりのクエリ数 (QPS) ワークスペースごと 200. QPS を上げるには、 ルートの最適化を有効にします。
モデルの実行時間 リクエストに応じて 297 秒
CPU エンドポイント モデルのメモリ使用量 エンドポイントあたり 4 GB
GPU エンドポイント モデルのメモリ使用量 エンドポイントあたり 割り当てられた GPU メモリ以上 (GPU ワークロードのサイズによって異なります)
プロビジョニング済みのコンカレンシー モデルごとおよびワークスペースごと 200 個のコンカレンシー。 Databricks アカウント チームに問い合わせて増やすことができます。
オーバーヘッド待機時間 リクエストに応じて 50 ミリ秒未満
init スクリプト init スクリプトはサポートされていません。
Foundation Model API のレート制限 ワークスペースごと トークンごとの支払いおよびプロビジョニングされたスループット制限の詳細については、 Foundation Model API のレート 制限とクォータに関する記事を参照してください。

ネットワークとセキュリティの制限事項

  • Model Serving エンドポイントは、アクセス制御によって保護され、IP 許可リストや PrivateLink など、ワークスペース上に構成されたネットワーク関連のイングレス ルールを尊重します。
  • プライベート接続 (Azure Private Link など) は、プロビジョニングされたスループットを使用するエンドポイントまたはカスタム モデルにサービスを提供するエンドポイントを提供するモデルでのみサポートされます。
  • 既定では、Model Serving は外部エンドポイント (Azure OpenAI など) への Private Link をサポートしていません。 この機能のサポートは、リージョンごとに評価および実装されます。 詳細については、Azure Databricks アカウント チームにお問い合わせください。
  • 運用環境のデプロイが不安定になるリスクがあるため、Model Serving では、既存のモデル イメージにセキュリティ パッチが提供されません。 最新のパッチは、新しいモデル バージョンから作成された新しいモデル イメージに含まれています。 詳細については、Databricks アカウント チームにお問い合わせください。

コンプライアンス セキュリティ プロファイル標準: CPU ワークロード

次の表に、CPU ワークロードの主要なモデル サービス機能でサポートされているコンプライアンス セキュリティ プロファイルのコンプライアンス標準を示します。

これらのコンプライアンス標準では、最新の 30 日以内に提供されたコンテナーを構築する必要があります。 Databricks は、ユーザーに代わって古いコンテナーを自動的に再構築します。 ただし、この自動ジョブが失敗した場合は、次のようなイベント ログ メッセージが表示され、エンドポイントがコンプライアンス要件内に収まるようにする方法に関するガイダンスが提供されます。

"Databricks couldn't complete a scheduled compliance check for model $servedModelName. This can happen if the system can't apply a required update. To resolve, try relogging your model. If the issue persists, contact support@databricks.com."

リージョン ロケーション HIPAA HITRUST(ヒートラスト) PCI-DSS IRAP CCCS ミディアム (Protected B) 英国 Cyber Essentials Plus
australiacentral オーストラリア中部            
australiacentral2 AustraliaCentral2            
australiaeast オーストラリア東部      
australiasoutheast オーストラリア南東部            
brazilsouth ブラジル南部      
canadacentral カナダ中部      
canadaeast カナダ東部            
centralindia CentralIndia      
centralus セントラルUS      
chinaeast2 ChinaEast2            
chinaeast3 ChinaEast3            
chinanorth2 ChinaNorth2            
chinanorth3 ChinaNorth3            
eastasia EastAsia      
eastus イーストUS      
eastus2 EastUS2      
francecentral FranceCentral      
germanywestcentral ドイツ中西部      
japaneast JapanEast      
japanwest JapanWest            
koreacentral KoreaCentral      
mexicocentral MexicoCentral            
northcentralus NorthCentralUS      
northeurope NorthEurope      
norwayeast ノルウェー東部            
qatarcentral カタールセントラル            
southafricanorth 南アフリカ北部            
southcentralus SouthCentralUS      
southeastasia 東南アジア      
southindia 南インド            
swedencentral スウェーデンセントラル      
switzerlandnorth スイス北部      
switzerlandwest スイス西部            
uaenorth UAENorth      
uksouth UKSouth    
ukwest UKWest            
westcentralus WestCentralUS            
westeurope 西ヨーロッパ      
westindia WestIndia            
westus WestUS      
westus2 WestUS2      
westus3 WestUS3      

Foundation Model API の制限

Foundation Model API の詳細については、以下を参照してください。

利用可能なリージョン

サポートされていないリージョンにエンドポイントが必要な場合は、Azure Databricks アカウントチームにお問い合わせください。

ワークスペースがモデルサービスをサポートするリージョンにデプロイされているが、サポートされていないリージョンの コントロール プレーンによって提供されている場合 ワークスペースはモデルサービスをサポートしません。 このようなワークスペースでサービスを提供するモデルを使用しようとすると、ワークスペースがサポートされていないことを示すエラー メッセージが表示されます。 詳細については、Azure Databricks アカウント チームにお問い合わせください。

各モデル サービス機能のリージョン別の可用性の詳細については、「 モデル サービス機能の可用性」を参照してください。

Databricks でホストされる基盤モデルのリージョンの可用性については、 Databricks でホストされている Foundation モデルを参照してください。