Compartilhar via


Adicionar um modelo que fornece um recurso de ponto de extremidade a um aplicativo do Databricks

Adicione o modelo que serve pontos de extremidade como recursos do Databricks Apps para que seu aplicativo possa consultar modelos de machine learning para inferência. Os endpoints de atendimento de modelo gerenciam previsões de modelos e fornecem uma interface consistente para acessar modelos implantados.

Adicionar um recurso de ponto de extremidade de serviço de modelo

Antes de adicionar um endpoint de serviço de modelo como recurso, confira os pré-requisitos de recurso do aplicativo.

  1. Ao criar ou editar um aplicativo, navegue até a etapa Configurar.
  2. Na seção Recursos do aplicativo, clique em + Adicionar recurso.
  3. Selecione Servir ponto de extremidade como o tipo de recurso.
  4. Escolha um ponto de extremidade de serviço de modelo entre os pontos de extremidade disponíveis em seu espaço de trabalho.
  5. Selecione o nível de permissão apropriado para seu aplicativo:
    • Pode exibir: Exiba metadados de ponto de extremidade, incluindo nomes de modelo, versões e configuração de carga de trabalho. Não é possível enviar solicitações de inferência.
    • Pode consultar: Enviar solicitações de inferência e exibir metadados. Use isso para a maioria dos aplicativos que precisam de previsões de modelo.
    • Pode gerenciar: Controle administrativo completo, incluindo exibição, edição, consulta, exclusão e gerenciamento de permissões.
  6. (Opcional) Especifique uma chave de recurso personalizada, que é como você faz referência ao ponto de extremidade de serviço do modelo na configuração do aplicativo. A chave padrão é serving-endpoint.

Observação

O endpoint de serviço do modelo deve estar em um READY estado para processar solicitações de inferência do seu aplicativo.

Variáveis de ambiente

Quando você implanta um aplicativo com um modelo que atende ao recurso de ponto de extremidade, o Azure Databricks expõe o nome do ponto de extremidade de serviço por meio de variáveis de ambiente que você pode referenciar usando o valueFrom campo.

Por exemplo:

SERVING_ENDPOINT=<your-serving-endpoint-name>

Para obter mais informações, consulte Usar variáveis de ambiente para acessar recursos.

Remover um recurso de ponto de entrega de modelo

Quando você remove um modelo que atende o recurso de ponto de extremidade de um aplicativo, a entidade de serviço do aplicativo perde o acesso ao ponto de extremidade. O modelo que serve o ponto de extremidade em si permanece inalterado e continua disponível para outros usuários e aplicativos que têm permissões apropriadas.

Práticas recomendadas

Considere o seguinte quando você trabalha com o modelo que fornece recursos de ponto de extremidade:

  • Conceda permissões mínimas. Use Can view para o menor acesso ou Can query para a maioria dos aplicativos que precisam enviar solicitações de inferência, a menos que seu aplicativo precise executar tarefas administrativas especificamente no ponto de extremidade.
  • Evite consultas de longa execução quando possível, pois as solicitações de inferência podem expirar.
  • Verifique o status do ponto de extremidade antes de enviar solicitações. Os endpoints devem estar no estado READY para processar consultas.
  • Considere limitar a taxa de solicitações de inferência para evitar sobrecarregar o ponto final, especialmente durante períodos de alto tráfego.