Partilhar via


Pacote HPC da Microsoft

O Microsoft HPC Pack é uma solução HPC gratuita baseada no Microsoft Azure com tecnologias Windows Server e suporta uma vasta gama de cargas de trabalho HPC. Esta página articula os recursos e detalhes de configuração para a integração do HPC Pack com o Cyclecloud.

Limitações e versões suportadas

O Microsoft HPC Pack 2016 (com Atualização 3) e o Microsoft HPC Pack 2019 são suportados no CycleCloud com as limitações abaixo:

  • O cluster deve ser criado em um domínio do Ative Directory.
  • O cluster pode conter apenas um único nó principal.
  • A alta disponibilidade no nó principal ainda não é suportada.
  • A personalização da imagem da VM do nó principal não é suportada.
  • Os nós de computação do Linux ainda não são suportados.
  • O nó principal requer acesso à internet de saída para baixar o binário Nuget e o Python3.
  • A configuração CLI e cloud-init ainda não é suportada.

Pré-requisitos

Domínio do Active Directory

Atualmente, todos os nós do HPC Pack devem ser associados a um Active Directory Domain. Se você estiver implantando o cluster HPC Pack em uma rede virtual que tenha uma conexão VPN Site a Site ou ExpressRoute com sua rede corporativa, normalmente já há um Domínio Ative Directory existente. Se ainda não tiver um domínio do AD na sua rede virtual, pode optar por criar um novo domínio do AD promovendo o nó principal como controlador de domínio.

Azure Key Vault

O Microsoft HPC Pack requer um certificado PFX para proteger a comunicação dos nós e também requer credenciais de utilizador de domínio do AD para unir os nós ao domínio do AD. Embora você possa especificar diretamente um arquivo PFX, senha de proteção e senha de usuário no modelo, é altamente recomendável usar o Cofre de Chaves do Azure para lidar com o certificado e a senha do usuário. Consulte Criar um Certificado do Azure Key Vault.

O cluster também requer o nome de utilizador e a senha de uma conta de administrador do AD para unir os nós ao domínio à medida que são criados. É altamente recomendável usar o Azure Key Vault.

Identidade Gerenciada Atribuída ao Usuário do Azure

Para usar o Cofre da Chave do Azure para o certificado e as credenciais, você precisa criar uma Identidade Gerenciada Atribuída ao Usuário do Azure e conceder a permissão Get' para Secret e o Certificado do Cofre da Chave do Azure.

Você pode consultar este tutorial do Cofre da Chave para criar o Cofre da Chave e uma Identidade Gerenciada com acesso ao Cofre da Chave.

Recomendamos usar o Controle de Acesso Role-Based do Azure para atribuir permissões do Cofre da Chave à Identidade Gerenciada.

Funções do nó do Pacote HPC

Há três funções de nó diferentes no cluster do HPC Pack:

  • Nó principal: fornece os serviços de gestão de cluster e agendamento de tarefas. Atualmente, apenas um único nó principal com bancos de dados locais é suportado.
  • Nó do broker: recebe solicitações de um cliente SOA, distribui-as aos hosts de serviço nos nós de computação e, em seguida, coleta respostas e as envia de volta ao cliente. Os nós do corretor são criados na matriz de nós do broker. Você deve criar nós de corretor se quiser executar uma carga de trabalho SOA no cluster.
  • Nó de computação: Recebe e executa tarefas de cluster. Os nós de computação são criados na matriz de nós cn .

Criar um novo cluster HPC Pack

Você pode clicar no ícone Microsoft HPC Pack em Agendadores para criar um novo cluster Microsoft HPC Pack.

Na página Sobre , especifique um Nome de Cluster exclusivo para o cluster. Como ele é usado como o nome do computador NetBIOS do nó principal, verifique se ele é exclusivo no domínio do AD e está em conformidade com as convenções de nomenclatura.

Configurações básicas

  • Versão do HPC Pack: Você pode selecionar HPC Pack 2019 ou HPC Pack 2016 (com Atualização 3). Recomendamos que utilize a versão mais recente do HPC Pack, ou seja, o HPC Pack 2019.
  • Máquinas Virtuais: Você pode selecionar a Região do Azure onde deseja criar o cluster do HPC Pack e o Tipo de VM para cada função de nó de cluster. Você também pode especificar Num. Brokers para criar um ou mais nós Broker se quiser executar cargas de trabalho SOA no cluster.

Dimensionamento Automático

O cluster é iniciado sem nenhum nós de processamento. Você pode habilitar o Autoscale para aumentar / reduzir automaticamente os nós de computação dependendo das cargas de trabalho do cluster, você pode usar Max Cores para especificar o número máximo de núcleos vCPU de computação do cluster. O autoscaler é executado a cada minuto como uma Tarefa Agendada do Windows no nó principal.

Há duas opções de redução de escala para nós de computação: Desalocar ou Encerrar. Se escolher a opção Encerrar, o cluster do HPC Pack removerá sempre as VMs do nó de computação durante a redução de escala. Se você escolher a opção Desalocar , o cluster do HPC Pack deslocalizará as VMs do nó de computação em escala reduzida e as manterá por até um número configurável de dias (Dias de Retenção da VM). Os nós de computação desalocados não são removidos do cluster do HPC Pack, desde que ainda sejam mantidos. No entanto, eles são colocados offline e mostrados como inacessíveis no cluster HPC Pack. A opção Desalocar é recomendada para o cluster HPC Pack, pois pode reduzir significativamente o tempo de preparação do nó na expansão e você paga apenas pelo armazenamento em disco das VMs desalocadas.

Configurações de infraestrutura

  • Rede virtual: você pode selecionar uma rede virtual e uma sub-rede existentes na qual o cluster do HPC Pack é criado.
  • Active Directory Domain: se já houver um domínio do AD na sua rede virtual, especifique o Nome de Domínio completo e o Caminho da UO no qual os nós do cluster estão aderidos. Ou selecione Novo Domínio do AD para criar um novo domínio do AD promovendo o nó principal como um controlador de domínio.
  • Segredos e Certificado: É altamente recomendável que você selecione Usar KeyVault para usar o Cofre de Chaves do Azure para passar o certificado de comunicação do nó e a senha do usuário. Em Identidade MSI, selecione Identidade Atribuída ao Usuário do Azure que você criou em Pré-requisitos na lista suspensa e especifique o Nome do Cofre da Chave do Azure criado em Pré-requisitos.
  • Credenciais do usuário: em Nome de usuário, especifique o nome de usuário do domínio. Em Segredo de Senha, especifique o nome secreto do Cofre de Chaves do Azure que você criou em Pré-requisitos para armazenar a senha de usuário do domínio.
  • Certificado PFX: em Nome do Certificado, especifique o nome do Certificado do Cofre da Chave do Azure criado em Pré-requisitos.

Configurações avançadas

  • Configurações do Azure: selecione as Credenciais da nuvem do Azure na lista suspensa.
  • Software de cluster: especifique o sistema operativo (SO) para cada função de nó de cluster.
  • Rede avançada: Por padrão, os servidores DNS configurados na rede virtual são aplicados a todos os nós HPC, você pode, opcionalmente, especificar o servidor DNS se quiser usar um servidor DNS diferente. Opcionalmente, você também pode selecionar IP público HN para atribuir um endereço IP público para o nó principal.

CLI azhpcpack

A CLI azhpcpack.ps1 é a interface principal para todo o comportamento de escalonamento automático (chamadas de Tarefas Agendadas azhpcpack.ps1 autoscale). A CLI está disponível em C:\cycle\hpcpack-autoscaler\bin)

CLI pode ser usada para diagnosticar problemas com o dimensionamento automático ou para controlar manualmente o dimensionamento do cluster de dentro do Nodo Principal.

Comando Descrição
dimensionamento automático Processo de dimensionamento automático de ponta a ponta, incluindo criação, exclusão e junção de nós.
baldes Imprime informações do bucket em escala automática, como limites, etc.,
Configurações Grava a configuração de escala automática efetiva, após qualquer pré-processamento, no stdout
create_nodes Crie um conjunto de nós dadas as várias restrições. Uma versão CLI da interface nodemanager.
default_output_columns (colunas_de_saída_padrão) Indique quais são as colunas de saída padrão para um comando opcional.
delete_nodes Exclua o nó e remova do cluster.
initconfig Cria uma configuração inicial de escala automática. Escreve para stdout.
limites Grava um conjunto detalhado de limites para cada balde. O padrão é json devido ao número de campos.
nós Nodos de consulta.
atualizar_autocompletar Atualiza as informações autocompletadas localmente para recursos e nós específicos do cluster.
repetir_nós_falhados Tenta reiniciar todos os nós que estão em estado de falha.
validar_restrição Valida e depois produz em JSON uma ou mais restrições.