Partilhar via


Agrupamento de Failover no Windows Server e no ambiente local do Azure

A clusterização de failover é uma estratégia poderosa para garantir alta disponibilidade e operações ininterruptas em ambientes críticos. Envolve uma configuração de computadores independentes, conhecidos como nós, que trabalham juntos para melhorar a disponibilidade e a escalabilidade de aplicativos e serviços, agora conhecidos como funções clusterizadas. Esses nós são interconectados através de cabeamento físico e software.

Se ocorrer uma falha em um ou mais nós, os nós restantes assumirão automaticamente a carga de trabalho, um processo chamado failover, minimizando interrupções. Além disso, a integridade das funções clusterizadas é monitorada continuamente. Se algum problema for detetado, as funções serão reiniciadas ou migradas para outro nó para manter a operação perfeita. Essa abordagem proativa garante que os serviços permaneçam consistentemente disponíveis, mesmo se ocorrerem falhas de hardware ou software.

A rede é um papel crucial em clusters de failover, permitindo uma comunicação confiável e uma troca de dados eficiente entre nós de cluster e com clientes externos. Os clusters geralmente empregam redes privadas dedicadas para funções internas, como sinais de batimento e gestão do cluster, enquanto redes públicas separadas gerem o acesso dos clientes e os dados das aplicações. Essa separação de rede melhora o desempenho e a segurança, isolando o tráfego crítico do cluster de interrupções externas. Ele também aumenta a tolerância a falhas, garantindo que as operações internas do cluster permaneçam ininterruptas e que as conexões do cliente mantenham alta disponibilidade durante eventos de failover.

A integridade do cluster é monitorada continuamente através de sinais de batimento cardíaco, que ajudam a detetar quaisquer problemas. Se surgir um problema, o sistema pode iniciar automaticamente um failover para manter a continuidade do serviço. Para proteger dados confidenciais e atender aos padrões organizacionais, os clusters de failover incorporam medidas de segurança robustas, como criptografia, para proteger os dados em trânsito e em repouso. Eles também usam controle de acesso granular para gerenciar permissões e direitos de acesso de forma eficaz.

Para saber mais sobre clustering de failover no Azure Local, consulte Entenda o quórum de clusters e pools.

Configuração de failover ativo e passivo

Os clusters de failover podem ser configurados em duas configurações primárias, ativo-ativo e ativo-passivo. Cada configuração tem os seus próprios compromissos, com o ativo-ativo focando no desempenho e na eficiência de recursos, enquanto o ativo-passivo enfatiza a simplicidade e a confiabilidade em cenários de falha. A escolha depende das necessidades organizacionais específicas e da criticidade dos aplicativos que estão sendo agrupados.

Configuration Operation
Active Em um cluster de failover ativo-ativo, todos os nós estão ativos e trabalham juntos simultaneamente para equilibrar a carga de trabalho no cluster. Essa configuração distribui tarefas, poder de processamento ou serviços entre todos os nós disponíveis, fazendo uso eficiente dos recursos. Veja como funciona:

  • Balanceamento de carga: Cada nó lida com uma parte da carga de trabalho total, melhorando o desempenho e garantindo que nenhum nó se torne um gargalo. Essa distribuição igualitária pode melhorar a capacidade de resposta e a taxa de transferência, já que vários nós estão atendendo às solicitações simultaneamente.
  • Utilização de recursos: Uma configuração ativo-ativo maximiza a utilização de recursos, uma vez que todos os nós estão operacionais e contribuindo para o desempenho do cluster. Essa configuração é ideal para ambientes onde maximizar os recursos disponíveis é fundamental.
  • Tolerância a falhas: Se um nó falhar, os nós restantes no cluster poderão continuar a lidar com a carga de trabalho. A perda de um nó pode reduzir temporariamente a capacidade geral, mas o sistema permanece operacional sem interrupções de serviço.
  • Passive Num cluster de failover ativo-passivo, alguns nós são designados como ativos, enquanto outros estão em espera, prontos para assumir o controlo se um nó ativo falhar. Veja como funciona:

  • Nós em espera: Os nós passivos estão essencialmente em um estado de "espera", não lidando com quaisquer tarefas ou serviços durante as operações normais. Esses nós estão preparados para assumir responsabilidades caso um nó ativo sofra uma falha.
  • Processo de failover: Quando uma falha é detetada, um nó em espera é ativado para assumir as responsabilidades do nó com falha. Isso envolve colocar rapidamente o nó passivo online para garantir a continuidade dos serviços.
  • Alocação de recursos: As configurações ativo-passivo podem não fazer pleno uso dos recursos de hardware disponíveis durante as operações normais, uma vez que os nós em espera permanecem ociosos. No entanto, essa configuração pode ser mais simples de gerenciar e pode garantir um desempenho previsível sob certas condições.
  • Simplicidade e fiabilidade: Uma configuração ativo-passiva pode ser vantajosa para aplicações onde a estabilidade e a previsibilidade são mais importantes do que maximizar a eficiência operacional. Muitas vezes, é mais fácil de implementar e manter em comparação com uma configuração ativa-ativa.
  • Funcionalidades de Clusterização de Tolerância a Falhas

    A clusterização de failover oferece um conjunto abrangente de funcionalidades projetadas para maximizar o tempo de atividade, garantir a integridade dos dados e simplificar a gestão de cargas de trabalho críticas. Esses recursos permitem que as organizações mantenham a continuidade do serviço, gerenciem recursos de forma eficiente e se recuperem rapidamente de falhas de hardware ou software. Algumas funcionalidades oferecidas pelo agrupamento de failover incluem:

    • Nós de cluster e quórum:

      Os nós de cluster colaboram para manter o que é conhecido como quórum, que é essencialmente o número mínimo de votos dos membros do cluster necessário para que o cluster funcione corretamente. Esse mecanismo evita cenários de cérebro dividido, onde partes divididas de um cluster podem tentar operar de forma independente, potencialmente causando inconsistências. Os modelos de quórum, como Maioria de Nós, Maioria de Nós e Disco, Maioria de Nós e Compartilhamento de Ficheiro e Nenhuma Maioria (Somente Disco), determinam como os votos são atribuídos e contados. Por exemplo, a Maioria de Nó atribui um voto a cada nó, enquanto a Maioria de Nó e a Maioria de Disco incorporam votos adicionais de um disco ou de um compartilhamento de arquivos.

    • Configuração de armazenamento:

      Um recurso notável dos clusters de failover é o Cluster Shared Volume (CSV), que permite que vários nós acessem o mesmo armazenamento simultaneamente, permitindo o gerenciamento e a coordenação suaves do disco sem perda de desempenho. Os CSVs são parte integrante das configurações de armazenamento em clusters de failover. Os CSVs facilitam o acesso eficiente ao disco, permitindo que os nós lidem com tarefas de armazenamento de forma colaborativa.

    • Monitorização e gestão proactivas:

      Os clusters de failover empregam sinais de pulsação como um meio de monitorar a integridade dos nós e suas funções. Esses sinais ajudam a detetar problemas como falhas de nó ou interrupções de serviço. Quando esses problemas são detetados, o sistema pode iniciar automaticamente os procedimentos de failover, garantindo a continuidade e minimizando o tempo de inatividade.

    • Segurança e conformidade:

      A segurança é um aspeto vital dos clusters de failover, incorporando recursos como criptografia e controle de acesso para proteger dados e operações de cluster. Os clusters ajudam as organizações a atender aos requisitos de conformidade para aplicativos críticos, garantindo o tratamento seguro de dados e o desempenho confiável do sistema. Isso os torna adequados para ambientes que exigem proteção de dados rigorosa e adesão à regulamentação.

    • Casos de uso:

      O agrupamento de failover tem várias aplicações práticas, incluindo a recuperação em caso de desastres, a distribuição de carga e a computação de alto desempenho. Ele suporta aplicativos críticos, fornecendo alta disponibilidade, permitindo que as empresas mantenham as operações mesmo em condições adversas. Por exemplo, em cenários de recuperação de desastres, os clusters podem restaurar rapidamente os serviços transferindo operações para nós não afetados.

      • O cluster de failover garante alta disponibilidade ou disponibilidade contínua para aplicações e serviços críticos (funções clusterizadas) executados em servidores físicos ou máquinas virtuais. Se ocorrer uma falha, essas funções podem ser rapidamente movidas ou reiniciadas em outro nó, minimizando o tempo de inatividade e mantendo um desempenho e redundância consistentes.

      • Aplicativos como o Microsoft SQL Server e Hyper-V máquinas virtuais se beneficiam do clustering de failover ao experimentar interrupções mínimas de serviço, mesmo durante falhas de hardware ou software.

    Recursos de Clustering de Tolerância a Falhas

    Esta tabela de recursos selecionados foi projetada para ajudá-lo a entender, planear, implementar e gerir de forma eficiente o agrupamento de failover.

    Understand Planning Deployment
    O que há de novo no Cluster de Failover Planeamento dos requisitos de hardware e das opções de armazenamento para clustering de failover Criando um cluster de contingência
    Servidor de arquivosScale-Out para dados de aplicativos Usar CSVs (Volumes Compartilhados de Cluster) Implantar um servidor de arquivos de dois nós
    Quórum de agrupamento e pool Usando clusters de máquinas virtuais convidadas com Storage Spaces Direct Preparar previamente objetos de cluster de computadores nos Serviços de Domínio Active Directory
    Reconhecimento de domínio de falha Configurando contas de cluster no Ative Directory
    Redes de cluster SMB multicanal e multi-NIC simplificadas Recuperar um cluster de failover sem quórum
    Balanceamento de carga de VM Implantar uma testemunha de quórum
    Conjuntos de clusters Atualizações contínuas do sistema operacional de cluster
    Afinidade de cluster Atualizando um cluster de failover no mesmo hardware
    Implantar um cluster desanexado do Ative Directory
    Manage Ferramentas e configurações Recursos da comunidade
    AtualizaçãoCluster-Aware Cmdlets PowerShell para Clusterização de Failover Fórum de Failover Cluster
    Serviço de Saúde Cmdlets do PowerShell de Atualização com Reconhecimento de Cluster Failover Clustering Blog
    Migração de domínio de cluster
    Solução de problemas usando o Relatório de Erros do Windows