Compartilhar via


Princípios de design de confiabilidade

Uma carga de trabalho confiável deve ser resiliente para que possa detectar e se recuperar de interrupções e mau funcionamento e fornecer funcionalidade de forma consistente. Ele deve ser capaz de se recuperar de falhas dentro de um prazo razoável. Ele também deve estar disponível para que os usuários possam acessar a carga de trabalho de forma consistente e confiável durante o prazo acordado e no nível de qualidade acordado.

Use os seguintes princípios de design do Microsoft Azure Well-Architected Framework para ajudar a garantir a confiabilidade durante todo o ciclo de vida. Comece com as melhores práticas recomendadas e justifique os benefícios de cada princípio de confiabilidade. Depois de definir sua estratégia, use a Lista de verificação de confiabilidade como seu próximo passo.

Se você não aplicar esses princípios ao seu design, a carga de trabalho provavelmente não estará preparada para prever ou lidar com problemas na produção. O resultado pode ser interrupções no serviço que levam a perdas financeiras. Para cargas de trabalho críticas, não aplicar esses princípios pode comprometer a segurança.

Design para requisitos de negócios

Ícone de meta Colete e entenda as necessidades do negócio com foco no uso esperado da carga de trabalho.

Os requisitos devem incluir a experiência do usuário, fluxos de trabalho, dados e recursos específicos da carga de trabalho. As metas devem ser realistas e acordadas com todas as partes interessadas, com base em um orçamento determinado. Os requisitos devem definir claramente as expectativas da equipe e das partes interessadas. Documentar requisitos para orientar escolhas de tecnologia, implementações e operações.

Saiba mais sobre como projetar para requisitos de negócios no Azure Well-Architected Framework.

Design para resiliência

Ícone de meta A carga de trabalho deve responder a falhas e continuar a operar com funcionalidade total ou reduzida.

Projete sua carga de trabalho para conseguir identificar falhas e interrupções de componentes. Torne o sistema resiliente para que ele possa tolerar falhas e lidar com elas sem problemas. Informe os usuários sobre o estado do sistema e defina as expectativas de quais componentes não estão disponíveis e quanto tempo a recuperação esperada levará.

Saiba mais sobre como projetar para resiliência no Azure Well-Architected Framework.

Design para recuperação

Ícone de meta A carga de trabalho deve ser capaz de se recuperar de falhas com interrupção mínima da experiência do usuário e dos objetivos de negócios.

Implemente planos de recuperação estruturados, testados e documentados que levem a uma recuperação rápida. Garanta que suas equipes de suporte e operações tenham acesso a esses planos e que exercícios de recuperação sejam realizados com frequência para evitar bagunça e caos durante uma interrupção real.

Saiba mais sobre design para recuperação no Azure Well-Architected Framework.

Design para operações

Ícone de meta A carga de trabalho deve ser observável, e as equipes de desenvolvimento devem ser capazes de aprender com as falhas.

Incorpore o monitoramento à sua carga de trabalho para que as equipes de desenvolvimento e suporte tenham dados suficientes para analisar quando, por que e qual componente está falhando. Crie alertas significativos para notificar as equipes de suporte quando ocorrer uma falha. Use análises e insights para impulsionar melhorias.

Saiba mais sobre como projetar para operações no Azure Well-Architected Framework.

Manter simples

Ícone de meta Evite complicar demais o design da arquitetura, o código do aplicativo e as operações.

Concentre-se nos requisitos de negócios e remova recursos e componentes que não sejam necessários. Estabeleça padrões para desenvolvimento e implantação que aumentem a consistência. Aproveite os recursos fornecidos pela plataforma e os ativos pré-criados para minimizar o tempo de desenvolvimento.

Saiba mais sobre como manter a simplicidade no Azure Well-Architected Framework. ...

Próximas etapas