Compartilhar via


Confiabilidade no Registro de Dispositivos do Azure

O Registro de Dispositivos do Azure armazena informações sobre ativos e dispositivos na nuvem. O Registro de Dispositivos do Azure projeta ativos como recursos do Azure na nuvem em um único registro. O registro único é uma fonte de verdade para metadados de dispositivo e ativo e recursos de gerenciamento de ativos. O Registro de Dispositivos pode ser usado em conjunto com as Operações de IoT do Azure.

Este artigo descreve o suporte à confiabilidade noRegistro de Dispositivo do Azure. Ele abrange a resiliência intra-regional com zonas de disponibilidade e informações sobre implantações em várias regiões.

Quando você usa o Azure, a confiabilidade é uma responsabilidade compartilhada. A Microsoft fornece uma variedade de recursos para dar suporte à resiliência e recuperação. Você é responsável por entender como esses recursos funcionam em todos os serviços que você usa e selecionar os recursos necessários para atender aos seus objetivos de negócios e metas de tempo de atividade.

Note

As Operações de IoT do Azure incluem vários outros componentes além do Registro de Dispositivo. Para obter informações detalhadas sobre a alta disponibilidade e os recursos de perda de dados zero dos componentes de Operações do Azure IoT, consulte Perguntas frequentes sobre Operações do Azure IoT.

Falhas transitórias

Falhas transitórias são falhas curtas e intermitentes nos componentes. Elas ocorrem com frequência em um ambiente distribuído, como a nuvem, e são uma parte normal das operações. Falhas transitórias se corrigem após um curto período de tempo. É importante que seus aplicativos possam lidar com falhas transitórias, geralmente repetindo solicitações afetadas.

Todos os aplicativos hospedados na nuvem devem seguir as diretrizes transitórias de tratamento de falhas do Azure quando eles se comunicam com qualquer APIs, bancos de dados e outros componentes hospedados na nuvem. Para obter mais informações, confira Recomendações para tratamento de falhas transitórias.

Os clientes interagem com o Registro de Dispositivos usando o Azure Resource Manager. Normalmente, você usa o portal do Azure, a CLI do Azure ou os SDKs do Azure para interagir com os recursos do Registro de Dispositivos e essas ferramentas fornecem tratamento automático de falhas transitórias. Se você usar as APIs do Resource Manager diretamente, certifique-se de lidar com falhas transitórias.

Suporte à zona de disponibilidade

As zonas de disponibilidade são grupos fisicamente separados de datacenters em cada região do Azure. Quando uma zona falha, os serviços podem passar para uma das zonas restantes.

O Registro de Dispositivos do Azure é com redundância de zona por padrão, o que significa que ele replica automaticamente seus dados em várias zonas de disponibilidade. Essa configuração aprimora a resiliência do serviço fornecendo alta disponibilidade. Se houver uma falha em uma zona, o serviço poderá continuar operando diretamente de outra zona.

A Microsoft gerencia a configuração e a configuração para redundância de zona no Registro de Dispositivos do Azure. Você não precisa executar mais nenhuma configuração para habilitar essa redundância de zona. A Microsoft garante que o serviço esteja configurado para fornecer o nível mais alto de disponibilidade e confiabilidade.

Regiões com suporte

A lista de regiões a seguir dá suporte a zonas de disponibilidade no Registro de Dispositivos do Azure:

Américas Europa
Leste dos EUA Centro-oeste da Alemanha
Leste dos EUA 2 Europa Setentrional
Oeste dos EUA Oeste da Europa
Oeste dos EUA 2
Oeste dos EUA 3

Cost

Não há custo adicional para usar a redundância de zona para o Registro de Dispositivos do Azure.

Configurar o suporte à zona de disponibilidade

Novos recursos: quando você cria um recurso do Registro de Dispositivos do Azure nas Operações do Azure IoT, ele inclui automaticamente a redundância de zona por padrão. Não é necessário executar mais nenhuma configuração.

Operações normais

As informações a seguir descrevem o que acontece quando você tem um registro de dispositivo com redundância de zona e todas as zonas de disponibilidade estão operacionais:

  • Roteamento de tráfego entre zonas: As solicitações são distribuídas automaticamente em cada zona de disponibilidade. Uma solicitação pode ir para uma instância do Registro de Dispositivo em qualquer zona de disponibilidade.

  • Replicação de dados entre zonas: Os dados do dispositivo são replicados de forma síncrona entre zonas de disponibilidade.

Experiência de redução de atividade na zona

As informações a seguir descrevem o que ocorre quando você possui um registro de dispositivos com redundância zonal e uma zona de disponibilidade sofre uma interrupção.

  • Detecção e resposta: como o Registro de Dispositivos do Azure detecta e responde automaticamente a falhas em uma zona de disponibilidade, você não precisa fazer nada para iniciar um failover de zona de disponibilidade.
  • Solicitações ativas: Algumas solicitações ativas podem ser descartadas e, portanto, podem precisar ser repetidas da mesma forma que outras falhas transitórias. Para garantir que seu aplicativo seja resiliente a falhas transitórias, consulte as diretrizes transitórias de tratamento de falhas.

  • Perda de dados esperada: Não é esperado que uma falha de zona cause perda de dados.

  • Tempo de inatividade esperado: Não é esperado que uma falha de zona cause tempo de inatividade para seus recursos.

Recuperação de zona

Quando a zona de disponibilidade é recuperada, o Registro de Dispositivos do Azure restaura automaticamente as operações na zona de disponibilidade.

Teste de falhas de zona

A plataforma do Registro de Dispositivo do Azure gerencia o roteamento de tráfego, o failover e o failback entre zonas de disponibilidade. Você não precisa iniciar nada. Como esse recurso é totalmente gerenciado, você não precisa validar os processos de falha da zona de disponibilidade.

Suporte para várias regiões

O Registro de Dispositivo é um serviço de região única. Se a região ficar indisponível, os recursos do Registro de Dispositivo também ficarão indisponíveis.

No entanto, os dados do seu registro são replicados para a região emparelhada. No caso de uma interrupção prolongada da região, a Microsoft pode optar por fazer failover para a região emparelhada. Se isso acontecer, o registro continuará disponível na região emparelhada.

Suporte de regiões

Há suporte para replicação e failover padrão em todas as regiões em que o Registro de Dispositivo está disponível, pois todas essas regiões estão emparelhadas.

Cost

Não há custo adicional para replicação ou failover de dados entre regiões.

Configurar a replicação e preparar-se para failover

Por padrão, a replicação de dados entre regiões é configurada automaticamente ao criar recursos do Registro de Dispositivo em uma região com um par. Esse processo é uma opção padrão e não requer nenhuma intervenção de você.

Operações normais

Esta seção descreve o que se deve esperar quando um registro de dispositivo é configurado para replicação e failover entre regiões, estando a região primária operacional.

  • Replicação de dados entre regiões: Os dados são replicados automaticamente para a região emparelhada. A replicação ocorre de forma assíncrona, o que significa que alguma perda de dados é esperada se ocorrer um failover.

  • Roteamento de tráfego entre regiões: Em operações normais, o tráfego flui apenas para a região primária.

Experiência de região inoperante

Esta seção descreve o que esperar quando um registro de dispositivo é configurado para replicação e failover entre regiões e há uma interrupção na região primária.

  • Detecção e resposta: A Microsoft pode decidir executar um failover se a região primária for perdida. Esse processo pode levar várias horas após a perda da região primária ou até mais tempo em alguns cenários. O failover dos recursos do Registro de Dispositivos pode não ocorrer ao mesmo tempo que outros serviços do Azure.

  • Notificação: Os eventos de falha de região podem ser monitorados por meio da Integridade do Serviço do Azure. Configure alertas para receber notificações de problemas no nível da região.

  • Solicitações ativas: As solicitações que a região primária está processando durante um failover provavelmente serão perdidas. Os clientes devem repetir as solicitações após a conclusão do failover.

  • Perda de dados esperada: Os dados são replicados de forma assíncrona para a região emparelhada. Como resultado, algumas perdas de dados são esperadas após o failover. Você pode esperar menos de 15 minutos de perda de dados após um failover de região.

  • Tempo de inatividade esperado: Espere aproximadamente 24 horas de tempo de inatividade desde quando a região é perdida até quando o recurso está disponível na região emparelhada.

  • Redirecionamento de tráfego: Durante o processo de failover, o Registro de Dispositivo atualiza registros DNS para apontar para a região emparelhada. Todas as solicitações subsequentes são enviadas para a região associada.

    Após a conclusão da operação de failover do registro, espera-se que todas as operações do dispositivo e dos aplicativos de back-end continuem funcionando sem a necessidade de intervenção manual.

Recuperação de região

Quando a região primária se recupera, o Registro de Dispositivos do Azure restaura automaticamente as operações na região.

Teste de falhas na região

A plataforma de Registro de Dispositivos do Azure gerencia o roteamento de tráfego, o failover e o failback em regiões emparelhadas. Você não precisa iniciar nada. Como esse recurso é totalmente gerenciado, você não precisa validar processos de falha de região emparelhados.