Este artigo responde a perguntas frequentes sobre o banco de dados do Azure Cosmos DB espelhado no Microsoft Fabric.
Importante
O espelhamento para o Azure Cosmos DB está atualmente em versão prévia. Não há suporte para cargas de trabalho de produção durante a visualização. Atualmente, há suporte apenas para contas do Azure Cosmos DB para NoSQL.
Perguntas gerais
Como o espelhamento é diferente dos atalhos em relação ao Azure Cosmos DB?
O espelhamento replica o banco de dados de origem no Fabric OneLake no formato delta de software livre. Você pode executar análises nesses dados de qualquer lugar no Fabric. Os atalhos não replicam os dados no Fabric OneLake. Em vez disso, os atalhos vinculam-se aos dados de origem sem movimentação de dados. Atualmente, o Azure Cosmos DB só está disponível como uma fonte para espelhamento.
O espelhamento afeta o desempenho do banco de dados do Azure Cosmos DB de origem?
Não, o espelhamento não afeta o desempenho ou o custo do banco de dados de origem. O espelhamento requer que o recurso de backup contínuo seja habilitado na conta do Azure Cosmos DB de origem. O backup contínuo habilita a replicação sem efeito nas cargas de trabalho transacionais.
Espelhar o Azure Cosmos DB é uma substituição funcional para trabalhos de cópia de pipeline no Fabric?
O espelhamento é uma replicação de baixa latência dos dados no Azure Cosmos DB. Ao contrário dos trabalhos de cópia, o espelhamento cria uma cópia contínua e incremental dos dados do Azure Cosmos DB. O espelhamento não afeta suas cargas de trabalho transacionais no banco de dados ou contêiner de origem.
Por outro lado, um trabalho de cópia é um trabalho agendado, que pode adicionar latência de ponta a ponta para trabalhos incrementais. Além disso, copie o gerenciamento de requisitos de trabalhos para obter alterações incrementais, adicione aos custos de computação no Fabric e afete o consumo de unidade de solicitação no banco de dados de origem no Azure Cosmos DB.
Os trabalhos de cópia são úteis para trabalhos de cópia únicos do Azure Cosmos DB, mas o espelhamento é ideal para acompanhar alterações incrementais.
A tentativa do recurso de espelhamento afeta minha conta do Azure Cosmos DB?
Não, você pode habilitar e desabilitar o espelhamento sem nenhum efeito em sua conta ou dados do Azure Cosmos DB de origem.
Aviso
Se você habilitar o backup contínuo em uma conta do Azure Cosmos DB para espelhamento no Fabric, o backup contínuo não poderá ser desabilitado. Da mesma forma, você não poderá desabilitar o repositório analítico para uma conta do Azure Cosmos DB se o backup contínuo estiver habilitado.
Pricing
Quais custos estão associados ao espelhamento do Azure Cosmos DB?
A computação de malha usada para replicar seus dados do Cosmos DB no Fabric OneLake é gratuita. O custo de armazenamento de espelhamento é gratuito até um limite com base na capacidade. Para obter mais informações, consulte Custo de espelhamento e Preços do Microsoft Fabric. A computação para consultar dados usando SQL, Power BI ou Spark é cobrada a taxas regulares.
Para o Azure Cosmos DB, o backup contínuo é um pré-requisito para espelhamento. Se você habilitou qualquer camada de backup contínua antes do espelhamento, não acumulará nenhum custo extra. Se você habilitar o backup contínuo especificamente para espelhamento, o modo de backup de 7 dias será gratuito; se você habilitar o backup de 30 dias, será cobrado o preço associado a esse recurso. Para obter mais informações, veja Preços do Azure Cosmos DB.
Se você usar o data explorer para exibir os dados de origem do Azure Cosmos DB, acumulará custos com base no uso de RU (Unidades de Solicitação).
Como as taxas de saída são tratadas para espelhar o Azure Cosmos DB?
As taxas de saída só serão cobradas se sua conta do Azure Cosmos DB estiver em uma região diferente da capacidade do Fabric. Espelhos de malha da região geograficamente mais próxima do Azure para a região de capacidade do Fabric em cenários em que uma conta do Azure Cosmos DB tem várias regiões de leitura. Para obter mais informações, consulte as limitações de replicação.
Link do Azure Synapse e repositório analítico
O espelhamento está usando o repositório analítico do Azure Cosmos DB?
Não, o espelhamento não usa o repositório analítico. O espelhamento não afeta suas cargas de trabalho transacionais ou o consumo de taxa de transferência.
No Azure Cosmos DB, o backup contínuo é um pré-requisito para espelhamento. Esse pré-requisito permite ao Fabric espelhar seus dados sem afetar suas cargas de trabalho transacionais ou exigir o repositório analítico.
O espelhamento está usando o Link do Azure Synapse para o Azure Cosmos DB?
Não, o espelhamento no Fabric não está relacionado ao Link do Azure Synapse.
No Azure Cosmos DB, o backup contínuo é um pré-requisito para espelhamento. Esse pré-requisito permite ao Fabric espelhar seus dados sem afetar suas cargas de trabalho transacionais ou exigir o repositório analítico.
O espelhamento afeta como o Link do Azure Synapse funciona com o Azure Cosmos DB?
Não, o espelhamento no Fabric não está relacionado ao Link do Azure Synapse. Você pode continuar a usar o Link do Azure Synapse ao usar o espelhamento do Fabric.
Posso continuar a usar o repositório analítico do Azure Cosmos DB como uma fonte CDC (captura de dados de alteração) no Azure Data Factory ao usar o espelhamento?
Sim, você pode usar o repositório analítico e o espelhamento do Fabric na mesma conta do Azure Cosmos DB. Esses recursos funcionam independentemente uns dos outros. O espelhamento não interfere no uso do repositório analítico.
Posso continuar a usar o feed de alterações do Azure Cosmos DB ao usar o espelhamento?
Sim, você pode usar o feed de alterações e o espelhamento do Fabric na mesma conta do Azure Cosmos DB. Esses recursos funcionam independentemente uns dos outros. O espelhamento não interfere no uso do feed de alterações.
Posso desabilitar o repositório analítico para minha conta do Azure Cosmos DB depois de usar o espelhamento?
O espelhamento requer o backup contínuo do Azure Cosmos DB como pré-requisito. Contas do Azure Cosmos DB com backup contínuo habilitado não podem desabilitar o repositório analítico. Depois de desabilitar o repositório analítico em qualquer coleção, você não poderá habilitar o backup contínuo. Essa limitação é temporária.
Com o espelhamento, você está substituindo o Link do Azure Synapse para o Azure Cosmos DB?
Não, o Link do Azure Synapse e o Azure Synapse Analytics ainda estão disponíveis para suas cargas de trabalho. Não há planos para preterir essas cargas de trabalho. Você pode continuar a usar o Link do Azure Synapse para suas cargas de trabalho de produção.
Conexões de dados e autenticação
Como gerenciar conexões de espelhamento para o Azure Cosmos DB?
No portal do Fabric, selecione as opções Gerenciar conexões e gateways na seção Configurações .
Quais métodos de autenticação têm permissão para contas do Azure Cosmos DB?
Há suporte apenas para chaves de conta de leitura/gravação e ID do Microsoft Entra.
Posso usar o logon único e o controle de acesso baseado em função como autenticação para espelhar o Azure Cosmos DB?
Sim. Para obter mais informações, consulte as limitações de segurança.
Posso usar identidades gerenciadas como autenticação para espelhar o Azure Cosmos DB?
Não, somente as chaves de conta de leitura/gravação e a ID do Microsoft Entra têm suporte no momento.
O que acontece se eu girar minhas chaves de conta do Azure Cosmos DB?
Você deve atualizar as credenciais de conexão para espelhamento do Fabric se as chaves da conta forem giradas. Se você não atualizar as chaves, o espelhamento falhará. Para resolver essa falha, interrompa a replicação, atualize as credenciais com as chaves recém-giradas e reinicie a replicação.
Configuração
Posso selecionar contêineres específicos em um banco de dados do Azure Cosmos DB para espelhamento?
Sim, quando você espelha um banco de dados do Azure Cosmos DB, pode escolher quais contêineres são replicados no Fabric OneLake. Você também pode reconfigurar os contêineres selecionados a qualquer momento para o item espelhado.
Posso usar o espelhamento para replicar um banco de dados do Azure Cosmos DB várias vezes?
Sim, vários espelhos são possíveis, mas desnecessários. Depois que os dados replicados estiverem no Fabric, eles poderão ser compartilhados com outros destinos diretamente do Fabric.
Posso criar atalhos para minha réplica de dados do Azure Cosmos DB que criei usando espelhamento?
Não, o espelhamento não dá suporte à criação de atalhos para fontes externas, como o Azure Data Lake Storage (ADLS) Gen2 ou o Serviço de Armazenamento Simples (S3) do Amazon Web Services (AWS).
Data explorer do Azure Cosmos DB
No Fabric, quando seleciono "Exibir" e "Banco de dados de origem" estou vendo dados no OneLake ou no Azure Cosmos DB?
A opção no Fabric para exibir o banco de dados de origem fornece uma exibição somente leitura dos dados dinâmicos no Azure Cosmos DB usando o data explorer. Essa perspectiva é uma exibição em tempo real dos contêineres que são a fonte dos dados replicados.
Essa exibição dos dados dinâmicos diretamente no portal do Fabric é uma ferramenta útil para determinar se os dados no OneLake são recentes ou representados corretamente quando comparados ao banco de dados do Azure Cosmos DB de origem. As operações que usam o data explorer nos dados dinâmicos do Azure Cosmos DB podem acumular o consumo de unidade de solicitação.
Análise de dados do Azure Cosmos DB
Como fazer para analisar os dados do Azure Cosmos DB espelhados no OneLake?
Use o portal do Fabric para criar uma nova consulta SQL no ponto de extremidade de análise do SQL. A partir daqui, você pode executar consultas comuns como SELECT TOP 100 * FROM ...
.
Além disso, use o Lakehouse para analisar os dados do OneLake com outros dados. No Lakehouse, você pode utilizar o Spark para consultar dados com notebooks.
Como os dados são sincronizados no espelhamento do Azure Cosmos DB?
A sincronização dos dados é totalmente gerenciada. Quando você habilita o espelhamento, os dados são replicados no Fabric OneLake quase em tempo real e o espelhamento replica continuamente novas alterações conforme elas ocorrem no banco de dados de origem.
O espelhamento do Azure Cosmos DB funciona nas regiões do Azure e do Fabric?
Há suporte para espelhamento entre regiões, mas esse cenário pode resultar em custos inesperados de saída de dados de rede e latência. O ideal é corresponder sua capacidade do Fabric a uma das regiões da sua conta do Azure Cosmos DB. Para obter mais informações, consulte as limitações de replicação.
Os dados espelhados do Azure Cosmos DB só estão disponíveis usando o ponto de extremidade de análise do SQL?
Você pode adicionar bancos de dados espelhados existentes como atalhos no Lakehouse. No Lakehouse, você pode explorar os dados diretamente, abrir os dados em um notebook para consultas do Spark ou criar modelos de machine learning.
Importante
O atalho no Lakehouse é um atalho para o banco de dados espelhado, a réplica onelake dos dados do Azure Cosmos DB. O atalho no Lakehouse não acessa diretamente a conta ou os dados do Azure Cosmos DB.
Quanto tempo leva a replicação inicial dos dados do Azure Cosmos DB?
A latência da replicação inicial e contínua varia de acordo com o volume de dados. Na maioria dos casos, a latência pode ser de alguns minutos, mas pode ser maior para grandes volumes de dados.
Quanto tempo leva para replicar operações de inserção, atualização e exclusão do Azure Cosmos DB?
Depois que os dados iniciais são replicados, as operações individuais são replicadas quase em tempo real. Em casos raros, pode haver um pequeno atraso se o banco de dados de origem tiver um alto volume de operações de atualização e exclusão em uma janela de tempo.
O espelhamento tem lógica de retirada interna com o Azure Cosmos DB?
Não, o espelhamento não tem lógica de retirada interna, pois a replicação é contínua e incremental.
O espelhamento dá suporte ao feed de dados de alteração do Azure Cosmos DB?
Não, atualmente, o espelhamento não dá suporte ao feed de dados de alteração em dados espelhados do Azure Cosmos DB.
O espelhamento dá suporte à arquitetura de medalhão para dados replicados do Azure Cosmos DB?
O espelhamento não tem suporte interno para a arquitetura de medalhão. Você pode configurar suas próprias camadas de prata e ouro com lógica de marca d'água e processamento para transformações e junções usando pipelines ou Spark.
Os relatórios do Power BI usam o modo de lago direto com dados espelhados do Azure Cosmos DB?
Sim.
O espelhamento do Azure Cosmos DB dá suporte a dados aninhados?
Sim, os dados aninhados são achatados no OneLake como uma cadeia de caracteres JSON. Use OPENJSON
, CROSS APPLY
e OUTER APPLY
para mesclar os dados para exibição. Para obter mais informações, consulte os dados aninhados. Para obter um tutorial passo a passo, confira como consultar dados aninhados.
O espelhamento do Azure Cosmos DB dá suporte ao nivelamento automático.
Não, o espelhamento não nivela automaticamente os dados aninhados. Os métodos estão disponíveis para que o ponto de extremidade de análise do SQL funcione com cadeias de caracteres JSON aninhadas. Para obter mais informações, consulte os dados aninhados.
Devo me preocupar com o desempenho de início frio com dados espelhados do Azure Cosmos DB?
Não, em geral, as consultas SQL no Fabric não experimentam latência de início frio.
O que acontece se eu excluir o banco de dados do Azure Cosmos DB de origem no Azure enquanto ele estiver sendo espelhado?
O Data Explorer e a replicação começam a falhar no Fabric. Os dados do OneLake permanecem as-is, até que você exclua os dados espelhados existentes.
Depois que o Azure Cosmos DB é espelhado, como faço para conectar o ponto de extremidade de análise do SQL a ferramentas ou aplicativos cliente?
Conectar-se ao ponto de extremidade de análise do SQL para dados espelhados é semelhante ao uso do mesmo ponto de extremidade para qualquer outro item no Fabric. Para obter mais informações, consulte conectar-se ao data warehousing no Fabric.
Como fazer para ingressar dados espelhados do Azure Cosmos DB em bancos de dados?
Espelhar cada banco de dados do Azure Cosmos DB de forma independente. Em seguida, adicione um dos pontos de extremidade de análise do SQL ao outro como um item de banco de dados espelhado. Em seguida, use uma consulta SQL JOIN
para executar consultas em contêineres em bancos de dados distintos do Azure Cosmos DB.
Como fazer para ingressar dados espelhados do Azure Cosmos DB com o Banco de Dados SQL do Azure ou dados snowflake?
Espelhar o banco de dados do Azure Cosmos DB. Em seguida, espelhar os dados do Banco de Dados SQL do Azure ou do Snowflake. Em seguida, adicione um dos pontos de extremidade de análise do SQL ao outro como um item de banco de dados espelhado. Agora, use uma consulta SQL JOIN
para executar consultas em vários serviços de dados.
Ações de replicação
Como posso parar ou desabilitar a replicação para um banco de dados espelhado do Azure Cosmos DB?
Pare a replicação usando a opção de replicação de parada do portal do Fabric. Essa ação interrompe completamente a replicação, mas não remove os dados que já existem no OneLake.
Como reiniciar a replicação para um banco de dados espelhado do Azure Cosmos DB?
A replicação não dá suporte aos conceitos de pausa ou retomada. Parar a replicação interrompe completamente a replicação e selecionar a replicação de reinicialização no portal do Fabric inicia a replicação totalmente do zero. Reiniciar a replicação substitui os dados do OneLake pelos dados mais recentes em vez de atualizá-los incrementalmente.
Como posso configurar a replicação para um banco de dados espelhado do Azure Cosmos DB?
O portal do Fabric contém uma opção para configurar opções de replicação específicas.
O que cada mensagem de status de replicação significa para dados replicados do Azure Cosmos DB?
Idealmente, você deseja que a replicação tenha um status de Execução. Se o status de replicação estiver em execução com aviso, a replicação será bem-sucedida, mas há um problema que você deve resolver. Um status de Parar, Parar, Falhar ou Erro indica estados mais graves que exigem intervenção antes que a replicação possa continuar. Para obter mais informações, consulte o espelhamento do Monitor Fabric.
TTL (vida útil analítica) ou exclusões temporárias
Os itens excluídos pelo recurso TTL (vida útil) do Azure Cosmos DB são removidos do banco de dados espelhado?
Sim, os dados excluídos usando TTL são tratados da mesma forma que os dados excluídos usando operações de exclusão no Azure Cosmos DB. Em seguida, os dados são excluídos do banco de dados espelhado. O espelhamento não distingue entre essas modalidades de exclusão.
Podemos configurar exclusões reversíveis para dados analíticos espelhados no Fabric do Azure Cosmos DB?
As operações de exclusão são replicadas imediatamente para o OneLake. No momento, não há como configurar exclusões temporárias ou TTL (vida útil analítica).
O espelhamento do Azure Cosmos DB dá suporte ao tempo de vida analítico?
Não há suporte para tempo de vida analítico.
Acessando dados do OneLake
Posso acessar arquivos OneLake gerados diretamente pelo espelhamento do Azure Cosmos DB?
Sim, você pode acessar arquivos OneLake diretamente usando os exploradores de arquivo ou armazenamento. Você também pode usar arquivos delta do OneLake no Databricks. Para obter mais informações, consulte acessar os dados do Fabric diretamente usando o Gerenciador de Arquivos do OneLake ou integrar o OneLake ao Azure Databricks.
Suporte de API
Posso configurar o espelhamento do Azure Cosmos DB programaticamente?
Sim, o suporte para configuração de espelhamento automatizado está disponível. Para saber mais sobre as APIs rest de espelhamento do Microsoft Fabric, visite a documentação aqui.
A CI/CD (integração ou implantação contínua) interna está disponível para espelhamento do Azure Cosmos DB?
Não, o suporte para CI/CD interno não está disponível no momento.
Segurança
Você pode acessar um banco de dados espelhado do Azure Cosmos DB usando o Gateway do Power BI ou atrás de um firewall?
Não, no momento, não há suporte para esse nível de acesso.
O espelhamento do Azure Cosmos DB dá suporte a pontos de extremidade privados?
Não, no momento, não há suporte para pontos de extremidade privados.
Os dados espelhados do Azure Cosmos DB já deixaram meu locatário do Fabric?
Não, os dados permanecem no locatário do Fabric.
Os dados espelhados do Azure Cosmos DB são armazenados fora do meu ambiente?
Não, os dados são preparados diretamente no OneLake do seu locatário e não são preparados fora do seu ambiente.
Licenciamento
Quais são as opções de licenciamento para espelhamento do Azure Cosmos DB?
O licenciamento de Capacidade de Avaliação, Capacidade do Power BI Premium ou Capacidade de Avaliação é necessário para usar espelhamento.
Qual licença é necessária para um usuário criar e configurar o espelhamento para dados do Azure Cosmos DB?
Para obter informações sobre licenciamento, consulte as licenças do Fabric.
Qual licença é necessária para um usuário consumir dados espelhados do Azure Cosmos DB?
Para obter informações sobre licenciamento, consulte as licenças do Fabric.