Compartilhar via


Configurar o Azure Cosmos DB para NoSQL em uma atividade de cópia

Este artigo descreve como usar a atividade de cópia em um pipeline para copiar dados de e para o Azure Cosmos DB para NoSQL.

Configuração com suporte

Para a configuração de cada guia sob a atividade de cópia, vá para as seções a seguir, respectivamente.

Geral

Consulte as diretrizes de Configurações Geraispara definir a guia Configurações Gerais.

Source

As propriedades a seguir têm suporte para o Azure Cosmos DB para NoSQL na guia Origem de uma atividade de cópia.

As três propriedades a seguir são necessárias:

  • Conexão: selecione uma conexão do Azure Cosmos DB para NoSQL na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB para NoSQL selecionando Nova.
  • Contêiner: selecione o contêiner que você deseja usar. Selecione Editar para inserir o nome do contêiner manualmente.

Em Avançado, você pode especificar os seguintes campos:

  • Usar consulta: você pode escolher Tabela ou Consulta como sua consulta de uso. A lista a seguir descreve a configuração de cada definição.

    • Tabela: Lê dados da tabela especificada na Tabela.

    • Consulta: especifica a consulta do Azure Cosmos DB para ler dados.

      Captura de tela mostrando a consulta.

  • Tamanho da página: o número de documentos por página do resultado da consulta. O padrão é "-1", o que significa usar o tamanho da página dinâmica do lado do servidor com limite de até 1000.

  • Detectar data e hora: se deve detectar data e hora dos valores de cadeia de caracteres nos documentos. Os valores permitidos são: true (padrão), false.

  • Regiões preferenciais: a lista preferencial de regiões às quais se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo.

    Captura de tela mostrando regiões preferenciais.

  • Colunas adicionais: adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia.

    Captura de tela mostrando colunas adicionais.

Destino

As propriedades a seguir têm suporte para o Azure Cosmos DB para NoSQL na guia Destino de uma atividade de cópia.

As três propriedades a seguir são necessárias:

  • Conexão: selecione uma conexão do Azure Cosmos DB para NoSQL na lista de conexões.
  • Contêiner: Selecione Procurar para escolher o arquivo que você deseja copiar ou preencha o caminho manualmente.

Em Avançado, você pode especificar os seguintes campos:

  • Comportamento de gravação: define o comportamento de gravação quando o destino é arquivos de um armazenamento de dados baseado em arquivo. Você pode escolher Adicionar conteúdo dinâmico, Inserir ou Upsert na lista suspensa.

    • Adicionar conteúdo dinâmico: abra o painel Adicionar conteúdo dinâmico . Isso abre o construtor de expressões em que você pode criar expressões a partir de variáveis de sistema compatíveis, saída de atividade, funções e parâmetros especificados pelo usuário. Para obter informações sobre a linguagem de expressão, acesse Expressões e funções.

    • Insira: escolha esta opção se os dados de origem tiverem inserções.

    • Upsert: o comportamento do upsert é substituir o documento se já existir um documento com a mesma ID; caso contrário, insira o documento.

      Captura de tela mostrando o comportamento da gravação.

  • Tempo limite de gravação em lote: tempo de espera para que a operação de inserção em lote seja concluída antes de atingir o tempo limite. Os valores permitidos são Timespan. Um exemplo é 00:30:00 (30 minutos).

  • Tamanho do lote de gravação: especifique o número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é um inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha.

  • Máximo de conexões simultâneas: o limite superior de conexões simultâneas estabelecidas para o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas.

  • Desabilitar a análise de métricas de desempenho: essa configuração controla a coleção de métricas, como DTU, DWU, RU e assim por diante para copiar recomendações e otimização de desempenho. Se você estiver preocupado com esse comportamento, desative esse recurso.

Mapeamento

Para a configuração da guia Mapeamento , vá para Configurar seus mapeamentos na guia mapeamento.

Configurações

Para a configuração da guia Configurações , vá para Definir suas outras configurações na guia Configurações.

Sumário da tabela

As tabelas a seguir contêm mais informações sobre a atividade de cópia no Azure Cosmos DB para NoSQL.

Tabela de origem

Nome Description Value Obrigatório Propriedade do script JSON
Conexão Sua conexão com o repositório de dados de origem. <sua conexão> Yes conexão
Contêiner O contêiner de seus dados de origem. <contêiner de sua fonte> Yes contêiner
fileName
Usar a consulta Você pode escolher Tabela ou Consulta como sua consulta de uso. Tabela
Consulta
Não tipo
Tamanho da página O número de documentos por página do resultado da consulta. O padrão é "-1", o que significa usar o tamanho da página dinâmica do lado do servidor com limite de até 1000. <seu tamanho de página> Não pageSize
Excluir data e hora Os arquivos no armazenamento de dados de origem serão excluídos logo após serem movidos para o repositório de destino. A exclusão de arquivo é por arquivo, portanto, quando a atividade de cópia falhar, você observará que alguns arquivos já foram copiados para o destino e excluídos da origem enquanto outros ainda estão no repositório de origem. Selecionado ou não selecionado Não detectDatetime
Regiões preferenciais A lista preferencial de regiões à qual se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo. <suas regiões preferenciais> Não preferredRegions
Colunas adicionais Adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia. <Máximo de conexões simultâneas> Não additionalColumns

Tabela de Destino

Nome Description Value Obrigatório Propriedade do script JSON
Conexão Sua ligação com o banco de dados de destino. <sua conexão> Yes conexão
Contêiner O contêiner de seus dados de destino. <contêiner de origem> Yes contêiner
fileName
Comportamento de gravação Descreve como gravar dados no Azure Cosmos DB. Valores permitidos: inserir e upsert. O comportamento do upsert é substituir o documento se já existir um documento com a mesma ID; caso contrário, insira o documento. Adicionar conteúdo dinâmico
Inserir
Upsert
Não writeBehavior
Tempo limite do lote de gravação Tempo de espera para que a operação de inserção em lote seja concluída antes de atingir o tempo limite. Os valores permitidos são Timespan. Um exemplo é 00:30:00 (30 minutos). intervalo de tempo Não writeBatchTimeout
Tamanho do lote de gravação O número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha. <número de linhas >
(inteiro)
Não writeBatchSize
Máximo de conexões simultâneas O limite superior de conexões simultâneas estabelecidas para o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas. <Máximo de conexões simultâneas> Não maxConcurrentConnections
Desabilitar análise de métricas de desempenho Essa configuração controla a coleta de métricas como DTU, DWU, RU e assim por diante para otimização e recomendações de desempenho de cópia. Se você estiver preocupado com esse comportamento, desative esse recurso. Selecionado ou não selecionado Não disableMetricsCollection