Compartilhar via


Estrutura de teste do SDK do Power Query, parte 2 – Dados de teste

Esta referência com várias partes aborda a configuração e a execução de um conjunto padrão de testes para desenvolvedores do conector do Power Query. A referência deve ser seguida em sequência para garantir que o ambiente esteja configurado para o teste do conector de extensão.

Nesta seção, você vai:

  • Saber mais sobre o conjunto de dados usado no conjunto padrão dos testes
  • Baixar uma cópia dos dados de teste
  • Carregar os dados no banco de dados de sua escolha para o conector a ser testado

Esta seção aborda os dados de teste usados pelo conjunto de testes para verificar o conector.

Visão geral do conjunto de dados

Os dados de teste usados para a estrutura são uma versão modificada dos dados de registro de corridas verdes da Comissão de táxis e limusines de Nova York (TLC).

Os dados de corridas verdes de fevereiro de 2023 foram convertidos em arquivo CSV "NycTaxiGreen" e 10.000 linhas foram amostradas a partir dele. O arquivo CSV "TaxiZoneLookup" contém 265 linhas da tabela de pesquisa da zona de táxi. O formato de dados CSV foi escolhido devido à sua grande aplicabilidade a quase todas as outras fontes de dados, o que facilita a importação.

A definição para cada campo pode ser um pouco diferente das informações encontradas no conjunto de dados verdes de táxis e limusines de Nova York – Azure Open Datasets e data_dictionary_trip_records_green.pdf (nyc.gov).

O conjunto de dados para os testes é dividido em dois arquivos csv: NycTaxiGreen e TaxiZoneLookup.

Obter os dados de teste

Os dados de teste são colocados no repositório Git do Data Connectors. Os dados de teste são fornecidos no formato CSV junto com a definição de esquema das tabelas NycTaxiGreen e TaxiZoneLookup. Esses dados devem ser carregados na fonte de dados como tabelas separadas e você deve garantir que o esquema corresponda aos tipos de dados definidos na fonte de dados.

Observação

Durante o carregamento para a fonte de dados, todos os valores decimais devem ter uma escala de 2. Ou seja, o número de dígitos após a vírgula decimal deve ser 2. Todos os valores de carimbo de data/hora devem ser carregados na fonte de dados no formato MM/DD/YYYY HH24:MI:SS.

Você também pode revisar os detalhes sobre os dados de teste.

Recursos:

Descrição da tabela NycTaxiGreen

A tabela a seguir fornece mais informações sobre cada campo na tabela "NycTaxiGreen":

Nome Tipo Descrição
RecordID Inteiro A ordem da ID do registro original. O CSV começa fora de ordem devido à amostragem aleatória. Esse campo pode ser usado como a chave primária da tabela.
VendorID Inteiro Código indicando o provedor.
lpep_pickup_datetime Timestamp As informações de fuso horário não foram incluídas. Se a fonte de dados exigir um, UTC deve ser usado.
lpep_dropoff_datetime Timestamp As informações de fuso horário não foram incluídas. Se a fonte de dados exigir um, UTC deve ser usado.
store_and_fwd_flag Booliano Um campo true/false. Algumas fontes de dados podem importar esse campo como um caractere ou como uma cadeia de caracteres se o tipo de campo não for especificado. Para fins de teste, este campo deve ser especificado como booleano.
RatecodeID Inteiro O código da taxa em vigor ao final da viagem.
PULocationID Inteiro Zona de Táxi da TLC quando taxímetro foi ativado.
DOLocationID Inteiro Zona de Táxi da TLC quando o taxímetro foi desativado.
passenger_count Inteiro O número de passageiros no veículo.
trip_distance Double Distância de viagem em milhas.
fare_amount Double Tarifa por tempo e distância. Duas casas decimais.
extra Double Cobranças diversas. Duas casas decimais.
mta_tax Double Imposto MTA adicionado. Duas casas decimais.
tip_amount Double Valor da gorjeta. Duas casas decimais.
tolls_amount Double Número total de pedágios pagos na viagem. Duas casas decimais.
improvement_surcharge Double Sobretaxa de melhoria. Duas casas decimais.
total_amount Double Preço total cobrado dos clientes. Não inclui gorjetas. Duas casas decimais.
payment_type Inteiro Código numérico que indica como o passageiro pagou pela viagem.
trip_type Inteiro Código numérico para saber se o táxi foi chamado ou despachado.
congestion_surcharge Double Taxa extra para o congestionamento. Duas casas decimais.

Descrição da tabela TaxiZoneLookup

A tabela a seguir traz mais informações sobre cada campo na tabela "TaxiZoneLookup":

Nome Tipo Descrição
LocationId Inteiro ID de localização para qualquer local. Mapeia para PULocationID e DOLocationID na tabela "NycTaxiGreen". Esse campo pode ser usado como a chave primária da tabela.
Borough String Bairro da localização.
Zona String Nome da Zona da localização.
service_zone String Nome da zona de serviço da localização.

Conclusão

Esta seção descreveu os dados de teste usados no conjunto de testes padronizado e seu esquema. O banco de dados agora deve estar preenchido com tabelas baseadas nos arquivos CSV especificados com o esquema correto.

Na próxima seção, você conhecerá diferentes seções do conjunto de testes que ajuda a validar a configuração do conjunto de dados e do conector de extensão.

Próximas etapas

Estrutura de teste do SDK do Power Query, parte 3 – Conjunto de testes