Compartilhar via


Lição 1: Criar um projeto e pacote básico com oSQL Server Integration Services (SSIS)

Aplica-se a:SQL Server SSIS Integration Runtime no Azure Data Factory

Nessa lição, você criará um pacote simples de extração, transformação e carregamento (ETL). O pacote extrai dados de uma fonte única de arquivo plano, transforma os dados usando duas operações de busca e grava os dados transformados em uma cópia da tabela de FactCurrencyRate fatos no banco de dados de exemplo AdventureWorksDW2025. Como parte desta lição, você cria novos pacotes, adiciona e configura conexões de fonte de dados e de destino e trabalha com novos componentes de fluxo de controle e fluxo de dados.

Antes de criar um pacote, você precisa ter um bom conhecimento da formatação usada nos dados de origem e de destino. Em seguida, você está pronto para definir as transformações necessárias para mapear os dados de origem para o destino.

Pré-requisitos

Este tutorial se baseia no Microsoft SQL Server Data Tools, um conjunto de pacotes de exemplo e um banco de dados de exemplo.

Observação

Os exemplos de código neste artigo usam o banco de dados de exemplo AdventureWorks2025 ou AdventureWorksDW2025, que você pode baixar na página inicial Microsoft SQL Server Samples and Community Projects.

Para instalar as Ferramentas de Dados do SQL Server, consulte Instalar o SSDT (SQL Server Data Tools) para Visual Studio.

Para baixar todos os pacotes de lição para este tutorial:

  1. Navegue até Arquivos do tutorial do Integration Services.
  2. Selecione o botão Baixar.
  3. Selecione o Creating a Simple ETL Package.zip arquivo e selecione Avançar.
  4. Depois que o arquivo for baixado, descompacte o conteúdo para um diretório local.

Examinar os dados de origem

Para este tutorial, os dados de origem são um conjunto de dados de moeda histórica em um arquivo simples chamado SampleCurrencyData.txt. A fonte de dados tem as seguintes quatro colunas: a taxa média de moeda, uma chave de moeda, uma chave de data e a taxa de final do dia.

Aqui está um exemplo dos dados de origem no SampleCurrencyData.txt arquivo:

1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009

Quando estiver trabalhando com os dados de origem de arquivo simples, é importante entender como o gerenciador de conexões de Arquivo Simples interpreta os dados de arquivo simples. Se a origem do arquivo simples for Unicode, o gerenciador de conexões de Arquivo Simples definirá todas as colunas como [DT_WSTR] com uma largura de coluna padrão de 50. Se a origem do arquivo simples for codificada em ANSI, as colunas serão definidas como [DT_STR] com uma largura de coluna padrão de 50. Você provavelmente precisará alterar esses padrões para tornar os tipos de coluna de cadeia de caracteres mais aplicáveis para seus dados. Você precisará examinar o tipo de dados de destino e, em seguida, escolher o tipo dentro do Gerenciador de conexão de Arquivo Simples.

Examinar os dados de destino

O destino dos dados de origem é uma cópia da FactCurrencyRate tabela de fatos em AdventureWorksDW2025. A FactCurrencyRate tabela de fatos tem quatro colunas e tem relações com duas tabelas de dimensão, conforme mostrado na tabela a seguir.

Nome da coluna Tipo de dados Tabela de consulta Coluna de pesquisa
AverageRate float Nenhum Nenhum
CurrencyKey int (FK) 1 DimCurrency CurrencyKey (PK) 2
DateKey int (FK) 1 DimDate DateKey (PK) 2
EndOfDayRate float Nenhum Nenhum

1 FK: Chave estrangeira

2 PK: Chave primária

Mapear os dados de origem para o destino

Nossa análise dos formatos de dados de origem e de destino indica que as pesquisas são necessárias para os valores CurrencyKey e DateKey. As transformações que executam essas pesquisas obtêm esses valores usando as chaves alternativas das tabelas de dimensão DimCurrency e DimDate.

Coluna de arquivo simples Nome da tabela Nome da coluna Tipo de dados
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Tarefas da lição

Próxima etapa