Delen via


Gegevens laden in Parallel Data Warehouse

U kunt gegevens laden of invoegen in SQL Server Parallel Data Warehouse (PDW) met behulp van Integration Services, bcp Utility, dwloader command-line Loader of de SQL INSERT-instructie.

Omgeving laden

Als u gegevens wilt laden, hebt u een of meer laadservers nodig. U kunt uw eigen bestaande ETL of andere servers gebruiken, of u kunt nieuwe servers kopen. Zie Een laadserver verkrijgen en configureren voor meer informatie. Deze instructies bevatten een werkblad voor capaciteitsplanning van de laadserver om u te helpen bij het plannen van de juiste oplossing voor het laden.

Laden met dwloader

Het gebruik van de dwloader Command-Line Loader is de snelste manier om gegevens in PDW te laden.

Laadproces

Dwloader laadt gegevens rechtstreeks naar de rekenknooppunten zonder de gegevens door te geven via het besturingsknooppunt. Als u gegevens wilt laden, communiceert dwloader eerst met het beheerknooppunt om contactgegevens voor de rekenknooppunten te verkrijgen. Dwloader stelt een communicatiekanaal in met elk rekenknooppunt en verzendt vervolgens 256 KB-segmenten met gegevens naar de rekenknooppunten op een round robin-manier.

Op elk rekenknooppunt ontvangt en verwerkt DMS (Data Movement Service) de segmenten van gegevens. Het verwerken van de gegevens omvat het converteren van elke rij naar een systeemeigen SQL Server-indeling en het berekenen van de distributie-hash om het rekenknooppunt te bepalen waartoe elke rij behoort.

Nadat de rijen zijn verwerkt, gebruikt DMS een schuifverplaatsing om elke rij over te dragen naar het juiste compute-node en het juiste exemplaar van SQL Server. Wanneer SQL Server de rijen ontvangt, worden ze in batches gebatched volgens de parameter -b batchgrootte die is ingesteld in het dwloader en laadt de batch vervolgens bulksgewijs.

Laden met voorbereide statements

U kunt voorbereide instructies gebruiken om gegevens te laden in gedistribueerde en gerepliceerde tabellen. Wanneer de invoergegevens niet overeenkomen met het doelgegevenstype, wordt een impliciete conversie uitgevoerd. De impliciete conversies die worden ondersteund door voorbereide PDW-instructies zijn een subset van conversies die worden ondersteund door SQL Server. Dat wil gezegd, alleen een subset van conversies wordt ondersteund, maar de ondersteunde conversies komen overeen met impliciete SQL Server-conversies. Ongeacht of de doeltabel die moet worden geladen, is gedefinieerd als een gedistribueerde of gerepliceerde tabel, worden impliciete conversies (indien nodig) toegepast op alle kolommen in de doeltabel.

Opdracht Description
Maak de faseringsdatabase. De faseringsdatabase maken
Laden met behulp van Integration Services. Het laden met Integration Services
Begrijp typeconversies voor dwloader. Regels voor gegevenstypeconversie voor dwloader
Gegevens laden met dwloader. dwloader opdrachtregel-laadprogramma
Inzicht in typeconversies voor INSERT. Gegevens laden met INSERT