Kopieren von Daten aus Google BigQuery V2 mithilfe von Azure Data Factory oder Synapse Analytics

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. In Microsoft Fabric können Sie alle erforderlichen Aufgaben ausführen, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

In diesem Artikel wird beschrieben, wie Sie die Copy-Aktivität in Azure Data Factory- und Synapse Analytics-Pipelines verwenden, um Daten aus Google BigQuery zu kopieren. Er baut auf dem Artikel zur Übersicht über die Kopieraktivität auf, der eine allgemeine Übersicht über die Kopieraktivität enthält.

Wichtig

Der Google BigQuery V1-Connector wird entfernt. Sie werden empfohlen, den Google BigQuery-Connector von V1 auf V2 zu aktualisieren.

Unterstützte Funktionen

Für den Google BigQuery-Connector werden die folgenden Funktionen unterstützt:

Unterstützte Funktionen	IR
Kopieraktivität (Quelle/-)	(1) (2)
Lookup-Aktivität	(1) (2)

① Azure Integration Runtime ② Selbstgehostete Integration Runtime

Eine Liste der Datenspeicher, die als Quellen oder Senken für die Kopieraktivität unterstützt werden, finden Sie in der Tabelle Unterstützte Datenspeicher.

Der Dienst stellt einen integrierten Treiber zur Verfügung, der die Konnektivität ermöglicht. Aus diesem Grund müssen Sie Treiber für die Verwendung dieses Connectors nicht manuell installieren.

Hinweis

Dieses Google BigQuery-Connector wird basierend auf den BigQuery-APIs erstellt. Beachten Sie, dass BigQuery die maximale Rate eingehender Anforderung begrenzt und entsprechende Kontingente projektbezogen durchsetzt, siehe Kontingente & Limits – API-Anfragen. Stellen Sie sicher, dass Sie nicht zu viele gleichzeitige Anforderungen für das Konto auslösen.

Erste Schritte

Zum Ausführen der Kopieraktivität mit einer Pipeline können Sie eines der folgenden Tools oder SDKs verwenden:

Erstellen eines verknüpften Dienstes mit Google BigQuery über die Benutzeroberfläche

Gehen Sie wie folgt vor, um einen verknüpften Dienst mit Google BigQuery in der Benutzeroberfläche des Azure-Portals zu erstellen.

Navigieren Sie in Ihrem Azure Data Factory- oder Synapse-Arbeitsbereich zur Registerkarte „Verwalten“, wählen Sie „Verknüpfte Dienste“ aus, und klicken Sie dann auf „Neu“:
- Azure Data Factory
- Azure Synapse
Suchen Sie nach Google BigQuery, und wählen Sie den Connector aus.
Konfigurieren Sie die Dienstdetails, testen Sie die Verbindung, und erstellen Sie den neuen verknüpften Dienst.

Details zur Connectorkonfiguration

Die folgenden Abschnitte enthalten Details zu Eigenschaften, die zur Definition von Entitäten verwendet werden, die für den Google BigQuery Connector spezifisch sind.

Eigenschaften des verknüpften Diensts

Folgende Eigenschaften werden für den mit Google BigQuery verknüpften Dienst unterstützt:

Eigenschaft	Beschreibung	Erforderlich
type	Die „type“-Eigenschaft muss auf GoogleBigQueryV2 festgelegt werden.	Ja
version	Die von Ihnen angegebene Version. Empfehlen Sie ein Upgrade auf die neueste Version, um die neuesten Verbesserungen zu nutzen.	Ja für Version 1.1
projectId	Das Projekt-ID des BigQuery-Standardprojekts, das abgefragt werden soll.	Ja
Authentifizierungstyp	Der OAuth 2.0-Authentifizierungsmechanismus, der für die Authentifizierung verwendet wird. Zulässige Werte sind UserAuthentication und ServiceAuthentication. Weitere Eigenschaften und JSON-Beispiele für diese Authentifizierungstypen finden Sie in den Abschnitten nach dieser Tabelle.	Ja

Verwenden der Benutzerauthentifizierung

Legen Sie die Eigenschaft „authenticationType“ auf UserAuthentication fest, und geben Sie zusammen mit den im vorherigen Abschnitt beschriebenen generischen Eigenschaften die folgenden Eigenschaften an:

Eigenschaft	Beschreibung	Erforderlich
Kunden-ID	Die ID der Anwendung, die verwendet wird, um das Aktualisierungstoken zu generieren.	Ja
Kundengeheimnis	Das Geheimnis der Anwendung, das verwendet wird, um das Aktualisierungstoken zu generieren. Markieren Sie dieses Feld als einen „SecureString“, um es sicher zu speichern, oder verweisen Sie auf ein in Azure Key Vault gespeichertes Geheimnis.	Ja
Aktualisierungs-Token	Das Aktualisierungstoken, das von Google für die Autorisierung des Zugriffs auf BigQuery abgerufen wird. Informationen dazu, wie Sie ein Token erhalten, finden Sie unter Abrufen von OAuth 2.0-Zugriffstoken und in diesem Communityblog. Markieren Sie dieses Feld als einen „SecureString“, um es sicher zu speichern, oder verweisen Sie auf ein in Azure Key Vault gespeichertes Geheimnis.	Ja

Beispiel:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "version": "1.1",
        "typeProperties": {
            "projectId" : "<project ID>",
            "authenticationType" : "UserAuthentication",
            "clientId": "<client ID>",
            "clientSecret": {
                "type": "SecureString",
                "value":"<client secret>"
            },
            "refreshToken": {
                "type": "SecureString",
                "value": "<refresh token>"
            }
        }
    }
}

Verwenden der Dienstauthentifizierung

Legen Sie die Eigenschaft „authenticationType“ auf ServiceAuthentication fest, und geben Sie zusammen mit den im vorherigen Abschnitt beschriebenen generischen Eigenschaften die folgenden Eigenschaften an.

Eigenschaft	Beschreibung	Erforderlich
keyFileContent	Die Schlüsseldatei im JSON-Format, die zum Authentifizieren des Dienstkontos verwendet wird. Markieren Sie dieses Feld als einen „SecureString“, um es sicher zu speichern, oder verweisen Sie auf ein in Azure Key Vault gespeichertes Geheimnis.	Ja

Beispiel:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "version": "1.1",
        "typeProperties": {
            "projectId": "<project ID>",
            "authenticationType": "ServiceAuthentication",
            "keyFileContent": {
                "type": "SecureString",
                "value": "<key file JSON string>"
            }
        }
    }
}

Dataset-Eigenschaften

Eine vollständige Liste mit den Abschnitten und Eigenschaften, die zum Definieren von Datasets zur Verfügung stehen, finden Sie im Artikel zu Datasets. Dieser Abschnitt enthält eine Liste der Eigenschaften, die vom Google BigQuery-Dataset unterstützt werden.

Legen Sie zum Kopieren von Daten aus Google BigQuery die „type“-Eigenschaft des Datasets auf GoogleBigQueryV2Object fest. Folgende Eigenschaften werden unterstützt:

Eigenschaft	Beschreibung	Erforderlich
type	Die type-Eigenschaft des Datasets muss auf GoogleBigQueryV2Object festgelegt sein.	Ja
Datensatz	Name des Google BigQuery-Datasets.	Nein (wenn „query“ in der Aktivitätsquelle angegeben ist)
Tisch	Der Name der Tabelle.	Nein (wenn „query“ in der Aktivitätsquelle angegeben ist)

Beispiel

{
    "name": "GoogleBigQueryDataset",
    "properties": {
        "type": "GoogleBigQueryV2Object",
        "linkedServiceName": {
            "referenceName": "<Google BigQuery linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "dataset": "<dataset name>",
            "table": "<table name>"
        }
    }
}

Eigenschaften der Kopieraktivität

Eine vollständige Liste mit den Abschnitten und Eigenschaften zum Definieren von Aktivitäten finden Sie im Artikel Pipelines. Dieser Abschnitt enthält eine Liste der Eigenschaften, die vom Google BigQuery-Quelltyp unterstützt werden.

GoogleBigQuerySource als Quelltyp

Legen Sie zum Kopieren von Daten aus Google BigQuery den Quelltyp in der Kopieraktivität auf GoogleBigQueryV2Source fest. Die folgenden Eigenschaften werden im Abschnitt source der Kopieraktivität unterstützt.

Eigenschaft	Beschreibung	Erforderlich
type	Die „type“-Eigenschaft der Quelle der Kopieraktivität muss auf GoogleBigQueryV2Source festgelegt werden.	Ja
Abfrage	Verwendet die benutzerdefinierte SQL-Abfrage zum Lesen von Daten. z. B. `"SELECT * FROM MyTable"`. Weitere Informationen finden Sie unter Abfragesyntax.	Nein (wenn „dataset“ und „table“ im Dataset angegeben sind)

Beispiel:

"activities":[
    {
        "name": "CopyFromGoogleBigQuery",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Google BigQuery input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GoogleBigQueryV2Source",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Datentypzuordnung für Google BigQuery V2

Wenn Sie Daten aus Google BigQuery kopieren, werden die folgenden Zuordnungen von Google BigQuery-Datentypen zu Zwischendatentypen innerhalb des Diensts intern verwendet. Informationen dazu, wie die Kopieraktivität das Quellschema und den Datentyp der Spüle zuordnet, finden Sie unter Schema- und Datentypzuordnungen.

Google BigQuery-Datentyp	Zwischendatentyp des Diensts
JSON	String
STRING	String
BYTES	Byte-Array
INTEGER	Int64
FLOAT	Double
NUMERISCH	Decimal
BIGNUMERIC	String
BOOLEAN	Boolean
TIMESTAMP	DateTimeOffset
DATE	DateTime
TIME	TimeSpan
Datum/Zeit	DateTimeOffset
GEOGRAFIE	String
RECORD/STRUCT	String
ARRAY	String

Eigenschaften der Lookup-Aktivität

Ausführliche Informationen zu den Eigenschaften finden Sie unter Lookup-Aktivität.

Google BigQuery Connector-Lebenszyklus und -Upgrade

Die folgende Tabelle zeigt die Veröffentlichungsphase und Änderungsprotokolle für verschiedene Versionen des Google BigQuery-Connectors:

Version	Freigabestufe	Änderungsprotokoll
Google BigQuery V1	Entfernt	Nicht zutreffend.
Google BigQuery V2 (Version 1.0)	GA-Version verfügbar	• Die Dienstauthentifizierung wird von der Azure-Integrationslaufzeit und der selbst gehosteten Integrationslaufzeit unterstützt. Die Eigenschaften `trustedCertPath`, `useSystemTrustStoreemail` und `keyFilePath` werden nicht unterstützt, da sie nur für die selbst gehostete Integrationslaufzeit verfügbar sind. • `requestGoogleDriveScope` wird nicht unterstützt. Sie müssen zusätzlich die Berechtigung im Google BigQuery-Dienst anwenden, indem Sie auf Google Drive API-Bereiche auswählen und Drive-Daten abfragen verweisen. • `additionalProjects` wird nicht unterstützt. Alternative: Öffentliches Dataset mit der Google Cloud Console abfragen. • ZAHL wird als Dezimaldatentyp gelesen. • Timestamp und Datetime werden als DateTimeOffset-Datentyp gelesen.
Google BigQuery V2 (Version 1.1)	GA-Version verfügbar	• Ein Fehler wurde behoben: Beim Ausführen mehrerer Anweisungen gibt dies `query` jetzt die Ergebnisse der ersten Anweisung zurück, nachdem die Auswertungsanweisungen ausgeschlossen wurden, anstatt immer das Ergebnis der ersten Anweisung zurückzugeben.

Upgrade des Google BigQuery-Connectors

So aktualisieren Sie Ihren Google BigQuery-Connector:

Von V1 bis V2:
Erstellen Sie einen neuen verknüpften Google BigQuery-Dienst, und konfigurieren Sie ihn, indem Sie auf verknüpfte Diensteigenschaften verweisen.
Von V2 Version 1.0 bis Version 1.1:
Wählen Sie auf der Seite "Verknüpften Dienst bearbeiten " 1.1 für die Version aus. Weitere Informationen finden Sie unter Eigenschaften verknüpfter Dienste.

Eine Liste der Datenspeicher, die als Quellen und Senken für die Kopieraktivität unterstützt werden, finden Sie unter Unterstützte Datenspeicher.

Feedback

War diese Seite hilfreich?

Last updated on 2025-12-01

Freigeben über

Kopieren von Daten aus Google BigQuery V2 mithilfe von Azure Data Factory oder Synapse Analytics

Unterstützte Funktionen

Erste Schritte

Erstellen eines verknüpften Dienstes mit Google BigQuery über die Benutzeroberfläche

Details zur Connectorkonfiguration

Eigenschaften des verknüpften Diensts

Verwenden der Benutzerauthentifizierung

Verwenden der Dienstauthentifizierung

Dataset-Eigenschaften

Eigenschaften der Kopieraktivität

GoogleBigQuerySource als Quelltyp

Datentypzuordnung für Google BigQuery V2

Eigenschaften der Lookup-Aktivität

Google BigQuery Connector-Lebenszyklus und -Upgrade

Upgrade des Google BigQuery-Connectors

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen