Azure Databricks Git フォルダーは、ワークスペース内に Git リポジトリを統合する視覚的な Git クライアントと API です。 Git フォルダーを使用してノートブックとファイル内のコードを開発し、バージョン管理、コラボレーション、CI/CD に Git を使用したソフトウェア開発のベスト プラクティスに従います。 Git フォルダーでは、リポジトリの複製、コミットとプッシュ、プル、ブランチ管理、コミット時の差分の視覚的な比較などの一般的な Git 操作がサポートされています。
このページでは、次の内容について説明します。
Git フォルダーの機能
Azure Databricks Git フォルダーは、Git プロバイダーと統合することで、データと AI プロジェクトのソース管理を提供します。
Azure Databricks ワークスペースの Git 機能を使用して、次の作業を行います。
- リモート Git リポジトリを複製、プッシュ、プルする。
- マージ、リベース、競合の解決などを含む、開発作業用のブランチを作成および管理します。
- IPYNB ノートブックを含むノートブックを作成し、それらのノートブックとその他のファイルを編集します。
- コミット時の相違点を視覚的に比較し、マージの競合を解決します。
詳細な手順については、「 Databricks Git フォルダーで Git 操作を実行する」を参照してください。
Git ディレクトリ API
Azure Databricks Git フォルダーには、CI/CD パイプラインと統合するための API があります 。 たとえば、常に最新バージョンのコードが含まれるように、ワークスペース Git フォルダーをプログラムで更新します。 Azure Databricks Git フォルダーを使用したコード開発のベスト プラクティスについては、 Databricks Git フォルダーでの CI/CD に関するページを参照してください。
Git プロバイダー
Git プロバイダーは、Git ベースのソース管理システムをホストするサービスです。 これらのプラットフォームは、ベンダーがホストするクラウド サービスと、組織が独自のハードウェアにインストールして管理するオンプレミス サービスの 2 つの主要な形式で提供されます。 GitHub、Microsoft、GitLab、Atlassian などの多くのプロバイダーは、クラウド SaaS とオンプレミス (多くの場合、"自己管理" と呼ばれる) オプションの両方を提供しています。
Azure Databricks Git フォルダーでは、統合された Git リポジトリが使用されます。 次のセクションに示すクラウドまたはエンタープライズ Git プロバイダーは、リポジトリをホストできます。
構成中に Git プロバイダーを選択するときは、クラウド (SaaS) とオンプレミス システムの違いを理解していることを確認してください。 組織は、多くの場合、VPN の背後でセルフマネージド プロバイダーをホストし、パブリック インターネットからアクセスできないようにすることができます。 これらのバージョンには、多くの場合、名前に "Server" または "Self-Managed" が含まれます。 組織で使用するものがわからない場合は、プロバイダーのドキュメントを確認するか、会社の管理者に問い合わせてください。
サポートされているプロバイダーの一覧にクラウド Git プロバイダーが表示されない場合、 GitHub を選択するとフォールバックとして機能する可能性がありますが、これは保証されません。
注
GitHub をプロバイダーとして使用していて、クラウドとオンプレミスのどちらのバージョンを使用しているかがまだ不明な場合は、 GitHub ドキュメントの GitHub Enterprise Server について を参照してください。
サポートされているクラウド Git プロバイダー
Azure Databricks Git フォルダーは、次のクラウドベースの Git プロバイダーと統合されます。
- GitHub、GitHub Advanced Enterprise、GitHub Enterprise Cloud
- Atlassian Bitbucket Cloud
- GitLab と GitLab Enterprise Edition
- Microsoft Azure DevOps (Azure Repos)
サポートされているオンプレミスの Git プロバイダー
Azure Databricks Git フォルダーは、次のオンプレミス Git プロバイダーと統合されます。
- ギットハブ エンタープライズ サービス
- Atlassian Bitbucket サーバーとデータ センター
- GitLab セルフマネージド
- Microsoft Azure DevOps Server: ワークスペース管理者は、URL が
dev.azure.com/*またはvisualstudio.com/*と一致しない場合、Microsoft Azure DevOps Server の URL ドメイン プレフィックスを明示的に許可リストする必要があります。 Git URL の許可リストを参照してください。
インターネットからアクセスできないオンプレミスの Git リポジトリを統合する場合は、会社の VPN 内に Git 認証要求のプロキシもインストールする必要があります。 Azure Databricks Git フォルダーのプライベート Git 接続の設定に関するページを参照してください。
Git プロバイダーでアクセス トークンを使用する方法については、「Git 資格情報を構成し、リモート リポジトリを Azure Databricks に接続する」を参照してください。