次の方法で共有


SQL Server ビッグ データ クラスターのための Machine Learning ガイド

適用対象: SQL Server 2019 (15.x)

この記事では、Machine Learning のシナリオに SQL Server ビッグ データ クラスター を使用する方法について説明します。

Important

Microsoft SQL Server 2019 ビッグ データ クラスターは廃止されました。 SQL Server 2019 ビッグ データ クラスターのサポートは、2025 年 2 月 28 日の時点で終了しました。 詳細については、Microsoft SQL Server プラットフォーム の発表ブログ投稿ビッグ データ オプションを参照してください。

SQL Server ビッグ データ クラスターでの Machine Learning の概要

SQL Server ビッグ データ クラスター を使用すると、SQL Server Machine Learning ServicesApache Spark ML というさまざまなテクノロジ スタックを使用して機械学習のシナリオとソリューションを実現できます。

SQL Server ビッグ データ クラスター には、確立された SQL Server Machine Learning Services テクノロジ スタックを使用して SQL Server エンジン内に Machine Learning 機能が用意されており、ハイ パフォーマンスなデータベース内 Machine Learning の推論とスコアリングのシナリオを実現できます。

ビッグ データ ベースの機械学習シナリオの場合、ビッグ データ ホスティングおよび Apache Spark ML の機能に対して HDFS を使用すると、よりコスト効率が高く、スケーラブルで強力になります。

Machine Learning のシナリオ

機械学習機能を使用すると、不正行為の検出、予測、チャーン、一般的な分類と回帰タスクなど、さまざまなアプリケーションとソリューションを実現できます。 ただし、シナリオに最適なテクノロジを使用することが重要です。

Aspect SQL Server Machine Learning サービス Apache Spark ML
Data placement SQL Server の表形式データの局所性を利用します。 Premium データ層。 HDFS を使用したスケーラブルなビッグ データ データ層: 非構造化データ、半構造化データ、構造化データのいずれか。
Best for 低待遅延推論とスコアリングのシナリオ 1. ビッグ データを基礎とする機械学習モデルの分散バッチ トレーニングとスコアリング
2. ETL シンク、大規模データの準備と ML のための特徴量化
Feeds ML を利用した BI ダッシュボード、レポート、アプリケーション。 低待遅延が必要 バッチでスコアリングされたデータは、SQL Server に昇格され、ML を利用したシナリオを推進することができます
Latency 低待遅延が必要 許容される待機時間が長い
Read more SQL Server ビッグ データ クラスターで Machine Learning Services を使用して Python および R のスクリプトを実行する SQL Server ビッグ データ クラスター上の Spark Machine Learning の概要

Next steps

詳細については、「SQL Server ビッグ データ クラスターの概要」を参照してください。