SQL Server ビッグデータクラスターのための Machine Learning ガイド

適用対象: SQL Server 2019 (15.x)

この記事では、Machine Learning のシナリオに SQL Server ビッグデータクラスターを使用する方法について説明します。

Important

Microsoft SQL Server 2019 ビッグデータクラスターは廃止されました。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日の時点で終了しました。詳細については、Microsoft SQL Server プラットフォームの発表ブログ投稿とビッグデータオプションを参照してください。

SQL Server ビッグデータクラスターでの Machine Learning の概要

SQL Server ビッグデータクラスターを使用すると、SQL Server Machine Learning Services や Apache Spark ML というさまざまなテクノロジスタックを使用して機械学習のシナリオとソリューションを実現できます。

SQL Server ビッグデータクラスターには、確立された SQL Server Machine Learning Services テクノロジスタックを使用して SQL Server エンジン内に Machine Learning 機能が用意されており、ハイパフォーマンスなデータベース内 Machine Learning の推論とスコアリングのシナリオを実現できます。

ビッグデータベースの機械学習シナリオの場合、ビッグデータホスティングおよび Apache Spark ML の機能に対して HDFS を使用すると、よりコスト効率が高く、スケーラブルで強力になります。

Machine Learning のシナリオ

機械学習機能を使用すると、不正行為の検出、予測、チャーン、一般的な分類と回帰タスクなど、さまざまなアプリケーションとソリューションを実現できます。ただし、シナリオに最適なテクノロジを使用することが重要です。

Aspect	SQL Server Machine Learning サービス	Apache Spark ML
Data placement	SQL Server の表形式データの局所性を利用します。 Premium データ層。	HDFS を使用したスケーラブルなビッグデータデータ層: 非構造化データ、半構造化データ、構造化データのいずれか。
Best for	低待遅延推論とスコアリングのシナリオ	1. ビッグデータを基礎とする機械学習モデルの分散バッチトレーニングとスコアリング 2. ETL シンク、大規模データの準備と ML のための特徴量化
Feeds	ML を利用した BI ダッシュボード、レポート、アプリケーション。低待遅延が必要	バッチでスコアリングされたデータは、SQL Server に昇格され、ML を利用したシナリオを推進することができます
Latency	低待遅延が必要	許容される待機時間が長い
Read more	SQL Server ビッグデータクラスターで Machine Learning Services を使用して Python および R のスクリプトを実行する	SQL Server ビッグデータクラスター上の Spark Machine Learning の概要

Next steps

詳細については、「SQL Server ビッグデータクラスターの概要」を参照してください。

Last updated on 2021-10-05

次の方法で共有

SQL Server ビッグ データ クラスターのための Machine Learning ガイド

SQL Server ビッグ データ クラスターでの Machine Learning の概要

Machine Learning のシナリオ

Next steps

その他のリソース

SQL Server ビッグデータクラスターのための Machine Learning ガイド

SQL Server ビッグデータクラスターでの Machine Learning の概要