Freigeben über


Leitfaden zu Machine Learning in SQL Server Big Data-Clustern

Gilt für: SQL Server 2019 (15.x)

In diesem Artikel wird erklärt, wie man Big Data-Cluster für SQL Server in Machine Learning-Szenarios verwendet.

Important

Die Big Data Cluster von Microsoft SQL Server 2019 werden eingestellt. Der Support für SQL Server 2019 Big Data Cluster endete am 28. Februar 2025. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und den Big Data-Optionen auf der Microsoft SQL Server-Plattform.

Einführung in Machine Learning in SQL Server Big Data-Clustern

Big Data-Cluster für SQL Server ermöglicht Machine Learning-Szenarios und -Lösungen mithilfe verschiedener Technologiestapel: SQL Server Machine Learning Services und Apache Spark ML.

Big Data-Cluster für SQL Server bieten Machine Learning-Funktionen innerhalb der SQL Server-Engine mithilfe des etablierten Technologiestapels SQL Server Machine Learning Services an. Dadurch ermöglichen sie leistungsstarke, datenbankinterne Rückschluss- und Bewertungsszenarios für Machine Learning.

Für Big Data-basierte Machine Learning-Szenarios ist die Verwendung von HDFS für Big Data-Hosting und Apache Spark ML-Funktionen kostengünstiger, skalierbarer und leistungsfähiger.

Machine Learning-Szenarios

Die Machine Learning-Funktion ermöglichen verschiedene Anwendungen und Lösungen wie die Erkennung von Betrugsversuchen, Prognosen und allgemeine Klassifizierungs- und Regressionsaufgaben. Es ist jedoch wichtig, die beste Technologie für ein Szenario zu verwenden.

Aspect SQL Server Machine Learning-Dienste Apache Spark ML
Data placement Nutzt die Lokalität von Tabellendaten auf SQL Server. Premium-Datenschicht Skalierbare Big Data-Datenschicht mit HDFS; entweder unstrukturierte, halbstrukturierte und strukturierte Daten
Best for Rückschluss- und Bewertungsszenarios mit geringer Latenz 1. Batchtraining und Bewertung von Machine Learning-Modellen auf der Grundlage von Big Data
2. ETL-Senken und weitreichende Datenaufbereitung und Featurisierung für ML
Feeds ML-gesteuerte BI-Dashboards, Berichte und Anwendungen. Geringe Latenz erforderlich Im Batch bewertete Daten können auf SQL Server höhergestuft werden, um ML-gesteuerte Szenarios voranzutreiben.
Latency Geringe Latenz erforderlich Höhere Latenz akzeptabel
Read more Ausführen von Python- und R-Skripts mit Machine Learning Services auf SQL Server-Big Data-Clustern Einführung in Spark Machine Learning auf SQL Server Big Data-Clustern

Next steps

Weitere Informationen finden Sie hier: Einführung in Big Data-Cluster für SQL Server.