Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Auf dieser Seite wird AI/BI Genie vorgestellt, ein Azure Databricks-Feature, mit dem Geschäftsteams mit ihren Daten mit natürlicher Sprache interagieren können. Es verwendet generative KI, die auf die Terminologie und Daten Ihrer Organisation zugeschnitten ist, mit der Möglichkeit, die Leistung durch Benutzerfeedback zu überwachen und zu verfeinern.
Übersicht
Domänenfachleute wie Datenanalystinnen und -analysten konfigurieren Genie Spaces mit Datasets, Beispielabfragen und Textrichtlinien, um Genie bei der Übersetzung von Geschäftsfragen in analytische Abfragen zu helfen. Nach dem Setup können Geschäftsbenutzer Fragen stellen und Visualisierungen generieren, um betriebstechnische Daten zu verstehen. Sie können das semantische Wissen von Genie kontinuierlich aktualisieren, wenn sich Ihre Daten ändern und Benutzer neue Fragen stellen. Weitere Informationen zu Databricks AI-basierten Features finden Sie unter Databricks AI Assistive Features.
AI/BI Genie wählt relevante Namen und Beschreibungen aus kommentierten Tabellen und Spalten aus, um Fragen in natürlicher Sprache in eine entsprechende SQL-Abfrage zu konvertieren. Anschließend antwortet es nach Möglichkeit mit der generierten Abfrage- und Ergebnistabelle. Wenn Genie keine Antwort generieren kann, kann er Nachverfolgungsfragen stellen, um zu klären, bevor er eine Antwort vorgibt.
Beispiele für Anwendungsfälle
Sie können verschiedene Genie Spaces für verschiedene nicht technische Zielgruppen erstellen. In den folgenden Szenarien werden zwei mögliche Anwendungsfälle beschrieben.
Beispiel 1: Visualisieren des Verkaufschancenstatus
Eine Vertriebsleiterin möchte den aktuellen Status von offenen und geschlossenen Verkaufschancen nach Stufen in ihrer Vertriebspipeline erhalten. Sie können mit dem Genie Space mit natürlicher Sprache interagieren und automatisch eine Visualisierung generieren.
Das folgende GIF zeigt diese Interaktion:
Beispiel 2: Nachverfolgen der Logistik
Ein Logistikunternehmen möchte Genie Spaces nutzen, um Geschäftskundinnen und -kunden aus verschiedenen Abteilungen dabei zu helfen, operative und finanzielle Details nachzuverfolgen. Es wurde ein Genie Space eingerichtet, in dem die Leiterinnen und Leiter der Versandabteilung die Sendungen verfolgen können, und ein weiterer Bereich, in dem die Finanzverantwortlichen die finanzielle Situation des Unternehmens nachvollziehen können.
Welche Daten sollte ich verwenden?
Ein Genie-Raum basiert auf Daten, die im Unity-Katalog registriert sind, einschließlich verwalteter Tabellen, externer Tabellen, Fremdtabellen, Ansichten, Metrikansichten und materialisierten Ansichten. AI/BI Genie verwendet die Metadaten, die an Unity Catalog-Objekte angefügt sind, sowie einen vom Autor kuratierten Wissensspeicher auf Raumebene, um Antworten zu generieren. Gut kommentierte Datasets, gepaart mit spezifischen Anweisungen, die Sie bereitstellen, sind entscheidend für die Erstellung einer positiven Erfahrung für Endbenutzerinnen und Endbenutzer.
Dateiuploads
Von großer Bedeutung
Dieses Feature befindet sich in der Public Preview.
Mit Dateiuploads können Benutzer ihre lokalen CSV- und Excel-Dateien mit Unity-Katalogdaten kombinieren, um Fragen zu beantworten. Um Dateiuploads zu aktivieren, wenden Sie sich an Ihr Databricks-Kontoteam. Weitere Informationen finden Sie unter Hochladen einer Datei.
Wie Genie funktioniert
Genie verwendet ein zusammengesetztes KI-System, um Geschäftsfragen zu interpretieren und Antworten zu generieren. Anstatt ein einzelnes großes Sprachmodell zu verwenden, verarbeiten zusammengesetzte KI-Systeme Aufgaben in KI-Anwendungen, indem mehrere interagierende Komponenten kombiniert werden. Zusammengesetzte KI-Systeme sind aufgrund ihrer Leistung und Flexibilität ein zunehmend gängiges Entwurfsmuster für KI-Anwendungen. Weitere Informationen finden Sie unter The Shift from Models to Compound AI Systems.
Sprachunterstützung
Sie können Genie in anderen Sprachen als Englisch verwenden, z. B. Portugiesisch und Französisch. Das zugrunde liegende Agentframework umschließt jedoch Eingabeaufforderungen in Englisch.
Databricks empfiehlt, Speicherplatzerstellern so viele Metadaten wie möglich in ihrer gewünschten Sprache hinzuzufügen. Genie-Antworten erscheinen manchmal in Englisch aufgrund der zugrunde liegenden Systemaufforderungen.
Was ist der Genie Wissensspeicher?
Genies Wissensspeicher ermöglicht Autoren:
Lokales Bearbeiten von Metadaten: Genie-Autoren können speicherplatzspezifische Metadaten zu Datenressourcen hinzufügen. Sie kann z. B. unternehmensspezifische Informationen enthalten, die für die Verwendung des Raums relevant sind. Dazu gehören Tabellen- und Spaltenmetadatenbeschreibungen, Synonyme auf Spaltenebene, stichprobenierte Werte und Wertwörterbücher, die Genie beim Generieren von Antworten konsultiert. Eine detaillierte Metadatenebene hilft Genie dabei, die richtigen Informationen abzurufen und genauere Ergebnisse zu erzielen.
Stellen Sie strukturierte, feinkörnige Anweisungen bereit: Autoren können Beziehungen zwischen Tabellen definieren JOIN , um Genie bei der Erstellung von SQL über mehrere Tabellen hinweg zu vermitteln.
Weitere Informationen finden Sie unter Erstellen eines Wissensspeichers für zuverlässigere Genie-Räume.
Wie generiert Genie eine Antwort?
Wenn ein Benutzer eine Frage einreicht, analysiert Genie die Anforderung, identifiziert relevante Datenquellen und bestimmt, wie eine entsprechende Antwort generiert wird. Details, die von Autoren in Kombination mit relevanten Unity-Katalogkommentaren, Metadaten und Beispielwerten aus ausgewählten Spalten bereitgestellt werden, ermöglichen Es Genie, sowohl geschäfts- als auch technische Logik abzuleiten. Weitere Informationen finden Sie unter Databricks AI Assistive Features Trust and Safety und Value Sampling. Genie filtert intelligente SQL-Abfragen, Tabellen- und Spaltenmetadaten und Chatverlauf, um den relevantesten Kontext für die Beantwortung der Anfrage auszuwählen.
Genie generiert Antworten mit Komponenten wie den folgenden:
- Unity Catalog Tabellenmetadaten: Enthält Tabellennamen, Beschreibungen und definierte Primärschlüssel (PK) und Fremdschlüssel (FK) Beziehungen. Genie verwendet diese Daten, da sie die Anforderung analysiert und die Aufforderung für natürliche Sprache in SQL konvertiert.
- Spaltennamen und Beschreibungen: Genie filtert intelligent nach relevanten Spaltennamen und Beschreibungen, die einbezogen werden sollen.
- Wissensspeicherkontext: Autoren können Ressourcenmetadaten lokal bearbeiten und Spalten auswählen, die relevante Werte für Genie bereitstellen. Dies hilft Genie dabei, präzisere Antworten zu generieren und vorhandene Unity-Katalogmetadaten nicht zu ändern. Weitere Informationen finden Sie unter Erstellen eines Wissensspeichers für zuverlässigere Genie-Räume.
- Beispiel-SQL-Abfragen: Genie wählt relevante SQL-Beispiele aus SQL-Abfragen intelligent aus.
- SQL-Funktionen: Alle SQL-Funktionen, die im Bereich hinzugefügt wurden.
- Anweisungen: Die als Allgemeine Anweisungen bereitgestellten Nur-Text-Notizen sind als Kontext enthalten.
- Verlauf von Eingabeaufforderungen und Antworten: Eingabeaufforderungen und Antworten aus dem aktuellen Chat werden als Kontext einbezogen. Bei Bedarf werden aufgrund der festgelegten Tokenlimitsdie ältesten Teile des Chatprotokolls ausgeschlossen.
Hinweis
Einige Tabellendetails, z. B. der Besitzer und die Tabellengröße, sind standardmäßig nicht enthalten. Um auf diese Informationen zuzugreifen, verwenden Sie Ansichten aus dem Informationsschema, das für alle Unity-Kataloge verfügbar ist. Standardansichten könnten unnötige Details enthalten, daher kann das Erstellen einer benutzerdefinierten Ansicht darauf helfen, sich auf die benötigten spezifischen Informationen zu konzentrieren. Weitere Informationen dazu, was im Informationsschema verfügbar ist, finden Sie unter "Informationsschema".
In vielen Fällen generiert Genie eine SQL-Abfrage, die im SQL-Warehouse des Raums ausgeführt wird. Generierte Abfragen sind immer schreibgeschützt. Wiederholungen werden automatisch verarbeitet, und das SQL-Lager übernimmt Parallelität und Skalierung. Der Ergebnisdatensatz wird als Teil der Antwort angezeigt.
Genie unterhält starke Sicherheits- und Datenschutzkontrollen. Ausführliche Informationen finden Sie unter Databricks AI unterstützende Funktionen Vertrauen und Sicherheit.
Einrichten eines Genie-Raums
Sie können einen Genie Space erstellen, wenn Sie folgendes haben:
- Die SQL-Berechtigung "Databricks".
- Mindestens die Berechtigung DARF VERWENDEN für ein Pro- oder Serverless-SQL-Warehouse.
-
SELECTMindestens Berechtigungen für mindestens ein Unity Catalog-Datenobjekt.
Siehe Einrichten und Verwalten eines AI/BI Genie-Raums.
Begleit-Genie-Räume für KI/BI-Dashboards (Öffentliche Vorschau)
Sie können Eingaben in natürlicher Sprache verwenden, um Visualisierungen für KI/BI-Dashboards mit dem Databricks-Assistenten zu generieren. Siehe Erstellen von Visualisierungen mit dem Databricks-Assistenten.
Wenn Sie ein Dashboard erstellen, erstellt Databricks automatisch einen Begleit-Genie-Bereich, der es Geschäftsbenutzern ermöglicht, Selbstbedienungs-Datenanalysen mit natürlicher Sprache durchzuführen. Sehen Sie Genie-Räume mit Dashboards.
Interagieren mit einem Genie-Raum
Geschäftsteams sind die Endbenutzer für einen Genie Space. Um einen Genie-Raum zu verwenden, müssen Geschäftsbenutzer folgendes haben:
- Der Verbraucherzugriff oder die SQL-Berechtigung für Databricks.
- Mindestens die Berechtigung DARF VERWENDEN für das standardmäßige Warehouse, das für den Genie-Space vorgesehen ist.
- Mindestens
SELECT-Berechtigungen für alle im Space verwendeten Unity Catalog-Datenobjekte.
Geschäftsbenutzer können beim Zusammenstellen eines Raums helfen, indem sie ihn testen und Während der Entwicklung Feedback geben. Weitere Informationen dazu, wie Geschäftsbenutzer mit einem Genie-Raum arbeiten können, finden Sie unter "Verwenden eines Genie-Raums", um Geschäftsdaten zu erkunden.
Vertrauenswürdige Ressourcen
Vertrauenswürdige Ressourcen vermitteln eine zusätzliche Zuverlässigkeitsebene in der Genauigkeit eines Ergebnisses für eine*n Raumbenutzer*in. Wenn der genaue Text einer parametrisierten Beispielabfrage oder SQL-Funktion verwendet wird, um eine Antwort zu generieren, markiert Genie die Antwort als vertrauenswürdig. Weitere Informationen zu vertrauenswürdigen Ressourcen finden Sie unter Verwenden von vertrauenswürdigen Ressourcen in AI/BI Genie Spaces . Um mehr über die Arbeit mit parametrisierten Abfragen zu erfahren, siehe Verwenden von Parametern in SQL-Abfragen.
Antworten mit Benchmarks bewerten
Benchmarks ermöglichen es Ihnen, Tests und Bewertungen einzelner Antworten in einem Genie-Raum zu skalieren. Im Gegensatz zu Anweisungen sollen Referenzwerte Ihren Genie-Bereich bewerten, nicht informieren. Genie verwendet keine Benchmarkfragen oder Beispiel-SQL, um den Kontext von Genie zu verbessern.
Mithilfe von Benchmarks können Sie eine Sammlung von Testfragen ausführen und die Antworten verwenden, um die Genauigkeit von Genie zu messen. Optional können Sie eine SQL-Anweisung einfügen, die die erwarteten Ergebnisse zurückgibt. Wenn die Benchmark-Frage ausgeführt wird, wird die Antwort von Genie mit den Ergebnissen der SQL-Anweisung verglichen und für die Genauigkeit bewertet. Die Frage wird zur Überprüfung markiert, wenn keine SQL-Antwort bereitgestellt wurde.
Siehe Verwenden von Benchmarks in einem Genie-Raum.
Datenschutz und Sicherheit
Der Datenzugriff in einem Genie-Raum unterliegt dem Unity-Katalog, einschließlich aller Zeilenfilter und Spaltenmasken, die auf Ihre Tabellen angewendet wurden. Siehe Datenzugriffssteuerung und Zeilenfilter und Spaltenmasken.
Weitere Häufig gestellte Fragen zu Datenschutz und Sicherheit finden Sie in den häufig gestellten Fragen zu Datenschutz und Sicherheit für KI-Hilfsfeatures.