Freigeben über


Schnellstart: Abfragen von Apache HBase in Azure HDInsight mit HBase Shell

In dieser Schnellstartanleitung erfahren Sie, wie Sie Apache HBase Shell verwenden, um eine HBase-Tabelle zu erstellen, Daten einzufügen und dann die Tabelle abzufragen.

Wenn Sie noch kein Azure-Abonnement haben, erstellen Sie ein kostenloses Konto, bevor Sie beginnen.

Voraussetzungen

Erstellen einer Tabelle und Bearbeiten von Daten

Für die meisten Personen werden Daten im tabellarischen Format angezeigt:

HDInsight Apache HBase Tabellendaten.

In HBase (einer Implementierung von Cloud BigTable) sehen die gleichen Daten wie folgt aus:

HDInsight-Apache-HBase-BigTable-Daten.

Sie können SSH verwenden, um eine Verbindung mit HBase-Clustern herzustellen, und dann Apache HBase Shell verwenden, um HBase-Tabellen zu erstellen, Daten und Abfragedaten einzufügen.

  1. Verwenden Sie ssh den Befehl, um eine Verbindung mit Ihrem HBase-Cluster herzustellen. Bearbeiten Sie den folgenden Befehl, indem Sie ihn durch den Namen Ihres Clusters ersetzen CLUSTERNAME und dann den Befehl eingeben:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Verwenden Sie hbase shell den Befehl, um die interaktive HBase-Shell zu starten. Geben Sie den folgenden Befehl in Ihre SSH-Verbindung ein:

    hbase shell
    
  3. Verwenden Sie create den Befehl zum Erstellen einer HBase-Tabelle mit zwei Spaltenfamilien. Geben Sie den folgenden Befehl ein:

    create 'Contacts', 'Personal', 'Office'
    
  4. Verwenden Sie list den Befehl zum Auflisten aller Tabellen in HBase. Geben Sie den folgenden Befehl ein:

    list
    
  5. Verwenden Sie den Befehl zum Einfügen von put Werten in einer angegebenen Spalte in einer angegebenen Zeile in einer bestimmten Tabelle. Geben Sie den folgenden Befehl ein:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Verwenden Sie scan den Befehl, um die Contacts Tabellendaten zu scannen und zurückzugeben. Geben Sie den folgenden Befehl ein:

    scan 'Contacts'
    
  7. Verwenden Sie get den Befehl zum Abrufen von Inhalten einer Zeile. Geben Sie den folgenden Befehl ein:

    get 'Contacts', '1000'
    

    Sie sehen ähnliche Ergebnisse wie die Verwendung des scan Befehls, da nur eine Zeile vorhanden ist.

  8. Verwenden Sie delete den Befehl, um einen Zellwert in einer Tabelle zu löschen. Geben Sie den folgenden Befehl ein:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Verwenden Sie disable den Befehl, um die Tabelle zu deaktivieren. Geben Sie den folgenden Befehl ein:

    disable 'Contacts'
    
  10. Verwenden Sie drop den Befehl, um eine Tabelle aus HBase abzulegen. Geben Sie den folgenden Befehl ein:

    drop 'Contacts'
    
  11. Verwenden Sie exit den Befehl, um die interaktive HBase-Shell zu beenden. Geben Sie den folgenden Befehl ein:

    exit
    

Weitere Informationen zum HBase-Tabellenschema finden Sie in der Einführung in das Apache HBase-Schemadesign. Weitere HBase-Befehle finden Sie im Apache HBase-Referenzhandbuch.

Bereinigen von Ressourcen

Nachdem Sie den Schnellstart abgeschlossen haben, können Sie den Cluster löschen. Mit HDInsight werden Ihre Daten in Azure Storage gespeichert, sodass Sie einen Cluster sicher löschen können, wenn er nicht verwendet wird. Sie werden auch für einen HDInsight-Cluster belastet, auch wenn er nicht verwendet wird. Da die Gebühren für den Cluster oft mehr sind als die Gebühren für die Speicherung, ist es wirtschaftlich sinnvoll, Cluster zu löschen, wenn sie nicht verwendet werden.

Informationen zum Löschen eines Clusters finden Sie unter "Löschen eines HDInsight-Clusters mit Ihrem Browser, PowerShell oder der Azure CLI".

Nächste Schritte

In dieser Schnellstartanleitung haben Sie erfahren, wie Sie Apache HBase Shell verwenden, um eine HBase-Tabelle zu erstellen, Daten einzufügen und dann die Tabelle abzufragen. Weitere Informationen zu daten, die in HBase gespeichert sind, erfahren Sie im nächsten Artikel, wie Sie Abfragen mit Apache Spark ausführen.