Compartilhar via


Início Rápido: Consultar o Apache HBase no Azure HDInsight com o HBase Shell

Neste início rápido, você aprenderá a usar o Shell do Apache HBase para criar uma tabela HBase, inserir dados e consultar a tabela.

Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Criar uma tabela e manipular dados

Para a maioria das pessoas, os dados são exibidos no formato tabular:

Dados tabulares do Apache HBase do HDInsight.

No HBase (uma implementação do BigTable na Nuvem), os mesmos dados são semelhantes a:

Dados do HdInsight Apache HBase BigTable.

Você pode usar o SSH para se conectar a clusters HBase e, em seguida, usar o Shell do Apache HBase para criar tabelas do HBase, inserir dados e consultar dados.

  1. Use o comando ssh para se conectar ao cluster HBase. Edite o comando abaixo substituindo CLUSTERNAME pelo nome do seu cluster, e então execute o comando:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Use hbase shell o comando para iniciar o shell interativo do HBase. Insira o seguinte comando em sua conexão SSH:

    hbase shell
    
  3. Use create o comando para criar uma tabela HBase com famílias de duas colunas. Insira o seguinte comando:

    create 'Contacts', 'Personal', 'Office'
    
  4. Use list o comando para listar todas as tabelas no HBase. Insira o seguinte comando:

    list
    
  5. Use put o comando para inserir valores em uma coluna especificada em uma linha especificada em uma tabela específica. Insira o seguinte comando:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Use o comando scan para verificar e retornar os dados da tabela Contacts. Insira o seguinte comando:

    scan 'Contacts'
    
  7. Use get o comando para buscar o conteúdo de uma linha. Insira o seguinte comando:

    get 'Contacts', '1000'
    

    Você vê resultados semelhantes ao uso do scan comando porque há apenas uma linha.

  8. Use delete o comando para excluir um valor de célula em uma tabela. Insira o seguinte comando:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Use o comando disable para desativar a tabela. Insira o seguinte comando:

    disable 'Contacts'
    
  10. Use drop o comando para remover uma tabela do HBase. Insira o seguinte comando:

    drop 'Contacts'
    
  11. Use o comando exit para parar o shell interativo do HBase. Insira o seguinte comando:

    exit
    

Para obter mais informações sobre o esquema de tabela do HBase, consulte Introdução ao Design de Esquema do Apache HBase. Para obter mais comandos do HBase, consulte o guia de referência do Apache HBase.

Limpar os recursos

Após concluir o início rápido, poderá ser conveniente excluir o cluster. Com o HDInsight, seus dados são armazenados no Armazenamento do Azure, para que você possa excluir com segurança um cluster quando ele não estiver em uso. Você também é cobrado por um cluster HDInsight, mesmo quando ele não está em uso. Como os encargos para o cluster são muitas vezes mais do que os encargos para o armazenamento, faz sentido econômico excluir clusters quando eles não estão em uso.

Para excluir um cluster, consulte Excluir um cluster HDInsight usando o navegador, o PowerShell ou a CLI do Azure.

Próximas etapas

Neste início rápido, você aprendeu a usar o Shell do Apache HBase para criar uma tabela HBase, inserir dados e consultar a tabela. Para saber mais sobre os dados armazenados no HBase, o próximo artigo mostrará como executar consultas com o Apache Spark.