Compartir a través de


Inicio rápido: Consulta Apache HBase en Azure HDInsight con HBase Shell

En este inicio rápido, aprenderá a usar El shell de Apache HBase para crear una tabla de HBase, insertar datos y, a continuación, consultar la tabla.

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Prerrequisitos

Creación de una tabla y manipulación de datos

Para la mayoría de las personas, los datos aparecen en el formato tabular:

Datos tabulares de Apache HBase de HDInsight.

En HBase (una implementación de Cloud BigTable), los mismos datos son los siguientes:

Datos de Apache HBase BigTable de HDInsight.

Puede usar SSH para conectarse a clústeres de HBase y, a continuación, usar El shell de Apache HBase para crear tablas de HBase, insertar datos y consultar datos.

  1. Use ssh el comando para conectarse al clúster de HBase. Edite el comando siguiente reemplazando CLUSTERNAME por el nombre del clúster y escriba el comando :

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Use hbase shell el comando para iniciar el shell interactivo de HBase. Escriba el siguiente comando en la conexión SSH:

    hbase shell
    
  3. Use create el comando para crear una tabla de HBase con familias de dos columnas. Escriba el comando siguiente:

    create 'Contacts', 'Personal', 'Office'
    
  4. Use list el comando para enumerar todas las tablas de HBase. Escriba el comando siguiente:

    list
    
  5. Use put el comando para insertar valores en una columna especificada de una fila especificada en una tabla determinada. Escriba el comando siguiente:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Utilice el comando scan para examinar y devolver los datos de la tabla Contacts. Escriba el comando siguiente:

    scan 'Contacts'
    
  7. Utiliza el comando get para obtener el contenido de una fila. Escriba el comando siguiente:

    get 'Contacts', '1000'
    

    Verá resultados similares al usar el scan comando porque solo hay una fila.

  8. Use delete el comando para eliminar un valor de celda en una tabla. Escriba el comando siguiente:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Usa el comando disable para deshabilitar la tabla. Escriba el comando siguiente:

    disable 'Contacts'
    
  10. Use drop el comando para quitar una tabla de HBase. Escriba el comando siguiente:

    drop 'Contacts'
    
  11. Usa el comando exit para detener el shell interactivo de HBase. Escriba el comando siguiente:

    exit
    

Para obtener más información sobre el esquema de tabla de HBase, consulte Introducción al diseño de esquemas de Apache HBase. Para obtener más comandos de HBase, consulte la guía de referencia de Apache HBase.

Limpieza de recursos

Después de completar el inicio rápido, puede ser conveniente eliminar el clúster. Con HDInsight, los datos se almacenan en Azure Storage, por lo que puede eliminar de forma segura un clúster cuando no esté en uso. También se le cobra por un clúster de HDInsight, incluso cuando no está en uso. Dado que los cargos del clúster son muchas veces más que los cargos por el almacenamiento, tiene sentido económico eliminar clústeres cuando no están en uso.

Para eliminar un clúster, consulte Eliminación de un clúster de HDInsight mediante el explorador, PowerShell o la CLI de Azure.

Pasos siguientes

En este inicio rápido, ha aprendido a usar El shell de Apache HBase para crear una tabla de HBase, insertar datos y, a continuación, consultar la tabla. Para más información sobre los datos almacenados en HBase, el siguiente artículo le mostrará cómo ejecutar consultas con Apache Spark.