Programa del Curso
- Sección 1: Introducción a Big Data y NoSQL
- Big Data Ecosistema
- NoSQL Visión general
- Teorema CAP
- ¿Cuándo es apropiado NoSQL?
- Almacenamiento en columnas
- HBase y NoSQL
- Sección 2 : Introducción a HBase
- Conceptos y diseño
- Arquitectura (HMaster y servidor de región)
- Integridad de los datos
- Ecosistema HBase
- Laboratorio : Explorando HBase
- Sección 3 : Modelo de datos HBase
- Espacios de nombres, tablas y regiones
- Filas, columnas, familias de columnas, versiones
- Comandos de HBase Shell y Admin
- Laboratorio : HBase Shell
- Sección 3 : Accessing HBase usando Java API
- Introducción a la API Java
- Ruta de lectura/escritura
- Datos de series temporales
- Escaneos
- Reducción de mapas
- Filtros
- Contadores
- Coprocesadores
- Labs (múltiples) : Uso de la API HBase Java para implementar series temporales, reducción de mapas, filtros y contadores.
- Sección 4 : Diseño del esquema de HBase: Sesión de grupo
- A los estudiantes se les presentan casos de uso del mundo real
- Los estudiantes trabajan en grupos para encontrar soluciones de diseño
- Discutir/criticar y aprender de múltiples diseños
- Labs: implementación de un escenario en HBase
- Sección 5 : Componentes internos de HBase
- Entendiendo HBase bajo el capó
- Memfile / HFile / WAL
- Almacenamiento HDFS
- Compactaciones
- Divide
- Filtros de floración
- Cachés
- Diagnósticos
- Sección 6 : Instalación y configuración de HBase
- Selección de hardware
- Métodos de instalación
- Configuraciones comunes
- Laboratorio: instalación de HBase
- Sección 7 : Ecosistema HBase
- desarrollo de aplicaciones con HBase
- interactuando con otra pila Hadoop (MapReduce, Pig, Hive)
- frameworks en torno a HBase
- Conceptos avanzados (coprocesadores)
- Laboratorios: escritura de aplicaciones HBase
- Sección 8 : Monitoreo y mejores prácticas
- Herramientas y prácticas de monitoreo
- optimización de HBase
- HBase en la nube
- Casos de uso de HBase en el mundo real
- Laboratorios: comprobación de los signos vitales de la HBasa
Requerimientos
- cómodo con el lenguaje de programación Java
- cómodo en el lenguaje de programación Java (navegar Linux línea de comandos, editar archivos con vi / nano)
- Un IDE de Java como Eclipse o IntelliJ
Entorno de laboratorio:
Se proporcionará un grupo de HBase de trabajo para los estudiantes. Los estudiantes necesitarían un cliente SSH y un navegador para acceder al clúster.
Instalación cero: ¡No es necesario instalar el software HBase en las máquinas de los estudiantes!
Testimonios (5)
El conocimiento práctico por encima de la teoría
Szymon - Agora SA
Curso - Scylla Database
Traducción Automática
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Curso - Data Analysis with Hive/HiveQL
I genuinely enjoyed the many hands-on sessions.