El ecosistema Hadoop en la nube significa que ejecutamos los clusters Hadoop sobre hardware y conectividad ofrecido por un proveedor de servicios en la nube. Los más usados son AWS, Google, Azure e IBM. Y esta práctica se ha convertido casi en de facto en comparación con la ejecución de clústeres Hadoop en nuestro propio hardware (on-premises). Sin embargo, instalar un clúster Hadoop en un servicio de nube pública no es tan sencillo como puede parecer, puede resultar un poco complicado la primera vez que se despliega debido a su distribución en paralelo. Sin embargo, tiene una serie de ventajas sobre una instalación local.
COSTE
Depende mucho de las necesidades de cada organización pero casi en cualquier sector para entornos de producción los servicios cloud van a suponer un coste menor al equivalente en un entorno on-premises si tenemos en cuenta todos los costes asociados (compras, instalaciones, actualizaciones, licencias, mantenimiento).
Escasez de almacenamiento
Nuestra organización o nuestros clientes pueden necesitar clústeres Hadoop, pero no tenemos ningún lugar para mantener racks de servidores físicos, junto con la energía necesaria y el enfriamiento.
Flexibilidad
Sin servidores físicos que ir acumulando y conectando es mucho más fácil reorganizar instancias, ampliar o contraer nuestras capacidades, según las necesidades del negocio. Todo se controla a través de las API del proveedor cloud mediante una consola web. Los cambios se pueden programar y poner en práctica de forma manual o incluso automática y cambiarlas dinámicamente en función de las condiciones del momento.
Nuevos patrones de uso
La flexibilidad de realizar cambios en la nube permite migrar a nuevos patrones de uso que de otro modo no son prácticos. Por ejemplo, los administradores pueden tener sus propias instancias, clusters e incluso redes, sin mucha sobrecarga administrativa. El presupuesto global para núcleos de CPU en nuestra cuenta del proveedor cloud puede concentrarse en un conjunto de instancias grandes, un conjunto más grande de instancias más pequeñas o alguna mezcla, e incluso puede cambiar con el tiempo.
Velocidad de cambio
Es mucho más rápido lanzar nuevas instancias en la nube o asignar nuevas bases de datos que comprar, descomprimir, montar y configurar equipos físicos. Del mismo modo, los recursos no utilizados en la nube pueden ser desconectados rápidamente, mientras que el hardware local no utilizado tiende a permanecer desperdiciado y quedar obsoleto.
Menor riesgo
¿Cuánto hardware on-premise debemos comprar? Si no tenemos suficiente, todo el negocio se ralentiza. Si compramos demasiado, hemos desperdiciado dinero y tenemos hardware inactivo que continúa depreciándose. En la nube, podemos cambiar rápida y fácilmente el número de recursos que utilizamos, por lo que existe poco riesgo de falta o exceso de compromiso Lo que es más, si se produce algún mal funcionamiento de los recursos, no recae sobre nosotros la tarea de arreglo y sustitución, podemos descartarlo sencillamente y asignar uno nuevo.
Enfoque
Una organización que utiliza un proveedor de cloud para dar servicios, en lugar de dedicar tiempo y esfuerzo a la logística de comprar y mantener su propio hardware físico y redes, es libre para concentrarse en sus competencias básicas, cómo usar clústeres Hadoop para llevar a cabo su negocio. Esta es una ventaja muy convincente para startups y pequeñas y pequeñas y medianas empresas.
Disponibilidad a nivel mundial
Los proveedores de cloud más grandes cuentan con centros de datos en todo el mundo, preparados para funcionar desde el momento que los necesitemos. Podemos utilizar recursos localizados cerca de donde trabajamos, o cerca de donde están nuestros clientes, para obtener el mejor rendimiento. Podemos configurar clusters redundantes, o incluso entornos informáticos completos, en múltiples centros de datos, de modo que si ocurren problemas locales en un centro de datos, podemos cambiar a trabajar en otro lugar.
Requisitos de almacenamiento de datos
Si tenemos datos que la ley requiere que se almacenen en áreas geográficas específicas, podemos mantenerla en clústeres alojados en centros de datos en esas áreas. Cada proveedor de cloud computing ofrece un ecosistema de características para soportar las funciones básicas de computación, redes y almacenamiento. Para utilizar estas funciones de la manera más eficaz, nuestros clústeres también deben ejecutarse en el proveedor de la nube.
Fiscalidad
Según qué casos desde el puto de vista fiscal acceder a servicios externos puede tener mejores ventajas que adquirir todo el hardware en propiedad.
¿Está interesado en desplegar una solución Hadoop – Spark o saber más de Big Data? Pregúntanos en info@baoss.es