10 razones para desplegar Hadoop en Cloud

mayo 18, 2017

Necesitamos una plataforma para Big Data. Cuando en muchas organizaciones se decide por desplegar un entorno de big data, pongamos por caso Hadoop, que de soporte a las necesidades de almacenamiento y análisis, a menudo se comienza por una unidad de negocio o departamento con un despliegue local. En seguida nos damos cuenta del quebradero de cabeza que es desplegar un entorno Hadoop en cuanto a recursos, conocimientos, y capacidades. Es cuando nos damos cuenta que hubiera sido mejor partir desde un principio con un despliegue en cloud.

El ecosistema Hadoop en la nube significa que ejecutamos los clusters Hadoop sobre hardware y conectividad ofrecido por un proveedor de servicios en la nube. Los más usados son AWS, Google, Azure e IBM. Y esta práctica se ha convertido casi en de facto en comparación con la ejecución de clústeres Hadoop en nuestro propio hardware (on-premises). Sin embargo, instalar un clúster Hadoop en un servicio de nube pública no es tan sencillo como puede parecer, puede resultar un poco complicado la primera vez que se despliega debido a su distribución en paralelo. Sin embargo, tiene una serie de ventajas sobre una instalación local.

COSTE

Depende mucho de las necesidades de cada organización pero casi en cualquier sector para entornos de producción los servicios cloud van a suponer un coste menor al equivalente en un entorno on-premises si tenemos en cuenta todos los costes asociados (compras, instalaciones, actualizaciones, licencias, mantenimiento).

Escasez de almacenamiento

Nuestra organización o nuestros clientes pueden necesitar clústeres Hadoop, pero no tenemos ningún lugar para mantener racks de servidores físicos, junto con la energía necesaria y el enfriamiento.

Flexibilidad

Sin servidores físicos que ir acumulando y conectando es mucho más fácil reorganizar instancias, ampliar o contraer nuestras capacidades, según las necesidades del negocio. Todo se controla a través de las API del proveedor cloud mediante una consola web. Los cambios se pueden programar y poner en práctica de forma manual o incluso automática y cambiarlas dinámicamente en función de las condiciones del momento.

Nuevos patrones de uso

La flexibilidad de realizar cambios en la nube permite migrar a nuevos patrones de uso que de otro modo no son prácticos. Por ejemplo, los administradores pueden tener sus propias instancias, clusters e incluso redes, sin mucha sobrecarga administrativa. El presupuesto global para núcleos de CPU en nuestra cuenta del proveedor cloud puede concentrarse en un conjunto de instancias grandes, un conjunto más grande de instancias más pequeñas o alguna mezcla, e incluso puede cambiar con el tiempo.

Velocidad de cambio

Es mucho más rápido lanzar nuevas instancias en la nube o asignar nuevas bases de datos que comprar, descomprimir, montar y configurar equipos físicos. Del mismo modo, los recursos no utilizados en la nube pueden ser desconectados rápidamente, mientras que el hardware local no utilizado tiende a permanecer desperdiciado y quedar obsoleto.

Menor riesgo

¿Cuánto hardware on-premise debemos comprar? Si no tenemos suficiente, todo el negocio se ralentiza. Si compramos demasiado, hemos desperdiciado dinero y tenemos hardware inactivo que continúa depreciándose. En la nube, podemos cambiar rápida y fácilmente el número de recursos que utilizamos, por lo que existe poco riesgo de falta o exceso de compromiso Lo que es más, si se produce algún mal funcionamiento de los recursos, no recae sobre nosotros la tarea de arreglo y sustitución, podemos descartarlo sencillamente y asignar uno nuevo.

Enfoque

Una organización que utiliza un proveedor de cloud para dar servicios, en lugar de dedicar tiempo y esfuerzo a la logística de comprar y mantener su propio hardware físico y redes, es libre para concentrarse en sus competencias básicas, cómo usar clústeres Hadoop para llevar a cabo su negocio. Esta es una ventaja muy convincente para startups y pequeñas y pequeñas y medianas empresas.

Disponibilidad a nivel mundial

Los proveedores de cloud más grandes cuentan con centros de datos en todo el mundo, preparados para funcionar desde el momento que los necesitemos. Podemos utilizar recursos localizados cerca de donde trabajamos, o cerca de donde están nuestros clientes, para obtener el mejor rendimiento. Podemos configurar clusters redundantes, o incluso entornos informáticos completos, en múltiples centros de datos, de modo que si ocurren problemas locales en un centro de datos, podemos cambiar a trabajar en otro lugar.

Requisitos de almacenamiento de datos

Si tenemos datos que la ley requiere que se almacenen en áreas geográficas específicas, podemos mantenerla en clústeres alojados en centros de datos en esas áreas. Cada proveedor de cloud computing ofrece un ecosistema de características para soportar las funciones básicas de computación, redes y almacenamiento. Para utilizar estas funciones de la manera más eficaz, nuestros clústeres también deben ejecutarse en el proveedor de la nube.

Fiscalidad

Según qué casos desde el puto de vista fiscal acceder a servicios externos puede tener mejores ventajas que adquirir todo el hardware en propiedad.

¿Está interesado en desplegar una solución Hadoop – Spark o saber más de Big Data? Pregúntanos en info@baoss.es

What do you think?

Show comments / Leave a comment

Deja una respuesta Cancelar la respuesta

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Deja una respuesta Cancelar la respuesta

Funciones de las herramientas para IaC Automation

UX Analytics – Transformación digital con experiencia de usuario

Analítica Avanzada: Powercenter + R

10 razones para desplegar Hadoop en Cloud

COSTE

Escasez de almacenamiento

Flexibilidad

Nuevos patrones de uso

Velocidad de cambio

Menor riesgo

Enfoque

Disponibilidad a nivel mundial

Requisitos de almacenamiento de datos

Fiscalidad

What do you think?

Deja una respuesta Cancelar la respuesta

More notes

Funciones de las herramientas para IaC Automation

UX Analytics – Transformación digital con experiencia de usuario

Analítica Avanzada: Powercenter + R

Inactive