Sistemas y herramientas big data
Para capturar y organizar la gran variedad de tipos de datos provenientes de diversas fuentes se requieren las herramientas adecuadas. Antes de nada debemos realizar un análisis en el contexto de todo la información corporativa. Siguiendo una estrategia de implementación definida y aplicando las tecnologías adecuadas, es cuando podemos capitalizar el potencial de big data y ganar una ventaja competitiva.
Cuando se hacen nuevas inversiones es fundamental construir sobre una infraestructura que permita escalar rápidamente y compartir entre equipos a medida que la demanda fluctúe. Ya sea en almacenamiento, procesamiento, o ancho de banda, los sistemas deben operar al mejor nivel de rendimiento durante el mayor tiempo posible y de la manera más eficiente. Hay dos maneras de implementar los sistemas para Big Data: hacerlo en la infraestructura propia de la empresa o contratar un proveedor que ofrezca una plataforma Big Data en la nube. Cada empresa es diferente, por gustos, preferencias, capacidades técnicas, de personal, requerimientos legislativos, financieros,… unas optan por seguir con su propio hardware autogestionado como hasta hace pocos años era la única opción, o bien, cada vez más, optar por subcontratar este área a empresas que se dedican solamente a ofrecer el mejor servicio posible en cuanto a sistemas y conectividad.
Las claves a la hora de elegir la mejor estrategia de sistemas para big data son coste, seguridad, escalabilidad, facilidad de tener la red distribuida, y compatibilidad.
Coste
El coste es uno de los factores más importantes y en ocasiones la condición que determina la estrategia de sistemas. ¿Cuáles son las diferencias en costes entre desarrollar Big Data on-site y hacerlo en cloud? La primera opción requiere adquirir infraestructura costosa (espacio físico, racks de servidores, conectividad) para poder recoger, almacenar y analizar los datos. Normalmente se trata de un proceso de varios millones de euros a pagar por adelantado (aunque se financie). Por el elevado coste de arranque hasta hace poco muchas empresas pequeñas no podían llevar a cabo proyectos de big data. Hoy en día, con la opción Big Data en la nube esos costes iniciales prácticamente se han eliminado. No hay tarifas de mantenimiento, se paga mensualmente solamente por el uso y así se puede ir creciendo a media de las necesidades. Además ya no se requiere de personal experto en administración de sistemas que monitoricen constantemente el estado ya que de eso se encarga la empresa proveedora del cloud.
Seguridad
Una de las ventajas que a priori tienen los sistemas on site son las medidas adicionales de seguridad de datos. Al tener los datos localmente almacenados son más fáciles de monitorizar. Las empresas pueden conocer en todo momento quien está accediendo a los datos y cómo se están usando. Aunque no tiene porqué ser, la mayoría de responsables de IT de las empresas piensan que un data center externo supone un riesgo inherente, a pesar de que los data centers son extremadamente seguros. En ocasiones más que los propios servidores mantenidos por la empresa ya que se dedican a ello y tienen más conocimientos y medios para predecir ataques y establecer medidas de defensa. Las soluciones cloud más respetadas han seguido los pasos necesarios para asegurar que los datos que almacenan están a salvo y sean seguros ofreciendo métodos de encriptación, reglas de seguridad física y lógica.
Capacidades
Otro punto importante a la hora de decidirse por un sistema cloud o on-premises es la capacidad actual que posee la empresa en tecnologías big data. ¿Tiene el personal adecuado para realizar la implantación? ¿Se dispone ya del equipo formado en todos los aspectos de big data que se vana requerir? ¿Tiene el equipo adecuado para mantenimiento y workflow? Si no se dispone, ¿tiene capacidad de adquirirlo, contratarlo y formarlo? Disponer de los sistemas big data in house tienen unas necesidades significativas, pero en modo cloud son más accesibles. Con Big Data en cloud las empresas pueden realmente centrarse en lo que es más importante, dar sentido a la información extraida del conjunto de datos y tomar las decsiones para mejorar su negocio.
Escalabilidad
A medida que los datos comienzan a estar disponibles para analizar, más importancia cobra la escalabilidad. De manera sencilla, la escalabilidad sería la flexibilidad con la que la empresa puede aumentar o disminuir sus necesidades de tratamiento de datos. Es mucho más complejo escalar una solución Big Data si reside en los sistemas propios. Si se reciben más datos de los que admite la solución hay que ampliar sistemas. Si sobran, se está desperdiciando infraestructura. Ambas situaciones suponen costes para la empresa. Con Big Data en la nube podemos escalar hacia arriba o hacia abajo con mucha mayor facilidad y rapidez sin que nos afecten las implicaciones financieras o fallos de previsión.
El método de despliegue de entornos de sistemas adecuado puede llevar al éxito o suponer el fracaso de nuestra iniciativa big data, por lo que se ha de tener en cuenta el conjunto de necesidades presentes y prever las futuras. Las inversiones pueden ir adaptándose según las condiciones del negocio, expandiéndose o reduciéndose según las circunstancias del momento, pero lo que será una constante es el uso estratégico de la información crítica para la empresa.
Recuerde, cada empresa es un mundo, y tienen sus propias necesidades y condicionantes. Las opciones de deployments de sistemas que existen ahora permiten planificar las iniciativas en big data e ir creciendo a medida de las necesidades. Los sistemas pueden estar dentro de la organización, fuera, o bien ser una mezcla, e incluyen:
- En las propias instalaciones (On-premises)
- En la nube (cloud pública o privada)
- Como un servicio (aaS)
- Híbrida (on-premises y en la nube).
El juego entre flexibilidad y control, coste y fiabilidad es donde cada empresa valorará su mejor opción. En cualquier caso, es importante no dejar pasar esta oleada de búsqueda de información y aprovechamiento de los datos, ya que si no lo hacemos nosotros, nuestra competencia lo hará y se llevará los beneficios.
What do you think?
Un post muy interesante y muy cierto.
En Alfatec Sistemas conocemos las importancia que tiene el Big Data a día de hoy.