3 diferentes tipos de software



Hadoop:
Es un sistema de código abierto que se usa para almacenar, procesar y analizar grandes volúmenes de datos, también almacena toda clase de datos, tanto estructurados como no estructurados o semiestructurados.
Ventaja: puede administrar prácticamente cualquier archivo o formato de manera que las organizaciones pueden plantearse cosas que nunca creyeron posibles.
Desventaja: no está pensado para hacerlo en tiempo real, ya que tiene una alta latencia.
Python:
Es una herramienta para Big Data muy eficiente, en parte debido a la gran comunidad existente, por lo que Python dispone de muchas librerías ya hechas por otros usuarios.
Ventaja: relativamente fácil de usar para usuarios que no estén familiarizados con la informática de manera profesional, pero que necesitan trabajar con análisis de datos 
Desventaja: no es un lenguaje muy rápido en su ejecución, por lo que suele ser empleado para tareas de integración o tareas donde no haya cálculos pesados. 
Elasticsearch:
Es una potente herramienta para la búsqueda entre grandes cantidades de datos, especialmente cuando los datos son de tipo complejo.
Ventaja: Nos permite indexar y analizar en tiempo real un gran volumen de datos y hacer consultas sobre ellos. No necesita declarar un esquema de la información que añadimos, no sabemos exactamente qué forma van a tener los datos.

Desventaja: Ejecutado sobre Java y consume mucha ram de nuestro servidor...

Cuesta asimilar los conceptos sobre todo si estamos acostumbrados a SQL

Referencias:

Comentarios