Glosario IA
El diccionario completo de la Inteligencia Artificial
Amazon EMR (Elastic MapReduce)
Servicio AWS gestionado para el procesamiento distribuido de grandes volúmenes de datos a través de frameworks como Apache Spark, Hadoop y Presto con escalabilidad elástica.
Azure HDInsight
Servicio en la nube de Azure que ofrece clústeres Hadoop gestionados, incluyendo Spark, Hive, HBase y Storm, para el procesamiento de datos masivos con integración nativa en el ecosistema de Microsoft.
Google Cloud Dataflow
Servicio sin servidor de GCP para la ejecución de pipelines de Apache Beam que permite el procesamiento por lotes y en streaming con autoescalado y un modelo de precios basado en el uso real.
Google Cloud Bigtable
Base de datos NoSQL de columnas anchas de GCP optimizada para cargas de trabajo de Big Data con baja latencia y alto rendimiento, ideal para aplicaciones analíticas y de series temporales.
Amazon Kinesis
Plataforma AWS para la recopilación, procesamiento y análisis de datos en streaming en tiempo real con componentes especializados para la ingesta (Kinesis Data Streams) y el procesamiento (Kinesis Data Analytics).
Google Cloud Pub/Sub
Servicio de mensajería distribuido y global de GCP para el intercambio de eventos entre aplicaciones con garantía de entrega al menos una vez y escalabilidad automática.
Azure Event Hubs
Plataforma de streaming de datos distribuida de Azure capaz de ingerir millones de eventos por segundo con soporte para los protocolos Apache Kafka y particionamiento automático.
AWS Lambda
Servicio sin servidor para la ejecución de código sin aprovisionamiento de servidores, ideal para transformaciones de datos en pipelines ETL con facturación por milisegundo.
Google Cloud Functions
Servicio sin servidor de GCP que permite la ejecución de funciones Python/Node.js/Go en respuesta a eventos, perfecto para microservicios de procesamiento de datos.
Azure Functions
Plataforma sin servidor de Azure para la ejecución de código basado en eventos con soporte para múltiples lenguajes y disparadores integrados para el procesamiento de datos en tiempo real.