Por Fabiola Blanco – Estudiante de la carrera de Ingeniería Informática

Como seres humanos modernos creamos una huella digital cada vez mayor, tanto así que, según Oracle (s. f.), el volumen de datos que se procesan duplica su tamaño cada dos años aproximadamente. Toda esta información puede llegar a ser de utilidad para las empresas si se utilizan con el fin adecuado, ayudando así a mejorar el desarrollo de sus productos y la experiencia del cliente al utilizarla. El big data se especializa en procesar grandes cantidades de datos. Sin embargo, debido al volumen de información que se debe manejar existen desafíos cada vez mayores para la industria tecnología que intenta seguir el ritmo exponencial con el que crece el flujo de datos. Por ello existen herramientas tecnológicas especializadas para procesar, almacenar y analizar dicha información, enfocándose principalmente en tecnologías como R, Python y servicios como ElasticSearch y Apache Spark. Sin embargo, no son las únicas opciones para el procesamiento de Big Data. A continuación se van a presentar algunas alternativas que ofrece Microsoft que pueden ser utilizadas en sincronía con otros productos dentro de su ecosistema tecnológico como son C# y Azure, entre otros.

Según Oracle (s. f.) existen tres acciones clave para el funcionamiento del Big Data. La primera de ellas es la integración de los datos, existen procesos tales como ETL que ayudan con esto. Sin embargo, de la mano de la segunda acción clave, la cual es el gestionamiento de la información, viene el tema del almacenamiento de datos. En términos de Big Data se les da preferencia a las bases de datos Nosql debido a la flexibilidad que ofrece para el almacenamiento de información, además de que este sistema de almacenamiento puede resultar mucho más eficaz y rápido que las bases de datos relacionales.

Como alternativa a SQL, Microsoft trae consigo CosmosBD, una base de datos no relacional que cuenta con API’s de código abierto para MongoBD, Cassandra y Gremlin, además de permitir el análisis en tiempo real de datos sin tener que pasar por procesos de ETL mediante su servicio Azure Synapse Link. Esta última herramienta nos lleva a hablar de la tercera acción necesaria para Big Data, la cual es el análisis de datos.

Con Azure Synapse Link se reduce la complejidad del proceso de análisis de datos que se tenía con ETL debido a que puede acceder directamente al almacén analítico de CosmosBD, de forma que se puede realizar un análisis de datos a gran escala sin tener que pasar por procesos de transformación de datos adicionales, sin afectar el rendimiento de la carga de trabajo de la base de datos. También es posible utilizar los servicios de Azure Stream Analytics para tareas de análisis de datos, que les permite a los desarrolladores escribir sus propias funciones en C# para el proceso de análisis de datos.

Como se puede observar Microsoft tiene un ecosistema muy completo para trabajar con Big Data relacionando sus servicios para ofrecer una solución completa e integrando a ella el posible uso de herramientas como lo es C# y su .Net Framework en el proceso. Con esto, abre la posibilidad de integración para desarrolladores que no conocen de tecnologías como R y Python en el mundo del Big Data, llevando a otro nivel sus servicios y evolucionando al igual que las demás compañías tecnológicas.

 

MOXIE es el Canal de ULACIT (www.ulacit.ac.cr), producido por y para los estudiantes universitarios, en alianza con el medio periodístico independiente Delfino.cr, con el propósito de brindarles un espacio para generar y difundir sus ideas.  Se llama Moxie - que en inglés urbano significa tener la capacidad de enfrentar las dificultades con inteligencia, audacia y valentía - en honor a nuestros alumnos, cuyo “moxie” los caracteriza.

Referencia bibliográfica:

  • Oracle. (s. f.). ¿Qué es big data? https://www.oracle.com/es/big-data/what-is-big-data/#link1.