La NASA usa Hadoop para gestionar su Big Data

La NASA produce altos volúmenes de información. Foto: Luke Bryant (Via: NASA)

La NASA produce altos volúmenes de información. Foto: Luke Bryant (Via: NASA)
La NASA produce altos volúmenes de información. Foto: Luke Bryant (Via: NASA)

A diario la NASA recibe varios petabytes (mil terabytes) de información, provenientes de todos los satélites y misiones que tienen en el espacio. La NASA como organización debe administrar con eficiencia esos volúmenes de datos y para muchos es un misterio saber cómo lo logran.

Según lo que Chris Mattman, investigador de la iniciativa big-data de un laboratorio de la agencia, le dijo a Information Weekly, “la NASA en total debe manejar cientos de petabytes, en ocasiones cerca un exabyte [mil petabytes], especialmente si tenemos en cuenta todos los dominios y disciplinas de la ciencia, y las información de los planetas y el espacio”.

Para manejar estos volúmenes de datos, la agencia tiene varios métodos. Lógicamente no pueden almacenar y conservar todo lo que reciben. El primer paso es identificar qué parte de la información debe ser conservada y qué parte puede ser desechada. Por ejemplo, todo lo que proviene de los Sistemas de Observación de la Tierra son procesados, archivados y repartidos por el Centro Activo de Archivos Distribuidos.

“Su misión [la del Centro] es ser los administradores y preservadores de la información. Tienen un proyecto muy grande, y su trabajo es asegurarse de que los datos correctos sean conservados”, y estén a la disposición del laboratorio de la NASA que los necesite para sus investigaciones.

Muchos laboratorios, incluyendo el que dirige Mattman, se apoyan en el software libre para manejar su información porque es más económico. Ellos utilizan una suite de Linux que se llama Hadoop y una herramienta que se llama Apache TIKA que sirve para extraer metadatos y texto estructurado de los documentos.

Nicolás Rueda

Nicolás Rueda

Soy un desparchado. Amo los videojuegos, la filosofía, la música y la poesía. Estoy obsesionado con las personas que se pegan a las pantallas y me gusta ver a la gente montar en bicicleta cuando voy en bus. Mi educación desde niño hasta lo que soy hoy, se resume a un supernintendo y a intentar vivir cada día como si fuera un juego. Por eso estoy acá, en ENTER.CO, donde colisionan, inevitablemente, todas mis pasiones: La vida y la tecnología como una sola cosa.

View all posts

4 comments

Archivos