La NASA usa Hadoop para gestionar su Big Data

noviembre 22, 2013

La NASA produce altos volúmenes de información. Foto: Luke Bryant (Via: NASA)

A diario la NASA recibe varios petabytes (mil terabytes) de información, provenientes de todos los satélites y misiones que tienen en el espacio. La NASA como organización debe administrar con eficiencia esos volúmenes de datos y para muchos es un misterio saber cómo lo logran.

Según lo que Chris Mattman, investigador de la iniciativa big-data de un laboratorio de la agencia, le dijo a Information Weekly, “la NASA en total debe manejar cientos de petabytes, en ocasiones cerca un exabyte [mil petabytes], especialmente si tenemos en cuenta todos los dominios y disciplinas de la ciencia, y las información de los planetas y el espacio”.

Para manejar estos volúmenes de datos, la agencia tiene varios métodos. Lógicamente no pueden almacenar y conservar todo lo que reciben. El primer paso es identificar qué parte de la información debe ser conservada y qué parte puede ser desechada. Por ejemplo, todo lo que proviene de los Sistemas de Observación de la Tierra son procesados, archivados y repartidos por el Centro Activo de Archivos Distribuidos.

“Su misión [la del Centro] es ser los administradores y preservadores de la información. Tienen un proyecto muy grande, y su trabajo es asegurarse de que los datos correctos sean conservados”, y estén a la disposición del laboratorio de la NASA que los necesite para sus investigaciones.

Muchos laboratorios, incluyendo el que dirige Mattman, se apoyan en el software libre para manejar su información porque es más económico. Ellos utilizan una suite de Linux que se llama Hadoop y una herramienta que se llama Apache TIKA que sirve para extraer metadatos y texto estructurado de los documentos.

Nicolás Rueda

Soy un desparchado. Amo los videojuegos, la filosofía, la música y la poesía. Estoy obsesionado con las personas que se pegan a las pantallas y me gusta ver a la gente montar en bicicleta cuando voy en bus. Mi educación desde niño hasta lo que soy hoy, se resume a un supernintendo y a intentar vivir cada día como si fuera un juego. Por eso estoy acá, en ENTER.CO, donde colisionan, inevitablemente, todas mis pasiones: La vida y la tecnología como una sola cosa.

View all posts

4 comments

Moises David Castro Martinez dice:

noviembre 22, 2013 a las 7:20 PM

procesar datos mas que tener grandes servidores es gestionar el software que los maneja….
Moises David Castro Martinez dice:

noviembre 22, 2013 a las 7:20 PM

procesar datos mas que tener grandes servidores es gestionar el software que los maneja….
L Toscano dice:

noviembre 28, 2013 a las 2:23 PM

cuantos hadoop tendran xD xD xD xD
L Toscano dice:

noviembre 28, 2013 a las 2:23 PM

cuantos hadoop tendran xD xD xD xD

La NASA usa Hadoop para gestionar su Big Data

Nicolás Rueda

4 comments

Relacionados

Asteroide 887 Alinda, tan grande como Manhattan, podría ser un peligro para la Tierra ¿Cuándo se aproximará?

El eclipse solar parcial de 2025 ¿Dónde y cómo verlo sin perderte el espectáculo?

Reviven cyborg líquido de “Terminator 2”: Surcorea desarrolló robot blando inspirado en el policía asesino

Buen dormir es perjudicado por el cambio climático: ¿Seremos humanos ‘trasnochados’ y enfermos en el futuro?

Ingenieros del MIT desarrollan músculos artificiales que piensan y se mueven

¿Qué le sucede al cuerpo humano tras meses en el espacio y su regreso a la Tierra?

Lo más leído de la semana

¿Pueden Movistar, Claro y ETB subir las tarifas de tu plan móvil en Colombia sin previo aviso?

Ahora podrás ver en Netflix contenido en HDR10+, ¿qué significa para los usuarios y cómo activarlo?

Así funciona la prueba beta de Starlink: Esta es la fecha límite para obtener el internet gratuito que ofrece Elon Musk

Latinoamérica necesita expertos en ciberseguridad: Inscríbete en este programa con certificaciones gratis

Los países más caros y baratos de América Latina ¿Dónde es más difícil llegar a fin de mes?

Quiso innovar con Teslas y terminó perdiendo su inversión: la historia de Piter Albeiro

TikTok lanza programa para aceleración de pymes en Colombia, México y Perú ¿Cómo participar?

El eclipse solar parcial de 2025 ¿Dónde y cómo verlo sin perderte el espectáculo?

Archivos

La NASA usa Hadoop para gestionar su Big Data

Nicolás Rueda

You may also like

4 comments

Relacionados

Lo más leído de la semana

Archivos