Microsoft creó un bot que describe qué hay en una foto

abril 15, 2016

El sistema aún está en fase inicial, así puede arrojar errores.

Microsoft acaba de crear un bot que añade descripciones automáticas a las fotos, llamado Captionbot. El sistema, que funciona con los servicios cognitivos de Microsoft da un vistazo a tus imágenes y da descripciones rudimentarias de lo que puede ver.

Este mismo software es el que usa Microsoft para el sistema de ‘How Old Do I Look?’, que busca adivinar tu edad, o el que te dice de qué raza es un perro. Así lo reportó hoy GizMag.

Todo el sistema se basa en un bot, que es un programa que puede comunicarse con humanos usando inteligencia artificial. Captionbot usa varios API, es son grupo de funciones acceden a datos, como fotos o documentos, dentro de un sistema operativo o aplicaciones.

Así, el bot usa un API de visión, que extrae información de imágenes y de datos que la acompañan, como etiquetas. También un API de Emotions, que analiza las expresiones faciales y las relaciona con una base de datos de emociones ‘universales’, como rabia, disgusto, felicidad, o sorpresa.

Para crear los ‘caption’ o las descripciones, el sistema se unificó con el equipo de lenguaje que usaba Tay, un intento de Microsoft por hacer un bot de chats, pero que fue suspendido porque comenzó a tuitear contenido racista y sexista.

Captionbot aún no es completamente acertado, pero intenta siempre describir a la persona que está en una foto, lo que está haciendo y sus emociones en el momento. También es capaz de reconocer animales y describir paisajes, aunque no es su especialidad. El bot te permite decirle si acertó o no cada vez que haces un intento.

Podríamos pensar que este bot se parece al sistema que recién lanzó Facebook para personas invidentes, pero lastimosamente no dice las descripciones en voz alta, solo en texto.

Por ahora, las personas están probando el sistema y están rodando muchos ejemplos en los que Captionbot confunde hombres con mujeres, la Luna con un terreno sucio, entre otros errores. DailyMail reportó que cientos de usuarios en Twitter están publicando sus desastrosas descripciones dadas por Captionbot.

Un vocero de Microsoft explicó que la tecnología de descripciones de imágen aún está comenzando, pero que están recibiendo todas las retroalimentaciones del sistema para poder mejorar el servicio y hacerlo más acertado.

Aquí probamos un par de fotos.

Captionbot cree que es un hombre parado frente a un edificio y que parece tener cara seria.

En esta Captionbot cree que es un hombre volando una cometa en el atardecer. Casi. — En esta Captionbot, cree que es un hombre volando una cometa en el atardecer.

Captionbot cree, aunque no está seguro, que es un hombre agarrando a un perro y que parece muy feliz ¡Bravo!

Imagen: captura de pantalla (Microsoft).

Susana Angulo

Antes de Internet ya me gustaban la música clásica, los animales,
cocinar postres, y leer cuentos de terror. La tecnología me ha
permitido ahondar en estas y tantas otras pasiones, que sería un error
pensar en la cultura digital como tema exclusivo de 'geeks'. Soy
periodista de la Universidad del Rosario.

View all posts

6 comments

Fernando Díaz dice:

abril 15, 2016 a las 2:55 PM

Impresionante los resultados
Tuxerito dice:

abril 15, 2016 a las 3:20 PM

No sirve. Coloque una foto de un carro de Formula 1 y me dijo “I am not really confident, but I think it’s a person on a motor bike.”
http://www.listadecarros.com/wp-content/uploads/2012/02/Red-Bull-BR8-11.jpg
Tuxerito dice:

abril 15, 2016 a las 3:22 PM

Coloque otro carro desde otro angulo y dice “I am not really confident, but I think it’s a red motorcycle.”
http://2.bp.blogspot.com/-9N1LBx-JJ3U/UUcfKKV2bOI/AAAAAAAAAnk/780C7i_Faj0/s1600/formula-1.jpg
- Carlos Molina Pedreros dice:
  
  abril 15, 2016 a las 5:12 PM
  
  Tiene sus fallas su avatar dice que es una muñeca sentada en un sofa, esperar que lo vayan puliendo
  - Tuxerito dice:
    
    abril 15, 2016 a las 5:16 PM
    
    Solo medio funciono en la 4 imagen que probe de un bebe despeinado y dijo que era un bebe usando una corbata, por lo menos le pego al bebe
Carlos Molina Pedreros dice:

abril 15, 2016 a las 4:11 PM

Despues de ver la Build 2016 de Microsoft entendi que el desarrollo de este tipo de tecnologia es para personas invidentes, como toda herramienta nueva tiene sus fallos e ira mejorando, es bueno saber que la tecnologia es incluyente

Microsoft creó un bot que describe qué hay en una foto

Susana Angulo

6 comments

Relacionados

YouTube deja de funcionar en ciertos dispositivos Android ampliamente utilizados ¿Cuáles?

Con la función ‘Acerca de’, Windows 11 detecta y resuelve los problemas de rendimiento de tu computador

¿Cómo convertir tus textos y guiones en un podcast con la IA de Google?

Google Assistant desaparece: Así será su reemplazo impulsado por inteligencia artificial

Microsoft anuncia el fin de Windows 10 en 2025 ¿Qué significa para los usuarios?

Lo más leído de la semana

Carlos Slim dueño de Telmex y Claro responde a Elon Musk, ofrecerá internet gratis para frenar a Starlink

Nuevo permiso obligatorio ETIAS para colombianos que viajan a España desde marzo de 2025 ¿Qué es y cómo solicitarlo?

Apple ahora recomienda a Wiltech para reparaciones fuera de su alcance: “Nunca pensé que llegara este momento”

Nubank (Nu) lanza convocatoria para emplear a jóvenes ingenieros y analistas de negocios en Colombia

¿Cómo ver Brasil vs. Colombia y todos los partidos de la eliminatorias de manera gratuita y legal?

Informe revela cuál es lenguaje de programación más usado en el mundo, la IA lo está cambiando todo

One UI 7 llega a dispositivos Samsung Galaxy ¿Cuáles son las novedades y desde cuándo estará disponible?

WhatsApp limitará hasta 30 mensajes por mes ¿A partir de cuándo? ¿Para cuentas individuales o de empresas?

Archivos

Microsoft creó un bot que describe qué hay en una foto

Susana Angulo

You may also like

6 comments

Relacionados

Lo más leído de la semana

Archivos