Durante el discurso de apertura del congreso anual de AWS, re:Invent, la compañía anunció cinco nuevos servicios de ‘machine learning’ (aprendizaje automatizado) y una cámara habilitada con ‘deep learning’ para desarrolladores.
Andy Jassy, CEO de AWS, presentó estos nuevos servicios y explicó que la gran intención detrás de ellos es hacer de la inteligencia artificial una tecnología accesible a la mayor cantidad de personas posible, no solo a desarrolladores especializados.
Para eso, se lanzó la plataforma SageMaker, un servicio pensado para desarrolladores y científicos de datos. Con ella, se pueden construir, desplegar y administrar rápidamente, modelos propios de ‘machine learning’. La compañía también presentó la cámara DeepLens, que ejecuta modelos de visión de computación en tiempo real.
Además, se lanzaron cuatro nuevos servicios de aplicación. Uno que permite transcribir audio a textos (Amazon Transcribe) y otro para traducir textos a otros idiomas (Amazon Translate). En tercer lugar, se presentó el servicio Amazon Rekognition Video, con el que se pueden analizar videos en tiempo real. Y finalmente, Amazon Comprehend, que permite entender lenguaje natural.
SageMaker, la llave para el aprendizaje de máquinas
Hoy en día, el proceso para implementar ‘machine learning’ es bastante complejo y se necesitan habilidades y conocimientos especializados. Incluso los modelos más simples requieren grandes cantidades de tiempo para ser entrenados y desplegados. Además, las compañías deben contratar varios equipos dedicados únicamente a desarrollar y administrar las máquinas. “Hasta el momento, el aprendizaje automático ha estado fuera del alcance de la mayoría de desarrolladores”, dijo Jassy.
Es por eso que AWS decidió hacer SageMaker, un servicio que le quita el trabajo pesado a los desarrolladores. La plataforma hace que construir modelos de ‘machine learning’ sea más fácil, porque ofrece catálogos prefabricados, algoritmos optimizados y mucha asistencia para desplegar un sistema de aprendizaje de máquinas.
“Nuestra visión original para AWS es permitir que cualquier persona en su habitación o garaje pueda tener acceso a la misma tecnología, herramientas, escalabilidad e infraestructura, que las grandes compañías en el mundo. Y nuestra visión para aprendizaje de máquinas no es distinta”, dijo Swami Sivasubramanian, vicepresidente de ‘machine learning’ de AWS. Con esta herramienta, cualquier desarrollador en el mundo puede desplegar una solución con aprendizaje de máquinas, dice la compañía.
DeepLens, un hardware de inteligencia artificial
AWS ha lanzado hardware en ocasiones anteriores, como su Snowmobile, un servicio de transferencia de grandes cantidades de datos. Y este año también se esperaba otra pieza tangible de productos de AWS, pero la diferencia es que se anunció por primera un producto relacionado con inteligencia artificial. Se trata de la cámara DeepLens, diseñada para ayudar a los desarrolladores a tener una experiencia física en construir, entrenar y desplegar modelos. Esto se logra al emparejar el dispositivo con los modelos de aprendizaje de máquinas que se pueden construir con SageMaker.
¿Qué cosas se pueden hacer con esta cámara? La idea con DeepLens es que los desarrolladores puedan hacer lo que su creatividad les dicte. El sistema se empareja con los modelos de aprendizaje realizados con Sagemaker, y otras plataformas como TensorFlow.
Así, se pueden detectar y reconocer objetos, como clasificar comida o animales, por ejemplo. También tiene reconocimiento facial, y puede reconocer una actividad como lavarse los dientes o tomar una bebida. Matt Wood, gerente general de inteligencia artificial de AWS, nos mostró un ejemplo de las capacidades de la cámara. Mostró un álbum en físico a la cámara y sonrió. La cámara inmediatamente conoció que era ‘The Dark Side of the Moon’ de Pink Floyd. Además, reconoció que la cara de Wood tenía una expresión positiva, porque estaba sonriendo.
Deep Lens estará disponible para preórdenes desde comienzos de 2018, y costará 249 dólares en Amazon.
Aplicaciones con inteligencia artificial
Jassy explicó en su discurso que para los desarrolladores que no quieren construir sus modelos de aprendizaje, pero que de todas formas están interesados en usar tecnologías de inteligencia artificial; están las aplicaciones. En esta ocasión la compañía presentó cuatro nuevos servicios: Amazon Transcribe, Amazon Translate, Amazon Comprehend y Amazon Rekognition Video.
Amazon Transcribe convierte audios en texto. Y, a diferencia de varios productos en el mercado, arroja textos precisos y con puntuación completa. Es capaz de reconocer varias personas hablando en el audio y, hasta el momento, está disponible en español e inglés únicamente. Por su parte, Amazon Translate, usa técnicas de ‘redes neuronales’ para traducir textos de un idioma a otro, y hasta el momento soporta siete idiomas: inglés, árabe, francés, alemán, portugués, chino y español.
Amazon Comprehend, otra de las aplicaciones presentadas, puede entender textos que están en documentos, publicaciones de redes sociales o cualquier otro dato textual almacenado en AWS. El sistema usa técnicas de ‘deep learning’ para identificar personas, lugares, fechas, organizaciones, marcas, entre otros. También puede identificar los sentimientos expresados en el texto, frases clave, conceptos y adjetivos. Este servicio permite reconocer cómo se sienten los usuarios frente a un producto, o un sitio web, por ejemplo.
Finalmente, Amazon Rekognition Video, es capaz de identificar personas, actividades, objetos, rostros, celebridades, contenidos inapropiados, dentro del contenido de millones de videos. Provee reconocimiento facial en tiempo real entre millones de rostros en videos en tiempo real. El sistema puede catalogar con etiquetas secciones específicas de los videos, según ubicaciones, actividades, por ejemplo. Este servicio puede ser útil para agencias de seguridad, que quieren seguir a personas de interés para ellos.
Imágenes: ENTER.CO y Amazon.