Google desarrolló un nuevo método que permite el entrenamiento de su inteligencia artificial (IA), conocido como JEST (Joint Example Selection Training). Este avance promete transformar la manera en que se curan y utilizan los datos en el entrenamiento de sus modelos. Esto hace que la IA sea 10 veces más eficiente y 13 veces más rápida.
La compañía tecnológica explica que JEST es una técnica que se centra en la selección conjunta de ejemplos durante el entrenamiento de modelos multimodales; que a diferencia de los métodos tradicionales que eligen ejemplos de forma individual, JEST selecciona lotes de datos completos basándose en su utilidad conjunta.
Es así como esta técnica permite al modelo aprender de manera más efectiva, acelerando el proceso de entrenamiento y mejorando el rendimiento con menos recursos.
Te puede interesar: ChatGPT ‘engañó’ a académicos de prestigiosa facultad de psicología, ¿cómo pasó?
Google señala que unas las características de este método es su capacidad para acelerar el aprendizaje multimodal de manera significativa. Según los estudios realizados por el buscador, este método puede reducir el número de operaciones de punto flotante (FLOPs) hasta diez veces y disminuir la cantidad de ejemplos necesarios hasta trece veces.
Esta eficiencia se logra mediante el “bootstraping de calidad de datos”, un proceso que utiliza pequeños conjuntos de datos bien curados para guiar el entrenamiento sobre conjuntos de datos más grandes y no curados.
¿Cómo funciona?
Como dijimos anteriormente, el método en lugar de depender de conjuntos de datos predefinidos y genéricos, el método ajusta dinámicamente las distribuciones de datos fundacionales durante el entrenamiento. Esto significa que el modelo selecciona continuamente los lotes de datos más útiles y relevantes, optimizando su proceso de aprendizaje.
Los experimentos, según Google demostraron, que los lotes de datos seleccionados de manera conjunta no solo aceleran el entrenamiento, sino que también mejoran la eficiencia y el rendimiento del modelo. Esto es posible por su capacidad de JEST para identificar y priorizar los datos más aprendibles, eliminando la necesidad de procesar grandes volúmenes de datos redundantes o irrelevantes.
Te puede interesar: ¿Qué hay detrás del pronóstico de resultados de partidos de fútbol con IA?
Pese a que el nuevo método tiene sus bondades, el gigante tecnológico explica que su eficacia depende en gran medida de la disponibilidad de conjuntos de datos de referencia pequeños y bien curados. Estos conjuntos de datos son cruciales para especificar las distribuciones a priorizar dentro de los conjuntos de datos más grandes y no curados.
Para superar esta limitación, los investigadores sugieren que futuros trabajos se enfoquen en desarrollar métodos para inferir conjuntos de datos de referencia a partir de las tareas específicas que el modelo debe realizar. Esta dirección podría permitir una mayor flexibilidad y aplicabilidad del método en una variedad de contextos y aplicaciones.
Google que con este nuevo método, JEST se convertirá en una herramienta importante para el desarrollo de modelos más rápidos y eficientes, allanando el camino hacia un futuro donde la inteligencia artificial pueda alcanzar nuevos niveles de rendimiento y utilidad.
Imagen: