Data2vec es parte de una gran tendencia en IA hacia modelos que pueden aprender a entender el mundo en más de una forma. “Es una idea inteligente”, dice Ani Kembhavi del Instituto Allen para IA en Seattle, que trabaja en visión y lenguaje. “Es un avance prometedor cuando se trata de sistemas generalizados para el aprendizaje”.

Una advertencia importante es que, aunque el mismo algoritmo de aprendizaje se puede usar para diferentes habilidades, solo puede aprender una habilidad a la vez. Una vez que ha aprendido a reconocer imágenes, debe empezar de cero para aprender a reconocer el habla. Darle a una IA múltiples habilidades a la vez es difícil, pero eso es algo que el equipo de Meta AI quiere ver a continuación.

Los investigadores se sorprendieron al descubrir que su enfoque en realidad funcionaba mejor que las técnicas existentes en el reconocimiento de imágenes y habla, y funcionaba tan bien como los principales modelos de lenguaje en la comprensión de textos.

Mark Zuckerberg ya está soñando con posibles aplicaciones de metaverso. “Todo esto eventualmente se integrará en gafas AR con un asistente de inteligencia artificial”, publicó hoy en Facebook. “Podría ayudarlo a cocinar la cena, notando si se olvida de un ingrediente, indicándole que baje el fuego o tareas más complejas”.

Para Auli, la conclusión principal es que los investigadores deberían salir de sus silos. “Oye, no necesitas concentrarte en una sola cosa”, dice. “Si tienes una buena idea, en realidad podría ayudar en todos los ámbitos”.

Ir arriba