Facebook da pasos gigantes con nuevos algoritmos DINO y PAWS

Iniciado por Denisse, Mayo 21, 2021, 10:38:51 AM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.


Una tarea a la que los investigadores  han dedicado mucho tiempo es la manera de dotar  de "sentido común" a la Inteligencia Artificial y no detenerse cada vez que quiera enseñarle algo nuevo.

Facebook, en una reciente investigación colaborativa con Inria podría haber resuelto la ecuación.


La división de investigación de IA de Facebook estuvo trabajando durante años en cómo avanzar y escalar algoritmos avanzados de visión por computadora, sus esfuerzos los conducen al aprendizaje semi-supervisado. Tipo de aprendizaje implica descubrir partes importantes de un conjunto de datos sin haber etiquetado ninguno previamente, por ejemplo, cuando entrenas un sistema introduciendo mil oraciones para estudiar y luego le das 10 más a las que les faltan varias palabras, el sistema probablemente trataría de rellenar los espacios faltantes basándose en la información que conoce; esto mismo no es tan fácil de hacer cuando se trata de imágenes y videos, no son tan sencillos ni predecibles.

Los investigadores de Facebook encontraron que el sistema de Destilación del conocimiento sin etiquetas, (DINO, por sus siglas en inglés) es capaz de aprender a encontrar objetos de interés en videos de:
• personas
• animales
• objetos

Sin ningún dato etiquetado.

¿Cómo funciona DINO?

El algoritmo de Facebook considera el vídeo no como una secuencia de imágenes para analizar una a una en orden, sino como un conjunto complejo e interrelacionado, es decir, como la diferencia entre una serie de palabras y una oración.

DINO presta atención a la información visual, la alimenta de otros conocimientos y reconoce cuando objetos distintos interactúan sin confundirlos, en otras palabras, desarrolla un sentido básico de significado visual con poco entrenamiento en nuevos objetos.

El resultado es extraordinario; un sistema de visión por computadora que funciona óptimamente en comparación con los sistemas entrenados tradicionalmente, además de que es identificable y explicable.

Asimismo, la división de investigación trabaja paralelamente en el proyecto PAWS un nuevo enfoque de entrenamiento de modelos que ofrece resultados de vanguardia utilizando menos cálculos.

La compañía señaló que al entrenar previamente al modelo ReseNEt-50 estándar con PAWS usando solo el uno por ciento de las etiquetas de ImageNet se obtiene una mejor precisión con 10 veces menos pasos de entrenamiento previo.

El proyecto se basa en enfoques de aprendizaje autosupervisados como SwAV, pero a diferencia del aprendizaje autosupervisado, PAWS logra resultados con menos cantidad de datos etiquetados en conjunto con datos no etiquetados.

Facebook encontró que, dado que PAWS no optimiza directamente la precisión de la predicción de las muestras etiquetadas, es mucho menos propenso a sobre ajustarse que otros enfoques semi supervisados; al mismo tiempo, aprovecha una pequeña cantidad de datos etiquetados.

Por último, Facebook apuntó que la anotación humana suele ser el cuello de botella en el desarrollo de sistemas de visión por computadora, por lo que, el hacer sus enfoques más eficientes en anotaciones, permiten a los modelos aplicar a un conjunto más amplio de tareas que resulta en una mayor cantidad de conceptos reconocidos.

Fuente
heraldodemexico.com.mx