Post futuros sobre IA y explicación FB después de que su IA desarrollo Idioma...

Iniciado por Andrey, Septiembre 24, 2017, 11:28:28 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

Primero que nada avisarles que en el mes de octubre comenzare a publicar una seria de post's sobre IA y temas relacionado a este mundo, no soy un especialista, simplemente soy un aficionado que se encuentra en etapa de aprendizaje, la gran mayoría no son de mi autoría, mi objetivo es traer más información sobre estos temas en español, ya que todos son en Inglés, Chino y otros idiomas.

Ojo, serán post´s que explicaran diversos temas de este mundo tan grande como lo es la IA, y también serán (no sé si llamarlos así) clases o curso sobre IA.

Espero sus comentarios ya que evidentemente mientras más se note su interés se le dará actividad al tema.

Sin más que decir les dejo el primer post para que se vallan familiarizando con estos temas, realizado por Roman Kucera un especialista en Big Data, conferencista y Jefe de Tecnologías.





Ha habido tantos artículos publicados sobre Facebook cerrando sus robots después de que desarrollaron su propio idioma. Los medios de comunicación sólo están amando estos títulos clickbait. Algunos de estos artículos le permitirían creer que se trataba de una llamada muy cercana, que los científicos de Facebook apenas cerraron la IA antes de que pudiera hacerse con el mundo.
Afortunadamente, todavía hay personas sanas por ahí, así que ha habido bastantes artículos explicando por qué toda la charla del día del juicio final es un disparate completo (como los publicados por Snopes o CNBC ).

Incluso algunos de los medios que originalmente ofrecieron una versión muy escandalosa de este evento finalmente editaron el contenido para ser menos dramático (como The Independent, por ejemplo).

El problema es que las noticias falsas pero pegadizas son mucho más fáciles de difundir que cualquier otra cosa. También me parece curioso que ninguno de los artículos realmente explicó lo que sucedió en términos que la gente entienda. Traté de explicar la situación a algunos de mis amigos y finalmente decidí que valía la pena anotar.

Tal vez ayudará a la gente a dormir sin pensar en SKYNET. Sin embargo, mi objetivo es educar - para mostrar cómo funciona el llamado IA.


Investigación de AI de Facebook (FAIR)

Entonces, ¿qué estaba haciendo realmente Facebook? ¿Y cómo los robots "casi se volvieron sensibles"? Todo el proyecto está bien documentado y disponible para el público en general. Cualquier persona puede realmente descargar y ejecutar este IA, así como observar el nuevo idioma por su cuenta. Sólo tenga cuidado y cerrarlo a tiempo como lo hicieron los ingenieros de Facebook.

El sistema intenta simular el diálogo y la negociación. Al robot se le da un conjunto de elementos (que consta de libros, sombreros y bolas) y algunas preferencias de los elementos que quiere más que otros.

Entonces se supone que debe negociar con su contraparte, ya sea un ser humano u otro robot, sobre cómo dividir el tesoro entre ellos.

La investigación se publicó en junio, incluyendo todos los datos de código y entrenamiento utilizados para el experimento.
Entonces, ¿cómo funciona en términos simples?


Aprendizaje automático

No voy a molestarle con todos los detalles técnicos, pero es importante entender algunos principios básicos sobre cómo funciona esta tecnología.

Al desarrollar un robot como este, usted comienza con algo llamado un "conjunto de datos de entrenamiento". Esto consiste en ejemplos bien descritos del comportamiento que el robot está tratando de simular. En el caso particular de la negociación de Facebook chat bot, le dan ejemplos de diálogos de negociación con toda la situación anotada correctamente - cuál era el estado inicial, las preferencias del negociador, qué se dijo, cuál fue el resultado, etc.

El programa analiza todos estos ejemplos, extrae algunas características de cada diálogo y asigna un número a estas características, representando la frecuencia con la que los cuadros de diálogo con esa característica terminaron con resultados positivos para el negociador. Para mejor imaginar lo que es una "característica", pensar palabras, frases y oraciones. En realidad es más complicado que eso, pero es lo suficientemente bueno para obtener el principio.
Para ser más específico, si el robot quiere sombreros, la frase "Usted puede tener todos los sombreros" tendrá una puntuación muy baja porque esta frase terminó con un mal resultado en cada escenario de los datos de entrenamiento - el negociador no obtuvo lo que él queria.


Esto básicamente te dará la versión cero de tu IA. Ahora sabe qué sentencias tienen más probabilidades de obtener un buen trato de la negociación. Puede utilizarlo para iniciar un diálogo. Se tratará de maximizar la probabilidad de un resultado positivo basado en los números reunidos durante la fase de entrenamiento. El término AI se siente un poco raro aquí - es muy artificial, pero no muy inteligente.

No entiende el significado de lo que está diciendo. Tiene un conjunto muy limitado de diálogos para relacionarse, y sólo selecciona algunas palabras o frases basadas en probabilidades calculadas a partir de esos diálogos históricos. No puede hacer nada más. Simplemente calcula la probabilidad de obtener la cantidad deseada de sombreros, bolas o libros, y basado en que escribe algo en la pantalla.

El siguiente paso es usar una técnica llamada aprendizaje de refuerzo.

Dado que nuestra capacidad de proporcionar datos de formación bien anotados es bastante limitada, necesitamos otra forma de aprender esta IA. Uno de los enfoques comunes es dejar que la IA ejecute una simulación, y aprender de sus propios resultados. Antes de explicar lo que esto significó para el caso de la robótica de negociación, déjame ir a una IA diferente.

AlphaGo

Google Deepmind AlphaGo es un programa que puede haber escuchado el año pasado. Fue el primer IA en vencer a un jugador profesional de Go. Y es un ejemplo perfecto de aprendizaje de refuerzo en acción.

AlphaGo comenzó a aprender de juegos reales jugados por personas reales. Analizó y anotó cada movimiento posible sobre la base de este conocimiento. Esto solo hizo AlphaGo capaz de jugar, aunque muy pobremente - no entendía el juego, pero tenía una manera de anotar los movimientos basados en juegos previamente analizados.

Pero, Go es bastante fácil de simular. Tenemos un conjunto exacto de reglas y tenemos un muy buen objetivo para el IA - para ganar el juego. Así que sólo podemos crear dos instancias de tal IA y dejarlo jugar contra sí mismo. Dado que tenemos una gran cantidad de poder de computación disponible, puede jugar millones de juegos para entrenar, muchos más de lo que cualquier humano podría. A continuación, actualiza las probabilidades de una victoria para cada movimiento sobre la base de todos estos resultados simulados, cada vez mejor y mejor en la puntuación de los movimientos bien calificados.


Una vez más, estoy simplificando el concepto. Sólo quiero que se quite una cosa de este ejemplo. Aprendizaje de refuerzo de trabajo realmente, muy bien (como lo demuestra AlphaGo y muchos otros) si podemos satisfacer tres condiciones:

-Un espacio bien definido de opciones para la IA. En el caso de AlphaGo, sólo puede jugar movimientos Go válidos.
-Una buena manera de anotar el resultado. En el caso de AlphaGo, una victoria es buena, una pérdida es mala.
-Una buena manera de simular la situación y dejar que la IA aprenda. En este caso, podemos dejar que la IA juegue Ir contra sí misma (preferiblemente contra diferentes versiones de sí mismo, ya que es más fácil aprender algo nuevo si tu oponente juega de manera diferente a ti).


Volviendo a Facebook

Así que echemos un vistazo al tema original. Facebook estaba tratando de crear un robot que pudiera negociar. ¿Qué tan bien encaja en las tres condiciones anteriores? Hay una gran manera de anotar el resultado ya que hay un valor asignado a cada elemento que es parte de la negociación. Tenemos una buena manera de simular la situación y dejar que la IA aprenda. Eso es exactamente lo que Facebook hizo - dejar que dos instancias del robot negociar entre sí. Pero el último punto es un poco problemático.

A diferencia con el juego de Go, no hay una definición fácil de la lengua inglesa. El conjunto de datos de entrenamiento original estaba en inglés, pero las características extraídas eran sólo palabras y frases, y el robot estaba reuniéndolas basándose en la representación numérica de la probabilidad de que fueran a ayudar a obtener el resultado deseado.

Dos robots que en realidad no entienden el inglés acabaron hablando entre sí y aprendiendo unos de otros. La única medida de su éxito era qué tan bien distribuían libros, sombreros y pelotas. La única regla a seguir era poner palabras en la pantalla. Empezaron a hablar más o menos en inglés, pero estaban aprendiendo de sus propios errores, sin saber que eran en realidad errores - llevaron al resultado deseado en forma de sombreros, libros y pelotas. Algunas palabras se perdieron porque según los números, no contribuyeron al resultado de la negociación. Algunos se multiplicaron. Si diciendo "quiero" mejora la posibilidad de conseguir algo, entonces ¿por qué no deberíamos decirlo varias veces, ¿verdad? Y una vez que esto funciona, la IA lo tomará como confirmación de que esta es una buena estrategia.

Si se tratara de un entrenamiento contra un ser humano, esto probablemente no sería un problema tan grande, ya que el otro lado estaría usando un lenguaje apropiado. Sin embargo, habría un problema diferente. Sería difícil ejecutar un número suficientemente grande de simulaciones para entrenar a la IA.

Como lo notaron los ingenieros de Facebook, podría haber funcionado mejor si la función de puntuación también incluía un chequeo de idioma, en lugar de sólo el valor total de los artículos recibidos después de la negociación. Pero no lo hizo. El hecho de que el lenguaje degenerado no es ni sorprendente ni interesante de ninguna manera. A todos los científicos que trabajan en este tipo de problemas les pasa, y estoy seguro de que los ingenieros de Facebook realmente esperaban ese resultado. Acaban de desactivar la simulación una vez que se degeneró demasiado, después de muchas iteraciones, y después de que dejó de proporcionar resultados útiles.

Por cierto, si usted lee el informe o el documento publicado, aparte de la charla de la charla que se compartió a través de Internet, en realidad había muchos buenos resultados también. El experimento funcionó como se pretende, y yo diría que fue bastante exitoso en general.



Al final, no es nada sorprendente

Nada espantoso, chocante o incluso digno de nota sucedió. Sólo un día regular con un experimento científico regular. Y entonces todo el infierno se soltó como quieren ser periodistas publicando un artículo del juicio final después de otro. Cerrar un bot de chat cuando deja de mostrar un resultado razonable es tan ominoso como cambiar una bombilla defectuosa.




Dudas, comentarios, aportes o algo que decir (Todo con el respeto que esta comunidad se merece) se los agradecería.
Saludos, gracias por leer y "happy learning"...

...


"Es un mundo brutal y peligroso el que hay allá afuera... Pero encontré mi camino. El caos es mi hogar, y me aseguraré de que no escapes de el"...

"Solo se necesita una excusa para cambiar el mundo"

Muy buena iniciativa bro!
Dejo un post sobre neuronas artificiales: No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

Saludos,
ANTRAX


No tienes permitido ver los links. Registrarse o Entrar a mi cuenta
Muy buena iniciativa bro!
Dejo un post sobre neuronas artificiales: No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

Saludos,
ANTRAX

Muchas gracias por el apoyo. Espero cumplir las expectativas.

Saludos.
Andrey...


"Es un mundo brutal y peligroso el que hay allá afuera... Pero encontré mi camino. El caos es mi hogar, y me aseguraré de que no escapes de el"...

"Solo se necesita una excusa para cambiar el mundo"

Que tal Andrey , Muchas gracias por compartir tus conocimientos por lo demas , estoy seguro a mas de uno le interesa , esperare cada uno de tus aportes con ansias :) !
Saludos y buena suerte  ;)

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta
Que tal Andrey , Muchas gracias por compartir tus conocimientos por lo demas , estoy seguro a mas de uno le interesa , esperare cada uno de tus aportes con ansias :) !
Saludos y buena suerte  ;)

Excelente. Muchas gracias por tu apoyo.
Saludos.
Andrey...


"Es un mundo brutal y peligroso el que hay allá afuera... Pero encontré mi camino. El caos es mi hogar, y me aseguraré de que no escapes de el"...

"Solo se necesita una excusa para cambiar el mundo"

Andrey te aseguro que a tienes un lector dedicado a esto, como puedes ver el hecho de que haya revivido este post es que tengo la intención de leérmelos todos hasta el ultimo en fecha y como no también a aportar lo que tenga de AI.

Saludos.

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta
Andrey te aseguro que a tienes un lector dedicado a esto, como puedes ver el hecho de que haya revivido este post es que tengo la intención de leérmelos todos hasta el ultimo en fecha y como no también a aportar lo que tenga de AI.

Saludos.

Excelente, que bueno que te interese. Esto solo es la punta del iceberg.

Un saludo...


"Es un mundo brutal y peligroso el que hay allá afuera... Pero encontré mi camino. El caos es mi hogar, y me aseguraré de que no escapes de el"...

"Solo se necesita una excusa para cambiar el mundo"