0.4 Entendiendo cómo nos entienden las máquinas IA

Andrey · Octubre 04, 2017, 12:23:43 PM

Estábamos acostumbrados a pensar que las computadoras se comunican a través de unos y ceros para obtener instrucciones y datos.

Pero durante la última década o algo así, ha habido avances masivos en el campo de la IA y la PNL que cambiaron la forma en que interactuamos con nuestros dispositivos. Antes, sólo podiamos interactuar con las máquinas a través del lenguaje de la computadora y comandos programados. Pero ahora estamos conversando con máquinas inteligentes como el chatbots de servicio al cliente en empresas y asistentes personales como Siri, Alexa y Cortana.

Estas máquinas inteligentes y computadoras fueron enseñadas a comprender lo que los seres humanos están diciendo a través de la Inteligencia Artificial y procesamiento del lenguaje natural (PNL).

AI es el campo de estudio responsable de la creación de máquinas inteligentes que piensan y reaccionan como seres humanos y la PNL es un subconjunto de IA. Con la PNL, las máquinas pueden entender y derivar el significado de los lenguajes naturales del ser humano como el inglés, el chino, el francés y otros. Con esto, las máquinas son más inteligentes que nos pueden entender y tener conversaciones más perspicaces con nosotros.

Por ejemplo, cuando alguien dice " perro", podemos asociar símbolos, imaginar imágenes y características basadas en nuestras experiencias anteriores del mundo real con los perros. Por lo tanto, para que las máquinas realmente nos entiendan, las máquinas también necesitan entender nuestro mundo.

Encontrar significado en palabras

Como sabemos, las máquinas se comunican a través de unos y ceros y es tan diferente en cómo nos comunicamos unos con otros a través de letras, palabras y símbolos. Entonces, ¿cómo pueden estas máquinas inteligentes entender lo que decimos?
Hemos adaptado un método llamado Tokenization, que descompone todo el texto en segmentos más simples, como palabras, números y puntuaciones, y luego asignar símbolos o fichas en lugar de estos segmentos. Estos tokens se convierten en la entrada para el análisis sintáctico o la minería de texto.

tf-idf

Para asignar texto a segmentos, podemos utilizar diferentes métodos y uno de ellos es el tf-idf o el término frecuencia-inverso de la frecuencia del documento, que toma en consideración la frecuencia y la importancia de las palabras en un documento. Este método se aplica a menudo para encontrar artículos relevantes en su búsqueda de Google. Cuanto más un artículo menciona una consulta en particular que tiene una mayor posibilidad de ser relevante para la palabra clave.

LDA

El siguiente método es el LDA o la Asignación Latente de Dirichlet. LDA es un modelo estadístico que ayuda a descubrir temas en una colección de documentos. Ya hay un número fijo de temas y cada tema es una distribución de palabras. Esto podría explicar por qué algunas partes de los datos son similares.

Análisis de los sentimientos

Las máquinas también pueden encontrar sentido a través del análisis del sentimiento o de la minería de opinión, donde añadimos algunas indirectas en el significado de las palabras, teniendo en cuenta cómo se siente la persona. Si la persona se siente feliz o contento estos son retroalimentaciones positivas, pero si la persona se siente insatisfecho o decepcionado, es una retroalimentación negativa. Así que cuando ejecutamos el análisis del sentimiento, asignamos puntuaciones en palabras basadas en el sentimiento de la persona.

Por ejemplo, en las estrategias de marketing de redes sociales, el análisis del sentimiento podría ayudar a los vendedores a escuchar lo que el público está diciendo sobre el producto. Va más allá de la cantidad de gustos y acciones, también analiza su respuesta y reacciones para que los vendedores puedan tener comentarios útiles si están implementando los planes de acción adecuados hacia los resultados deseados.

Enriquecer el vocabulario

Cuando éramos jóvenes, nuestro vocabulario de un idioma era limitado. A menudo no entendemos palabras complejas o figuras de lenguaje. Pero a través de la experiencia y con la ayuda de diccionarios y otros recursos, pudimos captar el significado de una palabra nueva y con el tiempo enriquecer nuestro vocabulario.

Para las máquinas, existen bases de datos que ayudan a asociar el significado en palabras e identificar relaciones entre conceptos como WordNet, ConceptNet, FrameNet y muchos más.

WordNet

El WordNet, que de alguna manera es una combinación de un tesauro y un diccionario, categoriza y agrupa las palabras en conjuntos de sinónimos llamados synsets . Una sola palabra podría pertenecer a varios synsets.

ConceptNet

Por otro lado, ConceptNet se preocupa más por las aplicaciones de sentido común para definir las relaciones entre dos conceptos. Es básicamente una base de conocimiento de sentido común donde se pueden encontrar hechos obvios como "el sol es muy caliente" o "pasar tiempo con amigos hace feliz a la gente".

FrameNet

El FrameNet decodifica el significado de una oración o grupo de palabras basado en el concepto de semántica de trama . Por ejemplo, cuando usted dice "compré el pan del panadero" FrameNet revelaría que tiene significado similar con "el panadero me vendió el pan".

Ontología sugerida superior fusionada (SUMO) y otra gran ontología (YAGO)
En informática, la ontología es un sistema diseñado para categorizar, nombrar, definir propiedades y la relación entre varios conceptos. SUMO, YAGO y la integración de los dos, YAGO-SUMO, es algo así como una base de conocimiento de sentido común que proporciona hechos obvios como "el sol está muy caliente" o "la gente es feliz si están con sus amigos".

DBpedia

DBpedia tiene como objetivo extraer la mayor cantidad de información en las páginas de Wikipedia. Normaliza la información en una sola base de datos para que pueda extraerla y hacerla disponible en la web.

Creación de un modelo mundial

Si las computadoras ya saben lo que significan las palabras y cómo se relaciona una vez que se usa en una oración o frase, las computadoras podrían empezar a entender lo que los seres humanos queremos decir. Les ayuda a tener una visión del mundo y entender situaciones similares a nuestro punto de vista.

Sin embargo, no es suficiente para que las computadoras realmente entiendan la información dada y datos por sí solos. El lenguaje es ambiguo. Los seres humanos entienden lo que otras personas están diciendo basado en el contexto más que el contenido. Por lo tanto, las computadoras necesitan seguir aprendiendo.

Aprendiendo a través de la experiencia

A través de las innovaciones en el aprendizaje profundo, muchas cosas han llegado a ser posibles, como la traducción automática, subtitular una imagen y detectar objetos en una fotografía. El aprendizaje profundo nos ayudó a dar un paso más cerca de una IA real que es tan humana y capaz de interactuar con los seres humanos.

Word2vec

Existen redes neuronales que ayudan a las máquinas a entrenar y reunir tanta información como sea posible. Uno de estos métodos que utilizan un grupo de modelos para aprender la incrustación de palabras se llama word2vec.

En word2vec, las palabras se representan como vectores, tratados como símbolos atómicos. Estos vectores son arbitrarios y no definen la relación entre dos conceptos diferentes. Por ejemplo, cuando la computadora está procesando algunos datos sobre perros, no puede aprovechar lo que aprendió acerca de los gatos.

Seq2seq

La seq2seq implica dos redes neuronales recurrentes (RNN). Los RNNs son capaces de analizar datos secuenciales, como secuencias de texto o símbolos. No necesariamente sabe qué significa cada símbolo / símbolo, sino que inferirá el significado teniendo en cuenta la estructura del texto y su relación con otros símbolos. Seq2seq tiene el codificador RNN que procesa la entrada y el decodificador RNN para la generación de salida.

El codificador introduce la secuencia y captura lo que está tratando de decir o su resumen semántico. Entonces el decodificador basará su respuesta mirando el contexto. El seq2seq se utiliza a menudo en chatbots, por lo que cuando preguntamos a un chatbot "¿Cómo estás?" Podría responder "estoy bien".

¿Pero las máquinas nos entenderán verdaderamente?

El lenguaje y las emociones humanas son conceptos tan grandes y amplios. Pero, con los robots inteligentes y los gustos de Siri, Cortana y Alexa, tuvimos una visión de cómo una IA puede empezar a hablar con nosotros como lo haría un ser humano. La forma en que interactuamos con nuestros dispositivos ha cambiado a lo largo de los años y nuestra relación con las máquinas se está profundizando también. Los consideramos como nuestros asistentes personales, entrenadores de trabajo y mano de ayuda confiable en nuestras vidas diarias.

Pero para comprender realmente, las computadoras deben aprender el contexto de lo que estamos diciendo. Las computadoras tienen que ver y comprender el mundo en que vivimos y una vez que lo hace, puede aprender a interactuar con los seres humanos.

0.4 Entendiendo cómo nos entienden las máquinas IA

Andrey

Octubre 04, 2017, 12:23:43 PM