En último tiempo, una tesis muy interesante sobre generación de memes con redes neuronales ha circulado las redes sociales. Sabemos que muchas personas han juzgado a la tesis únicamente por el título sin haber investigado a mayor profundidad el tema. En eeNube.com hemos logrado entrevistar al autor de la tesis Albert Manuel Orozco Camacho que nos ha contestado bastantes preguntas interesantes acerca del tema. Esperamos esta entrevista sirva para ayudar a generar más tesis tan interesantes cómo la suya y quitarnos los tabues que nos impiden analizar los trabajos con la seriedad que se requiere. Le agradezco a Albert por su tiempo y espero les interese la entrevista. Para más información pueden consultar la tesis completa en: http://132.248.9.195/ptd2018/febrero/0770173/

 

Eenube: Buenas tardes Albert Manuel Orozco Camacho, es un gusto poder hacer esta entrevista contigo sobre tu tesis de licenciatura titulada „Generación automática de memes de Internet a través de una red neuronal profunda“. He tenido la oportunidad de leerla y debo decir que me ha parecido estupenda. Para comenzar con nuestra entrevista, quisiera preguntarte sobre tu tema. Los „Memes“ son una forma muy ingeniosa de expresión y hasta de protesta en las redes sociales. ¿Qué te motivó crear una compleja red neuronal para la generación de estas imágenes?

 

Albert:

Primero que nada, me gustaría aclarar un poco el problema que estoy atacando. El tipo de memes que uso en mi trabajo tienen, necesariamente, dos componentes: una imagen y una leyenda asociada que funciona para dar un mensaje (que muchas veces es humorístico) sobre la imagen. Por lo tanto, yo me enfoqué en aprender a generar leyendas (texto) a través de las características detectadas en la imagen.

 

Habiendo aclarado el punto anterior, considero conveniente darle el debido crédito a mi director de tesis, Dr. Ivan Vladimir Meza, como impulsor de la idea de usar memes en aprendizaje profundo. En su momento, yo estuve muy interesado en realizar un trabajo que involucre aprender datos un poco “fuera de lo común”. Tuve la oportunidad de observar una exposición que hablaba sobre un modelo neuronal que aprendió a narrar partidos de fútbol del videojuego “FIFA”. Fue ahí, entonces, donde surgió mi interés en generar lenguaje natural a partir de otros datos no estructurados.

Eenube: Para los lectores que no están familiarizados con el tema, ¿podrías explicar (de manera muy general) qué es una red neuronal y por qué fue necesario usarla para generar memes?

 

Albert:

Las redes neuronales forman parte de los muchos modelos de aprendizaje automático que buscan resolver problemas cuya solución es casi imposible o difícil dársela a una computadora de manera explícita. En aprendizaje automático buscamos optimizar un modelo matemático (función) para que actúe según un gran conjunto de ejemplos y nos ayude a desvelar patrones ocultos, clasificar nuevos ítems y/o realizar predicciones.

 

En general, una red neuronal es un modelo inspirado en la biología del cerebro y que se compone de arreglos de células interconectadas entre sí, los cuales van regulando sus interacciones conforme transcurre una fase de entrenamiento: se les alimenta con un conjunto de datos y se adaptan a las características que éstos poseen. Para los lectores con interés de una mayor formalidad, cabe destacar que una red neuronal puede ser pensada como una composición de funciones que interactúan linealmente entre sí pero que, al final, llevan a un resultado dado por una función no-lineal y derivable.

 

Eenube: En lo particular me gustó bastante el fundamento matemático que describes en tu trabajo y un repaso de diversos modelos de redes neuronales, a pesar de que tu tesis es de licenciatura. ¿Consideras que todos los estudiantes deberían titularse por tesis para mejorar su nivel académico?

 

Albert:

Ésta es una pregunta bastante polémica. He de confesar que una de las razones que me llevaron a estudiar a la UNAM fue que me “obligaba a mí mismo” a realizar una tesis, dado que desde antes de entrar a mi carrera ya estaba enfocado en seguir un camino de investigación. Por otro lado, reconozco que es difícil encontrar el tiempo y la motivación para dedicarse de lleno a una tesis y más habiendo ya concluido con todas las materias de una licenciatura.

 

Personalmente, me parece que es un modo de titulación que debe persistir y que, muchas veces, es la única oportunidad que se le da a un profesionista de dejarle una aportación académica al área de estudios que le está dando un título. En este contexto yo exhortaría a la gente a realizar una tesis. Sin embargo, la realidad es que no todos quieren continuar estudiando tras haber acabado la licenciatura, lo cual hace que el argumento de “mejorar el nivel académico” quede a segundo plano. Más que elevar un nivel yo animaría al estudiante a tomar un tema interesante y apasionante con el que se terminen de enamorar de su área de estudios, que a la postre, les identificará a lo largo de su vida.

 

Eenube: En eenube hemos compartido tu tesis a través de nuestra página de Facebook. Las reacciones han sido diversas: desde las personas que se maravillan por tu excelente trabajo, hasta aquellas que no comprenden o no se toman la molestia de abrir el documento y creen que una tesis sobre memes no debería de realizarse. ¿Cuál es tu opinión sobre esta cerrazón al análisis de los nuevos fenómenos de Internet?

 

Albert:

El término meme es en sí, ya un sinónimo de chiste, de informalidad y, a veces, hasta de irrelevancia. Sin embargo, si nos ponemos a ver cómo es que los medios de comunicación masivos en México le han dado importancia al hecho de compartir memes a partir de “X” noticia, entonces es cuando uno se pone a pensar en que algo ha cambiado. Si los memes son populares, sin importar el tipo de humor que contengan, es porque le ofrecen un rato ameno al internauta. Por ello es que vale la pena estudiarlos como nuevas formas de comunicación (que de hecho, ¡no son tan nuevas!).

 

Yo invitaría a los lectores de Eenube a que lean por lo menos el resumen de la tesis (de una sola cuartilla) o, en su defecto, revisen este cartel ( https://drive.google.com/file/d/1DPjqiXcmliwPZBOfBIXxnIX_rs9EPUub/view?usp=sharing ). Reconozco que no se trata de un proyecto “que va a salvar a la humanidad”; no obstante, sí trata de entender mejor una parte del ser humano del siglo XXI.

 

Eenube: ¿Otros creen, que el crear memes es una actividad propia del humano por la creatividad que involucra. Bajo tu conocimiento del tema, ¿crees que las redes neuronales lograrán ser más creativos que los humanos?

 

Albert: Para este tipo de preguntas, siempre me gusta decir que fundamentalmente se trata de una carrera en la que la tecnología siempre irá acortando distancias pero el humano se mantendrá al frente por mucho tiempo. Y mi argumento gira entorno al ingenio que nos caracteriza y que nos lleva a reinventarnos siglo con siglo. Creo posible que haya redes neuronales lo suficientemente creativas para los parámetros de los memes que usé (populares hacia 2013) e incluso para las tendencias actuales en memética. Sin embargo, el concepto de meme va cambiando año con año, hecho que pone un nuevo reto que merece ser estudiado bajo modelos que van más allá de redes neuronales.

 

Eenube: Hasta donde sé, este trabajo ha sido presentado en foros internacionales junto con los mejores investigadores del campo. ¿Qué experiencia te ha dejado esto y cómo ven ellos tu trabajo?

 

Albert: Así es, el cartel que compartí en una pregunta previa fue presentado en el SOCML 2017, llevado a cabo en Sunnyvale, CA, EE.UU. En general, considero que los investigadores que observaron mi trabajo se llevaron una buena impresión; creo que fue un buen foro para que mucha gente realizando muchas ideas se dieran a conocer entre sí y que se sepa quién está haciendo cada cosa. La otra impresión que me dejó este evento es que estamos, como país, muy por debajo del nivel que se tiene, en particular, en el área de Silicon Valley. Fue realmente impresionante conocer a gente trabajando en problemas tan complejos y confiando totalmente en redes neuronales profundas.

 

 

Eenube: Ahora una pregunta entre colegas: Tu modelo es supervisado, con una Red Neuronal Recurrente, para lo cual has creado tu propio corpus. En tus conclusiones comentas la posibilidad de usar un modelo RNN Encoder-Decoder con unidades GRU (seq2seq), lo cuál suena completamente lógico, modelado como un problema de traducción imagen-texto. Esto mejoraría el rendimiento, pero no solucionaría el problema de mantener a la red al tanto de los nuevos tipos de memes (que surgen a cada momento) en redes sociales.  ¿Pero qué tan factible ves adaptar una Generative Adversarial Network (GAN) para este problema y hacer tu modelo no supervisado?

 

Albert:

Con respecto a la parte de Seq2Seq, en lo que estaba pensando era en procesar aquellos memes que están formados por historietas y que poseen una estructura temporal. En este sentido, creo que valdría la pena explorar una arquitectura que combine convoluciones con unidades recurrentes, lo que produciría un Seq2Seq para varias imágenes y un texto de salida.

 

Una GAN es prácticamente el estado del arte actual para producir nuevos datos a partir de un conjunto no etiquetado. Esto, en principio, me daría la oportunidad de aumentar considerablemente mi conjunto de datos de memes. Para la parte de generación de lenguaje natural, considero que deben explorarse otros métodos que ayuden a penalizar la producción de frases a partir de varios jueces humanos. Dado que trabajamos con frases humorísticas, vale la pena evaluarlas en en sintaxis y semántica adecuada dependiendo de cada imagen.

 

Eenube: ¿Ahora que tu trabajo está terminado, qué sigue en tu carrera profesional y académica?

 

Albert: Siempre me ha atraído el lado académico, por lo que espero poder estudiar una maestría y llegar al doctorado en un mediano plazo. Por otro lado, me gustaría fomentar una relación más abierta entre academia e industria, pues se trata de un vínculo necesario para llevar los modelos de aprendizaje más sofisticados a la producción de aplicaciones y servicios útiles para cualquier persona.

 

Eenube: Por último, cuéntanos acerca de los memes más extraños que ha creado tu red.

 

Albert:

 





























 

Eenube:  Quiero agradecer tu tiempo por haber aceptado hacer esta entrevista, y felicitarte por tu excelente trabajo. Espero lo mejor para tu futuro. Tu trabajo nos muestra la increíble capacidad que hemos creado en el campo del aprendizaje máquina y espero de todo corazón que tu trabajo inspire a nuevos investigadores con ideas innovadoras como la tuya. Muchas gracias y éxito.

 

 

Albert: Muchas gracias a ustedes por la oportunidad de la entrevista.

 

Share This