Inteligencia Artificial

Esta inteligencia artificial podría ser más persuasiva que tú

Project Debater, de IBM, todavía no ha alcanzado la excelencia, pero los últimos estudios revelan que está avanzando notablemente en la producción de discursos y réplicas.

Debate en vivo contra una versión anterior de Project Debater. El evento tuvo lugar en 2019 y hay que entender que en él se entremezclaba la demostración con un claro fin promocional.
Debate en vivo contra una versión anterior de Project Debater. El evento tuvo lugar en 2019 y hay que entender que en él se entremezclaba la demostración con un claro fin promocional.IBMCreative Commons

Imagina un mundo en el que la inteligencia artificial no solo pudiera tentarnos personalizando los anuncios que nos muestra, sino que sea capaz de darnos argumentos sólidos para que compremos algo y que incluso pueda crear contrarréplicas para de réplicas. Especulando un poco podemos imaginar que esta misma tecnología podría llegar a utilizarse para automatizar la propaganda política a través de redes sociales, convenciendo individualmente a grandes números de votantes por un módico precio. En un escenario así, la tecnología se habría vuelto una maestra de la persuasión, pero ¿estamos hablando de algo plausible o de pura ciencia ficción?

Todavía estamos lejos de conseguir una inteligencia artificial que sea tan exitosa debatiendo como lo son sus parientes jugando al ajedrez, escribiendo artículos o incluso resolviendo tareas de diseño gráfico. Sin embargo, esto no quiere decir que la tecnología no esté avanzando en esta dirección. Precisamente, la empresa tecnológica IBM acaba de anunciar los resultados de su último estudio en este campo: los sistemas autónomos de debate.

Project Debater

Existe un buen motivo por el que los debates se han estado resistiendo al campo de la inteligencia artificial. Los mayores éxitos para esta tecnología han venido de lo que conocemos como inteligencia artificial estrecha. Esta se enfrenta a tareas muy definidas en las cuales hay un objetivo claro y cuantificable, precisan de menos recursos computacionales y, sobre todo, solemos poder abordarlas de principio a fin, como un único gran problema. Frente a ellas, se encuentran tareas como el debate, que requieren de una inteligencia artificial compuesta. Esto se debe a que, para resolverlas hace falta desplegar varias habilidades de forma simultánea. Por ejemplo, para construir el discurso de un debate necesitamos dividir la tarea en otras menores que puedan avanzar en paralelo, imitando la forma en que nuestro cerebro se enfrenta a problemas complejos.

Así es como IBM se ha enfrentado al problema con su nueva inteligencia artificial: Project Debater. A pesar de que lleva desarrollándola desde 2012 y ya que fue presentada en 2019 a un debate público, la reciente publicación científica ofrece los resultados más completos y satisfactorios hasta la fecha. En ella se detalla tanto la prueba a la que Project Debater ha sido sometido, como la manera en que este se enfrenta al reto. Para ponerla a prueba, los investigadores seleccionaron 78 temas y posturas diferentes en torno a los cuales la inteligencia artificial tendría que construir su discurso.

La prueba

El estudio se dividiría en dos tareas. En la primera Project Debater tuvo que construir un discurso de apertura para el debate de 4 minutos, como es habitual en las competiciones de debate. La misma misión le fue encomendada a otros ocho participantes entre los cuales había una persona de a pie, un experto en debates, varias inteligencias artificiales conversacionales, y otra serie de sistemas más rudimentarios. En una segunda tarea, Project Debater debía dar un discurso de réplica tras la exposición de un experto para cada uno de los 78 temas del punto anterior. La respuesta de la inteligencia artificial fue evaluada en comparación con dos grupos de control y, si bien la primera tarea había sido evaluada por 15 “jueces” a esta segunda se sumaban otros 5.

Evaluación del rendimiento de las distintas inteligencias artificiales y personas sometidas a las pruebas del estudio
Evaluación del rendimiento de las distintas inteligencias artificiales y personas sometidas a las pruebas del estudioIBMCreative Commons

Los resultados fueron sorprendentes, pues en la primera prueba los jueces indicaron que estaban bastante de acuerdo con los argumentos de Project Debater, otorgándole un 4 sobre 5, solo superado por el humano experto, que había logrado un 4,2. Y para contextualizar el avance que supone, cabe resaltar que la siguiente inteligencia artificial más exitosa no alcanzó ni siquiera el 3,5.

A la hora de la réplica Project Debater obtuvo un 4,1 sobre 5, más de dos puntos por encima del grupo de control, lo cual significa que, a pesar de no haberlo podido comparar con tantos participantes como en la primera prueba, su rendimiento fue superior a lo estándar. Y, claro está, tanto un resultado como el otro han resultado ser estadísticamente significativos, esto es: suficientemente diferentes del resto de participantes como para descartar que su éxito se haya debido al puro azar.

Los pasos

Para obtener estos resultados, IBM dividió el problema en tareas más específicas que podrían ser resueltas en paralelo (simultáneamente en lugar de una tras otra). Cada una de ellas es enfrentada por un módulo distinto

Por un lado, tenemosel módulo de minería de argumentos. Este identificará los argumentos y contraargumentos más relevantes dentro de una extensa base de datos. En segundo lugar, se encuentra el módulo de conocimiento de argumentos (AKB), el cual contiene argumentos y contraargumentos, citas y demás contenido genérico que puede ser útil para cualquier debate independientemente del tema a tratar. Estos dos módulos trabajan juntos para seleccionar los mejores argumentos para determinar el contenido del discurso. En tercer lugar, tenemos el módulo de refutación de argumentos. Este estudiará las debilidades de los argumentos elegidos por los otros dos módulos para así poder anticiparse a la réplica del oponente. Por último, el módulo de construcción del debate ordenará todo lo producido por los otros módulos para configurar un discurso coherente, bien hilado y con cierto valor estético.

Diagrama mostrando los módulos que componen Project Debater y cómo se relacionan entre sí.
Diagrama mostrando los módulos que componen Project Debater y cómo se relacionan entre sí.IBMCreative Commons

Cada uno de estos pasos cuenta a su vez con su propia complejidad. Por ejemplo, la minería se divide en dos etapas. Una de ellas se realiza buscando en más de 400 millones de artículos periodísticos ya almacenados, mientras que, por otro lado, empleará una búsqueda en línea de argumentos accesorios que, aun versando sobre temas diferentes, pueden ayudar a defender la causa principal. A su vez, esto requiere de un análisis de los textos, dividiéndolos en oraciones y clasificándolas por las palabras que contienen, los conceptos a los que se refieren, etc.

Sin embargo, esto es solo la parte más innovadora del proceso, porque para que sea realmente autónomo, los investigadores han tenido que implementar un sistema para que la inteligencia artificial pueda transformar el discurso de sus oponentes en un texto, dividiéndolo en oraciones separadas correctamente por los signos de puntuación pertinentes. Así mismo, para exponer su discurso, la inteligencia artificial requiere de un sistema de vocalización capaz de transformar el texto de nuevo en voz que, por si fuera poco, debe usar las inflexiones adecuadas para dotar al discurso de cierta expresividad.

Lejos de ser perfecto

No obstante, esto no significa que el resultado de Project Debater fuera perfecto. Sigue enfrentándose a los problemas propios de una tecnología emergente. Algunos de sus discursos estaban mal enfocados y directamente no trataban el tema que debían. En otros casos, tuvieron lugar errores de enfoque, como cuando buscó defender la inseminación artificial haciendo referencia a su uso en ganadería o cuando centró su negativa a subsidiar a los atletas en torno a las lesiones físicas que suelen acabar padeciendo.

Por suerte, aun queda algún tiempo hasta que las inteligencias artificiales alcancen una capacidad de persuasión suficiente como para que empiecen a popularizarse con este fin. Claro que, en tecnología, hablar de “algún tiempo” puede significar un par de años o incluso unos pocos meses. Hasta entonces convendría seguir explorando ética y legalmente las problemáticas que podría asociar un sistema así, para que cuando llegue (que llegará) nos encuentre preparados.

QUE NO TE LA CUELEN:

  • Precaución y tecnofobia son dos cosas diferentes. Cada revolución ha tenido sus detractores que preferían cortar con ella de raíz en lugar de aprender a gestionarla de una forma responsable. Gracias a que el progreso suele triunfar, no hemos tenido que renunciar a los increíbles beneficios que la tecnología ofrece. En lugar de renunciar a ellos a cambio de obliterar los peligros, hemos desarrollado una serie de leyes y códigos morales que separan lo que podemos de lo que debemos hacer. Con la inteligencia artificial hará falta un abordaje parecido que ayude a marcar ciertos límites en su aplicación y uso. La gran dificultad de este reto radica en la vertiginosa velocidad a la que avanza la disciplina, haciendo que la regulación vaya siempre un paso por detrás. Si bien, podemos y debemos tratar de que ese retraso no sea de dos pasos si puede ser de uno.

REFERENCIAS (MLA):