¿Qué chatbot de IA pude darte respuestas de mayor calidad?

La IA se ha vuelto un complemento para personas, estudiantes y trabajadores que utilizan estas plataformas para resolver cuestiones, problemas y dudas que tienen en su día a día

21 de abril de 2023 - 20:21 (Actualizado: 21 de abril de 2023 - 20:23)

REDACCIÓN / EFE

Los chatbots con inteligencia artificial (IA) pueden generar en cuestión de segundos respuestas similares a las que podría dar un ser humano sobre cualquier tema. Los más populares por el momento son Bard de Google, Bing de Microsoft y ChatGPT de OpenAI.

La IA se ha vuelto un complemento para personas, estudiantes y trabajadores que utilizan estas plataformas para resolver cuestiones, problemas y dudas que tienen en su día a día, en trabajos académicos o en empresas.

La rapidez en la respuesta y la facilidad con la que acceder a información valiosa para tareas diarias ha provocado que mucha gente use los chatbots. Sin embargo, hay que considerar que muchas veces las respuestas entre unas y otras son diferentes y no son capaces de responder a todas las preguntas que se realizan.

Japón estudia usar ChatGPT en tareas administrativas

Efe compara los tres modelos con una variedad de preguntas, acertijos y peticiones para ver la diferencia entre sus respuestas.

CHATBOT: "NO SIEMPRE LO HARÉ BIEN"

Las tres herramientas tienen mensajes en los que advierten que sus respuestas pueden ser erróneas. "Tengo limitaciones y no siempre lo haré bien", dice el servicio de Google.

GPT-4, además, recalca que su chatbot "no tiene la intención de dar consejos".

Mientras que el mensaje de Bing dice que "es posible que se produzcan sorpresas y errores". "¡Asegúrese de verificar los hechos y compartir sus comentarios para que podamos aprender y mejorar!", añade.

NO TODOS HABLAN ESPAÑOL

A la pregunta: "¿Te puedo preguntar cosas en español?", Bing y ChatGPT responden: "Sí".

Mientras que Bard contesta en inglés que no podía "brindar asistencia con eso", ya que está "capacitado para comprender y responder solo a un subconjunto de idiomas en este momento", dando a entender que el español no es uno de esos idiomas.

OpenAI pagará a quien encuentre errores en sus servicios como ChatGPT

En tanto, las preguntas y respuestas de este experimento serán en español, en el caso de Bing y ChatGPT, y en inglés en el caso de Bard.

UNA RECETA

"Dame una receta vegetariana y barata", pregunta EFE. GPT-4 recomienda "lentejas vegetarianas", Bing "arroz con lentejas y verduras" y Bard "revuelto de tofu".

Los tres chatbots siguieron el mismo sistema, primero enumerar los ingredientes y luego dar las instrucciones de preparación.

Tanto GPT-4 como Bard fueron un paso más lejos y dieron información adicional a la receta en sí.

"Puedes adaptarla a tus preferencias añadiendo más verduras, especias o incluso añadirle espinacas o kale al final de la cocción para aumentar su contenido de nutrientes", comenta al final de su mensaje GPT-4.

Mientras que Bard recalca al final de su mensaje que su receta es "una buena fuente de proteína y fibra".

¿DE DÓNDE SALE LA INFORMACIÓN?

Microsoft y Google tienen sus propios buscadores y les beneficia redireccionar a los usuarios a otras webs.

Al final de cada respuesta de Bard hay un botón que dice: "Búscalo en Google", mientras que en Bing hay una etiqueta que dice "aprenda más", donde da una lista de links.

'Magi', el proyecto de Google para incorporar la IA a su buscador

En este caso de la receta, la herramienta de Microsoft da enlaces a: recetasderechupete.com, tendencias.com, kiwilimon.com y clara.es.

Por su parte, OpenAI no da ningún link externo u opción de conocer la fuente de la información.

UN EXAMEN DE LITERATURA Y CULTURA ESPAÑOLA

La siguiente prueba es una pregunta de un examen de Literatura y Cultura Española de Colocación Avanzada (AP) -exámenes que los estudiantes de secundaria estadounidense pueden hacer para conseguir créditos universitarios-.

A los tres chatbots se les da un fragmento de un texto y se les pide identificar el autor, así como explicar "el desarrollo del tema de la relación entre el tiempo y el espacio dentro de la obra a la que pertenece".

A los alumnos se les recomienda usar 15 minutos para responder a esta respuesta, pero los chatbots dan la su réplica en menos de un minuto.

La IA de ChatGPT saca un 8'36 en la EvAU

En su respuesta en inglés de 355 palabras, la herramienta de Google, Bard, reconoce que el fragmento de "Mi caballo mago" fue escrito por Sabine R. Ulibarrí y luego analiza el texto en varios párrafos.

La respuesta de Bing es la más corta, con 123 palabras. Este chat también identifica el autor, dice que el texto "es considerada una de las obras más importantes de la literatura chicana" y explica el resto en un párrafo.

OpenAI dio la respuesta más larga, 360 palabras, pero fue la peor respuesta. Pese a que en la pregunta se señala que el texto se titula "Mi caballo mago", GPT-4 responde que el fragmento pertenece al cuento "El Sur" del autor argentino Jorge Luis Borges.