Anthropic asegura que su nuevo modelo de IA supera los chatbots líderes de Google y OpenAI

  • Las distintas versiones de Claude 3  son capaces de responder a más preguntas, comprender instrucciones más largas y ser más precisos, dice la compañía
Imagen de marca de Claude, la IA de Anthropic
Imagen de marca de Claude, la IA de Anthropic |Anthropic

Anthropic, la empresa de inteligencia artificial (IA) fundada por varios exempleados de OpenAI, ha dicho este lunes que las distintas versiones de su nuevo modelo, Claude 3, funcionan tan bien o mejor que los modelos GPT-4 y Gemini Ultra, los modelos de los líderes en el mercado, OpenAI y Google.

Hay tres modelos de Claude 3: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus, siendo Opus el modelo más grande y "más inteligente". Opus y Sonnet ya están disponibles en 159 países y Haiku saldrá pronto.

EMO, la nueva IA generativa que hace cantar a Sora como Dua Lipa
EMO, la nueva IA generativa que hace cantar a Sora como Dua Lipa
EMO, la nueva IA generativa que hace cantar a Sora como Dua Lipa

EMO, la nueva IA generativa que hace cantar a Sora como Dua Lipa

Anthropic asegura que sus modelos son capaces de responder a más preguntas, comprender instrucciones más largas y ser más precisos.

"Opus, nuestro modelo más inteligente, supera a sus pares -ha asegurado la compañía aludiendo a su competencia- en la mayoría de los puntos de referencia de evaluación comunes para sistemas de IA", indica Anthropic en un comunicado.

La empresa señala que Opus ha mostrado un mejor razonamiento al nivel de posgrado que el chatbot GPT-4 de OpenAI, al obtener el 50,4 % en esa prueba y GPT-4 un 35,7 %.

Musk demanda a OpenAI por anteponer el lucro a los beneficios de "toda la humanidad"
Musk demanda a OpenAI por anteponer el lucro a los beneficios de "toda la humanidad"
Musk demanda a OpenAI por anteponer el lucro a los beneficios de "toda la humanidad"

Musk demanda a OpenAI por anteponer el lucro a los beneficios de "toda la humanidad"

También ha respondido mejor a preguntas de solución de problemas matemáticos, al conseguir el primer puesto al alcanzar el 60,1 % de respuestas correctas, seguido de Gemini Ultra 1.0, con el 53,2 %. Así como en programación, al obtener el 84,9 % en esa prueba, Gemini Ultra 1.0 el 74,4% y GPT-4 el 67 %.

"Todos los modelos Claude 3 muestran mayores capacidades de conversación en idiomas distintos del inglés, como el español, el japonés y el francés", recalca Anthropic.

La empresa también apunta a que sus modelos anteriores "a menudo hacían rechazos innecesarios que sugerían una falta de comprensión contextual" y que ahora han logrado "avances significativos en esta área, ya que Opus, Sonnet y Haiku tienen muchas menos probabilidades de negarse a responder".

Anthropic afirma que los modelos Claude 3 pueden dar resultados casi instantáneos incluso al analizar material denso como un trabajo de investigación y que Haiku, la versión más pequeña de Claude 3, es "el modelo más rápido y rentable del mercado" y es capaz de leer un denso trabajo de investigación completo con tablas y gráficos "en menos de tres segundos".

Anthropic entrenó sus modelos Claude 3 en una combinación de conjuntos de datos internos y de terceros no públicos, y datos disponibles públicamente a partir de agosto de 2023.

Tanto Amazon como Google han invertido en Anthropic 4.000 y 2.000 millones de dólares (3.685 y 1.842 millones de euros), respectivamente.