La carrera armamentista de IA de Big Tech con un nuevo paradigma de lenguaje se está calentando

Contenido del artículo

Meta Platforms Inc dijo el viernes que lanzará a los investigadores un nuevo modelo de lenguaje grande, el programa base para un nuevo sistema de inteligencia artificial, intensificando la carrera armamentista de IA a medida que las grandes empresas tecnológicas se apresuran a incorporar la tecnología en sus productos e impresionar a los inversores.

La batalla general por el control del campo de la tecnología de inteligencia artificial comenzó a fines del año pasado con el lanzamiento del software ChatGPT de OpenAI, respaldado por Microsoft, y llevó a los pesos pesados ​​de la tecnología, desde Alphabet Inc hasta Baidu de China, a anunciar sus propias ofertas.

Publicidad 2

Contenido del artículo

Contenido del artículo

Meta LLaMA, que significa Large Language Model Meta AI, estará disponible bajo una licencia no comercial para investigadores, entidades gubernamentales, la sociedad civil y la academia, dijo en una publicación de blog.

Los modelos de lenguaje grandes extraen cantidades masivas de texto para resumir información y crear contenido. Pueden responder preguntas, por ejemplo, con oraciones que se pueden leer como si estuvieran escritas por humanos.

El modelo, que según Meta requería «significativamente menos» poder de cómputo que las ofertas anteriores, fue entrenado en 20 idiomas con énfasis en aquellos con alfabetos latino y cirílico.

«El anuncio de Meta de hoy parece ser un paso en la prueba de sus capacidades generativas de inteligencia artificial para que puedan implementarlas en sus productos en el futuro», dijo Jill Luria, analista senior de software de DA Davidson.

Publicidad 3

Contenido del artículo

“La IA generativa es una nueva aplicación de IA con la que Meta tiene menos experiencia, pero que es claramente importante para el futuro de su negocio”.

La inteligencia artificial se ha convertido en un punto brillante para las inversiones en la industria tecnológica, cuyo lento crecimiento ha provocado despidos generalizados y menores apuestas experimentales.

Meta dijo que LLaMA puede superar a los competidores al examinar más parámetros o variables que el algoritmo tiene en cuenta.

READ  Los 5 mejores servidores de Minecraft para Build Battle (2023)

Específicamente, dijo que una versión de LLaMA con 13 mil millones de parámetros podría superar a GPT-3, un predecesor reciente del modelo en el que se basa ChatGPT.

Describió el modelo LLaMA de 65 mil millones de variables como «competitivo» con Chinchilla70B y PaLM-540B de Google, que son más grandes que el modelo que Google usó para mostrar la búsqueda impulsada por chat de Bard.

Publicidad 4

Contenido del artículo

Una portavoz de Meta atribuyó el rendimiento a la mayor cantidad de datos «más limpios» y las «mejoras arquitectónicas» en el modelo que mejoraron la estabilidad del entrenamiento.

Meta lanzó en mayo del año pasado un modelo de lenguaje grande OPT-175B, también destinado a investigadores, que formó la base para una nueva iteración del chatbot BlenderBot.

Más tarde presentó un modelo llamado Galactica, que podía escribir artículos científicos y resolver problemas matemáticos, pero retiró rápidamente la demostración después de que generó respuestas falsas y aparentemente creíbles. (Reporte de Yuvraj Malik y Eva Matthews en Bengaluru y Katie Paul en Nueva York; Editado por Shailesh Cooper y Grant McCall)

comentarios

Postmedia se compromete a mantener un foro activo y civilizado para el debate y animar a todos los lectores a compartir sus opiniones sobre nuestros artículos. Los comentarios pueden tardar hasta una hora en moderarse antes de que aparezcan en el sitio. Le pedimos que mantenga sus comentarios relevantes y respetuosos. Hemos habilitado las notificaciones por correo electrónico: ahora recibirá un correo electrónico si obtiene una respuesta a su comentario, si hay una actualización en un hilo de comentarios que está siguiendo o si es un usuario al que está siguiendo. Visite nuestras Pautas de la comunidad para obtener más información y detalles sobre cómo ajustar la configuración de su correo electrónico.

READ  El Q1 Pro de Keychron es el primer teclado inalámbrico totalmente de aluminio

Unirse a la conversación

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *