Meta anuncia los modelos Llama 4 y afirma que aplastan a la competencia

Iniciado por AXCESS, Abril 07, 2025, 11:14:09 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

No tienes permitido ver enlaces. Registrate o Entra a tu cuenta

En una entrada de blog, Meta reveló que Llama 4 Scout es un modelo de propósito general con 17 mil millones de parámetros activos y 109 mil millones de parámetros totales. Este modelo compacto cuenta con 16 expertos, una ventana de contexto de 10 millones de tokens y es compatible con una sola CPU NVIDIA H100. Se afirma que el modelo de lenguaje grande (LLM) supera a Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en una amplia gama de pruebas de rendimiento.

Con un total de 400 mil millones de parámetros y 17 mil millones de parámetros activos por comando, Meta define a Llama 4 Maverick como "el mejor modelo multimodal de su clase". Tiene una ventana de contexto de 1 millón de tokens y utiliza 128 expertos enrutados.

Al igual que Llama 4 Scout, este nuevo modelo de lenguaje utiliza una arquitectura de mezcla de expertos (MoE), lo que significa que un solo token activa solo una fracción de los parámetros totales. Por lo tanto, según Meta, los LLM con arquitecturas MoE son más eficientes computacionalmente y ofrecen mayor calidad en comparación con un modelo denso.

La compañía tecnológica afirma que Llama 4 Maverick tiene un rendimiento superior al de GPT-4o y Gemini 2.0 Flash en ciertas pruebas de referencia y un rendimiento similar al de DeepSeek v3 en codificación y razonamiento, con aproximadamente la mitad de parámetros activos.

Tanto Llama 4 Scout como Llama 4 Maverick son versiones derivadas de Llama 4 Behemoth. Este modelo multimodal cuenta con casi 2 billones de parámetros totales, incluyendo 288 mil millones de parámetros activos por comando. Además, Llama 4 Behemoth cuenta con 16 expertos y es el modelo de lenguaje más potente de Meta hasta la fecha.

Meta afirma que Llama 4 Behemoth es su modelo más potente hasta la fecha y uno de los LLM más inteligentes del mundo, superando a ChatGPT 4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en pruebas de referencia como LiveCodeBench, MATH-500 y GPQA Diamond.

Llama 4 Behemoth aún se encuentra en fase de desarrollo, por lo que Meta ha decidido no ponerlo a disposición del público todavía. Llama 4 Scout y Llama 4 Maverick están disponibles para descargar en No tienes permitido ver enlaces. Registrate o Entra a tu cuenta y Hugging Face. Los usuarios también pueden probar estos modelos en WhatsApp, Messenger, Instagram Direct y en el sitio web de No tienes permitido ver enlaces. Registrate o Entra a tu cuenta.

Meta ofrecerá más detalles sobre la familia Llama 4 en LlamaCon, una conferencia para desarrolladores que tendrá lugar el 29 de abril.

Fuente:
CyberNews
No tienes permitido ver enlaces. Registrate o Entra a tu cuenta

No tienes permitido ver enlaces. Registrate o Entra a tu cuenta