Te presentamos el procesador WSE-3 de Cerebras

Iniciado por Dragora, Marzo 14, 2024, 07:54:51 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.


NVIDIA lidera el mercado de las GPU para inteligencia artificial (IA) con una participación aproximada del 80%. Sin embargo, no es la única empresa que ofrece chips de vanguardia para IA. La compañía californiana Cerebras, de hecho, posee los procesadores más avanzados para este escenario de uso. Su chip WSE-2, por ejemplo, integra impresionantes 2,6 billones de transistores contabilizados en la escala numérica larga y 850,000 núcleos optimizados específicamente para IA.

Cerebras ofrece a sus clientes estos procesadores, integrados en una plataforma para IA conocida como CS-2. Una de las empresas que utiliza esta tecnología es la compañía de Emiratos Árabes, G42. Esta última está desarrollando seis superordenadores para IA capaces de superar la barrera de la exaescala, los cuales incluirán una gran cantidad de sistemas CS-2. Según la CIA, algunas de estas máquinas se destinarán a grandes empresas tecnológicas chinas. Pero eso no es todo. Cerebras ha anunciado recientemente un procesador para IA aún más potente que su WSE-2.

El procesador WSE-3 es tan potente como 62 GPU H100 de NVIDIA. Cerebras ya ha lanzado su procesador WSE-3 (Wafer Scale Engine 3), un producto que, como su nombre sugiere, está destinado a suceder al también ambicioso WSE-2. Ambos procesadores se fabrican a partir de una oblea completa de silicio, lo que permite a Cerebras integrar muchos más bloques funcionales y núcleos en la lógica que una GPU convencional, como las que producen NVIDIA, AMD o Huawei. Las especificaciones de este procesador son realmente impresionantes.

El procesador WSE-3 de Cerebras es una verdadera bestia con impresionantes especificaciones. Aglutina 4 billones de transistores (en escala numérica larga), tiene una superficie de 46.225 mm², integra 900.000 núcleos optimizados para IA y alcanza una potencia de cálculo de 125 petaflops. Sin lugar a dudas, es una auténtica maravilla tecnológica.

Además, este procesador se fabrica en TSMC utilizando su tecnología de integración de 5 nm. Aunque este fabricante de semiconductores taiwanés tiene nodos más avanzados, posiblemente no estén optimizados para producir procesadores del tamaño de una oblea.

Según Cerebras, su procesador WSE-3 es el doble de potente que el WSE-2. De hecho, según las especificaciones publicadas, equivale al rendimiento conjunto de 62 GPU H100 de NVIDIA. Es importante destacar que este procesador es el más potente de la compañía, al menos hasta que se lance la GPU H200.

Cerebras ofrece sus procesadores WSE-3 integrados en un superordenador conocido como CS-3, capaz de entrenar grandes modelos de IA con hasta 24 billones de parámetros. El mapa de memoria externa de este superordenador varía entre 1,5 TB y 1,2 PB, lo que proporciona un espacio de almacenamiento descomunal para modelos de lenguaje masivos en un solo espacio lógico.

Fuente: No tienes permitido ver los links. Registrarse o Entrar a mi cuenta