Supercomputadora “Frontier” basada en AMD atrapada bajo varias fallas de hardware Construir una supercomputadora siempre es exigente, pero establecer el primer equipo de clase exaescala para el sector es muy difícil e implica mucho desarrollo de hardware y software. Desafortunadamente, este puede ser el caso de la Frontera supercomputadora en Laboratorio Nacional de Oak Ridgeque apenas puede pasar un día sin experimentar muchos problemas de hardware. Con AMD 64 núcleos EPYC trento CPU, Instinto MI250X calcular GPU y Tirachinas de HPE interconectividad, Frontier de ORNL es el primer sistema de la industria que puede alcanzar un rendimiento máximo de hasta 1.685 FP64 ExaFLOPS en 21 megavatios de electricidad. El sistema fue creado por HPE utilizando el Cray EX arquitectura, que fue creada para aplicaciones de escalamiento horizontal, particularmente para supercomputadoras excepcionalmente rápidas.Aunque los componentes de hardware de la supercomputadora Frontier ya han sido entregados y la máquina parece tener un potencial notable sobre el papel, los problemas de hardware parecen impedir que se conecte y esté disponible para los investigadores que necesitan un rendimiento de aproximadamente 1 FP64 ExaFLOPS.Leer másIngrese a la expansión Gungeon que Advanced Gungeons & Draguns ha lanzadoJustin Whittdirector de programa de Oak Ridge Leadership Computing Facility (OLCF) comentó sobre la situación mencionando:Estamos solucionando problemas de hardware y asegurándonos de comprender (cuáles son). Vas a tener fracasos a esta escala. El tiempo medio entre fallos en un sistema de este tamaño es de horas, no de días”.Ha habido rumores sobre posibles fallos de funcionamiento del hardware de Frontier desde hace un tiempo. Según otro Dentro de HPC artículo, varios afirmaron que el conector Slingshot causaba problemas en el sistema. Las GPU informáticas Instinct MI250X de AMD no fueron tan confiables este año, según también otros informes. Es importante tener en cuenta que sólo un número limitado de consumidores puede comprar la versión X, que tiene una mayor cantidad de procesadores de flujo y velocidades más rápidas.El Sr. Whitt insistió en que la computadora tiene varios problemas de hardware, pero no indicó que el sistema tuviera algún problema específico con Instinct o Slingshot.Muchos desafíos se centran en estas (GPU), pero esa no es la mayoría de los desafíos que estamos viendo. Es una distribución bastante buena entre los culpables comunes de fallas de piezas que han sido una gran parte del problema. No creo que en este momento tengamos mucha preocupación por los productos AMD”.Leer másCómo desinstalar completamente Steam JuegosLa supercomputadora Frontier del Laboratorio Nacional Oak Ridge no es de ninguna manera la única que incorpora CPU EPYC de AMD, interconexiones Slingshot y arquitectura Cray EX de HPE. Por ejemplo, el lumi supercomputadora de Finlandiaoficialmente reconocido como el tercer superordenador más potente del mundo, tiene un rendimiento máximo de 550 PetaFLOPS utilizando componentes similares. El tamaño de la máquina, que requiere un total de 60 millones de piezaspuede hacer que el tema sea viable.Dado que la supercomputadora Frontier aún no se ha implementado formalmente, todavía no está claro si estará disponible para los académicos a partir de 2023 como estaba originalmente programado para estar en línea en 2022. Tecnología
Tecnología ¿Qué significa FA y dónde se debe utilizar? noviembre 4, 2023‘AF’ es una abreviatura de ‘As F***’, que es una jerga de Internet utilizada en… Read More
Tecnología Cómo solucionar el error de activación 0xc004f200 en Windows noviembre 11, 2023Alguno Windows Los usuarios se encuentran con que están experimentando un error de activación. 0xc004f200… Read More
Tecnología ¿Cómo solucionar el error de autenticación de Twitch? noviembre 27, 2023Twitch es una plataforma de transmisión en vivo controlada por Amazon. Se introdujo por primera… Read More