NVIDIA admitió su error. El director ejecutivo de la empresa, Jensen Huang, dijo que los problemas recientes fueron enteramente culpa suya.
Hace unas semanas supimos que los nuevos chips Blackwell B100 y B200 tienen un grave fallo de diseño. Por esta razón, el rendimiento de la producción fue muy bajo. El presidente de los Verdes admitió que el problema era enteramente culpa suya.
NVIDIA admite su error
Está claro que el problema era grave. Las GPU Blackwell B100 y B200 conectan sus dos chiplets utilizando la tecnología de empaquetado CoWoS-L de TSMC, que se basa en un interposer RDL equipado con puentes de silicio locales (LSI) para permitir velocidades de transferencia de datos de aproximadamente 10 TB/s. Sin embargo, era probable que una falta de coincidencia en las propiedades de expansión térmica entre los chips GPU, los puentes LSI, el intercalador RDL y el sustrato de la placa base estuviera provocando que el sistema se deformara y fallara.
Por este motivo, NVIDIA tuvo que cambiar la capa metálica superior del sistema para eliminar el defecto. Inicialmente, la falla se atribuyó a TSMC y su tecnología de empaque CoWoS-L. Resulta que toda la culpa la tienen los Verdes, como admitió el presidente de la empresa, Jensen Huang.
Tuvimos un defecto de diseño en el Blackwell, era funcional, pero el defecto de diseño provocó que el rendimiento fuera deficiente. Fue 100% culpa de NVIDIA.
– dijo Jensen Huang.
Sin embargo, lo más importante es que el problema se ha solucionado y los nuevos sistemas ahora funcionan según lo previsto. Sin embargo, esto provocó pequeños retrasos. La producción en masa comienza a finales de octubre. Los primeros modelos Blackwell B100/B200 se entregarán a los clientes a principios del próximo año.