La production d'assemblage de serveurs IA doubler Il ne s'agit pas d'un processus standard unique, mais d'un système à double voie intégrant l'assemblage électronique et la fabrication du système de refroidissement liquide. Les étapes principales sont : le contrôle qualité des composants à réception, l'assemblage des sous-systèmes de la carte mère (CPU/GPU/mémoire/stockage), l'intégration du module de refroidissement liquide (le cas échéant), l'assemblage complet de la machine, la programmation du firmware, plusieurs séries de tests automatisés (mise sous tension, pression, température, étanchéité) et l'étalonnage en usine.
- Réception et pré-inspection des composants : GPU (par exemple, NVIDIA H100/B100), CPU, mémoire DDR5, SSD NVMe, alimentation (généralement de 2 000 W ou plus avec redondance titane), carte mère (PCB multicouche), châssis et composants de refroidissement liquide (plaque froide, connecteurs, CDU) sont inspectés et acceptés pour stockage conformément à la nomenclature. Des mesures strictes de protection électrostatique et de contrôle de l’humidité sont mises en œuvre.
- Assemblage du sous-système de la carte mère : placement automatique/insertion et extraction manuelles (selon le niveau de personnalisation) → installation du CPU/GPU (alignement des encoches, serrage en diagonale, application précise du matériau d'interface thermique TIM) → insertion de la mémoire/SSD → fixation RAID/NIC/carte d'extension → base de la plaque froide et montage du GPU/CPU (contrôle du couple ±0,1 N·m, planéité ≤30 μm).
- Intégration du module de refroidissement liquide (si configuré) : Assemblage de la plaque froide divisée et du noyau de l'échangeur de chaleur (force d'insertion à l'aveugle du connecteur rapide ≤ 35 N, liquide résiduel < 0,05 mL) → Inspection initiale du raccordement de la tuyauterie et de l'étanchéité (pression d'air maintenue à 0,8 MPa pendant 60 s, chute de pression < 0,5 %) → Cette étape est ignorée pour les modèles non refroidis par liquide.
- Assemblage complet de la machine et câblage : mise en place de la carte mère dans le châssis (positionnement avec des piliers en cuivre, verrouillage en diagonale avec 8 à 12 vis), connexion de l'alimentation (24ATX + 8CPU + plusieurs PCIe), disposition des câbles internes de manière « horizontale et verticale droite » (pour éviter de bloquer le conduit d'air) et connexion du module IPMI/BMC.
Programmation du firmware et du BIOS : écriture du firmware BMC, configuration du BIOS (allocation des voies RAID/PCIe/limite de consommation d’énergie), numéro de série et injection de la clé de sécurité via des stations de test automatisées.
- Tests de mise sous tension et de fonctionnement : Inspection à la mise sous tension (tension/ventilateur/LED), autotest POST, test de stress de la mémoire (MemTest86), vérification de la bande passante NVLink (>900 Go/s/lien), entraînement de liaison PCIe Gen5.
Tests d'étanchéité thermique et hydraulique (principales différences) : Faire fonctionner le système à pleine charge (GPU/CPU 100 %) pendant 48 à 72 heures. Pour les modèles à refroidissement liquide, mesurer la résistance thermique (< 0,08 °C/W à 1 L/min), la résistance à l'écoulement et les fuites (détection de fuites par spectromètre de masse à l'hélium < 1 × 10⁻⁹ atm·mL/s) dans un bain d'eau à 45 °C. Pour les modèles à refroidissement par air, mesurer l'élévation de température dans le conduit d'air et le niveau sonore.
- Pré-installation et étalonnage du système : Déploiement du système d'exploitation (tel que Ubuntu Server), des pilotes, des agents de surveillance (Prometheus), des cadres d'inférence d'IA prédéfinis (tels que Triton) → Génération de codes de traçabilité uniques de « jumeaux numériques » (liant tous les numéros de série des composants, les données de test et les courbes de température de soudure de la plaque froide).
- Emballage et expédition : Les emballages antichoc (en particulier pour les GPU et les connecteurs de refroidissement liquide), les sacs antistatiques, les étiquettes personnalisées (telles que les positions de rack, les schémas de topologie de réseau) et les conteneurs complets de grande valeur (tels que NVL72) nécessitent un étalonnage de la surface d'accouplement de la plaque froide avant d'être scellés et transportés dans leur intégralité.
Actuellement, les principaux ODM (Foxconn, Wistron, Quanta) maîtrisent entre 27 et 35 processus standard. L'intégration du refroidissement liquide a transformé la ligne de production traditionnelle des serveurs en une ligne de production composite englobant l'électronique, les fluides et le contrôle thermique. Le système de certification NVIDIA de niveau L1 à L10 (de la puce au conteneur complet) domine la fabrication des serveurs IA haut de gamme. La ligne de production utilise généralement des convoyeurs flexibles antistatiques, une coordination par bras robotisés (installation de la carte mère et du GPU), un contrôle visuel AOI et des entrepôts de vieillissement entièrement automatisés. Le numéro de série de chaque serveur est traçable tout au long du processus, et un CPK ≥ 1,67 est requis pour la production en série.
Personne à contacter : Kalisa
400: +86 400-8055-828
Tél : +86-755-29554900
Téléphone portable : +86 15919917235
Courriel: service@szsunqit.com
Ajouter : Bloc 3# Parc industriel HongTianFu GuanGuang RD. Communauté Dashuikeng rue FuCheng district de LongHua Shenzhen Chine.