Monitoraggio delle temperature dei data center IA con i termistori NTC

Di Kenton Williston

Contributo di Editori nordamericani di DigiKey

I data center oggi devono affrontare sfide di gestione termica senza precedenti, con l'intensificarsi delle richieste di intelligenza artificiale (IA) e l'aumento delle densità di potenza. Il monitoraggio preciso e in tempo reale della temperatura è necessario per ottimizzare le prestazioni e l'efficienza, evitando il surriscaldamento. Queste soluzioni di rilevamento devono essere precise, reattive e robuste per gestire carichi termici che variano bruscamente su apparecchiature molto sensibili.

Questo articolo esamina le sfide insite nella gestione termica che i progettisti dei moderni data center IA devono affrontare ed esplora vari sistemi di raffreddamento, tra cui il condizionamento dell'aria, il raffreddamento a immersione e le soluzioni con tubi di calore. Presenta quindi le soluzioni con termistore a coefficiente di temperatura negativo (NTC) di EPCOS (TDK) e mostra come utilizzarle per affrontare queste sfide.

Perché i data center IA presentano nuove sfide in fatto di gestione termica

L'hardware per IA, come le unità di elaborazione grafica (GPU) e le unità di elaborazione tensoriale (TPU), consuma in genere molta più energia delle tradizionali unità di elaborazione centrale (CPU). Di conseguenza, i data center incentrati sull'intelligenza artificiale tendono ad avere densità di potenza notevolmente superiori, con punti caldi concentrati difficili da gestire con gli approcci di raffreddamento convenzionali.

Come se non bastasse, i carichi di lavoro IA tendono a essere molto variabili, con un potenziale di rapido aumento dei carichi termici durante le operazioni di formazione intensiva o di inferenza. Senza un'adeguata gestione termica, queste condizioni possono inficiare le prestazioni, portare a interruzioni non pianificate e a un deterioramento accelerato dell'hardware.

In risposta a queste esigenze emergenti, i data center stanno adottando metodi di raffreddamento più avanzati. Il raffreddamento diretto al chip è una scelta molto diffusa. Questa tecnica posiziona tubi di raffreddamento, piastre fredde o scambiatori di calore direttamente a contatto con i componenti ad alta potenza come CPU, GPU e memoria. Un'altra opzione è il raffreddamento a immersione; in questo caso, interi server vengono immersi in un liquido non conduttivo.

Anche l'aria condizionata sta vedendo una serie di aggiornamenti. Ad esempio, le unità su file e su rack integrano il condizionamento dell'intera struttura con un raffreddamento localizzato in grado di rispondere ai punti caldi in tempo reale.

Sebbene le specifiche di questi sistemi di raffreddamento varino, tutti spingono a richiedere un monitoraggio della temperatura più distribuito e reattivo. Prendiamo in esempio i sistemi diretti al chip. I sensori montati sui dissipatori di calore sono necessari in ogni chip per garantire il mantenimento degli standard di temperatura. I sensori montati sui tubi sono necessari per monitorare il flusso di refrigerante in entrata e altri sensori sono necessari per le unità di distribuzione del refrigerante e gli scambiatori di calore per verificare che il sistema funzioni in modo efficiente.

Vantaggi dei sensori a termistore NTC per le applicazioni dei data center

I termistori NTC sono adatti a tutti questi requisiti. Come suggerisce il nome, un sensore NTC mostra una prevedibile diminuzione della resistenza elettrica all'aumentare della temperatura. Nel caso dei termistori NTC, ciò avviene grazie a un piccolo elemento ceramico ossidato, sensibile al calore, racchiuso in un alloggiamento protettivo metallico o epossidico.

La Figura 1 mostra le tipiche curve temperatura/resistenza dei termistori con valori nominali da 2 a 5 kΩ a 25 °C. Come illustra questo grafico, i termistori con resistenze più elevate sono migliori per le applicazioni ad alta temperatura, perché la variazione di resistenza è più facile da misurare.

Immagine delle tipiche curve di temperatura e resistenzaFigura 1: Tipiche curve di temperatura e resistenza di termistori con valori nominali da 2 kΩ a 5 kΩ a 25 °C. (Immagine per gentile concessione di EPCOS (TDK))

I vantaggi dei termistori NTC per i data center IA includono:

  • Alta precisione e tempi di risposta brevi: i termistori NTC sono estremamente sensibili a lievi variazioni di temperatura e possono rispondere rapidamente grazie alla loro ridotta massa termica. Questi fattori rendono i termistori NTC adatti alle esigenze termiche fluttuanti dei data center IA.
  • Durata e stabilità: i termistori NTC sono realizzati con materiali robusti e offrono un'eccellente affidabilità a lungo termine, con una deriva minima della resistenza nel tempo. Questa stabilità riduce al minimo i requisiti di manutenzione e il rischio di tempi morti imprevisti.
  • Dimensioni compatte e montaggio flessibile: le piccole dimensioni consentono una facile integrazione nei data center affollati, dove lo spazio è limitato. Sono disponibili in un'ampia varietà di fattori di forma, per soddisfare l'intera gamma di sistemi di raffreddamento per data center IA.

La famiglia di termistori NTC di EPCOS illustra questi vantaggi. La gamma comprende soluzioni per il monitoraggio di dissipatori e tubi, sistemi di raffreddamento a immersione e unità di trattamento dell'aria.

Monitoraggio di componenti ad alta potenza con termistori NTC montati sul dissipatore di calore

I processori ad alta potenza come le GPU e le TPU richiedono un attento monitoraggio termico per mantenere le prestazioni e prevenire il surriscaldamento. B57703M0103G040 (Figura 2) è progettato per il fissaggio diretto ai dissipatori di calore e quindi è particolarmente adatto a questo compito. Questo sensore a vite racchiude un termistore NTC incapsulato in custodia metallica con un capocorda ad anello sporgente.

Immagine del termistore con capocorda ad anello B57703M0103G040 di EPCOSFigura 2: Il termistore con capocorda ad anello B57703M0103G040 consente il monitoraggio accurato della temperatura sui dissipatori di calore per processori ad alta potenza. (Immagine per gentile concessione di EPCOS (TDK))

Il design del sensore a vite è pratico e importante per garantire un buon accoppiamento termico e una pressione di contatto costante con la superficie del dissipatore di calore, riducendo la resistenza termica e migliorando l'accuratezza della misurazione durante le rapide variazioni di carico.

Il sensore è stato testato per una stabilità a lungo termine di oltre 10.000 ore a +70 °C, che ne supporta l'utilizzo nelle condizioni di temperatura elevata tipiche dei carichi di lavoro dei data center IA. Il valore nominale di 10 kΩ a +25 °C fa da base affidabile per la misurazione di temperature di funzionamento più elevate e offre un riscontro accurato per i sistemi di controllo della temperatura.

Monitoraggio dei tubi di raffreddamento a liquido con termistori NTC

I sistemi di raffreddamento a liquido dipendono da una fornitura costante di refrigerante alla temperatura corretta. B58100A0506A000 (Figura 3) è un termistore NTC da 10 kΩ progettato per una rapida installazione sui tubi, il che lo rende una buona scelta per il monitoraggio delle linee di alimentazione di un fluido di raffreddamento. Questo gruppo stampato si aggancia direttamente a tubi di diametro compreso tra 18 e 19 mm, con altre misure disponibili per installazioni diverse. Le linguette di contatto integrate ne consentono il collegamento diretto alle apparecchiature di monitoraggio.

Immagine del termistore a molletta B58100A0506A000 di EPCOSFigura 3: Il termistore a molletta B58100A0506A000 misura la temperatura del refrigerante nei sistemi di raffreddamento a liquido. (Immagine per gentile concessione di EPCOS (TDK))

Il monitoraggio esterno della temperatura del tubo è un modo accurato e di facile manutenzione per monitorare le prestazioni del refrigerante senza immergere il sensore direttamente in un liquido. Questo approccio riduce al minimo la complessità dell'installazione e i rischi di perdita e offre una rapida sostituzione del sensore in caso di necessità.

Un parametro prestazionale fondamentale per i sensori di temperatura è la costante di tempo termico, nota anche come tempo di risposta termica, che riflette la velocità con cui la resistenza di un termistore NTC cambia in risposta alle fluttuazioni di temperatura esterne. Questo parametro è influenzato dal design del sensore, dalla configurazione di montaggio e dall'ambiente circostante.

Ad esempio, il modello B58100A0506A000 utilizza un alloggiamento in rame per accoppiare termicamente il sensore al tubo e ottenere una costante di tempo termico inferiore a 5 secondi, misurata sul tubo. Questo tempo di risposta veloce contribuisce a garantire un'alimentazione affidabile del fluido di raffreddamento.

Monitoraggio dei sistemi di distribuzione del refrigerante con termistori NTC

Oltre a monitorare le fonti di calore e le linee di alimentazione del refrigerante, i sistemi di raffreddamento a liquido richiedono il rilevamento della temperatura nell'unità di distribuzione del refrigerante, nello scambiatore di calore e in altri componenti centrali. Il modello B57800K0103A001 (Figura 4) è adatto a questo ruolo. La custodia cilindrica in rame offre un'eccellente conducibilità termica per una misurazione accurata delle temperature dei fluidi nei punti critici del sistema.

Immagine del termistore a sonda cilindrica B57800K0103A001 di EPCOSFigura 4: Il termistore a sonda cilindrica B57800K0103A001 monitora le temperature del refrigerante nei sistemi di distribuzione. (Immagine per gentile concessione di EPCOS (TDK))

Con una temperatura di funzionamento di +150 °C, questo sensore da 10 kΩ può essere collocato in posizioni calde senza il rischio che si surriscaldi. Ha una costante di tempo termico di circa 8 s in acqua, che gli consente di monitorare le variazioni di temperatura del refrigerante con una velocità sufficiente per il controllo e la protezione del sistema.

L'installazione dei sensori sia all'ingresso che all'uscita di questi componenti consente agli operatori di monitorare i differenziali di temperatura tra gli scambiatori di calore o i circuiti di distribuzione. Scostamenti significativi possono indicare problemi quali la riduzione del flusso di refrigerante, blocchi parziali o sporcizia sulle superfici degli scambiatori di calore, facendo scattare la manutenzione preventiva prima che le prestazioni del sistema siano compromesse.

Monitoraggio dei sistemi di raffreddamento a immersione con termistori NTC

I sistemi di raffreddamento a immersione, che immergono i server in un liquido non conduttivo come l'olio dielettrico, richiedono sensori in grado di resistere alla potenziale corrosione. Il modello B57504K0103A009 (Figura 5) è un sensore da 10 kΩ realizzato appositamente per questi ambienti. La custodia in acciaio inossidabile garantisce la durata in presenza di agenti corrosivi non molto aggressivi, assicurando al contempo un efficace accoppiamento termico con l'elemento sensibile.

Immagine del termistore a sonda in acciaio inox B57504K0103A009 di EPCOSFigura 5: Il termistore a sonda in acciaio inossidabile B57504K0103A009 monitora la temperatura del refrigerante nei sistemi di raffreddamento a immersione. (Immagine per gentile concessione di EPCOS (TDK))

Questo sensore ha una costante di tempo termico inferiore a 2 s in acqua, che consente di monitorare con precisione le variazioni di temperatura all'interno del bagno di immersione.

Monitoraggio della climatizzazione con termistori NTC

Si consideri per ultimo il modello B57500M0103A005 (Figura 6). Questo dispositivo da 10 kΩ utilizza un semplice incapsulamento epossidico per ottenere un fattore di forma compatto, abbinato a conduttori di 470 mm per opzioni di instradamento flessibili. Ad esempio, le piccole dimensioni e i conduttori lunghi ne consentono l'installazione vicino alle spire di un evaporatore o all'interno dei canali di ventilazione, dove il rilevamento rapido delle variazioni termiche contribuisce a mantenere stabile il controllo climatico.

Immagine del termistore incapsulato in resina epossidica B57500M0103A005 di EPCOSFigura 6: Il termistore incapsulato in resina epossidica B57500M0103A005 può monitorare i sistemi di condizionamento dell'aria. (Immagine per gentile concessione di EPCOS (TDK))

Tra gli altri vantaggi, questo sensore è stato testato per resistere alle vibrazioni, ai rapidi cicli di temperatura e ad altri rischi comuni nei sistemi in c.a. senza subire danni fisici o avere un impatto significativo sulla precisione delle misurazioni.

Conclusione

I carichi di lavoro IA stanno creando una necessità impellente di monitoraggio distribuito della temperatura all'interno dei data center. Con opzioni per dissipatori di calore, tubi di raffreddamento, bagni a immersione, unità di trattamento dell'aria e altro ancora, la famiglia di termistori NTC di EPCOS (TDK) supporta il funzionamento affidabile e reattivo in ambienti difficili.

DigiKey logo

Esonero della responsabilità: le opinioni, le convinzioni e i punti di vista espressi dai vari autori e/o dai partecipanti al forum su questo sito Web non riflettono necessariamente le opinioni, le convinzioni e i punti di vista di DigiKey o le sue politiche.

Informazioni su questo autore

Image of Kenton Williston

Kenton Williston

Kenton Williston ha conseguito un B.S. in ingegneria elettrica nel 2000 e ha iniziato la carriera come analista di benchmark dei processori. Da allora ha lavorato come redattore presso il gruppo EE Times e ha contribuito a lanciare e condurre numerose pubblicazioni e conferenze al servizio del settore dell'elettronica.

Informazioni su questo editore

Editori nordamericani di DigiKey