L’importanza di un accurato monitoraggio della temperatura per i sistemi basati su SoC

Il calore generato dai dispositivi System-on-Chip (SoC) e  dai dispositivi programmabili è diventato una questione importante nella progettazione elettronica. Sebbene la tensione di funzionamento sia inferiore ad 1 volt, le correnti assorbite possono essere causa di pericolosi surriscaldamenti, specie quando i processori presenti all’interno debbono funzionare a pieno regime. 

La dissipazione di potenza su un singolo SoC può variare significativamente in funzione dei core attivi e del carico di lavoro del sistema. Un die SoC può passare da relativamente freddo a molto caldo in pochi secondi se il carico di lavoro aumenta all’improvviso.  Se i picchi di lavoro sono numerosi e particolarmente intensi, la temperatura locale del die può alzarsi fino a raggiungere un valore che può causare un arresto termico o influire sulle prestazioni e sull’affidabilità dei componenti vicini.

Monitorando le temperature dei die e dei componenti sensibili, un sistema può evitare i problemi causati dal calore, aumentando la velocità di rotazione delle ventole di raffreddamento o riducendo la velocità di clock, per aiutare a ridurre la temperatura di un componente in fase di surriscaldamento.  Di conseguenza, il monitoraggio della temperatura è essenziale in sistemi che utilizzano SoC avanzati e dispositivi con Field Programmable Gate Array (FPGA). Sonde integrate su die forniscono il sistema più accurato per determinare le condizioni termiche di core critici.

Sensori di Temperatura On-Die

I sensori di temperatura on-die usufruiscono di una proprietà delle giunzioni PN dei semiconduttori. Per una giunzione PN di una data area, la tensione sviluppata su tutta la giunzione avrà un valore caratteristico dipendente dal flusso di corrente e temperatura. La sensibilità alla temperatura è dovuta alla presenza di portatori generati termicamente nel semiconduttore. Se la corrente si mantiene costante, qualsiasi cambiamento nella tensione sarà dovuto a cambiamenti nella temperatura. Solitamente, nei semiconduttori la tensione su una giunzione diminuisce con la temperatura. Comunque, se si applicano due diversi livelli di corrente, uno dopo l’altro, e la differenza nella tensione viene misurata ogni volta, si otterrà una piccola differenza di tensione tra le due letture. Un innalzamento nella temperatura assoluta, invece, porterà a una variazione quasi lineare, fornendo una base affidabile per l’utilizzo in sensori di temperatura a semiconduttore.

Nei moderni processi CMOS utilizzati per costruire SoC complessi, è facile costruire giunzioni PN adeguate. Solitamente il sensore termico è un transistor bipolare con la giunzione emettitore di base, che forma il diodo richiesto e il collettore legato al substrato del dispositivo.

La necessità di una gestione termica dei livelli di sistema

Nonostante molti componenti, in maniera particolare i dispositivi programmabili, siano in grado di monitorare la loro stessa temperatura, i problemi termici devono frequentemente essere risolti a livello di sistema. Per esempio, controllando la velocità delle ventole di chiusura, si cambierà il raffreddamento di tutti i componenti nel sistema. Per raggiungere il controllo di livello del sistema, la temperatura locale del die di numerosi dispositivi deve essere monitorata remotamente.

In teoria è semplice costruire un sensore a temperatura completo sul SoC per ciascuna area che richieda un monitoraggio termico. La misurazione implica formare il sensore vicino al circuito di interesse che viene in seguito scambiato tra due sorgenti di corrente di diversa entità. Le due misurazioni di tensione che risultano dalla sorgente di corrente vengono quindi fornite a un convertitore Analogico Digitale (ADC) e la logica associativa calcola la temperatura stimata.

Figura 1: schema a blocchi semplificato di un sensore remoto basato su una giunzione PN.

In pratica, molti progettisti di sistema scelgono di impiegare sensori di temperatura remota dal momento che forniscono più alti livelli di affidabilità e accuratezza. Se implementa interamente sul die SoC, l’applicazione delle due sorgenti di corrente per sonda termica significa che la ditta produttrice dovrà allineare precisamente i dispositivi, il che è piuttosto difficile nei processi digitali di molti prodotti. Formando sorgenti di corrente su un die realizzato utilizzando un processo di segnali misti di precisione, è possibile ottenere una maggiore attendibilità di misurazione. Inoltre, si avrà bisogno di un numero inferiore di pin sul SoC, dal momento che sarà necessario fare i collegamenti a un transistor per regione monitorata invece che a due.

Un vantaggio secondario dei sensori di temperatura a distanza è che permettono di monitorare più di un singolo hot spot con un solo CI e a far scattare automaticamente l’allarme. Un solo sensore remoto di base, come il MAX6642, può monitorare due temperature: la sua stessa temperatura e la temperatura di un vicino SoC o FPGA.

Figura 2: Il MAX31730 è in grado do monitorare la sua temperatura interna oltre a quella di altre
tre sonde esterne.

Altri sensori remoti monitorano tre o più temperature esterne. Il MAX31730, per esempio, può monitorare la sua stessa temperatura interna e quella di altre tre sonde esterne. Se la temperatura di qualsiasi ingresso supera la soglia programmata, il dispositivo imposta uno stato e registra la temperatura del canale più caldo in un registro dedicato. Il MAX31730 utilizza il bus seriale SMbus per trasmettere questa informazione a un controller del sistema.

Per monitorare un maggior numero di ingressi il progettista può selezionare un dispositivo come il MAX6681, che ha sette ingressi a diodi remoti. Questo sistema potrà essere utilizzato per monitorare le temperature di una coppia di FPGA con diodi termici integrati, quattro hotspot su scheda che utilizzano transistor separati collegati con diodi, e la temperatura della scheda nella posizione del MAX6681. Un’altra opzione è distribuire fino a otto dispositivi MAX31730 come dispositivi slave sull’SMbus.

Assicurare l’accuratezza quando si monitora la temperatura della die

Sebbene l’approccio che utilizza il sensore di temperatura a distanza presenti un numero di vantaggi nella progettazione del sistema, ci sono fonti di errore e imprecisioni che il team di ingegneri dovrà prendere in considerazione.

Una resistenza parassita in serie di un qualche tipo è inevitabile in qualsiasi circuito e interesserà la temperatura fornita dal dispositivo del sensore se la compensazione non viene applicata. Scegliere, ad esempio, una impostazione in cui la prima corrente di Bias sia 100 µA e la seconda 10 µA. La differenza di tensione tra le due sarà proporzionale al logaritmo naturale della corrente della prima divisa per la seconda. Il valore assoluto sarà quello del valore di log moltiplicato per una costante ideale, che è normalmente vicina a 1, e kT/q, dove k è la costante Boltzmann e q è la carica dell’elettrone. Se la resistenza della serie è 1 Ω, la caduta di tensione per la sorgente di corrente più alta sarà 100 µV e 10 µV per la seconda. Il cambio di temperatura misurata che risulterà sarà 0.45 °C.

Se la resistenza della serie è conosciuta e può essere calcolata utilizzando resistenze di tracce PCB tipiche, allora sarà possibile correggere il cambio della temperatura. Alcuni sensori, come il MAX31730 e altri IC prodotti di Maxim, hanno una cancellazione automatica della resistenza, che permette di evitare la necessità di compensare questa sorgente parassita di errore.

Sebbene il fattore ideale sia normalmente vicino a 1.01, il suo valore esatto dipenderà dal processo e dal design del transistor ed è pertanto un potenziale fonte di errore. La maggior parte dei sensori remoti sarà ottimizzata per un fattore specifico ideale. Maxim ne offre molti regolati su un valore di circa 1.008, valori che si individuano di solito su processi avanzati, come quelli utilizzati in FPGA e SoC avanzati. Per un dispositivo con un diverso fattore ideale, è relativamente normale applicare una correzione nel firmware del controller del sistema.

Un’ulteriore fonte di errore può provenire dai transistor basati su sonde termiche SoC, che risentono di un basso aumento di corrente o valore beta. Se l’aumento di corrente è molto basso, il rapporto delle correnti del collettore non corrisponderà con il rapporto delle correnti dell’emettitore e potrà causare un errore nella temperatura calcolata. Un cambiamento del 10 percento nella corrente del collettore potrà causare nella temperatura riportata un aumento di circa 12°C.

Figura 3: Se, come sensori, vengono utilizzate giunzioni bipolari PN, è consigliabile impiegare
IC con compensazione beta.

Ciò non è normalmente un problema per i sensori di temperatura a distanza CI, dal momento che impiegano transistor con un alto aumento di corrente. Ma i transistor SoC sono fabbricati su processi ottimizzati per MOS piuttosto che per i transistor bipolari e, quindi, non possono garantire un alto aumento di corrente in questi dispositivi. Qualora vengano utilizzati questi transistor, è meglio utilizzare un sensore remoto CI con compensazione beta, sebbene non sia sempre richiesto.

Se il beta è relativamente uniforme nell’intervallo previsto delle correnti e delle temperature, l’effetto potrà essere abbastanza piccolo da essere ignorato. Per esempio, nei test di tre campioni di microprocessori costruito su un processo 45 nm che mostra un beta per i transistor bipolari di circa 0.3, l’errore risultante era inferiore a ±1 °C. Comunque, quando un basso beta può indurre a errori più grandi, potranno essere applicati i sensori remoti con compensazione beta come i MAX31730, MAX6693 o MAX6581 di Maxim.

Grazie ai dispositivi della gamma Maxim, che garantiscono impostazioni utili per situazioni diverse di misurazioni di temperature remote, i programmatori di sistema potranno assicurarsi la possibilità di implementare controlli termici che reagiscano all’attuale situazione termica all’interno dei loro prodotti. Il risultato è una maggiore affidabilità, una durata di prodotto più lunga e un rischio inferiore di arresto termico distruttivo.

 

A cura di Kim Majkowski, Global Product Manager, CI Power Management, Farnell 

Post correlati

Commenta questo articolo