چگونه دمای سی پی یو در سرور و تجهیزات دیگر را بفهمیم؟
دمای پردازنده (CPU) یکی از مهمترین شاخصهای سلامت و عملکرد هر سیستمی است و راههای مختلفی برای بررسی آن وجود دارد. سادهترین روش، استفاده از نرمافزارهای مانیتورینگ سختافزار است. برنامههایی مانند HWMonitor و Core Temp که به شکل رایگان در دسترس قرار دارند به صورت دمای لحظهای هر هسته از پردازنده را نمایش میدهند. در سیستمعامل ویندوز نیز میتوان از ابزارهایی مانند Task Manager برای بررسی اولیه دما استفاده کرد. این در حالی است که برای کامپیوترهای گیمینگ، نرمافزارهای مخصوصی مانند MSI Afterburner یا RivaTuner Statistics Server علاوه بر دما، اطلاعات دیگری مانند فرکانس و مصرف انرژی را نیز در حین بازی نمایش میدهند، اما در دنیای سرورها شرکتهایی مثل اچپی و دل، ابزارهای دقیقی برای این منظور ارائه کردهاند که در این مقاله به بررسی آنها خواهیم پرداخت.
در دنیای کامپیوترهای شخصی و لپتاپها، نرمافزارهای کاربرد زیادی وجود دارند که به شما کمک میکنند تا از داغ شدن بیش از حد پردازنده جلوگیری کنید. در سرورها، بهترین و دقیقترین راه بررسی دما، استفاده از ابزارهای مدیریتی اختصاصی سازندگان مانند HPE iLO یا Dell iDRAC است که دمای پردازنده و سایر قطعات را به صورت لحظهای و در قالب گزارشهای جامع نمایش میدهند. همچنین در سیستمعاملهای لینوکس، ابزارهایی مانند lm-sensors برای پایش دما بسیار کاربردی هستند. چرا باید در مورد دمای پردازنده حساس باشیم؟ به طور کلی، توجه به دمای پردازنده در هر دستگاهی، از کامپیوتر شخصی گرفته تا سرورهای دیتاسنتر، برای جلوگیری از آسیب دیدن قطعات و کاهش عملکرد و افزایش طول عمر مفید آنها ضروری است.
دمای CPU در سرورهای HPE ProLiant Gen9 و نسلهای قدیمیتر

سرورهای HPE ProLiant Gen9 و نسلهای پیشین (مانند Gen8)، از پردازندههای Intel Xeon E5 و E7 استفاده میکنند که دارای TDP متوسطی هستند. به طور معمول، دمای ایدهآل پردازنده در این سرورها معمولا بین ۳۵ تا ۵۰ درجه سانتیگراد در حالت Idle (بیکاری) و ۶۰ تا ۷۵ درجه سانتیگراد در حالت Load (بار کاری) قرار دارد. دمای بالاتر از ۸۰ درجه سانتیگراد، زنگ خطری جدی محسوب میشود و میتواند نشاندهنده مشکل در سیستم خنکسازی باشد. در این سرورها، سیستمهای فن هوشمند (Smart Fans) وجود دارند که با افزایش دما، سرعت چرخش خود را بالا میبرند تا از گرمای بیش از حد جلوگیری کنند. نکات فنی مهم در این نسل از منظر دما، اطمینان از عملکرد صحیح فنها، تمیز بودن هیتسینک و بهروز بودن فریمویر سرور است. فریمویر قدیمی ممکن است الگوریتمهای مدیریت دما را به درستی اجرا نکند و منجر به افزایش دما شود. برای پایش دما در این سرورها، استفاده از ابزار HPE iLO 4 توصیه میشود که امکان دسترسی به گزارشهای دقیق و هشدارهای دمایی را فراهم میکند.
دمای CPU در سرورهای HPE ProLiant Gen10 و Gen10 Plus

با معرفی سرورهای HPE ProLiant Gen10 و Gen10 Plus، پردازندههای پیشرفتهتری مانند Intel Xeon Scalable (Cascade Lake و Ice Lake) و AMD EPYC (Zen 2 و Zen 3) وارد میدان شدند. این پردازندهها با تعداد هستههای بیشتر و فرکانسهای بالاتر، گرمای بیشتری تولید میکنند، بنابراین مدیریت دما در آنها اهمیت دوچندانی دارد. دمای ایدهآل پردازنده در این نسل معمولا بین ۴۰ تا ۶۰ درجه سانتیگراد در حالت Idle و ۷۰ تا ۹۰ درجه سانتیگراد در حالت بار کاری است. در این سرورها، به دلیل استفاده از فناوریهای جدید، دمای تا ۹۵ درجه سانتیگراد نیز ممکن است در پیکهای بار کاری بالا مشاهده شود، اما نباید به صورت پایدار در این محدوده باقی بماند. بنابراین، استمرار دما در این درجه باید به دقت مورد بررسی قرار بگیرد. ابزار HPE iLO 5 در این سرورها قابلیتهای پیشرفتهتری برای پایش دما و گزارشدهی دارد. اطمینان از جریان هوای مناسب در رک، استفاده از فنهای با کارایی بالا و تنظیم پالیسیهای مدیریت توان در بایوس، برای کنترل دمای این پردازندههای قدرتمند ضروری است.
دمای CPU در سرورهای HPE Synergy و Edge

سرورهای HPE Synergy و سرورهای HPE Edgeline که برای محیطهای خاص طراحی شدهاند، نیازمندیهای دمایی متفاوتی دارند. در سرورهای HPE Synergy که برای دیتاسنترهای مدرن و متراکم طراحی شدهاند، مدیریت دما به صورت مرکزی و از طریق سیستمهای خنککننده پیشرفته انجام میشود. دمای پردازنده در این سیستمها به شدت تحت کنترل است و معمولا در محدودهای مشابه سرورهای Gen10 قرار میگیرد. در مقابل، سرورهای HPE Edgeline که برای محیطهای لبه (Edge) و صنعتی طراحی شدهاند، ممکن است در شرایط محیطی سختتر با دماهای بالاتر کار کنند. این سرورها با قطعات مقاومتر و سیستمهای خنکسازی اختصاصی، قادر به تحمل دماهای محیطی بالا هستند، اما همچنان دمای داخلی پردازنده باید در محدوده مجاز (معمولا زیر ۱۰۰ درجه سانتیگراد) باقی بماند. در این نوع سرورها، علاوه بر پایش دمای پردازنده، پایش دمای محیطی نیز از اهمیت ویژهای برخوردار است و باید به آن توجه شود. به طور کلی، رعایت اصول جریان هوا و بهروز بودن فریمور در تمامی این پلتفرمها حیاتی است.
چگونه از iLO برای مشاهده دما استفاده کنیم؟

استفاده از iLO برای مشاهده دمای پردازنده یکی از دقیقترین و کاربردیترین روشها در سرورهای HPE ProLiant است. iLO یک ابزار مدیریت از راه دور است که حتی زمانی که سرور خاموش یا بدون سیستمعامل است، به شما اجازه میدهد تا وضعیت سختافزاری آن را پایش کنید. به طور کلی، مراحل گام به گام استفاده از iLO برای مشاهده دمای پردازنده به شرح زیر است:
۱. دسترسی به رابط کاربری iLO
ابتدا باید به رابط کاربری iLO سرور خود دسترسی پیدا کنید. این کار معمولا از طریق یک مرورگر وب انجام میشود. آدرس آیپی اختصاص داده شده به iLO را در نوار آدرس مرورگر خود وارد کنید (این آدرس در هنگام بوت شدن سرور روی صفحه نمایش داده میشود یا توسط مدیر شبکه پیکربندی شده است). نام کاربری و رمز عبور iLO خود را وارد کنید. اگر تنظیمات پیشفرض را تغییر ندادهاید، میتوانید از اطلاعات روی تگ فیزیکی سرور یا در مستندات آن استفاده کنید.
۲. پیمایش به بخش اطلاعات سیستم
پس از ورود به iLO، به داشبورد اصلی منتقل خواهید شد. برای مشاهده دمای پردازنده، باید به بخش مربوط به وضعیت سختافزار بروید.
در پنل ناوبری سمت چپ، روی گزینه Information یا System Status کلیک کنید.
از زیرمنوی باز شده، گزینه System Health یا System Information را انتخاب کنید.
۳. مشاهده دمای پردازنده
در این بخش، اطلاعات جامع و لحظهای از وضعیت سختافزاری سرور نمایش داده میشود. به دنبال بخش Temperatures (دماها) یا Sensors (حسگرها) بگردید. در این لیست، حسگرهای دمای مختلفی برای قطعات گوناگون نمایش داده میشوند. به دنبال گزینههایی با برچسبهایی مانند CPU1 Temp, CPU2 Temp, یا Processor 1, Processor 2 باشید. در مقابل هر یک از این گزینهها، دمای فعلی پردازنده بر حسب درجه سانتیگراد (°C) یا فارنهایت (°F) نمایش داده میشود.
۴. بررسی وضعیت و هشدارهای دمایی
iLO تنها دما را نمایش نمیدهد، بلکه وضعیت سلامتی را نیز گزارش میدهد. در کنار مقدار دما، یک آیکون وضعیت وجود دارد که معمولا به صورت سبز (OK)، زرد (Caution) یا قرمز (Critical) است.
سبز: دمای پردازنده در محدوده مجاز و ایمن قرار دارد.
زرد: دما در حال نزدیک شدن به محدوده هشدار است. این حالت نیاز به بررسی دارد تا از افزایش بیشتر دما جلوگیری شود.
قرمز: دما از حد بحرانی عبور کرده و نیاز به اقدام فوری برای جلوگیری از آسیب دیدن پردازنده دارد.
شایان ذکر است در iLO میتوانید گزارش Active Health System را دانلود کنید. این گزارش یک فایل جامع است که شامل تاریخچه دمای پردازنده و هرگونه رویداد مربوط به دما در گذشته است. همچنین، iLO به شما اجازه میدهد تا هشدارهای دمایی را پیکربندی کنید تا در صورت عبور دما از آستانههای مشخص، به شما از طریق ایمیل یا SNMP اطلاعرسانی شود. در برخی نسخههای iLO، میتوانید با کلیک بر روی حسگر دما، به اطلاعات دقیقتری مانند حداکثر دمای مجاز (Thermal Thresholds) دسترسی پیدا کنید. این مورد به نوع لایسنس نصب شده روی سرور بستگی دارد. به طور کلی، با استفاده از iLO، میتوانید به راحتی دمای پردازنده سرورهای خود را از راه دور پایش کرده و قبل از بروز مشکلات جدی، اقدامات لازم را انجام دهید.
چگونه از Dell iDRAC برای مشاهده دمای پردازنده استفاده کنیم؟

Dell iDRAC ابزاری معادل HPE iLO در سرورهای Dell PowerEdge است که به مدیران سیستم امکان مدیریت و پایش سرور را از راه دور میدهد. برای مشاهده دمای پردازنده با استفاده از iDRAC، مراحل زیر را دنبال کنید:
۱. دسترسی به رابط کاربری iDRAC
ابتدا با وارد کردن آدرس آیپی یا نام میزبان iDRAC در مرورگر وب خود، به رابط کاربری آن دسترسی پیدا کنید. اطلاعات ورود معمولا در پشت یا روی سرور چاپ شدهاند. نام کاربری و رمز عبور خود را وارد کنید. اگر از اولین باری است که وارد میشوید، رمز عبور پیشفرض را وارد کرده و در صورت نیاز آن را تغییر دهید.
۲. پیمایش به بخش وضعیت سیستم
پس از ورود، به داشبورد اصلی iDRAC منتقل میشوید. در اینجا، یک نمای کلی از وضعیت سرور را مشاهده خواهید کرد. در نوار منوی سمت چپ، گزینه Overview را انتخاب کنید.
۳. مشاهده دمای پردازنده
در منوی Overview، به دنبال زیرمنوی Performance بگردید و روی آن کلیک کنید. در این بخش، اطلاعات مربوط به عملکرد و دما نمایش داده میشود. به طور معمول، اطلاعات دما در بخش Temperature یا Sensors قرار دارد. شما میتوانید دمای پردازندههای مختلف (مانند CPU1 Temp، CPU2 Temp) و سایر اجزای سرور را مشاهده کنید. یکی از ویژگیهای جالبی که ابزار فوق در اختیارتان قرار میدهد بررسی وضعیت است. به بیان دقیقتر، iDRAC وضعیت سلامتی هر سنسور را با رنگهای مختلف نمایش میدهد که به شرح زیر هستند:
رنگ سبز: وضعیت عادی است.
رنگ زرد: هشدار (Warning) وجود دارد و دما به محدوده خطر نزدیک میشود.
رنگ قرمز: وضعیت بحرانی (Critical) است و نیاز به اقدام فوری دارد.

iDRAC گزارشهای کاملی از فعالیتها، هشدارها و خطاهای سیستم را ثبت میکند. در منوی Logs، میتوانید System Event Log را بررسی کرده و هشدارهای دمایی گذشته را مشاهده کنید. البته، پیشنهاد میشود همیشه از بهروز بودن Firmware iDRAC و بایوس سرور مطمئن شوید. بهروزرسانیها میتوانند دقت پایش دما را افزایش دهند و مشکلات مربوط به سنسورها را برطرف کنند. همچنین، میتوانید در iDRAC، هشدارهای خودکار را برای دمای بالا تنظیم کنید تا در صورت افزایش دما از حد مشخص، ایمیل یا پیامهای دیگری دریافت کنید. به طور کلی، iDRAC نیز همانند iLO به شما امکان میدهد تا به صورت فعال وضعیت سرور خود را پایش کرده و قبل از بروز مشکلات جدی، اقدامات لازم را انجام دهید.
نکات مهم مرتبط با دمای پردازنده
همانگونه که اشاره کردیم، دمای پردازنده یک فاکتور حیاتی برای پایداری و عملکرد سرور است که مهندسان شبکه و طراحان زیرساخت باید به آن توجه ویژهای داشته باشند. در جدول زیر نکات کلیدی مربوط به دمای پردازنده را در قالب یک جدول مشاهده میکنیم.
| نکته مهم | شرح برای مهندس شبکه و طراح | پیامد عدم توجه |
| محدوده دمایی (Temperature Range) | دمای پردازنده در حالت Idle (بیکاری) باید بین ۴۰-۶۰ درجه سانتیگراد و در حالت بار کاری بین ۷۰-۹۰ درجه سانتیگراد باشد. این محدوده بسته به نسل پردازنده و سازنده (HPE، Dell و غیره) متفاوت است. | افزایش دما به بالای ۹۵ درجه سانتیگراد به صورت پایدار باعث کاهش فرکانس و افت عملکرد شدید سرور میشود. |
| جریان هوا و خنکسازی (Airflow & Cooling) | طراحی درست جریان هوا در داخل رک و دیتاسنتر بسیار مهم است. باید اطمینان حاصل شود که هوای سرد از جلو وارد و هوای گرم از عقب خارج میشود. فنهای سرور، هیتسینکها و خمیر حرارتی باید به طور منظم بررسی شوند. | عدم خنکسازی مناسب میتواند به خاموش شدن ناگهانی سرور و آسیب فیزیکی به پردازنده منجر شود. |
| Firmware و BIOS | بهروز نگه داشتن فریمویر و BIOS/ROM سرور ضروری است. سازندگان بهروزرسانیهایی را برای بهبود الگوریتمهای مدیریت دما و توان پردازنده ارائه میدهند. | فریمویر قدیمی ممکن است با پردازندههای جدیدتر ناسازگار باشد یا نتواند به درستی دمای آنها را کنترل کند، که نتیجه آن کاهش عملکرد یا ناپایداری است. |
| پایش و مانیتورینگ (Monitoring) | استفاده از ابزارهای مدیریتی مانند HPE iLO یا Dell iDRAC برای پایش دمای لحظهای و تاریخچه آن حیاتی است. این ابزارها هشدارهای خودکار را در صورت افزایش دما فعال میکنند. | عدم پایش مداوم میتواند باعث شود که مشکلات دمایی به صورت پنهان باقی بمانند و زمانی کشف شوند که به عملکرد سرور آسیب جدی وارد شده است. |
| فاکتورهای محیطی | دمای اتاق سرور و رطوبت آن باید در محدوده توصیهشده توسط سازنده (معمولا ۱۸-۲۴ درجه سانتیگراد) حفظ شود. وجود گرد و غبار نیز میتواند عملکرد خنکسازی را کاهش دهد. | دمای محیطی بالا میتواند باعث شود که حتی با وجود سیستم خنکسازی داخلی مناسب، دمای پردازنده از حد مجاز فراتر رود و هزینههای عملیاتی افزایش یابد. |
| بار کاری (Workload) | نوع بار کاری بر دمای پردازنده تاثیر مستقیم دارد. بارهای پردازشی سنگین (مانند رندرینگ، پردازش دادههای بزرگ یا مجازیسازی فشرده) دمای پردازنده را به شدت بالا میبرند. | در صورت استفاده از بارهای کاری سنگین بدون سیستم خنکسازی قوی و مناسب، پردازنده ممکن است به سرعت به دمای بحرانی برسد و عملکرد سرویسها کاهش یابد. |
نویسنده: حمیدرضا تائبی