پردازنده (CPU)

چگونه دمای سی پی یو در سرور و تجهیزات دیگر را بفهمیم؟

دمای پردازنده (CPU) یکی از مهم‌ترین شاخص‌های سلامت و عملکرد هر سیستمی است و راه‌های مختلفی برای بررسی آن وجود دارد. ساده‌ترین روش، استفاده از نرم‌افزارهای مانیتورینگ سخت‌افزار است. برنامه‌هایی مانند HWMonitor و Core Temp که  به شکل رایگان در دسترس قرار دارند به صورت دمای لحظه‌ای هر هسته از پردازنده را نمایش می‌دهند. در سیستم‌عامل ویندوز نیز می‌توان از ابزارهایی مانند Task Manager برای بررسی اولیه دما استفاده کرد. این در حالی است که برای کامپیوترهای گیمینگ، نرم‌افزارهای مخصوصی مانند MSI Afterburner یا RivaTuner Statistics Server علاوه بر دما، اطلاعات دیگری مانند فرکانس و مصرف انرژی را نیز در حین بازی نمایش می‌دهند، اما در دنیای سرورها شرکت‌هایی مثل اچ‌پی و دل، ابزارهای دقیقی برای این منظور ارائه کرده‌اند که در این مقاله به بررسی آن‌ها خواهیم پرداخت. 

در دنیای کامپیوترهای شخصی و لپ‌تاپ‌ها، نرم‌افزارهای کاربرد زیادی وجود دارند که به شما کمک می‌کنند تا از داغ شدن بیش از حد پردازنده جلوگیری کنید. در سرورها، بهترین و دقیق‌ترین راه بررسی دما، استفاده از ابزارهای مدیریتی اختصاصی سازندگان مانند HPE iLO یا Dell iDRAC است که دمای پردازنده و سایر قطعات را به صورت لحظه‌ای و در قالب گزارش‌های جامع نمایش می‌دهند. همچنین در سیستم‌عامل‌های لینوکس، ابزارهایی مانند lm-sensors برای پایش دما بسیار کاربردی هستند. چرا باید در مورد دمای پردازنده حساس باشیم؟ به طور کلی، توجه به دمای پردازنده در هر دستگاهی، از کامپیوتر شخصی گرفته تا سرورهای دیتاسنتر، برای جلوگیری از آسیب دیدن قطعات و کاهش عملکرد و افزایش طول عمر مفید آن‌ها ضروری است.

دمای CPU در سرورهای HPE ProLiant Gen9 و نسل‌های قدیمی‌تر

سرورهای HPE ProLiant Gen9 و نسل‌های پیشین (مانند Gen8)، از پردازنده‌های Intel Xeon E5 و E7 استفاده می‌کنند که دارای TDP متوسطی هستند. به طور معمول، دمای ایده‌آل پردازنده در این سرورها معمولا بین ۳۵ تا ۵۰ درجه سانتی‌گراد در حالت Idle (بیکاری) و ۶۰ تا ۷۵ درجه سانتی‌گراد در حالت Load (بار کاری) قرار دارد. دمای بالاتر از ۸۰ درجه سانتی‌گراد، زنگ خطری جدی محسوب می‌شود و می‌تواند نشان‌دهنده مشکل در سیستم خنک‌سازی باشد. در این سرورها، سیستم‌های فن هوشمند (Smart Fans) وجود دارند که با افزایش دما، سرعت چرخش خود را بالا می‌برند تا از گرمای بیش از حد جلوگیری کنند. نکات فنی مهم در این نسل از منظر دما، اطمینان از عملکرد صحیح فن‌ها، تمیز بودن هیت‌سینک و به‌روز بودن فریم‌ویر سرور است. فریم‌ویر قدیمی ممکن است الگوریتم‌های مدیریت دما را به درستی اجرا نکند و منجر به افزایش دما شود. برای پایش دما در این سرورها، استفاده از ابزار HPE iLO 4 توصیه می‌شود که امکان دسترسی به گزارش‌های دقیق و هشدارهای دمایی را فراهم می‌کند.

دمای CPU در سرورهای HPE ProLiant Gen10 و Gen10 Plus

با معرفی سرورهای HPE ProLiant Gen10 و Gen10 Plus، پردازنده‌های پیشرفته‌تری مانند Intel Xeon Scalable (Cascade Lake و Ice Lake) و AMD EPYC (Zen 2 و Zen 3) وارد میدان شدند. این پردازنده‌ها با تعداد هسته‌های بیشتر و فرکانس‌های بالاتر، گرمای بیشتری تولید می‌کنند، بنابراین مدیریت دما در آن‌ها اهمیت دوچندانی دارد. دمای ایده‌آل پردازنده در این نسل معمولا بین ۴۰ تا ۶۰ درجه سانتی‌گراد در حالت Idle و ۷۰ تا ۹۰ درجه سانتی‌گراد در حالت بار کاری است. در این سرورها، به دلیل استفاده از فناوری‌های جدید، دمای تا ۹۵ درجه سانتی‌گراد نیز ممکن است در پیک‌های بار کاری بالا مشاهده شود، اما نباید به صورت پایدار در این محدوده باقی بماند. بنابراین، استمرار دما در این درجه باید به دقت مورد بررسی قرار بگیرد. ابزار HPE iLO 5 در این سرورها قابلیت‌های پیشرفته‌تری برای پایش دما و گزارش‌دهی دارد. اطمینان از جریان هوای مناسب در رک، استفاده از فن‌های با کارایی بالا و تنظیم پالیسی‌های مدیریت توان در بایوس، برای کنترل دمای این پردازنده‌های قدرتمند ضروری است.

دمای CPU در سرورهای HPE Synergy و Edge

سرورهای HPE Synergy و سرورهای HPE Edgeline که برای محیط‌های خاص طراحی شده‌اند، نیازمندی‌های دمایی متفاوتی دارند. در سرورهای HPE Synergy که برای دیتاسنترهای مدرن و متراکم طراحی شده‌اند، مدیریت دما به صورت مرکزی و از طریق سیستم‌های خنک‌کننده پیشرفته انجام می‌شود. دمای پردازنده در این سیستم‌ها به شدت تحت کنترل است و معمولا در محدوده‌ای مشابه سرورهای Gen10 قرار می‌گیرد. در مقابل، سرورهای HPE Edgeline که برای محیط‌های لبه (Edge) و صنعتی طراحی شده‌اند، ممکن است در شرایط محیطی سخت‌تر با دماهای بالاتر کار کنند. این سرورها با قطعات مقاوم‌تر و سیستم‌های خنک‌سازی اختصاصی، قادر به تحمل دماهای محیطی بالا هستند، اما همچنان دمای داخلی پردازنده باید در محدوده مجاز (معمولا زیر ۱۰۰ درجه سانتی‌گراد) باقی بماند. در این نوع سرورها، علاوه بر پایش دمای پردازنده، پایش دمای محیطی نیز از اهمیت ویژه‌ای برخوردار است و باید به آن توجه شود. به طور کلی، رعایت اصول جریان هوا و به‌روز بودن فریم‌ور در تمامی این پلتفرم‌ها حیاتی است.

چگونه از iLO برای مشاهده دما استفاده کنیم؟

استفاده از iLO برای مشاهده دمای پردازنده یکی از دقیق‌ترین و کاربردی‌ترین روش‌ها در سرورهای HPE ProLiant است. iLO یک ابزار مدیریت از راه دور است که حتی زمانی که سرور خاموش یا بدون سیستم‌عامل است، به شما اجازه می‌دهد تا وضعیت سخت‌افزاری آن را پایش کنید. به طور کلی، مراحل گام به گام استفاده از iLO برای مشاهده دمای پردازنده به شرح زیر است:

۱. دسترسی به رابط کاربری iLO

ابتدا باید به رابط کاربری iLO سرور خود دسترسی پیدا کنید. این کار معمولا از طریق یک مرورگر وب انجام می‌شود. آدرس آی‌پی اختصاص داده شده به iLO را در نوار آدرس مرورگر خود وارد کنید (این آدرس در هنگام بوت شدن سرور روی صفحه نمایش داده می‌شود یا توسط مدیر شبکه پیکربندی شده است). نام کاربری و رمز عبور iLO خود را وارد کنید. اگر تنظیمات پیش‌فرض را تغییر نداده‌اید، می‌توانید از اطلاعات روی تگ فیزیکی سرور یا در مستندات آن استفاده کنید.

۲. پیمایش به بخش اطلاعات سیستم

پس از ورود به iLO، به داشبورد اصلی منتقل خواهید شد. برای مشاهده دمای پردازنده، باید به بخش مربوط به وضعیت سخت‌افزار بروید.

در پنل ناوبری سمت چپ، روی گزینه Information یا System Status کلیک کنید.

از زیرمنوی باز شده، گزینه System Health یا System Information را انتخاب کنید.

۳. مشاهده دمای پردازنده

در این بخش، اطلاعات جامع و لحظه‌ای از وضعیت سخت‌افزاری سرور نمایش داده می‌شود. به دنبال بخش Temperatures (دماها) یا Sensors (حسگرها) بگردید. در این لیست، حسگرهای دمای مختلفی برای قطعات گوناگون نمایش داده می‌شوند. به دنبال گزینه‌هایی با برچسب‌هایی مانند CPU1 Temp, CPU2 Temp, یا Processor 1, Processor 2 باشید. در مقابل هر یک از این گزینه‌ها، دمای فعلی پردازنده بر حسب درجه سانتی‌گراد (°C) یا فارنهایت (°F) نمایش داده می‌شود.

۴. بررسی وضعیت و هشدارهای دمایی

iLO تنها دما را نمایش نمی‌دهد، بلکه وضعیت سلامتی را نیز گزارش می‌دهد. در کنار مقدار دما، یک آیکون وضعیت وجود دارد که معمولا به صورت سبز (OK)، زرد (Caution) یا قرمز (Critical) است.

سبز: دمای پردازنده در محدوده مجاز و ایمن قرار دارد.

زرد: دما در حال نزدیک شدن به محدوده هشدار است. این حالت نیاز به بررسی دارد تا از افزایش بیشتر دما جلوگیری شود.

قرمز: دما از حد بحرانی عبور کرده و نیاز به اقدام فوری برای جلوگیری از آسیب دیدن پردازنده دارد.

شایان ذکر است در iLO می‌توانید گزارش Active Health System را دانلود کنید. این گزارش یک فایل جامع است که شامل تاریخچه دمای پردازنده و هرگونه رویداد مربوط به دما در گذشته است. همچنین، iLO به شما اجازه می‌دهد تا هشدارهای دمایی را پیکربندی کنید تا در صورت عبور دما از آستانه‌های مشخص، به شما از طریق ایمیل یا SNMP اطلاع‌رسانی شود. در برخی نسخه‌های iLO، می‌توانید با کلیک بر روی حسگر دما، به اطلاعات دقیق‌تری مانند حداکثر دمای مجاز (Thermal Thresholds) دسترسی پیدا کنید. این مورد به نوع لایسنس نصب شده روی سرور بستگی دارد. به طور کلی، با استفاده از iLO، می‌توانید به راحتی دمای پردازنده سرورهای خود را از راه دور پایش کرده و قبل از بروز مشکلات جدی، اقدامات لازم را انجام دهید.

چگونه از Dell iDRAC برای مشاهده دمای پردازنده استفاده کنیم؟

Dell iDRAC ابزاری معادل HPE iLO در سرورهای Dell PowerEdge است که به مدیران سیستم امکان مدیریت و پایش سرور را از راه دور می‌دهد. برای مشاهده دمای پردازنده با استفاده از iDRAC، مراحل زیر را دنبال کنید:

۱. دسترسی به رابط کاربری iDRAC

ابتدا با وارد کردن آدرس آی‌پی یا نام میزبان iDRAC در مرورگر وب خود، به رابط کاربری آن دسترسی پیدا کنید. اطلاعات ورود معمولا در پشت یا روی سرور چاپ شده‌اند. نام کاربری و رمز عبور خود را وارد کنید. اگر از اولین باری است که وارد می‌شوید، رمز عبور پیش‌فرض را وارد کرده و در صورت نیاز آن را تغییر دهید.

۲. پیمایش به بخش وضعیت سیستم

پس از ورود، به داشبورد اصلی iDRAC منتقل می‌شوید. در اینجا، یک نمای کلی از وضعیت سرور را مشاهده خواهید کرد. در نوار منوی سمت چپ، گزینه Overview را انتخاب کنید.

۳. مشاهده دمای پردازنده

در منوی Overview، به دنبال زیرمنوی Performance بگردید و روی آن کلیک کنید. در این بخش، اطلاعات مربوط به عملکرد و دما نمایش داده می‌شود. به طور معمول، اطلاعات دما در بخش Temperature یا Sensors قرار دارد. شما می‌توانید دمای پردازنده‌های مختلف (مانند CPU1 Temp، CPU2 Temp) و سایر اجزای سرور را مشاهده کنید. یکی از ویژگی‌های جالبی که ابزار فوق در اختیارتان قرار می‌دهد بررسی وضعیت است. به بیان دقیق‌تر، iDRAC وضعیت سلامتی هر سنسور را با رنگ‌های مختلف نمایش می‌دهد که به شرح زیر هستند:

رنگ سبز: وضعیت عادی است.

رنگ زرد: هشدار (Warning) وجود دارد و دما به محدوده خطر نزدیک می‌شود.

رنگ قرمز: وضعیت بحرانی (Critical) است و نیاز به اقدام فوری دارد.

iDRAC گزارش‌های کاملی از فعالیت‌ها، هشدارها و خطاهای سیستم را ثبت می‌کند. در منوی Logs، می‌توانید System Event Log را بررسی کرده و هشدارهای دمایی گذشته را مشاهده کنید. البته، پیشنهاد می‌شود همیشه از به‌روز بودن Firmware iDRAC و بایوس سرور مطمئن شوید. به‌روزرسانی‌ها می‌توانند دقت پایش دما را افزایش دهند و مشکلات مربوط به سنسورها را برطرف کنند. همچنین، می‌توانید در iDRAC، هشدارهای خودکار را برای دمای بالا تنظیم کنید تا در صورت افزایش دما از حد مشخص، ایمیل یا پیام‌های دیگری دریافت کنید. به طور کلی، iDRAC نیز همانند iLO به شما امکان می‌دهد تا به صورت فعال وضعیت سرور خود را پایش کرده و قبل از بروز مشکلات جدی، اقدامات لازم را انجام دهید.

نکات مهم مرتبط با دمای پردازنده

همان‌گونه که اشاره کردیم، دمای پردازنده یک فاکتور حیاتی برای پایداری و عملکرد سرور است که مهندسان شبکه و طراحان زیرساخت باید به آن توجه ویژه‌ای داشته باشند. در جدول زیر نکات کلیدی مربوط به دمای پردازنده را در قالب یک جدول مشاهده می‌کنیم.

نکته مهم شرح برای مهندس شبکه و طراح پیامد عدم توجه
محدوده دمایی (Temperature Range) دمای پردازنده در حالت Idle (بیکاری) باید بین ۴۰-۶۰ درجه سانتی‌گراد و در حالت بار کاری بین ۷۰-۹۰ درجه سانتی‌گراد باشد. این محدوده بسته به نسل پردازنده و سازنده (HPE، Dell و غیره) متفاوت است. افزایش دما به بالای ۹۵ درجه سانتی‌گراد به صورت پایدار باعث کاهش فرکانس و افت عملکرد شدید سرور می‌شود.
جریان هوا و خنک‌سازی (Airflow & Cooling) طراحی درست جریان هوا در داخل رک و دیتاسنتر بسیار مهم است. باید اطمینان حاصل شود که هوای سرد از جلو وارد و هوای گرم از عقب خارج می‌شود. فن‌های سرور، هیت‌سینک‌ها و خمیر حرارتی باید به طور منظم بررسی شوند. عدم خنک‌سازی مناسب می‌تواند به خاموش شدن ناگهانی سرور و آسیب فیزیکی به پردازنده منجر شود.
Firmware و BIOS به‌روز نگه داشتن فریم‌ویر و BIOS/ROM سرور ضروری است. سازندگان به‌روزرسانی‌هایی را برای بهبود الگوریتم‌های مدیریت دما و توان پردازنده ارائه می‌دهند. فریم‌ویر قدیمی ممکن است با پردازنده‌های جدیدتر ناسازگار باشد یا نتواند به درستی دمای آن‌ها را کنترل کند، که نتیجه آن کاهش عملکرد یا ناپایداری است.
پایش و مانیتورینگ (Monitoring) استفاده از ابزارهای مدیریتی مانند HPE iLO یا Dell iDRAC برای پایش دمای لحظه‌ای و تاریخچه آن حیاتی است. این ابزارها هشدارهای خودکار را در صورت افزایش دما فعال می‌کنند. عدم پایش مداوم می‌تواند باعث شود که مشکلات دمایی به صورت پنهان باقی بمانند و زمانی کشف شوند که به عملکرد سرور آسیب جدی وارد شده است.
فاکتورهای محیطی دمای اتاق سرور و رطوبت آن باید در محدوده توصیه‌شده توسط سازنده (معمولا ۱۸-۲۴ درجه سانتی‌گراد) حفظ شود. وجود گرد و غبار نیز می‌تواند عملکرد خنک‌سازی را کاهش دهد. دمای محیطی بالا می‌تواند باعث شود که حتی با وجود سیستم خنک‌سازی داخلی مناسب، دمای پردازنده از حد مجاز فراتر رود و هزینه‌های عملیاتی افزایش یابد.
بار کاری (Workload) نوع بار کاری بر دمای پردازنده تاثیر مستقیم دارد. بارهای پردازشی سنگین (مانند رندرینگ، پردازش داده‌های بزرگ یا مجازی‌سازی فشرده) دمای پردازنده را به شدت بالا می‌برند. در صورت استفاده از بارهای کاری سنگین بدون سیستم خنک‌سازی قوی و مناسب، پردازنده ممکن است به سرعت به دمای بحرانی برسد و عملکرد سرویس‌ها کاهش یابد.

نویسنده: حمیدرضا تائبی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *