מחשב Radeon Open Compute “ROCm” Stack v3.1 שוחרר עם RAS עבור Vega 7nm, תמיכה ב- SLURM לניהול משאבים טוב יותר, אך נאווי עדיין חסר

מחשב Radeon Open Compute “ROCm” Stack v3.1 שוחרר עם RAS עבור Vega 7nm, תמיכה ב- SLURM לניהול משאבים טוב יותר, אך נאווי עדיין חסר

חוּמרָה / מחשב Radeon Open Compute “ROCm” Stack v3.1 שוחרר עם RAS עבור Vega 7nm, תמיכה ב- SLURM לניהול משאבים טוב יותר, אך נאווי עדיין חסר קריאה של 2 דקות

AMD Radeon

גרסת ה- Radeon Open Compute או הגרסה החדשה 'ROCm' מוצגת כעת זמין להורדה. ה- Radeon Open Compute v3.1 מביא איתו לא מעט תכונות, אך באופן מוזר, עדיין חסרה תמיכה ב- AMD Navi וגם ב- GFX10.



ROCm, הפלטפורמה האוניברסלית המקובלת ביותר למחשוב מואץ ב- GPU, נמצאת כעת בגרסה 3.1. העדכון האחרון לפלטפורמה המודולרית המאפשרת לספקי חומרה לבנות מנהלי התקנים התומכים במסגרת ROCm כוללת כמה תכונות צפויות כמו תמיכה ב- RAS בתמיכה של 7nm Vega ותמיכה ב- SLURM עבור AMD GPUs. עם זאת, מסיבות שעדיין לא ידועות, ל- ROCm עדיין אין תמיכה מלאה בדור הבא של AMD Navi Architecture.

מה חדש ב- Radeon ROCm v3.1:

השינוי הגדול והברור ביותר בהתקנה החדשה של Radeon ROCm v3.1 הוא במבנה מדריך ההתקנות של ROCm. התקנה חדשה של ערכת הכלים ROCm מתקנת את החבילות ב- / opt / rocm- תיקיה. בעבר הותקנו חבילות ערכות כלים של ROCm / opt / rocm תיקיה.

הגרסה החדשה של ROCm שיפרה את התמיכה באמינות, נגישות ושירות (RAS) עבור מעבדי Vega 7nm. סביר להניח שעבודת וגה זו, 7 ננומטר, עדיין נמצאת תחת מיקרוסקופ טבעת 'ארקטורוס' מאיץ חישובים שמגיע השנה. התמיכה כוללת:



  • UMC RAS ​​- HBM ECC (הזרקת שגיאות בלתי ניתנת לתיקון), פרישת עמוד, התאוששות RAS באמצעות GPU (BACO)
  • GFX RAS - GFX, MMHUB ECC (הזרקת שגיאות בלתי ניתנות לתיקון), התאוששות RAS באמצעות GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (הזרקת שגיאות בלתי ניתנת לתיקון), התאוששות RAS באמצעות GPU (BACO)

Radeon ROCm v3.1 מקבל גם תמיכה ב- SLURM עבור AMD GPUs. SLURM או כלי שירות לינוקס פשוט לניהול משאבים הוא אחד ממערכת ניהול האשכולות ותזמון התפקידים המועדפים והמשמשים בקלות עבור אשכולות לינוקס. SLURM מועדף בגלל היותו קוד פתוח, סובלני לתקלות וניתן להרחבה.

מערכת זו יכולה כעת לתקשר היטב עם GPUs של AMD. הגרסה האחרונה 20.02.0 של SLURM כוללת תוספי AMD המאפשרים ל- SLURM לזהות ולהגדיר תצורה אוטומטית של GPUs של AMD. הוא גם אוסף ומדווח על צריכת האנרגיה של שבבים גרפיים. תמיכת SLURM היא תוספת שימושית בהתחשב במספר ההולך וגדל של פריסות מחשוב העל באמצעות GPUs של Radeon ואשכולות GPU אחרים של AMD גדולים יותר.

למרות הכללתם של מספר תכונות, עדיין אין סימנים לתמיכה ב- GFX10 / Navi ב- ROCm. ה דף GitHub ל- ROCm עודכן כך שישקף את כל השינויים, הערות ההתקנה והבעיות הידועות.



תגים אמד