پردازشگر گرافیکی H100 کمپانی انویدیا اخیراً از طریق شرکتهای ارائهدهنده خدمات ابری در دسترس قرار گرفته و اکنون نوبت به مقایسه کارایی آن با جایگزین نسل قبل، یعنی A100 رسیده است تا چشماندازی از مزیتهای به دست آمده مشخص شوند. امروز به لطف MosaicML که یک شرکت استارت آپ احداث شده بهوسیله مدیر عامل سابق Nervana و مدیرکل بخش هوش مصنوعی کمپانی اینتل به شمار میرود، جزئیات بسیار جالب توجهی در مورد فاکتور هزینه این دو پردازشگر گرافیکی به دست آمدهاند. در ابتدا این شرکت مدلهای قابل تبدیل مولد از پیش آموزش دیده (Generative Pre-trained Transformer یا بهاختصار GPT) را در اندازههای مختلف انتخاب و سپس به آموزش آنها از طریق فرمتهای bfloat16 و FP8 Floating Point پرداخته است. تمامی فرآیندهای آموزش بهوسیله پردازشگر گرافیکی ابری CoreWeave به انجام رسیده است.
با توجه به اطلاعات به اشتراک گذاشته شده، پردازشگر گرافیکی H100 کمپانی انویدیا موفق شده است تا افزایش سرعت 2.2 تا 3.3 برابری را به ارمغان آورد. شرکت CoreWeave که یکی از ارائهدهندگان خدمات ابری به شمار میرود هزینه استفاده از سیستمهای مبتنی بر پردازشگر H100 SXM خود را برابر 4.76 دلار بر هر ساعت بر هر جیپییو تعیین کرده است که در مقایسه با هزینه 2.21 دلاری سیستمهای A100 80GB افزایش پیدا کرده است. اگرچه استفاده از پردازشگر گرافیکی H100 در حدود 2.2 برابر گرانتر میباشد، اما بهبود کارایی به جبران آن پرداخته است، زیرا آموزش مدلهای هوش مصنوعی مدت زمانی کمتری به طول انجامیده و در دراز مدت به نفع کاربر تمام خواهد شد. این موضوع بهطور ذاتی پردازشگر گرافیکی H100 را برای محققان و شرکتهایی که به دنبال آموزش مدلهای زبانی بزرگ (LLM) هستند به انتخابی جذابتر تبدیل میکند. در ادامه میتوانید جداولی مربوط به مدت زمان مورد نیاز برای آموزش بین دو پردازشگر گرافیکی، بهبود سرعت و هزینه آموزش را مشاهده بفرمایید. نظر شما در این باره چیست؟
منبع: TechPowerUP