أصدرت شركة Tenstorrent، التي يقودها جيم كيلر، معالج Wormhole من الجيل التالي لأحمال عمل الذكاء الاصطناعي، والذي تتوقع أن يقدم أداءً جيدًا بسعر معقول.تُقدّم الشركة حاليًا بطاقتين إضافيتين من نوع PCIe تدعمان معالجًا واحدًا أو اثنين من معالجات Wormhole، بالإضافة إلى محطتي عمل TT-LoudBox وTT-QuietBox لمطوري البرامج. جميع إعلانات اليوم موجهة للمطورين، وليس لمن يستخدمون لوحات Wormhole في تطبيقات تجارية.
"من دواعي سرورنا دائماً أن نوفر المزيد من منتجاتنا للمطورين. يمكن لأنظمة تطوير الإصدارات التي تستخدم بطاقات Wormhole™ الخاصة بنا أن تساعد المطورين على توسيع نطاق وتطوير برامج الذكاء الاصطناعي متعددة الشرائح"، هذا ما قاله جيم كيلر، الرئيس التنفيذي لشركة Tenstorrent.بالإضافة إلى هذا الإطلاق، نحن متحمسون لرؤية التقدم الذي نحرزه في عملية إخراج الشريط وتشغيل منتجنا من الجيل الثاني، بلاكهول.
يحتوي كل معالج Wormhole على 72 نواة Tensix (خمس منها تدعم نوى RISC-V بتنسيقات بيانات متنوعة) وذاكرة SRAM بسعة 108 ميجابايت، مما يوفر أداءً يصل إلى 262 تيرافلوب FP8 بتردد 1 جيجاهرتز مع استهلاك طاقة حرارية تصميمية تبلغ 160 واط. بطاقة Wormhole n150 أحادية الشريحة مزودة بذاكرة فيديو GDDR6 بسعة 12 جيجابايت وعرض نطاق ترددي يبلغ 288 جيجابايت/ثانية.
توفر معالجات Wormhole قابلية توسع مرنة لتلبية الاحتياجات المتنوعة لأحمال العمل. في إعداد محطة عمل قياسية مزودة بأربع بطاقات Wormhole n300، يمكن دمج المعالجات في وحدة واحدة تظهر في البرنامج كشبكة Tensix أساسية موحدة وواسعة. يتيح هذا التكوين للمُسرِّع معالجة نفس حمل العمل، وتوزيعه بين أربعة مطورين، أو تشغيل ما يصل إلى ثمانية نماذج ذكاء اصطناعي مختلفة في وقت واحد. من أهم ميزات قابلية التوسع هذه إمكانية تشغيلها محليًا دون الحاجة إلى المحاكاة الافتراضية. في بيئة مركز البيانات، تستخدم معالجات Wormhole منفذ PCIe للتوسع داخل الجهاز، أو منفذ Ethernet للتوسع الخارجي.
من حيث الأداء، حققت بطاقة Wormhole n150 أحادية الشريحة من Tenstorrent (72 نواة Tensix، تردد 1 جيجاهرتز، 108 ميجابايت SRAM، 12 جيجابايت GDDR6، عرض نطاق ترددي 288 جيجابايت/ثانية) 262 FP8 TFLOPS عند 160 واط، بينما توفر لوحة Wormhole n300 ثنائية الشريحة (128 نواة Tensix، تردد 1 جيجاهرتز، 192 ميجابايت SRAM، 24 جيجابايت GDDR6 مجمعة، عرض نطاق ترددي 576 جيجابايت/ثانية) ما يصل إلى 466 FP8 TFLOPS عند 300 واط.
لإعطاء فكرة عن أداء 300 واط من 466 تيرافلوب FP8، سنقارنه بما تقدمه شركة Nvidia، الرائدة في سوق الذكاء الاصطناعي، عند نفس مستوى استهلاك الطاقة الحرارية. لا يدعم معالج A100 من Nvidia تقنية FP8، ولكنه يدعم تقنية INT8، مع ذروة أداء تبلغ 624 تيرافلوب (1248 تيرافلوب عند استخدام المصفوفات المتفرقة). في المقابل، يدعم معالج H100 من Nvidia تقنية FP8 ويصل إلى ذروة أداء تبلغ 1670 تيرافلوب عند استهلاك 300 واط (3341 تيرافلوب عند استخدام المصفوفات المتفرقة)، وهو ما يختلف اختلافًا كبيرًا عن معالج Wormhole n300 من Tenstorrent.
مع ذلك، ثمة مشكلة رئيسية. يُباع معالج الرسوميات Wormhole n150 من Tenstorrent بسعر 999 دولارًا، بينما يُباع n300 بسعر 1399 دولارًا. في المقابل، يُباع معالج الرسوميات Nvidia H100 الواحد بسعر 30000 دولار، حسب الكمية. بالطبع، لا نعلم ما إذا كان بإمكان أربعة أو ثمانية معالجات Wormhole تقديم أداء معالج H300 واحد، لكن استهلاك الطاقة الحرارية (TDP) لكل منهما هو 600 واط و1200 واط على التوالي.
بالإضافة إلى البطاقات، تقدم Tenstorrent محطات عمل جاهزة للمطورين، بما في ذلك 4 بطاقات n300 في TT-LoudBox الأقل تكلفة والقائمة على معالج Xeon مع تبريد نشط، وTT-QuietBox المتقدمة مع وظيفة التبريد السائل (Xiaolong) القائمة على معالج EPYC.
تاريخ النشر: 29 يوليو 2024
