أصدرت شركة TenStorrent التي يقودها Jim Keller من الجيل التالي معالج Wormhole من أجل أعباء العمل من الذكاء الاصطناعى ، والتي تتوقع تقديم أداء جيد بسعر معقول.تقدم الشركة حاليًا بطاقتي PCIe إضافية يمكن أن تستوعب معالجات ثقب واحد أو اثنين ، بالإضافة إلى محطات عمل TT-Loudbox و TT-Quietbox لمطوري البرامج. تهدف جميع إعلانات اليوم إلى المطورين ، وليس أولئك الذين يستخدمون لوحات ثقف الدودة لأعباء العمل التجارية.
وقال جيم كيلر ، الرئيس التنفيذي لشركة TenStorrent: "من دواعي سرورنا دائمًا الحصول على المزيد من منتجاتنا في أيدي المطورين. يمكن أن تساعد أنظمة تطوير الإصدار باستخدام بطاقات Wormhole ™ المطورين على توسيع نطاق وتطوير برامج AI متعددة النقاط".بالإضافة إلى هذا الإطلاق ، نحن متحمسون لرؤية التقدم الذي نحققه من خلال الشريط والضغط على منتج الجيل الثاني ، Blackhole. "

يحتوي كل معالج ثقب الدودة على 72 نوى Tensix (خمسة منها تدعم النوى RISC-V في تنسيقات البيانات المختلفة) و 108 ميغابايت من SRAM ، مما يوفر 262 FP8 TFLOPs عند 1 جيجاهرتز مع قوة تصميم حرارية قدرها 160 واط. تم تجهيز بطاقة Wormhole N150 ذات الرقاقة الواحدة بذاكرة فيديو GDDR6 التي تبلغ 12 جيجابايت وتبلغ 288 جيجابايت/ثانية.
توفر معالجات ثقب الدودة قابلية توسيعية مرنة لتلبية الاحتياجات المتنوعة لأعباء العمل. في إعداد محطة عمل قياسية مع أربع بطاقات N300 دودة ، يمكن دمج المعالجات في وحدة واحدة تظهر في البرنامج كشبكة Core Core الموحدة العريضة. يتيح هذا التكوين للمسرع أن يتعامل مع عبء العمل نفسه ، أو الانقسام بين أربعة مطورين أو تشغيل ما يصل إلى ثمانية نماذج مختلفة من الذكاء الاصطناعي في وقت واحد. تتمثل الميزة الرئيسية لهذا التوسع في أنه يمكن تشغيله محليًا دون الحاجة إلى المحاكاة الافتراضية. في بيئة مركز البيانات ، ستستخدم معالجات Wormhole PCIe للتوسع داخل الجهاز ، أو Ethernet للتوسع الخارجي.
من حيث الأداء ، حققت بطاقة TenStorrent ذات الرقاقة الواحدة N150 (72 نوى Tensix ، وتردد 1 جيجا هرتز ، 108 ميجا بايت SRAM ، 12 جيجابايت GDDR6 ، 288 جيجا بايت/ثانية) 262 FP8 TFLOPS في 160W ، في حين تم تجميعها 24 جيجابايت GDDR6 ، عرض النطاق الترددي 576 جيجابايت/ثانية) إلى 466 FP8 TFLOPS في 300W.
لوضع 300W من 466 FP8 TFLOPS في السياق ، نقارنها بما يقدمه NVIDIA الذي تقدمه NVIDIA AI في قوة التصميم الحراري هذه. لا يدعم Nvidia's A100 FP8 ، ولكنه يدعم INT8 ، بأداء ذروة 624 قمم (1،248 قمم عندما يكون متناثرًا). وبالمقارنة ، تدعم NVIDIA's H100 FP8 ويصل إلى ذروة أداء 1،670 TFLOPS عند 300W (3341 TFLOPs في متفرقة) ، وهو ما يختلف اختلافًا كبيرًا عن ثقب Tenstorrent N300.
ومع ذلك ، هناك مشكلة كبيرة واحدة. يبيع ثقب TenStorrent N150 مقابل 999 دولارًا ، بينما يبيع N300 مقابل 1،399 دولار. بالمقارنة ، تقوم بطاقة رسومات NVIDIA H100 واحدة بالتجزئة مقابل 30،000 دولار ، اعتمادًا على الكمية. بالطبع ، لا نعرف ما إذا كان بإمكان أربعة أو ثمانية معالجات ثقب الدودة تقديم أداء H300 واحد ، ولكن TDPs هم 600W و 1200W على التوالي.
بالإضافة إلى البطاقات ، تقدم TenStorrent محطات عمل تم إنشاؤها مسبقًا للمطورين ، بما في ذلك 4 بطاقات N300 في TT-Loudbox الأكثر بأسعار معقولة مع تبريد نشط ، ودالة تبريد سائلة TT-Quietbox المتقدمة مع EPYC).
وقت النشر: يوليو 29-2024