case banner ပါ။

စက်မှုသတင်း- Jim Keller သည် RISC-V ချစ်ပ်အသစ်ကို မိတ်ဆက်ခဲ့သည်။

စက်မှုသတင်း- Jim Keller သည် RISC-V ချစ်ပ်အသစ်ကို မိတ်ဆက်ခဲ့သည်။

Jim Keller ဦးဆောင်သော ချစ်ပ်ကုမ္ပဏီ Tenstorrent သည် AI လုပ်ငန်းတာဝန်များ အတွက် ၎င်း၏ မျိုးဆက်သစ် Wormhole ပရိုဆက်ဆာကို စျေးနှုန်းသက်သာစွာဖြင့် စွမ်းဆောင်ရည် ကောင်းမွန်စွာ ပေးဆောင်ရန် မျှော်လင့်ထားကြောင်း သိရသည်။ကုမ္ပဏီသည် လက်ရှိတွင် Wormhole ပရိုဆက်ဆာ တစ်ခု သို့မဟုတ် နှစ်ခု ထားရှိနိုင်သည့် နောက်ထပ် PCIe ကတ်နှစ်ခုအပြင် ဆော့ဖ်ဝဲလ်တီထွင်သူများအတွက် TT-LoudBox နှင့် TT-QuietBox အလုပ်ရုံများ ကမ်းလှမ်းထားသည်။ ယနေ့ကြေငြာချက်အားလုံးသည် စီးပွားဖြစ်အလုပ်များများအတွက် Wormhole boards ကိုအသုံးပြုသူများမဟုတ်ဘဲ developer များအတွက်ရည်ရွယ်ပါသည်။

“ကျွန်ုပ်တို့၏ထုတ်ကုန်များကို developer များလက်သို့ ပေးအပ်ရခြင်းသည် အမြဲပင် ကျေနပ်စရာကောင်းပါသည်။ ကျွန်ုပ်တို့၏ Wormhole™ ကတ်များကို အသုံးပြု၍ ဖွံ့ဖြိုးတိုးတက်မှုစနစ်များကို ဖြန့်ချိခြင်းသည် developer များအား အတိုင်းအတာနှင့် multi-chip AI ဆော့ဖ်ဝဲလ်ကို ဖန်တီးရာတွင် ကူညီပေးနိုင်သည်" ဟု Tenstorrent ၏ CEO Jim Keller က ပြောကြားခဲ့သည်။ဒီပစ်လွှတ်မှုအပြင်၊ ကျွန်ုပ်တို့ရဲ့ ဒုတိယမျိုးဆက်ထုတ်ကုန် Blackhole ရဲ့ တိပ်ခွေထုတ်ခြင်းနဲ့ ပါဝါတက်လာခြင်းနဲ့အတူ ကျွန်တော်တို့ လုပ်ဆောင်နေတဲ့ တိုးတက်မှုကို မြင်တွေ့ရတဲ့အတွက် စိတ်လှုပ်ရှားမိပါတယ်။”

၁

Wormhole ပရိုဆက်ဆာတစ်ခုစီတွင် 72 Tensix cores (ငါးခုသည် ဒေတာဖော်မတ်အမျိုးမျိုးအတွက် RISC-V cores များကို ပံ့ပိုးပေးသည့်) နှင့် 108 MB SRAM ၊ 1 GHz တွင် 262 FP8 TFLOPS သည် အပူဒီဇိုင်းစွမ်းအား 160W ဖြင့် ပေးဆောင်သည်။ single-chip Wormhole n150 ကတ်တွင် 12 GB GDDR6 ဗီဒီယိုမမ်မိုရီ တပ်ဆင်ထားပြီး bandwidth 288 GB/s ရှိသည်။

Wormhole ပရိုဆက်ဆာများသည် လုပ်ငန်းခွင်လိုအပ်ချက်များကိုဖြည့်ဆည်းရန် လိုက်လျောညီထွေရှိသော အရွယ်အစားကို ပေးစွမ်းသည်။ Wormhole n300 ကတ်လေးခုဖြင့် ပုံမှန်အလုပ်ရုံတည်ဆောက်မှုတွင်၊ ပရိုဆက်ဆာများကို တစ်စုတစ်စည်းတည်း၊ ကျယ်ပြန့်သော Tensix core ကွန်ရက်အဖြစ် ဆော့ဖ်ဝဲလ်တွင်ပေါ်လာသည့် ယူနစ်တစ်ခုတည်းသို့ ပေါင်းစပ်နိုင်သည်။ ဤဖွဲ့စည်းပုံသည် အရှိန်မြှင့်စက်အား တူညီသောအလုပ်တာဝန်ကို ကိုင်တွယ်ရန်၊ ဆော့ဖ်ဝဲအင်ဂျင်နီယာလေးဦးကြား ပိုင်းခြားရန် သို့မဟုတ် မတူညီသော AI မော်ဒယ်ရှစ်ခုအထိ တစ်ပြိုင်နက် လုပ်ဆောင်နိုင်စေမည်ဖြစ်သည်။ ဤချဲ့ထွင်နိုင်မှု၏ အဓိကအင်္ဂါရပ်မှာ virtualization မလိုအပ်ဘဲ စက်တွင်းတွင် လုပ်ဆောင်နိုင်ခြင်းဖြစ်သည်။ ဒေတာစင်တာပတ်ဝန်းကျင်တွင် Wormhole ပရိုဆက်ဆာများသည် စက်အတွင်းတွင် ချဲ့ထွင်ရန်အတွက် PCIe သို့မဟုတ် ပြင်ပချဲ့ထွင်ရန်အတွက် Ethernet ကို အသုံးပြုမည်ဖြစ်သည်။

စွမ်းဆောင်ရည်အရ Tenstorrent ၏ single-chip Wormhole n150 ကတ် (72 Tensix cores၊ 1 GHz ကြိမ်နှုန်း၊ 108 MB SRAM၊ 12 GB GDDR6၊ 288 GB/s bandwidth) သည် 160W တွင် 262 FP8 TFLOPS ရရှိခဲ့ပြီး Wormhole-chip နှစ်ခု (128 Tensix cores၊ 1 GHz ကြိမ်နှုန်း၊ 192 MB SRAM၊ စုစည်းထားသော 24 GB GDDR6၊ 576 GB/s bandwidth) သည် 300W တွင် 466 FP8 TFLOPS အထိ ထုတ်ပေးသည်။

466 FP8 TFLOPS ၏ 300W ၏ 300W ကို ဆက်စပ်၍ ထည့်သွင်းရန်၊ ၎င်းကို AI စျေးကွက်ခေါင်းဆောင် Nvidia က ဤအပူဒီဇိုင်းပါဝါဖြင့် ကမ်းလှမ်းသည့်အရာနှင့် နှိုင်းယှဉ်ပါမည်။ Nvidia ၏ A100 သည် FP8 ကို မထောက်ပံ့သော်လည်း ၎င်းသည် 624 TOPS (ကျဲသောအခါတွင် 1,248 TOPS) ဖြင့် INT8 ကို ပံ့ပိုးပေးသည်။ နှိုင်းယှဉ်ကြည့်လျှင် Nvidia ၏ H100 သည် FP8 ကို ပံ့ပိုးပေးကာ Tenstorrent ၏ Wormhole n300 နှင့် သိသိသာသာကွာခြားသည့် 300W တွင် 1,670 TFLOPS ၏ အထွတ်အထိပ်စွမ်းဆောင်ရည် (3,341 TFLOPS) ရှိသည်။

သို့သော် အဓိကပြဿနာတစ်ခုရှိသည်။ Tenstorrent ၏ Wormhole n150 သည် $999 ဖြင့် လက်လီရောင်းချနိုင်ပြီး n300 သည် $1,399 ဖြင့် ရောင်းချသည်။ နှိုင်းယှဉ်ကြည့်လျှင် Nvidia H100 ဂရပ်ဖစ်ကတ်တစ်ခုသည် အရေအတွက်ပေါ်မူတည်၍ $30,000 ဖြင့် လက်လီရောင်းချသည်။ ဟုတ်ပါတယ်၊ Wormhole ပရိုဆက်ဆာ လေးခု သို့မဟုတ် ရှစ်ခုသည် H300 တစ်ခုတည်း၏ စွမ်းဆောင်ရည်ကို အမှန်တကယ် ပေးနိုင်ခြင်းရှိမရှိ ကျွန်ုပ်တို့မသိရသော်လည်း ၎င်းတို့၏ TDP များသည် 600W နှင့် 1200W အသီးသီးဖြစ်သည်။

ကတ်များအပြင် Tenstorrent သည် ပိုမိုစျေးသက်သာသော Xeon-based TT-LoudBox တွင် တက်ကြွသောအအေးပေးသည့် 4 n300 ကတ်များအပါအဝင် developer များအတွက် ကြိုတင်တည်ဆောက်ထားသည့် workstations များကို ပေးစွမ်းပါသည်။) liquid cooling function)။


စာတိုက်အချိန်- ဇူလိုင်-၂၉-၂၀၂၄