জিম কেলারের নেতৃত্বাধীন চিপ কোম্পানি টেনস্টোরেন্ট এআই ওয়ার্কলোডের জন্য তাদের পরবর্তী প্রজন্মের ওয়ার্মহোল প্রসেসর উন্মোচন করেছে, যা সাশ্রয়ী মূল্যে ভালো পারফরম্যান্স দেবে বলে তারা আশা করছে।কোম্পানিটি বর্তমানে দুটি অতিরিক্ত PCIe কার্ড সরবরাহ করছে যেগুলোতে একটি বা দুটি ওয়ার্মহোল প্রসেসর ব্যবহার করা যায়, সেইসাথে সফটওয়্যার ডেভেলপারদের জন্য TT-LoudBox এবং TT-QuietBox ওয়ার্কস্টেশনও রয়েছে। আজকের সমস্ত ঘোষণা ডেভেলপারদের লক্ষ্য করে করা হয়েছে, বাণিজ্যিক কাজের জন্য ওয়ার্মহোল বোর্ড ব্যবহারকারীদের জন্য নয়।
“ডেভেলপারদের হাতে আমাদের আরও বেশি পণ্য পৌঁছে দিতে পারাটা সবসময়ই সন্তোষজনক। আমাদের Wormhole™ কার্ড ব্যবহার করে তৈরি রিলিজ ডেভেলপমেন্ট সিস্টেমগুলো ডেভেলপারদের মাল্টি-চিপ এআই সফটওয়্যারের পরিধি বাড়াতে ও তা উন্নত করতে সাহায্য করতে পারে,” বলেছেন টেনসটরেন্টের সিইও জিম কেলার।এই লঞ্চের পাশাপাশি, আমাদের দ্বিতীয় প্রজন্মের পণ্য ‘ব্ল্যাকহোল’-এর টেপ আউট এবং পাওয়ার-আপের অগ্রগতি দেখতেও আমরা উচ্ছ্বসিত।
প্রতিটি ওয়ার্মহোল প্রসেসরে ৭২টি টেনসিক্স কোর (যার মধ্যে পাঁচটি বিভিন্ন ডেটা ফরম্যাটে RISC-V কোর সমর্থন করে) এবং ১০৮ মেগাবাইট SRAM রয়েছে, যা ১৬০ ওয়াট থার্মাল ডিজাইন পাওয়ারে ১ গিগাহার্টজ গতিতে ২৬২ FP8 TFLOPS পারফরম্যান্স প্রদান করে। সিঙ্গেল-চিপ ওয়ার্মহোল n150 কার্ডটিতে ১২ জিবি GDDR6 ভিডিও মেমোরি রয়েছে এবং এর ব্যান্ডউইথ ২৮৮ জিবি/সেকেন্ড।
ওয়ার্মহোল প্রসেসরগুলো ওয়ার্কলোডের বিভিন্ন চাহিদা মেটাতে নমনীয় স্কেলেবিলিটি প্রদান করে। চারটি ওয়ার্মহোল n300 কার্ড সহ একটি স্ট্যান্ডার্ড ওয়ার্কস্টেশন সেটআপে, প্রসেসরগুলোকে একটি একক ইউনিটে একত্রিত করা যায়, যা সফটওয়্যারে একটি সমন্বিত, বিস্তৃত টেনসিক্স কোর নেটওয়ার্ক হিসাবে প্রদর্শিত হয়। এই কনফিগারেশনটি অ্যাক্সিলারেটরকে একই ওয়ার্কলোড চারজন ডেভেলপারের মধ্যে ভাগ করে পরিচালনা করতে অথবা একই সাথে আটটি পর্যন্ত ভিন্ন ভিন্ন এআই মডেল চালাতে সক্ষম করে। এই স্কেলেবিলিটির একটি প্রধান বৈশিষ্ট্য হলো এটি ভার্চুয়ালাইজেশনের প্রয়োজন ছাড়াই স্থানীয়ভাবে চলতে পারে। একটি ডেটা সেন্টার পরিবেশে, ওয়ার্মহোল প্রসেসরগুলো মেশিনের অভ্যন্তরে সম্প্রসারণের জন্য PCIe, অথবা বাহ্যিক সম্প্রসারণের জন্য ইথারনেট ব্যবহার করবে।
পারফরম্যান্সের দিক থেকে, টেনসটরেন্টের সিঙ্গেল-চিপ ওয়ার্মহোল এন১৫০ কার্ড (৭২টি টেনসিক্স কোর, ১ গিগাহার্টজ ফ্রিকোয়েন্সি, ১০৮ মেগাবাইট এসর্যাম, ১২ জিবি জিডিডিআর৬, ২৮৮ জিবি/সেকেন্ড ব্যান্ডউইথ) ১৬০ ওয়াটে ২৬২ এফপি৮ টিএফএলওপিএস অর্জন করেছে, অন্যদিকে ডুয়াল-চিপ ওয়ার্মহোল এন৩০০ বোর্ড (১২৮টি টেনসিক্স কোর, ১ গিগাহার্টজ ফ্রিকোয়েন্সি, ১৯২ মেগাবাইট এসর্যাম, মোট ২৪ জিবি জিডিডিআর৬, ৫৭৬ জিবি/সেকেন্ড ব্যান্ডউইথ) ৩০০ ওয়াটে ৪৬৬ এফপি৮ টিএফএলওপিএস পর্যন্ত পারফরম্যান্স প্রদান করে।
৩০০ ওয়াটের ৪৬৬ FP8 TFLOPS-কে একটি প্রেক্ষাপটে স্থাপন করার জন্য, আমরা এটিকে AI বাজারের শীর্ষস্থানীয় প্রতিষ্ঠান Nvidia এই একই থার্মাল ডিজাইন পাওয়ারে কী দিচ্ছে তার সাথে তুলনা করব। Nvidia-র A100 FP8 সমর্থন করে না, কিন্তু এটি INT8 সমর্থন করে, যার সর্বোচ্চ পারফরম্যান্স ৬২৪ TOPS (স্পার্স মোডে ১,২৪৮ TOPS)। তুলনামূলকভাবে, Nvidia-র H100 FP8 সমর্থন করে এবং ৩০০ ওয়াটে ১,৬৭০ TFLOPS (স্পার্স মোডে ৩,৩৪১ TFLOPS) সর্বোচ্চ পারফরম্যান্সে পৌঁছায়, যা Tenstorrent-এর Wormhole n300 থেকে উল্লেখযোগ্যভাবে ভিন্ন।
তবে, একটি বড় সমস্যা আছে। টেনস্টোরেন্টের ওয়ার্মহোল এন১৫০-এর খুচরা মূল্য ৯৯৯ ডলার, যেখানে এন৩০০ বিক্রি হয় ১,৩৯৯ ডলারে। তুলনামূলকভাবে, সংখ্যার ওপর নির্ভর করে একটি এনভিডিয়া এইচ১০০ গ্রাফিক্স কার্ডের খুচরা মূল্য ৩০,০০০ ডলার। অবশ্যই, আমরা জানি না যে চারটি বা আটটি ওয়ার্মহোল প্রসেসর আসলেই একটি এইচ৩০০-এর পারফরম্যান্স দিতে পারবে কি না, কিন্তু তাদের টিডিপি যথাক্রমে ৬০০ওয়াট এবং ১২০০ওয়াট।
কার্ডগুলোর পাশাপাশি, টেনসটরেন্ট ডেভেলপারদের জন্য আগে থেকে তৈরি ওয়ার্কস্টেশনও সরবরাহ করে, যার মধ্যে রয়েছে তুলনামূলকভাবে সাশ্রয়ী মূল্যের অ্যাক্টিভ কুলিং সুবিধাযুক্ত জিয়ন-ভিত্তিক টিটি-লাউডবক্স (TT-LoudBox)-এ ৪টি এন৩০০ (n300) কার্ড এবং এপিক-ভিত্তিক লিকুইড কুলিং ফাংশনযুক্ত উন্নত টিটি-কোয়ায়েটবক্স (TT-QuietBox)।
পোস্ট করার সময়: ২৯ জুলাই, ২০২৪
