آژانس اخبار سایبری ایران

سه‌شنبه ۱۴۰۴/۵/۲۸ ساعت 03:45:33 info@icyna.ir

مایکروسافت، مدل هوش مصنوعی سبک و کارآمد BitNet را معرفی کرد

۱۴۰۴/۰۱/۲۸
16:32:51

پژوهشگران مایکروسافت به معرفی BitNet b1.58 2B4T—یکی از بزرگ‌ترین مدل‌های هوش مصنوعی یک‌بیتی—پرداخته‌اند. این مدل که تحت مجوز MIT به‌طور آزاد منتشر شده است، به گونه‌ای طراحی شده تا روی پردازنده‌های مرکزی (CPU) اجرا شود؛ از جمله پردازنده‌های نسل جدید مانند M2 اپل. ویژگی‌های کلیدی BitNet ساختار فشرده‌شده: در مدل‌های استاندارد هوش مصنوعی، وزن‌های شبکه معمولاً نیاز به فضای محاسباتی بالا دارند. BitNet با استفاده از روش‌های کمی‌سازی پیشرفته، وزن‌های خود را به سه مقدار (-1، 0 و 1) کاهش می‌دهد. این امر به اجرای سریع‌تر و بهره‌وری بهتر روی سخت‌افزارهای سبک مانند CPU منجر می‌شود. ابعاد مدل و آموزش: BitNet b1.58 2B4T با داشتن ۲ میلیارد پارامتر، توانسته است در میان مدل‌های یک‌بیتی مشابه، عملکرد قابل توجهی ارائه دهد. این مدل روی مجموعه‌ای حاوی ۴ تریلیون توکن (معادل تقریبی ۳۳ میلیون کتاب) آموزش دیده و در آزمون‌های ریاضی (مانند GSM8K) و تست‌های استدلال فیزیکی و عمومی (مانند PIQA) عملکرد قابل رقابتی از خود نشان داده است. سرعت اجرا: بر اساس آزمایش‌های انجام‌شده، این مدل نسبت به همتایانش مانند Llama 3.2 1B، Gemma 31B و Qwen 2.5 1.5B، تا دو برابر سریع‌تر عمل می‌کند. لازم به ذکر است که جهت بهره‌مندی از این سرعت بالا، پیاده‌سازی مدل با چهارچوب bitnet.cpp مایکروسافت انجام می‌شود؛ که تنها با سخت‌افزارهای مشخصی سازگار است. در این میان، پردازنده‌های گرافیکی (GPU) در فهرست پشتیبانی‌شده قرار ندارند. چشم‌انداز و اهمیت این نوآوری مایکروسافت با معرفی BitNet گامی مهم در جهت طراحی مدل‌های هوش مصنوعی سبک و بهینه برداشته است. اجرای این مدل بر روی CPU نه تنها باعث کاهش نیاز به سخت‌افزارهای پیشرفته‌تر می‌شود، بلکه امکان استفاده از فناوری هوش مصنوعی در دستگاه‌های مصرفی با منابع محدود را فراهم می‌آورد.