پژوهشگران مایکروسافت به معرفی BitNet b1.58 2B4T—یکی از بزرگترین مدلهای هوش مصنوعی یکبیتی—پرداختهاند. این مدل که تحت مجوز MIT بهطور آزاد منتشر شده است، به گونهای طراحی شده تا روی پردازندههای مرکزی (CPU) اجرا شود؛ از جمله پردازندههای نسل جدید مانند M2 اپل. ویژگیهای کلیدی BitNet ساختار فشردهشده: در مدلهای استاندارد هوش مصنوعی، وزنهای شبکه معمولاً نیاز به فضای محاسباتی بالا دارند. BitNet با استفاده از روشهای کمیسازی پیشرفته، وزنهای خود را به سه مقدار (-1، 0 و 1) کاهش میدهد. این امر به اجرای سریعتر و بهرهوری بهتر روی سختافزارهای سبک مانند CPU منجر میشود. ابعاد مدل و آموزش: BitNet b1.58 2B4T با داشتن ۲ میلیارد پارامتر، توانسته است در میان مدلهای یکبیتی مشابه، عملکرد قابل توجهی ارائه دهد. این مدل روی مجموعهای حاوی ۴ تریلیون توکن (معادل تقریبی ۳۳ میلیون کتاب) آموزش دیده و در آزمونهای ریاضی (مانند GSM8K) و تستهای استدلال فیزیکی و عمومی (مانند PIQA) عملکرد قابل رقابتی از خود نشان داده است. سرعت اجرا: بر اساس آزمایشهای انجامشده، این مدل نسبت به همتایانش مانند Llama 3.2 1B، Gemma 31B و Qwen 2.5 1.5B، تا دو برابر سریعتر عمل میکند. لازم به ذکر است که جهت بهرهمندی از این سرعت بالا، پیادهسازی مدل با چهارچوب bitnet.cpp مایکروسافت انجام میشود؛ که تنها با سختافزارهای مشخصی سازگار است. در این میان، پردازندههای گرافیکی (GPU) در فهرست پشتیبانیشده قرار ندارند. چشمانداز و اهمیت این نوآوری مایکروسافت با معرفی BitNet گامی مهم در جهت طراحی مدلهای هوش مصنوعی سبک و بهینه برداشته است. اجرای این مدل بر روی CPU نه تنها باعث کاهش نیاز به سختافزارهای پیشرفتهتر میشود، بلکه امکان استفاده از فناوری هوش مصنوعی در دستگاههای مصرفی با منابع محدود را فراهم میآورد.