شرکت AgiBot، فعال در حوزه رباتیک و هوش مصنوعی، از مدل پیشرفته جدیدی به نام Genie Operator-1 (GO-1) رونمایی کرده است. این مدل با هدف بهبود توانایی رباتهای انساننما در اجرای وظایف پیچیده دنیای واقعی توسعه یافته است. قابلیتهای کلیدی مدل GO-1 پردازش تصاویر و ویدیوها از طریق مدلهای بینایی-زبان (Vision-Language Models) برای افزایش درک و اجرای حرکات انسانی توسط رباتها برنامهریزی دقیق وظایف با استفاده از الگوریتمهای پیشرفته یادگیری ماشینی افزایش دقت و کارایی در انجام وظایف پیچیده مانند کنترل اشیاء و انجام حرکات هماهنگ مجموعه داده AgiBot World؛ پایه آموزشی GO-1 شرکت AgiBot در اواخر سال ۲۰۲۴، مجموعه دادهای گسترده به نام AgiBot World را منتشر کرد که شامل بیش از ۱ میلیون مسیر در ۲۱۷ وظیفه مختلف است. این دادهها بهعنوان پایه آموزشی برای مدل GO-1 استفاده شدهاند. چارچوب ViLLA؛ ترکیب بینایی، زبان و عمل AgiBot برای بهبود فرآیند یادگیری، چارچوب Vision-Language-Latent-Action (ViLLA) را معرفی کرده است. این چارچوب با ترکیب دادههای بینایی، زبان و عمل، توانایی رباتها را در درک و اجرای وظایف پیچیده بهبود میبخشد. مدل بینایی-زبان (VLM): پردازش دادههای چندرسانهای برای درک بهتر صحنه و زبان ترکیب کارشناسان (MoE): شامل برنامهریز نهفته (Latent Planner) و کارشناس عمل (Action Expert) که الگوهای عمومی حرکتی را تجزیهوتحلیل کرده و حرکات دقیق و روانی را ایجاد میکند دستاوردهای GO-1 در آزمایشها افزایش نرخ موفقیت وظایف رباتیک از ۴۶ درصد به ۷۸ درصد بهبود عملکرد برنامهریز نهفته با ۱۲ درصد افزایش دقت ارتقای تواناییهای رباتها در انجام وظایف عملیاتی مانند پر کردن نوشیدنی و کنترل اشیاء چشمانداز آینده مدل GO-1 AgiBot ادعا میکند که GO-1 میتواند با یادگیری مداوم از دادههای انسانی و رباتها، در طیف گستردهای از کاربردها مانند صنعت، خدمات و خانههای هوشمند استفاده شود. این مدل، گامی مهم در جهت توسعه رباتهای چندمنظوره با توانایی تطبیقپذیری بالا محسوب میشود.