شرکت xAI رسماً از افزودن قابلیت جدیدی به چتبات هوش مصنوعی خود خبر داد: Grok Vision. این قابلیت به Grok امکان میدهد تصاویر محیط اطراف را از طریق دوربین گوشی شناسایی و تحلیل کند.
شرکت xAI رسماً از افزودن قابلیت جدیدی به چتبات هوش مصنوعی خود خبر داد: Grok Vision. این قابلیت به Grok امکان میدهد تصاویر محیط اطراف را از طریق دوربین گوشی شناسایی و تحلیل کند. کاربران میتوانند با استفاده از دوربین گوشی خود، آن را به سمت اشیاء، تابلوها، اسناد یا هر محتوای دیداری دیگر بگیرند و سوالاتی درباره آن بپرسند. Grok پاسخ را با تحلیل بلادرنگ تصویر ارائه میدهد. این قابلیت فعلاً بهصورت انحصاری برای کاربران iOS عرضه شده و هنوز برای نسخه اندروید در دسترس نیست. GROK میبیند آنچه تو میبینی—دقیقاً! در توییتی از Mario Nawfal آمده: «حالت صوتی Grok با دسترسی به دوربین گوشی، به کاربر اجازه میدهد تا از آن بپرسد: “من دارم به چی نگاه میکنم؟”» قابلیت Grok Vision از لحاظ عملکرد مشابه امکانات دیداری در مدلهای پیشرفتهی Gemini گوگل و ChatGPT OpenAI است و رقابت در حوزهی هوش مصنوعی مولد با قدرت درک بصری را وارد مرحلهای تازه کرده است. دیگر ویژگیهای جدید Grok در کنار Grok Vision، xAI قابلیتهای زیر را نیز به این چتبات افزوده است: پشتیبانی صوتی چندزبانه (از جمله اسپانیایی، فرانسوی، ترکی، ژاپنی، هندی) جستوجوی بلادرنگ در حالت صوتی این ویژگیها در حال حاضر تنها در نسخه اندروید برای مشترکین پلن ۳۰ دلاری SuperGrok فعال هستند. xAI در ماههای اخیر روند توسعهی Grok را با سرعت بالا ادامه داده است. از جمله بهروزرسانیهای پیشین میتوان به: امکان استفاده از حافظه برای بازیابی اطلاعات مکالمات قبلی افزودن ابزاری شبیه بوم دیجیتال برای ایجاد اسناد و اپلیکیشنها اشاره کرد. Grok: نه فقط شنونده، بلکه بینندهای تحلیلگر افزودن قابلیت Grok Vision، چتبات Grok را از یک دستیار صرف گفتوگویی فراتر برده است؛ این هوش مصنوعی اکنون میتواند دنیای واقعی را "ببیند" و "درک کند". گامی بزرگ به سمت ادغام هوش مصنوعی با زندگی روزمره که میتواند نحوه تعامل انسان با فناوری را متحول کند.