گوگل از ادغام دستیار هوش مصنوعی جمینای با مرورگر محبوب خود، کروم، خبر داد تا کاربران بتوانند بهراحتی با کلیک روی آیکون مخصوص، پنجرهای شناور از این دستیار هوشمند را باز کنند و از امکانات آن بهرهمند شوند.
در رویداد Google I/O 2025، جاش وودوارد، معاون پروژه جمینای در گوگل لبز، توضیح داد که نسخه اولیه این دستیار قادر است اطلاعات پیچیده صفحات وب را برای کاربران توضیح داده یا خلاصه کند. همچنین گوگل برنامه دارد این دستیار را به گونهای توسعه دهد که بتواند بین چندین تب مرورگر حرکت کرده و حتی بهصورت خودکار در وبسایتها ناوبری کند.
در نمایش پیش از رونمایی رسمی، شارمین دیسیلوا، مدیر محصول تیم کروم، نسخه اولیه جمینای را به نمایش گذاشت. کاربران با کلیک روی آیکون براق در گوشه بالا سمت راست مرورگر، پنجرهای شناور و قابل تغییر اندازه از این چتبات هوشمند را باز میکنند و میتوانند درباره محتوای صفحه سوال بپرسند. در حال حاضر، این قابلیت فقط بین دو تب فعال است، اما گوگل وعده داده تا پایان سال قابلیت پشتیبانی از چند تب بهبود یابد.
ویژگیها و محدودیتها
گوگل همچنین قابلیت جدیدی به نام Gemini Live را معرفی کرد که در آینده به مرورگر اضافه خواهد شد. این ویژگی میتواند در انجام سریع کارها مانند مقایسه محصولات یا تبدیل واحدهای مختلف مفید باشد. با این حال، برخی کارشناسان درباره دقت پاسخهای تولیدشده توسط هوش مصنوعی هشدار دادهاند و نگران بروز پدیده «توهم هوش مصنوعی» (AI hallucination) هستند که در آن اطلاعات نادرست یا غیرواقعی ارائه میشود.
شرایط دسترسی
ابزار جمینای در کروم از ۲۳ می ۲۰۲۵ (۲ خرداد ۱۴۰۴) بهصورت دسترسی زودهنگام برای کاربران ویندوز و مکاواس منتشر خواهد شد. برای استفاده از این قابلیت، کاربران باید حداقل ۱۸ سال سن داشته و زبان رابط مرورگرشان انگلیسی باشد. همچنین، استفاده از نسخههای Beta، Canary یا Dev مرورگر کروم و داشتن اشتراک AI Pro یا Ultra گوگل الزامی است.
آینده ادغام در موبایل
در پاسخ به پرسشی درباره نسخه موبایل مرورگر کروم، پریسا تبریز، معاون و مدیرکل کروم گوگل، اعلام کرد که تمرکز فعلی روی نسخه دسکتاپ است، اما امکان توسعه و عرضه این قابلیت برای موبایل نیز در آینده بررسی خواهد شد.
ادغام جمینای با کروم گامی بزرگ در مسیر تبدیل مرورگرها به دستیارهای هوشمند و تعاملی است. با وجود اینکه این فناوری در مراحل ابتدایی خود قرار دارد، پتانسیل تغییر اساسی در تجربه وبگردی کاربران را دارد.
در مراسم I/O 2025، ساندار پیچای، مدیرعامل گوگل، از افزوده شدن قابلیت ترجمه زنده گفتار به سرویس گوگل میت خبر داد. این قابلیت جدید به کاربران امکان میدهد گفتار خود را بهصورت همزمان به زبانهای دیگر ترجمه کنند و تجربهای طبیعیتر و روانتر در جلسات آنلاین داشته باشند.
پشتیبانی فعلی و برنامه توسعه
هماکنون قابلیت ترجمه زنده در گوگل میت از دو زبان انگلیسی و اسپانیایی پشتیبانی میکند. کاربران میتوانند بهصورت زنده بین این دو زبان ترجمه انجام دهند و گوگل اعلام کرده است که در هفتههای آینده زبانهای بیشتری نیز به این قابلیت اضافه خواهند شد.
در ابتدا، این ویژگی برای مشترکان عرضه میشود و کاربران سازمانی نیز تا پایان سال جاری به آن دسترسی خواهند داشت.
کیفیت و کاربردهای ترجمه زنده
گوگل تأکید کرده است که فناوری هوش مصنوعی مورد استفاده به سطحی رسیده که امکان برقراری مکالمهای طبیعی و روان را فراهم میکند. در نسخه نمایشی که در مراسم نشان داده شد، ترجمه زنده گوگل میت توانست لحن، سرعت و حتی حالتهای خاص گفتار کاربران را بهخوبی بازتولید کند.
این قابلیت بهخصوص برای جلسات کاری بینالمللی بسیار کاربردی است و به کاربران اجازه میدهد با مشتریان و همکاران خارجی خود، بدون دغدغه زبان، ارتباط مؤثری برقرار کنند.
مزیت نسبت به زیرنویس زنده
پیش از این، کاربران گوگل میت برای ترجمه گفتار باید از زیرنویس زنده استفاده میکردند که تمرکز بر مکالمه را دشوار میکرد. اما با افزودن ترجمه صوتی همزمان، تجربه مکالمه طبیعیتر و کارآمدتر خواهد شد.
از زمان معرفی اولین نسخه ChatGPT در سال ۲۰۲۲، شرکت OpenAI بهطور منظم مدلهای جدیدی با ویژگیها و نامگذاریهای متنوع ارائه داده است. این مدلها کاربردهای گستردهای از جمله برنامهنویسی، تحلیل، استدلال، نوشتن محتوا و طراحی را پوشش میدهند. در این گزارش با مهمترین مدلهای OpenAI و کاربردهای هر یک آشنا میشویم.
GPT-4 و GPT-4o: پرچمداران قدرتمند
مدل GPT-4 در سال ۲۰۲۳ بهعنوان یک مدل زبانی پیشرفته معرفی شد. به گفته سم آلتمن، مدیرعامل OpenAI، توسعه این مدل تلاش اصلی تیم در آن زمان بوده است.
نسخه بهروزشده آن با نام GPT-4o (حرف «o» مخفف omni بهمعنای همهکاره) ارائه شد. این مدل از همان هوش و دقت GPT-4 برخوردار است، اما سریعتر، چندوجهیتر و در حوزههای متن، صوت و تصویر بسیار قدرتمندتر است. از ترجمه گفتار تا تولید تصاویر خلاقانه (مانند سبک Studio Ghibli)، GPT-4o در بسیاری از وظایف روزمره مانند خلاصهسازی، طوفان فکری، نوشتن ایمیل و اصلاح متن عملکردی درخشان دارد.
GPT-4.5: گفتوگو با یک ذهن متفکر
مدلی میان GPT-4 و GPT-4o، با نام GPT-4.5، معرفی شد که به گفته آلتمن، تجربه گفتوگو با آن شبیه صحبت با یک انسان متفکر است.
آملیا گلیز، از مهندسان OpenAI، این مدل را نتیجه پیشرفتهای یادگیری بدون نظارت دانست که بر درک کلامی، شهود انسانی و کاهش خطاها متمرکز است. GPT-4.5 گزینهای عالی برای تعاملهای حرفهای، نوشتن متنهای حساس، و پروژههای خلاقانه است.
مدلهای استدلالی o1 و o1-mini: تفکر پیش از پاسخ
مدل o1 و نسخه سبکتر آن o1-mini بهعنوان اولین مدلهایی طراحی شدهاند که پیش از پاسخ دادن، فرآیند فکری مرحلهبهمرحله (Chain-of-Thought) را طی میکنند. این ویژگی باعث میشود مدل در تحلیلهای عددی و استدلالی عملکردی دقیقتر داشته باشد.
به گفته OpenAI، حالت حرفهای o1 میتواند خلاصههای چندصفحهای، الگوریتمهای مالی، یا تحلیل استراتژیک پیچیده ارائه دهد. این مدل برای کاربرانی که با مسائل کمّی، کدنویسی یا طرحهای توسعهای سر و کار دارند، انتخابی هوشمندانه است.
o3 و o3-mini: مقرونبهصرفه، سریع و مناسب برای توسعه
مدلهای o3 و o3-mini بهعنوان جایگزینهایی سبکتر و اقتصادی برای مدلهای بزرگتر طراحی شدهاند. این مدلها برای کدنویسی، ریاضیات، علوم و تحلیل دادهها بهینه شدهاند و میتوانند وظایفی مانند طراحی وب، نمونهسازی اولیه و حل مسائل علمی را انجام دهند.
بهویژه o3-mini برای توسعه سریع، جاوا اسکریپت پایه، HTML/CSS و منطق برنامهنویسی گزینه مناسبی است. مدل کامل o3 که در آوریل معرفی شد، بهعنوان قدرتمندترین مدل استدلالی OpenAI شناخته میشود.
o4-mini: سریعترین مدل برای استدلال روزمره
جدیدترین مدل سبک OpenAI با نام o4-mini در آوریل ۲۰۲۵ عرضه شد. این مدل با تمرکز بر استدلال سریع و مقرونبهصرفه طراحی شده و عملکرد بسیار خوبی در ریاضی، کدنویسی و وظایف بصری از خود نشان داده است.
به گفته OpenAI، o4-mini در حل پرسشهای روزمره در حوزههای علم، فناوری، مهندسی و ریاضیات (STEM) بسیار مؤثر است. این مدل حتی در آزمون مشهور AIME آمریکا بهترین عملکرد را در بین مدلها داشته است.
در یک آزمایش، این مدل توانست یکی از مسائل سخت Euler را در کمتر از ۳ دقیقه حل کند، رکوردی که تنها تعداد اندکی از انسانها توانستهاند به آن نزدیک شوند.
جمعبندی: کدام مدل برای چه کاری مناسب است؟
مدل کاربردهای پیشنهادی
GPT-4 / GPT-4o کارهای چندرسانهای، خلاصهسازی، ترجمه گفتار، تولید محتوا
GPT-4.5 مکالمات حرفهای، پروژههای خلاقانه، بهبود نوشتار رسمی
o1 / o1-mini تحلیل داده، مسائل کمّی، استدلال پیچیده
o3 / o3-mini برنامهنویسی سبک، توسعه اولیه، حل مسائل علمی
o4-mini پرسوجوهای سریع، تحلیل بصری، ریاضی و مهندسی روزمره
با توجه به تنوع مدلها، کاربران میتوانند بر اساس نیاز خود از مناسبترین گزینه بهره بگیرند؛ چه در جستوجوی راهحلی سریع باشید و چه به دنبال ابزار قدرتمندی برای پروژههای تحلیلی، OpenAI گزینهای برای شما دارد.
گسترش قابلیتهای هوش مصنوعی در جستوجوی گوگل، بهویژه ویژگی پاسخهای مبتنی بر هوش مصنوعی (AI Overview)، رفتار کاربران را بهصورت بنیادین تغییر داده و زنگ خطری جدی برای وبسایتها و ناشران به صدا درآورده است.
مطالعهای تازه نشان میدهد زمانی که پاسخهای AIO در صفحه نتایج جستوجو ظاهر میشوند، میزان کلیک کاربران روی لینکها بهشدت کاهش مییابد. در نسخه دسکتاپ، ترافیک ارجاعشده به سایتهای خارجی تا دو سوم کاهش یافته و در موبایل نیز این کاهش به حدود ۵۰ درصد میرسد.
کاربران اغلب پاسخهای ارائهشده توسط AIO را کافی میدانند؛ تنها ۷.۴ درصد از کاربران دسکتاپ و ۱۹ درصد از کاربران موبایل روی لینکهای داخل AIO کلیک میکنند. حتی وقتی گزینه «نمایش بیشتر» فعال میشود، تنها ۱۴ درصد از کاربران تا انتهای پاسخ را مطالعه میکنند.
با این حال، موضوع جستوجو نقش مهمی در رفتار کاربران دارد. در حوزههایی مانند سلامت و امور مالی، تعامل کاربران بیشتر است و معمولاً اسکرول بیشتری انجام میدهند (میانگین بالای ۵۰ درصد). اما در جستوجوهای سادهتر مانند دریافت کد تخفیف، کاربران کمتر با AIO تعامل میکنند.
همچنین مشخص شده که نسل جوانتر و افراد با سواد دیجیتال بالاتر، اعتماد بیشتری به پاسخهای هوش مصنوعی دارند. در بازه سنی ۲۵ تا ۳۴ سال، حدود نیمی از کاربران پاسخ AIO را بدون بررسی منابع دیگر قبول میکنند. کاربران موبایل هم در مقایسه با دسکتاپ، اسکرول بیشتری دارند (۵۴٪ در مقابل ۲۹٪). در مقابل، کاربران مسنتر هنوز به لینکهای سنتی وفادار هستند.
در جستوجوهای تجاری مانند بررسی یا خرید محصول، نقش AIO کمتر است؛ کاربران معمولاً ترجیح میدهند به منابعی مانند آمازون با اطلاعات تصویری و نظرات کاربران مراجعه کنند.
این تغییرات، قواعد بازی در بازاریابی و سئو را نیز دگرگون کرده است. حالا دیده شدن برند در پاسخهای AIO اهمیت بیشتری از تعداد کلیک دارد. معیارهایی مانند سهم از صدا (Share of Voice) و رتبه ارجاع (Referral Rank) به فاکتورهای کلیدی موفقیت تبدیل شدهاند. سایتهایی که پیش از این به ترافیک مستقیم و ارگانیک متکی بودند، حالا برای دیده شدن باید به فکر هزینهکرد تبلیغاتی باشند.
این مطالعه توسط کوین ایندیگ و اریک فن بوسکرک انجام شده و بر اساس تحلیل رفتار کاربران در ۵۰۰ ویدئوی جستوجو تدوین شده است. نتایج آن نشان میدهد که با ظهور AI Overview، اینترنت وارد عصری تازه شده که در آن گوگل بیش از هر زمان دیگری در مرکز تعاملات دیجیتال قرار گرفته است.
مایکروسافت در جدیدترین نسخههای آزمایشی ویندوز 11 برای کانالهای Dev و Beta، مجموعهای از قابلیتهای نوآورانه، بهویژه در حوزه هوش مصنوعی را معرفی کرده است. این قابلیتها تجربهای هوشمندتر، سریعتر و شخصیسازیشدهتر را برای کاربران فراهم میکنند.
یکی از مهمترین ویژگیهای جدید، اضافه شدن گزینههای هوش مصنوعی به فایل اکسپلورر با عنوان «AI Actions» است. کاربران میتوانند با کلیک راست روی تصاویر (فرمتهای JPG، JPEG و PNG)، اقداماتی مانند جستجوی تصویری با بینگ، محو یا حذف پسزمینه و حذف اشیاء را انجام دهند. قرار است این قابلیتها در آینده به اسناد Microsoft 365 نیز گسترش یابند تا امکان خلاصهسازی، پرسشوپاسخ و تحلیل محتوا را نیز شامل شوند.
در بخش تنظیمات سیستم، صفحهی جدیدی با عنوان Advanced جایگزین بخش «For Developers» شده که امکانات بیشتری از جمله حذف محدودیت مسیر پوشهها، فعالسازی محیطهای مجازی و یکپارچگی بهتر با GitHub را ارائه میدهد.
ویجتهای ویندوز نیز با طراحی جدید و قابلیت شخصیسازی بیشتر بهروزرسانی شدهاند و حالا فیدهای سازمانیافتهتر و محتوای منتخب از Copilot نمایش داده میشود، هرچند برخی ویژگیها هنوز فعال نشدهاند.
همچنین، قابلیت جدیدی در مدیریت انرژی با عنوان User Interaction-Aware CPU Power Management معرفی شده که با شناسایی زمانهای بیکاری، مصرف انرژی را کاهش داده و عمر باتری را افزایش میدهد.
در نهایت، رابط اشتراکگذاری (Share UI) با امکان تنظیم سطح فشردهسازی تصاویر هنگام ارسال بهبود یافته و برخی مشکلات جزئی در منوی استارت، فایل اکسپلورر، بلوتوث و صفحه قفل نیز رفع شدهاند.
با وجود برخی باگها، این بیلدها مسیر آیندهای هوشمندتر برای ویندوز 11 را نشان میدهند.
مایکروسافت اعلام کرد که مدلهای هوش مصنوعی شرکت xAI متعلق به ایلان ماسک را در پلتفرم ابری آژور میزبانی میکند. با این اقدام، تعداد مدلهای هوش مصنوعی قابلدسترس در آژور از ۱۹۰۰ مورد فراتر رفته است.
علاوه بر xAI، مدلهای استارتآپ فرانسوی میسترال و استارتآپ آلمانی بلک فارست لبز نیز در دیتاسنترهای مایکروسافت میزبانی خواهند شد. همچنین، مایکروسافت ابزار هوش مصنوعی جدیدی را برای تسهیل فرآیند کدنویسی معرفی کرده است.
این اظهارات در جریان کنفرانس سالانه توسعهدهندگان «بیلد» در سیاتل مطرح شد و نشاندهنده تغییر رویکرد مایکروسافت در حوزه هوش مصنوعی است؛ بهطوریکه این شرکت اکنون بیشتر بهعنوان یک بازیگر بیطرف در این حوزه ظاهر میشود و دیگر تمرکز انحصاری بر همکاری با OpenAI ندارد.
ابزار جدید کدنویسی مایکروسافت با نام GitHub Copilot اکنون بهعنوان یک «عامل کدنویسی» مستقل عمل میکند. نسخههای پیشین تنها قادر به تکمیل بخشهایی از کد براساس فعالیتهای کاربر بودند، اما نسخه جدید توانایی دریافت چند دستور پیچیده مانند توصیف یک باگ و ارائه استراتژی رفع آن را دارد. همچنین این ابزار پس از پایان کار، به کاربر درباره بررسی مجدد کد هشدار میدهد.
این اقدام در حالی انجام میشود که OpenAI نیز اخیراً پیشنمایشی از عامل هوش مصنوعی خود با نام Codex ارائه داده است. همچنین این شرکت در کنفرانس «بیلد» از چشمانداز پلتفرمی با نام Azure AI Foundry پرده برداشت که به کسبوکارها اجازه میدهد عاملهای هوش مصنوعی اختصاصی خود را با استفاده از مدلهای مختلف بسازند.
در مجموع، با اضافه شدن مدلهای گروک ۳ و گروک مینی ۳ از شرکت xAI، و همچنین مدلهای شرکتهای میسترال و بلک فارست لبز، مایکروسافت تنوع مدلهای هوش مصنوعی ارائهشده در آژور را گسترش داده و گامی دیگر در جهت تسهیل دسترسی کسبوکارها به ابزارهای هوش مصنوعی برداشته است.
تا همین چندی پیش، داشتن یک دستیار هوش مصنوعی شبیه «سامانتا» (از فیلم Her) که بهطور طبیعی و انسانگونه صحبت کند، احساساتمان را درک کند و در کارهای روزمره یاریمان دهد، فقط یک رویا بود؛ اما حالا این رویا به واقعیت نزدیک شده و حتی از آن فراتر رفته است: هوش مصنوعی در آیندهای نزدیک میتواند به جای ما خرید اینترنتی انجام دهد.
OpenAI بهتازگی اعلام کرده که قابلیت خرید آنلاین از طریق چتجیپیتی را بهزودی فعال خواهد کرد. این ویژگی به کاربران امکان میدهد بهصورت شخصیسازیشده و مکالمهمحور، محصول مورد نظر خود را پیدا کنند.
قابلیت خرید برای همه کاربران در دسترس خواهد بود
این ویژگی در بهروزرسانیهای آینده برای همه کاربران چتجیپیتی فعال میشود؛ فرقی نمیکند از نسخه رایگان استفاده کنند یا اشتراک پلاس و پرو داشته باشند. حتی کاربران بدون حساب نیز (در کشورهای تحت پوشش) قادر به استفاده خواهند بود.
در این قابلیت، وقتی کاربران به دنبال محصولاتی مثل پوشاک، لوازم آرایشی یا وسایل الکترونیکی میگردند، چتجیپیتی فهرستی از پیشنهادها را همراه با جزئیات محصول، بررسی کاربران، مقایسه قیمتها و لینک مستقیم خرید از فروشگاهها نمایش میدهد. البته پرداخت نهایی درون پلتفرم انجام نمیشود؛ کاربران برای تکمیل خرید به وبسایت فروشنده هدایت خواهند شد.
برخلاف موتورهای جستوجوی سنتی مانند گوگل، نتایج ارائهشده در چتجیپیتی تبلیغاتی نیستند و کاملاً بر پایهی تحلیل محتوای اینترنتی و ترجیحات کاربر نمایش داده میشوند.
تفاوت تجربه خرید ChatGPT با گوگل
آدام فرای، مدیر بخش جستوجوی چتجیپیتی، در نمایشی از این ویژگی نشان داد که چگونه کاربران میتوانند با کمک چتجیپیتی مثلاً بهترین دستگاه اسپرسوساز زیر ۲۰۰ دلار را بر اساس ترجیحات خود بیابند. چتجیپیتی نظرات کاربران درباره مزایا و معایب محصول، تجربه استفاده و گفتگوهای پیشین را تحلیل کرده و نتایجی کاملاً شخصیسازیشده ارائه میدهد.
همچنین اگر کاربر تمایل داشته باشد، میتواند تنظیمات حافظه چتجیپیتی را برای ذخیره یا حذف ترجیحات شخصی و گفتگوهای گذشته، مدیریت کند. البته این قابلیت فعلاً در برخی کشورهای اروپایی بهدلیل قوانین حریم خصوصی غیرفعال خواهد بود.
تأثیر بر بازار فروش آنلاین
این تحول، میتواند شیوهی سنتی خرید اینترنتی را دگرگون کند. کاربران دیگر نیازی به باز کردن چندین تب برای مقایسه قیمت، خواندن نقدها یا مشاهده فروشگاههای مختلف ندارند؛ همهچیز از طریق یک گفتوگوی ساده در چتجیپیتی انجام میشود.
گوگل پیشتر اعتراف کرده بود که چتجیپیتی بخشی از ترافیک جستوجوهای مرتبط با تکالیف یا سوالات ریاضی را از آن خود کرده، ولی تأثیر چشمگیری بر جستوجوهای تجاری نداشته است. اما قابلیت خرید در چتجیپیتی این وضعیت را ممکن است تغییر دهد و گوگل را وارد رقابت جدیتری با OpenAI کند.
مدل درآمدی آینده چگونه خواهد بود؟
در حال حاضر، چتجیپیتی از محتوای عمومی و منابع ثالث برای نمایش محصولات استفاده میکند، اما OpenAI برنامههایی برای برقراری ارتباط مستقیم با خردهفروشان دارد. فروشگاهها میتوانند فهرست محصولات خود را بهصورت مستقیم در اختیار این پلتفرم قرار دهند تا تجربه کاربری بهروزتر و دقیقتری ارائه شود.
با توجه به نقش روزافزون محتواهای نقد و بررسی در تصمیمگیری کاربران، مسئلهای که مطرح میشود این است که مدل درآمدی ناشران اینترنتی چگونه خواهد بود. چرا که اگر کاربر خرید را مستقیماً از پیشنهادات چتجیپیتی انجام دهد، ممکن است درآمد ناشی از همکاری در فروش (affiliate) برای سایتهای نقد و بررسی کاهش یابد.
آدام فرای در پاسخ به این نگرانی میگوید: «ما مدلهای مختلف درآمدزایی از جمله همکاری در فروش را در آینده آزمایش خواهیم کرد؛ اما در حال حاضر تمرکز ما بر ارائهی بهترین تجربه کاربری است.»
آینده خرید اینترنتی از نگاه OpenAI
OpenAI با هدف رسیدن به درآمد ۱۲۵ میلیارد دلاری تا سال ۲۰۲۹، مسیرهای متنوعی برای درآمدزایی را بررسی میکند. یکی از این مسیرها میتواند ادغام خرید با مدل همکاری در فروش باشد. در حال حاضر، این شرکت در حال جمعآوری بازخورد، بهبود تجربه خرید و آمادهسازی زیرساخت ارتباط با فروشگاهها است.
همزمان، دیگر رقبا نیز بیکار ننشستهاند. برای مثال، پرپلکسیتی قابلیت «Buy with Pro» را ارائه کرده که امکان خرید مستقیم از داخل اپلیکیشن را فراهم میکند. گوگل نیز در حال توسعه بخش «تحقیقشده با هوش مصنوعی» در Google Shopping است.
با این تحول، فروشگاهها و ناشران باید خود را با شیوهی جدید پیشنهاد و تصمیمگیری کاربران تطبیق دهند؛ چرا که ساختار سنتی ترافیک وب و فروش آنلاین ممکن است بهزودی زیر و رو شود.
در پایان دومین اجلاس وزرای آموزش عالی کشورهای اسلامی، قرار است اولین سند هوش مصنوعی جهان اسلام به تصویب برسد؛ سندی که با هدف تبیین رویکردی اخلاقمحور و هماهنگ میان کشورهای مسلمان در حوزه استفاده از هوش مصنوعی تدوین شده است.
نشست خبری در چارچوب سکوی گفتوگوی OIC-15
این اجلاس روز یکشنبه ۲۸ اردیبهشت در هتل اسپیناس پالاس تهران برگزار شد. در نشست خبری این رویداد، حسین سیماییصراف، معاون حقوقی وزارت علوم، با اشاره به دغدغههای اخلاقی موجود در حوزه هوش مصنوعی اظهار داشت:
«یکی از نگرانیهای جدی در سطح جهان اسلام، استفاده رژیم صهیونیستی از هوش مصنوعی در جنگ علیه مردم مظلوم فلسطین است؛ اقدامی که نهتنها ناقض اصول بینالمللی و موازین بشردوستانه، بلکه مغایر با هنجارهای عرفی و اخلاقی جهانی است.»
او ادامه داد: «تشدید نقض هنجارها با بهرهگیری از ظرفیتهای فناورانه، زنگ خطری برای بشریت محسوب میشود. اگر استفاده از این فناوری در چارچوب اخلاقی مدیریت نشود، میتواند تهدیدی بزرگ برای آینده جهان باشد.»
نقش جهان اسلام در اخلاق هوش مصنوعی
سیماییصراف تأکید کرد که تعهد به اخلاق در توسعه و بهرهبرداری از هوش مصنوعی باید یکی از اصول بنیادین کشورهای اسلامی باشد. او افزود:
«خوشبختانه مباحث اخلاقی اکنون به دغدغهای جهانی تبدیل شدهاند. به همین دلیل یونسکو نیز در حال تدوین سند جهانی استفاده اخلاقی از هوش مصنوعی است که جمهوری اسلامی ایران نیز در نگارش این سند نقش دارد.»
در پایان، او ابراز امیدواری کرد که سند تدوینشده جهان اسلام در حوزه هوش مصنوعی با همکاری اعضای سازمان همکاری اسلامی (OIC) در پایان اجلاس امضا و تصویب شود.
سیستمهای هوش مصنوعی میتوانند بدون دخالت انسان، تصمیمات جمعی اتخاذ کرده و حتی یکدیگر را برای تغییر نظر قانع کنند.
نگرانیهایی درباره تأثیر احتمالی این سیستمها در صورت سوءاستفاده و بهکارگیری در شرایط نامناسب ایجاد کرده است.
این مطالعه برای نخستینبار رفتار گروهی عاملهای هوش مصنوعی را مورد بررسی قرار داده است. در مرحله اول آزمایش، جفتهایی از این سیستمها بدون دخالت انسانی بر سر انتخاب نامی جدید به توافق رسیدند. در مرحله دوم، این جفتها به گروههای بزرگتری اضافه شدند و مشخص شد که بهتدریج نسبت به برخی نامها تعصب پیدا کرده و در ۸۰ درصد موارد، یک نام خاص را بر سایر گزینهها ترجیح میدهند.
این یافتهها میتواند زمینهساز پژوهشهای عمیقتری درباره نحوه تعامل سیستمهای هوش مصنوعی با یکدیگر و تأثیر احتمالی آنها بر تصمیمگیریهای جمعی در آینده باشد.
یکی از معروفترین و محبوبترین ابزارهای گفتوگومحور هوش مصنوعی است که توسط شرکت OpenAI توسعه یافته است. این ابزار با بهرهگیری از مدلهای زبانی قدرتمند (مانند GPT-4)، توانایی درک، پردازش و تولید زبان طبیعی را دارد و میتواند در حوزههای مختلفی مانند پاسخگویی به سؤالات، تولید محتوای متنی، نوشتن مقاله، انجام تمرینهای آموزشی، کدنویسی، ترجمه و حتی یادگیری زبان فارسی مورد استفاده قرار گیرد.
یکی از مزایای بزرگ ChatGPT، پشتیبانی گسترده از زبان فارسی و توانایی تولید پاسخهای طبیعی و دقیق در موضوعات مختلف است. کاربران میتوانند از آن برای یادگیری زبان، رفع اشکال در تکالیف درسی، خلق داستان، نوشتن ایمیل یا حتی مکالمات روزمره بهره ببرند. این ابزار هم در نسخه رایگان و هم در نسخه پیشرفته (پلاس یا GPT-4) ارائه میشود و در بسیاری از سیستمعاملها و پلتفرمها (وب، اپلیکیشن موبایل، افزونه مرورگر و...) قابلدسترس است.
جمعبندی: کدام ابزار مناسب شماست؟
انتخاب بهترین ابزار هوش مصنوعی رایگان به نیاز، هدف و سطح مهارت شما بستگی دارد. اگر به دنبال خلق آثار هنری هستید، ابزارهایی مانند Dream Studio، NightCafe یا WOMBO Dream میتوانند انتخاب مناسبی باشند. برای یادگیری زبان یا گفتگو با هوش مصنوعی، ChatGPT، Character AI و ELSA Speak گزینههای کاربردی و جذابی هستند.
اگر هدفتان تولید محتوا یا تحلیل داده است، استفاده از ابزارهایی مانند Photosonic یا Gemini گوگل پیشنهاد میشود. و اگر به دنبال تجربهای تعاملی و سرگرمکننده هستید، AI Dungeon و Wonder تجربهای متفاوت ارائه میدهند.
ابزار جدیدی با نام Codex رونمایی کرده است؛ ابزاری که در نقش یک دستیار مجازی هوش مصنوعی برای مهندسان نرمافزار طراحی شده و هماکنون در قالب نسخه پیشنمایش تحقیقاتی برای کاربران اشتراکی ChatGPT در دسترس قرار گرفته است. این ابزار در حال حاضر بدون هزینه اضافی ارائه میشود، اما OpenAI قصد دارد در آینده متناسب با استقبال کاربران، مدلهای پرداختی برای آن در نظر بگیرد.
قابلیتهای Codex: فراتر از تولید کد
OpenAI، هدف از توسعه Codex تبدیل ChatGPT به یک همکار واقعی برای برنامهنویسان است. این ابزار میتواند به کمک زبان طبیعی کد بنویسد، خطاها را شناسایی و اصلاح کند، کدها را تست کند و پیشنهادهایی برای بهبود آنها ارائه دهد. این فرآیند ممکن است تا ۳۰ دقیقه زمان ببرد. همچنین OpenAI برنامه دارد قابلیت فعالیت طولانیمدت Codex در پسزمینه را در آینده اضافه کند.
Codex فعلاً به نسخه تحت وب ChatGPT اضافه شده و عمداً به اینترنت متصل نیست تا از بروز مشکلات امنیتی احتمالی جلوگیری شود. این ابزار بر پایه نسخهای سفارشی از مدل استدلالگر o3 شرکت OpenAI توسعه یافته که با نام codex-1 شناخته میشود و مختص کدنویسی است.
Codex؛ مکمل ابزارهای تخصصیتر کدنویسی
OpenAI Codex را مکمل ابزارهای تخصصیتری مانند Cursor و Windsurf معرفی کرده است. در همین راستا، این شرکت در حال مذاکره برای خرید Windsurf با قیمتی حدود ۳ میلیارد دلار است. گفته میشود مهندسان OpenAI از Codex برای انجام وظایف روزمره خود استفاده کرده و با کمک آن چندین کار را همزمان مدیریت و وضعیت آنها را بررسی میکنند.
محدودیتها و آینده Codex
با این حال، Codex همچنان محدودیتهایی در انجام خودکار وظایف پیچیده دارد. هدف نهایی OpenAI این است که Codex بتواند تمامی پیچیدگیهای برنامهنویسی را برای کاربران حذف کند. الکساندر امبریکوس، مدیر محصول Codex، در این زمینه گفته است:
«در آینده توسعه نرمافزار به این شکل خواهد بود که ایجنت هوش مصنوعی مستقیماً روی کامپیوتر کار میکند و ما صرفاً وظایف را به آن واگذار میکنیم.»
رقابت داغ هوش مصنوعی در حوزه کدنویسی
کدنویسی به یکی از حوزههای داغ رقابت در دنیای هوش مصنوعی تبدیل شده است. شرکتهایی مانند Anthropic و Google نیز سرمایهگذاریهای گستردهای در این زمینه انجام دادهاند. هفته گذشته OpenAI دسترسی به GitHub را به ابزار Deep Research خود اضافه کرد تا کاربران بتوانند کدها را با دقت بیشتری تحلیل کنند. همچنین این هفته گوگل قابلیت اتصال مدلهای Gemini به GitHub و ایجنت جدیدی به نام AlphaEvolve را معرفی کرد که به طور ویژه برای طراحی الگوریتمها توسعه یافته است.
آزمایشگاه فیتبیت از سه قابلیت جدید مبتنی بر هوش مصنوعی «جمینای» برای تحلیل سلامت و سادهسازی اطلاعات پزشکی رونمایی کرد.
فیتبیت در راستای توسعه بخش آزمایشی خود، از سه قابلیت نوآورانه با تمرکز بر سلامت کاربران پردهبرداری کرده است. این قابلیتها از توانمندیهای مدل هوش مصنوعی «جمینای» بهره میبرند و قرار است تجربه کاربری در حوزه سلامت دیجیتال را به سطح بالاتری ارتقا دهند.
۱. رهیاب سوابق پزشکی (Medical Record Navigator)
این ابزار با استفاده از جمینای، گزارشهای پیچیده پزشکی کاربران را به زبان ساده و قابلدرک ترجمه میکند. هدف این ویژگی، کمک به کاربران برای درک بهتر وضعیت سلامتیشان است. همچنین، این قابلیت کاربران را به منابع آموزشی مرتبط با دادههای ارائهشده متصل میکند. بهزودی، این ابزار در قالب یک اپلیکیشن تلفن همراه عرضه خواهد شد و کاربران میتوانند با ثبتنام در آن، گزارشهای آزمایشگاهی خود را بهصورت ایمن بارگذاری کنند.
۲. بررسیکننده علائم (Symptom Checker)
این قابلیت به کاربران اجازه میدهد علائم جسمی خود (مانند سردرد یا خستگی) را توصیف کنند. سپس، با کمک جمینای، اپلیکیشن سؤالات تکمیلی میپرسد تا درک دقیقتری از وضعیت کاربر بهدست آورد. بر اساس پاسخها، دلایل احتمالی برای این علائم ارائه میشود. این آزمایش بهزودی برای کاربران منتخب فعال خواهد شد.
۳. روندهای غیرمعمول (Unusual Trends)
این ابزار، عملکردی مشابه یک ناظر سلامت دارد. پس از ثبتنام، وضعیت پایه سلامت هر کاربر مشخص میشود. سپس این ابزار با تحلیل دادههای روزانه، به دنبال الگوهای غیرعادی میگردد. در صورت مشاهده تغییراتی که ممکن است نشانهای از بیماری یا اضطراب باشند، به کاربر هشدار داده میشود.
برنامههای مکمل
پیش از این نیز، فیتبیت در ماه مارس اپلیکیشن «زمانبندی خواب» را در اختیار گروه آزمایشی قرار داده بود. این اپلیکیشن با استفاده از نظرسنجیهای روزانه، عوامل مؤثر بر کیفیت خواب – مانند سروصدا – را شناسایی میکند و به کاربران برای دستیابی به خواب بهینه کمک میکند.
جمعبندی
قابلیتهای جدید فیتبیت با تکیه بر هوش مصنوعی جمینای، گامی رو به جلو در سلامت دیجیتال بهشمار میروند. این ابزارها با سادهسازی اطلاعات پیچیده و ارائه تحلیلهای کاربردی، میتوانند نقش مؤثری در ارتقای آگاهی کاربران از وضعیت سلامت خود ایفا کنند.
همکاری میان انسان و «هوش مصنوعی مولد» فرصتهای بزرگی برای افزایش بهرهوری و کیفیت کار ایجاد کرده، اما نباید از هزینههای روانی آن غافل شد. کاهش انگیزه، افزایش بیحوصلگی و احساس جداشدگی از کار از جمله پیامدهایی هستند که ممکن است در بلندمدت به کاهش رضایت شغلی و فرسودگی منجر شوند.
سازمانها برای بهرهگیری پایدار از مزایای این فناوری باید با طراحی آگاهانه جریانهای کاری، ایجاد تعادل میان وظایف انسانی و ماشینی، و آموزش کارکنان برای استفاده هدفمند از «هوش مصنوعی»، محیطی فراهم کنند که هم عملکرد بالا حفظ شود و هم انگیزه و تعامل انسانی تضعیف نگردد.
در نهایت، آینده کار موفق در گرو همافزایی میان تواناییهای انسان و هوش مصنوعی است؛ نه جایگزینی یکی با دیگری.
شرکت OpenAI در راستای توسعه کاربردهای سازمانی ابزار ChatGPT، از قابلیت جدید اتصال مستقیم این مدل هوش مصنوعی به سرویسهای Microsoft OneDrive و SharePoint رونمایی کرد. این قابلیت اکنون در قالب نسخه بتا برای کاربران اشتراکهای Plus، Pro و Team فعال شده است.
با استفاده از این ویژگی، کاربران میتوانند بهصورت بلادرنگ دادههای ذخیرهشده در حسابهای OneDrive و SharePoint را تحلیل کرده و پاسخهای مبتنی بر محتوای واقعی اسناد خود دریافت کنند. البته، کاربران در منطقه اقتصادی اروپا (EEA)، بریتانیا و سوئیس فعلاً از این ویژگی محروم هستند. به گفته OpenAI، این قابلیت در آینده برای کاربران سازمانی (Enterprise) نیز عرضه خواهد شد.
نحوه اتصال ChatGPT به OneDrive و SharePoint
برای فعالسازی این اتصال، کاربران میتوانند از دو مسیر اقدام کنند:
هنگام نوشتن متن در ChatGPT، گزینه «تحقیق عمیق» (Deep Research) را انتخاب کرده و از منوی کشویی گزینه SharePoint یا OneDrive را برگزینند. سپس با ورود به حساب کاربری مایکروسافت و تأیید دسترسی، امکان انتخاب پوشههای دلخواه برای تجزیهوتحلیل فراهم میشود.
از طریق تنظیمات ChatGPT، در بخش «اپهای متصل» (Connected Apps) و سپس زیرمجموعه «Connectors»، امکان اتصال مستقیم Microsoft OneDrive نیز وجود دارد.
قابلیتها و کاربردها
اتصال ChatGPT به فضای ذخیرهسازی مایکروسافت به کاربران این امکان را میدهد تا به سادگی از طریق چت، اطلاعات و اسناد موجود را بازیابی و تحلیل کنند. برای مثال، کاربران میتوانند سوالاتی مانند موارد زیر را مطرح کنند:
«میتونی خلاصه مالی فصل اول برای منطقه آمریکای شمالی رو بهم بدی؟»
«دادههای فروش ماه ژانویه برای اروپا کجا ذخیره شده؟»
ابزار تحقیق عمیق، با جستجوی محتوای اسناد بارگذاریشده، پاسخهایی دقیق به همراه ارجاع (Citation) ارائه میدهد.
پیششرطهای سازمانی
در محیطهای سازمانی، مدیران سیستم Microsoft 365 باید پیش از استفاده، اپلیکیشن ChatGPT را تأیید کرده و دسترسی لازم را در سطح سازمان (Tenant-wide Admin Consent) صادر کنند.
این اقدام، گامی دیگر در راستای تلفیق هوش مصنوعی با زیرساختهای سازمانی محسوب میشود و مسیر تحلیل هوشمند اسناد، اتوماسیون تصمیمسازی و دسترسی سریع به اطلاعات کاری را برای سازمانها هموارتر میسازد.
گوگل در آستانه برگزاری کنفرانس سالانه توسعهدهندگان خود، از مجموعهای از محصولات جدید رونمایی کرده که در رأس آنها، ابزاری مبتنی بر هوش مصنوعی برای تسهیل فرآیند طراحی و توسعه نرمافزارها قرار دارد.
این ابزار هوشمند که بهصورت داخلی به برخی از کارکنان و توسعهدهندگان خارجی نمایش داده شده، قادر است طیف گستردهای از مراحل تولید نرمافزار را پوشش دهد؛ از انجام وظایف برنامهنویسی گرفته تا مستندسازی کدها و اعتبارسنجی آنها.
همچنین گزارشها حاکی از آن است که گوگل ممکن است در این رویداد از ادغام دستیار هوش مصنوعی خود، Gemini، با عینکها و هدستهای واقعیت ترکیبی (XR) مبتنی بر اندروید نیز رونمایی کند. این قابلیت جدید میتواند امکان صدور فرامین صوتی برای تعامل با هوش مصنوعی از طریق این گجتها را فراهم سازد.
گوگل در شرایطی این ابزارها را معرفی میکند که فشار رقابتی در حوزه هوش مصنوعی روزبهروز در حال افزایش است. سرمایهگذاران نیز خواهان مشاهده بازده ملموس سرمایهگذاریهای چند میلیارد دلاری این شرکت در زمینه هوش مصنوعی هستند.
در عین حال، کسبوکارهای اصلی گوگل در حوزه جستجو و تبلیغات آنلاین با چالشهای قانونی و فشار رگولاتورهای ضد انحصار در کشورهای مختلف روبهرو شدهاند. این موضوع موجب شده تا گوگل تمرکز خود را بیش از پیش بر توسعه و تجاریسازی فناوریهای نوین مبتنی بر هوش مصنوعی معطوف کند.
گفتنی است کنفرانس توسعهدهندگان گوگل قرار است هفته آینده در مانتین ویو، کالیفرنیا برگزار شود و سخنرانی افتتاحیه این رویداد برای هفته آینده برنامهریزی شده است.
عامل هوش مصنوعی جدید در ویندوز ۱۱ فرآیند یافتن تنظیمات مورد نیاز را سادهتر کرده است. کاربران میتوانند به راحتی عباراتی مانند «چطور با صدا رایانه را کنترل کنم؟» یا «اشارهگر ماوس خیلی کوچک است» را تایپ کرده و پاسخ مناسب دریافت کنند.
این عامل هوشمند، با کسب اجازه از کاربر، قادر است برخی تنظیمات را به صورت خودکار تغییر دهد. در حال حاضر، این قابلیت برای کاربران عضو برنامه Windows Insider و روی دستگاههای مجهز به پردازنده Snapdragon فعال است و بهزودی برای پردازندههای Intel و AMD نیز عرضه خواهد شد.
متنهای هوشمند در Click to Do
قابلیت Click to Do که مبتنی بر مدل زبانی سبک Phi Silica توسعه یافته، اکنون عملکردی هوشمندتر دارد. کاربران میتوانند با فشردن کلید WIN همراه با کلیک ماوس یا کلیدهای ترکیبی WIN + Q، متنی را انتخاب و اقداماتی مانند خلاصهسازی، ایجاد فهرست گلولهای یا بازنویسی آن را انجام دهند.
بازنویسی متن میتواند با لحن رسمی، غیررسمی یا روانتر صورت گیرد. برای استفاده از این قابلیت باید حداقل ۱۰ واژه انتخاب شده باشد، زبان سیستم انگلیسی باشد و ورود از طریق حساب Microsoft یا Entra انجام شده باشد.
تغییرات دیگر در نسخه جدید ویندوز ۱۱
پیشنمایش Click to Do به زبانهای دیگر: کاربران فرانسوی و اسپانیایی فعلاً فقط به قابلیتهایی مانند خلاصهسازی، فهرستسازی و اصلاح متن دسترسی دارند. گزینه بازنویسی در نسخههای آینده در دسترس قرار خواهد گرفت.
نورپردازی پویا (Dynamic Lighting): اکنون کاربران میتوانند دستگاههای مجهز به نورپردازی پویا را با استفاده از گزینه «خارج کردن سختافزار با اطمینان» در نوار وظیفه، بهطور ایمن جدا کنند.
افزودن بخش پرسشهای متداول (FAQ): در مسیر Settings > System > About بخشی جدید اضافه شده که به سوالات رایج درباره پیکربندی، کارایی و سازگاری سیستم پاسخ میدهد و به کاربران کمک میکند تصمیمات آگاهانهتری درباره رایانه خود بگیرند.
در کنفرانس امنیتی RSA که اخیراً در سانفرانسیسکو برگزار شد، کارشناسان امنیت سایبری با هشدار درباره ظهور نسل جدیدی از تهدیدات دیجیتال، مفهوم «هوش مصنوعی شرور» را به نمایش گذاشتند. این ابزارها، که بدون محدودیتهای اخلاقی طراحی شدهاند، میتوانند آسیبپذیریهای نرمافزاری را با سرعتی فراتر از توان تیمهای دفاعی کشف و بهرهبرداری کنند.
این نشست، که با حضور گسترده شرکتکنندگان و با هدایت شری دیویداف (مدیرعامل شرکت امنیتی LMG) و مت دورین (مدیر تحقیقات و آموزش این شرکت) برگزار شد، بهجای پرداخت صرف به تئوری، یک نمایش زنده از عملکرد هوش مصنوعی مخرب ارائه کرد.
WormGPT؛ نسخه تاریک ChatGPT در خدمت مهاجمان
در این ارائه، از ابزاری به نام WormGPT رونمایی شد؛ نسخهای تغییر یافته از مدل ChatGPT که برخلاف نسخه رسمی، هیچگونه محدودیت اخلاقی یا فنی در پاسخگویی به درخواستهای مخرب ندارد. به گفته دورین، این ابزار تنها با پرداخت ۵۰ دلار از طریق تلگرام در دسترس قرار گرفته است.
در آزمایش اولیه، نسخهای قدیمی از WormGPT موفق شد یک آسیبپذیری SQL در نرمافزار DotProject را شناسایی کند، هرچند در بهرهبرداری کامل از آن ناکام بود. اما در بررسی آسیبپذیری معروف Log4j، مشخص شد که این ابزار میتواند اطلاعات کافی برای ساخت یک کد مخرب را در اختیار هکرهای سطح متوسط قرار دهد.
دستورالعمل کامل حمله، تنها با یک درخواست
شوک اصلی زمانی وارد شد که نسخه جدید WormGPT موفق شد دستورالعملی کامل همراه با کد اجرایی و متناسب با سرور آزمایشی ارائه دهد. در یک سناریوی دیگر، این ابزار توانست در پلتفرم Magento یک آسیبپذیری پیچیده و چندمرحلهای را کشف کند؛ آسیبپذیریای که حتی ابزارهای شناختهشدهای مانند SonarQube و حتی خود ChatGPT از شناسایی آن ناتوان بودند.
هشداری جدی از آیندهای نزدیک
در پایان این نشست، شری دیویداف با ابراز نگرانی از سرعت پیشرفت این ابزارها گفت:
«من بابت شش ماه آینده نگرانم. پیشرفت آنها در طول یک سال گذشته، هم واضح بوده و هم هشداردهنده.»
سکوت سنگین حضار پس از این اظهارنظر، خود گواهی بر نگرانی فزاینده در جامعه امنیت سایبری نسبت به آیندهی هوش مصنوعی بدون نظارت و چارچوبهای اخلاقی بود.
در سالهای اخیر، فناوریهای هوشمند به بخشهای مختلف زندگی روزمره وارد شدهاند و اکنون نقش پررنگی در بازاریابی و فروش ایفا میکنند. این تحول دیجیتال، بهطور چشمگیری رفتار مشتریان و تصمیمگیریهای تجاری را دگرگون ساخته است.
«هوش مصنوعی» که نخستین بار در دهه ۵۰ میلادی به مفهوم ساخت ماشینهایی با توانایی تفکر انسانی معرفی شد، امروز به بخشی جداییناپذیر از صنایع گوناگون از جمله بازاریابی تبدیل شده است. این فناوری به شرکتها کمک میکند تا شناخت دقیقتری از مشتریان خود پیدا کنند، خدمات را بر اساس نیاز هر فرد شخصیسازی کرده و در نهایت بهرهوری و میزان فروش خود را افزایش دهند.
هرچند استفاده از هوش مصنوعی در حوزههایی مانند مهندسی و فناوری سابقهای طولانی دارد، اما ورود آن به عرصههای انسانیتر مانند بازاریابی نسبتاً تازه است. بهویژه با گسترش دادههای رفتاری کاربران در اینترنت و شبکههای اجتماعی، فرصتهایی نو برای تحلیل دقیق رفتار مشتریان فراهم شده است.
در همین راستا، دکتر قاسم زارعی، دانشیار گروه مدیریت بازرگانی دانشگاه محقق اردبیلی، همراه با دو تن از همکاران دانشگاهی خود، پژوهشی علمی انجام دادهاند تا پیامدهای بهکارگیری هوش مصنوعی در بازاریابی بینالمللی را شناسایی و تحلیل کنند.
این تحقیق با رویکردی ترکیبی شامل روشهای کیفی و کمی انجام شده است. در مرحله کیفی، مصاحبههای عمیق با متخصصان و بررسی منابع علمی انجام شده و در بخش کمی نیز از پرسشنامه برای جمعآوری دادهها استفاده شده است. جامعه آماری این پژوهش شامل کارشناسان و مدیران فعال در حوزه بازاریابی دیجیتال و فناوری اطلاعات بودهاند.
بر اساس نتایج بهدستآمده، ۹ دسته اصلی از پیامدهای هوش مصنوعی در بازاریابی بینالمللی شناسایی شده است که مجموعاً ۵۰ اثر مشخص را دربرمیگیرد. این یافتهها میتوانند بهعنوان راهنمایی ارزشمند برای کسبوکارها و بازاریابان مورد استفاده قرار گیرند.
از جمله مهمترین اثرات مثبت هوش مصنوعی در بازاریابی میتوان به افزایش رضایت مشتری، حفظ مشتریان کلیدی، بهبود پیشبینی فروش، کمک به تصمیمگیری دقیقتر در قیمتگذاری، و شخصیسازی خدمات بر اساس تحلیل دادههای کلان اشاره کرد. همچنین این فناوری میتواند عملکرد بازاریابی را هوشمندتر، سریعتر و هدفمندتر کند.
پژوهش همچنین نشان میدهد که هوش مصنوعی دیگر صرفاً یک ابزار فناورانه نیست، بلکه به بخش کلیدی از فرآیند خلق ارزش در بازاریابی تبدیل شده است. الگوریتمهای یادگیری ماشینی، رباتهای گفتگو (چتباتها)، سیستمهای تحلیل تصویر و صدا، و پلتفرمهای تصمیمگیری خودکار، همگی نحوه تعامل برندها با مشتریان را متحول کردهاند.
از دیگر دستاوردهای کلیدی این تحقیق، میتوان به نقش هوش مصنوعی در بهینهسازی زنجیره تأمین، تحلیل رفتار مصرفکننده، طراحی محصولات جدید، قیمتگذاری هوشمند، ارتقای امنیت دادهها، و حتی کاهش ضایعات و اتلاف منابع اشاره کرد.
در مجموع، این مطالعه نشان میدهد که شرکتهایی که بهدرستی از فناوریهای هوشمند بهرهبرداری میکنند، قادر خواهند بود بازاریابی خود را از یک فعالیت سنتی به سیستمی هوشمند و رقابتی در سطح جهانی ارتقا دهند.
گفتنی است مقاله علمی–پژوهشی حاصل از این تحقیق، در فصلنامه «پژوهشهای مدیریت در ایران» وابسته به دانشگاه تربیت مدرس منتشر شده است؛ نشریهای معتبر که به بررسی موضوعات نوین در حوزههای مدیریت و اقتصاد میپردازد.
صنعت هوش مصنوعی در سالهای اخیر بهسرعت رشد کرده و شرکتهای بزرگی مانند OpenAI و Google در رقابتی تنگاتنگ در این حوزه قرار دارند. این دو شرکت با معرفی ابزارهای قدرتمند خود، یعنی «چت جیپیتی» از سوی OpenAI و «جمینای» از سوی Google، تحولی در نحوه تعامل کاربران با هوش مصنوعی ایجاد کردهاند. در ادامه به مقایسه برخی از ویژگیهای کلیدی این دو پلتفرم میپردازیم:
۱. جستجو
در اواخر اکتبر ۲۰۲۴، OpenAI قابلیت جستجو را به چت جیپیتی اضافه کرد؛ قابلیتی که به کاربران اجازه میدهد پاسخهای لحظهای برای سوالاتی مانند اخبار فوری، نتایج ورزشی و قیمت سهام دریافت کنند. این قابلیت با استفاده از همکاری با رسانههایی چون رویترز، تایم، فایننشال تایمز و دیگر منابع خبری، نتایجی مشابه موتورهای جستجو ارائه میدهد. هرچند صحبتهایی درباره ساخت مرورگر اختصاصی از سوی OpenAI مطرح شد، اما این پروژه هنوز به مرحله اجرا نرسیده است.
در مقابل، گوگل سالهاست با موتور جستجوی پیشرفتهاش، پیشتاز این حوزه است. با اینکه جستجوی گوگل مبتنی بر کلمات کلیدی است، اما اخیراً با استفاده از فناوریهای هوش مصنوعی، پردازش زبان طبیعی آن بهبود یافته است.
برنده در جستجو: گوگل
۲. خرید با هوش مصنوعی
در آوریل ۲۰۲۵، OpenAI ویژگی خرید را به چت جیپیتی اضافه کرد که به کاربران اجازه میدهد با یک کلیک روی نماد جستجو، درباره محصولات مختلف تحقیق کنند. این ابزار تا پنج پیشنهاد خرید را با اطلاعاتی مانند قیمت، تخفیف، مشخصات و فروشگاههای مناسب نمایش میدهد.
در مقابل، سرویس Google Shopping از سال ۲۰۰۲ فعالیت دارد و با بهرهگیری از هوش مصنوعی و نمایش تصاویر محصولات، تجربه کاربری کاملی را ارائه میدهد.
برنده در خرید: هر دو
هر دو پلتفرم ابزارهای خوبی برای مقایسه و خرید هستند. با این حال، Google به دلیل نمایش بهتر تصاویر مزیت دارد، در حالی که چت جیپیتی با حذف تبلیغات، تجربهای بدون مزاحمت ارائه میکند.
۳. تحقیقات عمیق
ویژگی تحقیقات عمیق Google در دسامبر ۲۰۲۴ معرفی شد و از طریق نسخه پولی جمینای (۲۰ دلار در ماه) در دسترس است. این ویژگی با بررسی دهها منبع معتبر، تحلیلهایی دقیق و تخصصی از موضوعات ارائه میدهد.
در فوریه ۲۰۲۵، OpenAI قابلیت مشابهی را به چت جیپیتی اضافه کرد. در این سیستم، کاربران نسخه رایگان میتوانند تا ۵ پرسش تحقیقاتی در ماه داشته باشند، در حالی که مشترکین Plus و Pro به ترتیب به ۲۵ و ۲۵۰ پرسش دسترسی دارند.
در یک آزمایش مستقل با پرسشی علمی درباره بقا در سطح سیاره زهره، نتایج جالبی به دست آمد:
چت جیپیتی سریعتر پاسخ داد و با استفاده از قابلیت تولید تصویر، محتوای خلاقانه و بصری ارائه کرد.
جمینای اگرچه پاسخ را دیرتر ارائه داد، اما تحلیل دقیقتری شامل جداول، محاسبات و ساختار پیچیدهتری از پاسخ داشت.
برنده در تحقیقات عمیق: هر دو
چت جیپیتی در سرعت و خلاقیت بصری برتری دارد، اما جمینای تحلیلهای عمیقتری ارائه میدهد.
نتیجهگیری
چت جیپیتی و جمینای هرکدام نقاط قوت خاص خود را دارند:
گوگل در جستجو و نمایش تصویری بهتر عمل میکند.
چت جیپیتی تجربهای بدون تبلیغ، سریعتر و خلاقتر ارائه میدهد.
انتخاب بهتر، بستگی به نیاز کاربر دارد: اگر دقت و تحلیل عمیق میخواهید، جمینای انتخاب خوبی است. اگر سرعت، راحتی و قابلیت تعامل بیشتر مدنظر است، چت جیپیتی گزینه مناسبی خواهد بود.
به گفته متیو پرینس، مدیرعامل شرکت «کلودفلر»، هوش مصنوعی در حال آسیب زدن به موتور اقتصادی وب است و گوگل نقش کلیدی در این تغییرات دارد.
پرینس در مصاحبهای در روز جمعه اعلام کرد که هوش مصنوعی در حال بازتعریف مدل کسبوکار تحت وب است؛ مدلی که طی ۱۵ سال گذشته بهطور عمده بر پایه جستوجو بنا شده بود. او گفت: «جستوجو، موتور محرک اینترنت بوده و گوگل، نقطه عطف این مسیر به شمار میرود. اما اکنون، با استفاده کاربران از ابزارهای هوش مصنوعی برای یافتن پاسخهای خود، ارزش مبادلهای میان گوگل و تولیدکنندگان محتوا از بین میرود.»
او توضیح داد که حدود یک دهه پیش، گوگل در ازای هر دو صفحهای که بررسی میکرد، یک بازدیدکننده به وبسایتها میفرستاد. اما امروز، این نسبت به یک بازدیدکننده در ازای هر شش صفحه کاهش یافته است. این کاهش به دلیل افزایش جستوجوهای بدون کلیک است؛ یعنی زمانی که کاربران پاسخ پرسش خود را مستقیماً در صفحه نتایج گوگل دریافت میکنند. به گفته او، امروزه حدود ۷۵ درصد جستوجوها بدون خروج از گوگل انجام میشود.
پرینس افزود: «این روند مدتهاست که مورد انتقاد ناشران محتوا و فعالان سئو قرار گرفته و اکنون با رشد مدلهای زبانی بزرگ (LLM) بدتر شده است. شرکتهای هوش مصنوعی برای پاسخگویی به کاربران، محتوای بسیار بیشتری را نسبت به گوگل استخراج میکنند، اما در مقابل، ترافیک بسیار ناچیزی به تولیدکنندگان محتوا بازمیگردانند.»
او با اشاره به دادههایی نگرانکننده اظهار داشت: «نسبت استفاده به بازگشت ترافیک در مورد شرکت OpenAI، حدود ۲۵۰ به یک و برای Anthropic، شش هزار به یک است. یعنی کاربران پاسخهای خود را بهصورت مشتقشده از محتوا دریافت میکنند، بدون آنکه به منبع اصلی هدایت شوند.»
پرینس هشدار داد: «اگر تولیدکنندگان محتوا نتوانند از فعالیت خود کسب درآمد کنند، تولید محتوا متوقف خواهد شد و وب مدرن با تهدیدی جدی مواجه خواهد شد. شرکتهای فعال در حوزه هوش مصنوعی از این چالش آگاه هستند و ادامه حیات مدل اقتصادی وب بدون تغییرات ساختاری ممکن نخواهد بود.»
او در پایان خاطرنشان کرد که مدیرعامل OpenAI، سم آلتمن، به این مسئله واقف است، اما «او نمیتواند تنها کسی باشد که برای محتوا هزینه میکند، در حالی که سایر شرکتها آن را به رایگان بهرهبرداری میکنند.»
مایکروسافت در ادامه تلاشهای خود برای گسترش کاربرد هوش مصنوعی، از مجموعهای از قابلیتهای جدید برای رایانههای Copilot+ PCs و سیستمعامل ویندوز ۱۱ رونمایی کرد. برجستهترین این قابلیتها، معرفی عامل هوش مصنوعی (AI Agent) است؛ دستیار هوشمندی که به صورت محلی روی رایانه اجرا میشود و میتواند تعامل کاربران با سیستم را متحول کند.
ویژگیهای کلیدی عامل هوش مصنوعی مایکروسافت
پاسخگویی و اجرای فرمانها
این عامل نهتنها به سوالاتی مانند «چگونه با دستور صوتی رایانه را کنترل کنم؟» یا «نشانگر ماوس من بسیار کوچک است» پاسخ میدهد، بلکه با داشتن مجوز کاربر، قادر است تنظیمات را بهصورت خودکار تغییر دهد.
فعلاً فقط زبان انگلیسی پشتیبانی میشود
در حال حاضر، این ابزار تنها به زبان انگلیسی کار میکند اما مایکروسافت اعلام کرده است که پشتیبانی از زبانهای بیشتر در آینده نزدیک اضافه خواهد شد.
سازگاری اولیه با تراشههای اسنپدراگون
در مرحله اول، این قابلیت روی رایانههایی با تراشههای Snapdragon فعال خواهد بود و بهزودی در سیستمهای مبتنی بر Intel و AMD نیز عرضه میشود.
بهبود قابلیت Click to Do در Copilot
مایکروسافت قابلیت «Click to Do» را نیز توسعه داده تا دستیار Copilot بتواند اقدامات بیشتری روی محتوای نمایشگر انجام دهد. بهعنوان مثال، کوپایلوت میتواند:
از متن انتخابشده فهرست ایجاد کند،
پیشنویس یک سند برای Word تهیه کند،
یا اقدامات مشابهی را روی تصاویر انجام دهد.
سم آلتمن، مدیرعامل شرکت OpenAI، در سخنانی تأکید کرد که ChatGPT بهرغم تواناییهای چشمگیرش، جایگزین موتور جستوجوی گوگل نخواهد شد. او گوگل را «رقیبی سرسخت» توصیف کرد که از تیم هوش مصنوعی قدرتمند، زیرساخت گسترده و مدل تجاری بسیار محافظتشدهای برخوردار است.
آلتمن در جلسهای در کمیته بازرگانی سنای آمریکا درباره رقابتپذیری ایالات متحده در حوزه هوش مصنوعی، در پاسخ به پرسش سناتور تد کروز مبنی بر اینکه آیا ChatGPT میتواند جایگزین گوگل شود، گفت:
«احتمالاً نه. اگرچه ChatGPT در برخی زمینهها عملکرد بهتری دارد، اما بهطور کلی نمیتواند جای موتور جستوجوی گوگل را بگیرد.»
این اظهار نظر در حالی مطرح شد که برای نخستینبار، گوگل کاهش ترافیک جستوجوی خود از مرورگر سافاری را گزارش کرده است.
کارشناسان بر این باورند که ابزارهای جدیدی مانند ChatGPT Search و نسخهی آزمایشی SearchGPT، در حال تغییر شیوه تعامل کاربران با اینترنت و نحوه جستوجو هستند. آلتمن با اشاره به تجربه شخصیاش گفت که دیگر از گوگل برای جستوجو استفاده نمیکند و ChatGPT را بهعنوان سامانهای پیشگو معرفی کرد.
OpenAI اخیراً ابزار ChatGPT Search را بهصورت رایگان در اختیار عموم کاربران قرار داده است. استفاده از این ابزار نیازی به پرداخت هزینه یا حتی ایجاد حساب کاربری ندارد.
لینکدین با معرفی ابزاری نوین مبتنی بر هوش مصنوعی، گامی بلند در جهت بهبود تجربه جویندگان کار برداشته است. این ابزار جدید به کاربران اجازه میدهد با استفاده از زبان طبیعی، توصیف دقیقی از شغل ایدهآل خود ارائه دهند و متناسب با آن، فرصتهای شغلی مرتبط را دریافت کنند.
تحول در جستجوی شغلی با هوش مصنوعی
ابزار جدید لینکدین با بهرهگیری از یک سیستم جستجوی هوشمند و پیشرفته، امکان جستجو با عبارات طبیعی مانند «مدیر برند سطح پایه در صنعت مد» یا «تحلیلگر علاقهمند به پایداری محیطزیست» را فراهم کرده است. این قابلیت، فراتر از فیلترهای سنتی نظیر موقعیت جغرافیایی یا نوع شغل عمل میکند و نتایجی دقیقتر و مرتبطتر با علاقهمندیها و مهارتهای کاربر ارائه میدهد.
پایان جستجوی دستی آگهیها
پیش از این، کاربران برای یافتن فرصتهای شغلی مناسب، ناچار بودند فیلترهای متعددی اعمال کرده یا صدها آگهی را بهصورت دستی بررسی کنند. اما ابزار جدید لینکدین با تحلیل دقیق درخواستهای کاربران، فرآیند جستجو را بهینه کرده و یافتن موقعیتهای شغلی همراستا با اهداف فردی را سادهتر ساخته است.
هدف: سادهسازی مسیر شغلی
زارا ایستون، کارشناس حوزه اشتغال در لینکدین، در بیانیهای اعلام کرد:
«هوش مصنوعی در حال متحول کردن نحوه کار و زندگی ماست. با معرفی این ابزار، ما امیدواریم جویندگان کار بتوانند مهارتها، علاقهمندیها و آرزوهای شغلی خود را بهدرستی بیان کرده و مسیر حرفهای خود را با آگاهی بیشتری انتخاب کنند.»
در دسترس برای کاربران Premium
در حال حاضر، این ابزار تنها برای مشترکان پلن Premium لینکدین و به زبان انگلیسی فعال شده و قرار است تا پایان هفته برای تمامی کاربرانی که زبان پیشفرض حساب آنها «انگلیسی جهانی» است، فعال شود. با این حال، انتظار میرود در آیندهای نزدیک، این قابلیت برای همه کاربران لینکدین نیز عرضه شود.
گامی دیگر در مسیر هوشمندسازی
این قابلیت با تحلیل توصیفات دقیقتر کاربران، پیشنهادهای شغلی شخصیسازیشدهتری ارائه میدهد. معرفی چنین ابزاری از سوی لینکدین، نمایانگر حرکت رو به جلوی این پلتفرم در جهت استفاده از هوش مصنوعی برای ارتقای تجربه کاربری و تسهیل فرآیندهای پیچیده کاری است.
این شرکت تاکنون ۶ مدل مختلف از این چتبات هوش مصنوعی را در دسترس کاربران قرار داده که هر یک در حوزهای خاص عملکرد بهتری دارند.
با توجه به پیچیدگی مدلهای زبانی بزرگ (LLM)، OpenAI اعلام کرده که به جای توسعه یک مدل همهمنظوره، مجموعهای از مدلها را ارائه داده است تا نیازهای متنوع کاربران را بهتر برآورده کند. این شرکت تاکید دارد که گاهی بهبود عملکرد در یک زمینه میتواند باعث افت کیفیت در زمینهای دیگر شود؛ به همین دلیل، تنوع مدلها ضروری بوده است.
مدلهای اصلی ChatGPT و کاربرد آنها به شرح زیر است:
GPT-4o:
مدل پیشفرض نسخه رایگان ChatGPT. مناسب برای کارهای روزمره مانند خلاصهنویسی، تولید محتوا، نوشتن ایمیل و حتی جستجو در وب. با این حال، نرخ ارائه اطلاعات نادرست اما قانعکننده («توهم») در آن نسبتاً بالاست.
GPT-4.5:
مدلی با تمرکز بر «هوش هیجانی». مناسب برای نگارش پستهای شبکههای اجتماعی، توضیح محصولات و نگارش نامههای عذرخواهی به مشتریان.
OpenAI o4-mini:
مدل سبک، سریع و ارزان با دانش محدودتر. کاربرد آن بیشتر در وظایف فنی سریع مانند استخراج داده از فایلهای CSV، بررسی کدهای ساده و خلاصهسازی متون است. این مدل به دلیل اندازه کوچک، مستعد توهم بیشتری است.
OpenAI o4-mini-high:
نسخه تقویتشده o4-mini که توانایی تحلیل عمیقتری دارد. مناسب برای حل مسائل ریاضی پیچیده، نگارش کوئریهای SQL و توضیح مفاهیم علمی به زبان ساده.
OpenAI o3:
مدلی قدیمی اما قدرتمند برای پروژههای پیچیده و چندمرحلهای. برای تحلیل استراتژیک، برنامهریزی دقیق و کدنویسی سنگین انتخاب مناسبی است.
OpenAI o1 pro mode:
با وجود قدیمی بودن، در زمینه دقت و استدلال عملکرد بسیار خوبی دارد. نرخ توهم پایینی دارد و برای تولید محتوای دقیق، تحلیلهای مالی و خلاصهسازی تحقیقات علمی پیشنهاد میشود.
دسترسی کاربران:
در حال حاضر فقط مدلهای GPT-4o و o4-mini در نسخه رایگان ChatGPT در دسترس هستند. برای استفاده از سایر مدلها، کاربران نیاز به اشتراک دارند.
شرکت Hugging Face با معرفی یک عامل هوش مصنوعی رایگان و متنباز، گام تازهای در توسعه ابزارهای عاملمحور برداشته است.
این ابزار جدید که در تاریخ ۶ مه ۲۰۲۵ معرفی شد، میتواند با بهرهگیری از ماشین مجازی لینوکس و برنامههایی مانند فایرفاکس، مجموعهای از وظایف رایانهای را بهصورت خودکار انجام دهد.
کاربران میتوانند از طریق مرورگر وب، دستوراتی مانند «یافتن دفتر مرکزی Hugging Face در پاریس با استفاده از گوگل مپس» را به این عامل بدهند و اجرای خودکار مراحل مربوطه را مشاهده کنند.
عملکرد و محدودیتها
این عامل در انجام وظایف ساده عملکرد قابل قبولی دارد، اما هنگام مواجهه با کارهای پیچیدهتر، مانند جستوجوی پروازها یا عبور از آزمونهای CAPTCHA، همچنان با چالشهایی روبهرو است.
آیمریک روشر، عضو تیم توسعه عاملهای Hugging Face، در پستی در شبکه اجتماعی X نوشت:
«با پیشرفت مدلهای بینایی، عاملهای هوش مصنوعی توانایی انجام جریانهای کاری پیچیدهتری را پیدا کردهاند. برخی از این مدلها از قابلیت مکانیابی داخلی برخوردارند؛ بهطوریکه میتوانند عناصر داخل تصویر را شناسایی کرده و با مختصات مشخص روی آنها کلیک کنند.»
هدف و آینده بازار
هدف اصلی Hugging Face از توسعه این ابزار، نمایش پیشرفت مدلهای متنباز و کاهش هزینههای اجرا در زیرساختهای ابری عنوان شده است.
بر اساس نتایج یک نظرسنجی از شرکت KPMG، حدود ۶۵ درصد شرکتها در حال آزمایش عاملهای هوش مصنوعی هستند. همچنین پیشبینی میشود که بازار جهانی این عاملها از ۷.۸۴ میلیارد دلار در سال ۲۰۲۵ به ۵۲.۶۲ میلیارد دلار در سال ۲۰۳۰ برسد.
مایکروسافت در بهروزرسانی جدید ویندوز ۱۱ که در همین ماه منتشر خواهد شد، از نسخهای بازطراحیشده از منوی استارت و مجموعهای از قابلیتهای هوش مصنوعی برای کاربران رونمایی کرد.
این تغییرات در گام نخست برای کاربران رایانههای Copilot+ مبتنیبر تراشههای اسنپدراگون X از جمله مدلهای جدید مایکروسافت سرفیس عرضه میشود و بهزودی برای دستگاههای دارای پردازندههای اینتل و AMD نیز ارائه خواهد شد.
طراحی جدید منوی استارت با پنل Phone Companion
نسخه جدید منوی استارت که پیشتر در نسخههای آزمایشی دیده شده بود، حالا فضای بیشتری برای نمایش برنامهها در اختیار کاربران قرار میدهد. این طراحی جدید با دستهبندی منظمتر و اسکرول روانتر، بهویژه برای نمایشگرهای بزرگتر مناسبتر شده است. همچنین پنلی با عنوان Phone Companion به منو اضافه شده که امکان مشاهده سریع مخاطبان اخیر، پیامها، تماسها، وضعیت باتری و سایر اطلاعات گوشیهای اندرویدی یا آیفون همگامشده را فراهم میسازد.
ادغام هوش مصنوعی در ویندوز ۱۱
همزمان با بازطراحی منوی استارت، مایکروسافت مجموعهای از ابزارهای هوش مصنوعی را نیز به ویندوز ۱۱ افزوده است. از جمله مهمترین آنها میتوان به حضور یک عامل هوشمند (AI Agent) اشاره کرد که به کاربران امکان میدهد تنظیمات سیستم را بهصورت متنی یا صوتی تغییر دهند. برای مثال، کاربر میتواند مشکل «کوچک بودن نشانگر ماوس» را مطرح کند و عامل هوشمند راهحل را ارائه داده یا تنظیمات مربوط را اعمال کند. البته مایکروسافت هشدار داده که این پیشنهادها همیشه دقیق نیستند و بهتر است کاربران با احتیاط از آنها استفاده کنند.
ابزارهای هوش مصنوعی دیگر
دیگر امکانات جدید شامل موارد زیر است:
Click to Do: انجام خودکار وظایف متنی و تصویری از طریق Copilot
Paint: انتخاب هوشمند، قابلیت پر کردن خودکار (Generative Fill) و ساخت استیکر از متن
Photos: قابلیت Relight برای افزودن منابع نور مجازی
Snipping Tool: ابزار Perfect Screenshot، استخراج متن و انتخاب رنگ با Eyedropper
Copilot Vision: جستوجوی تصویری هوشمند
Notepad: پیشنهادهای نگارشی و اصلاحی
File Explorer: بهبودهای عملکردی و دسترسی سریعتر به محتوا
Narrator: توضیحات غنیتر و دقیقتر برای دسترسی بهتر
هدف: تجربهای هوشمند، روان و شخصیسازیشده
مایکروسافت در بیانیهای اعلام کرده است که این تغییرات با هدف ارتقاء شهودیبودن، دسترسپذیری و هوشمندی بیشتر طراحی شدهاند تا تجربه کاربران از ویندوز ۱۱ سادهتر، سریعتر و شخصیتر شود.
مایکروسافت از مجموعهای از قابلیتهای جدید برای رایانههای Copilot+ و سیستمعامل ویندوز ۱۱ رونمایی کرده که مهمترین آنها، معرفی یک عامل هوش مصنوعی (AI Agent) است.
این عامل هوشمند، دستیار هوش مصنوعی را بهصورت محلی (on-device) برای مدیریت تنظیمات سیستم در اختیار کاربران قرار میدهد. برای مثال، کاربران میتوانند سوالاتی مانند «چگونه با فرمان صوتی رایانه را کنترل کنم؟» یا «نشانگر ماوس من بسیار کوچک است» را مطرح کنند.
نکته قابل توجه این است که این عامل تنها به پاسخگویی محدود نیست؛ در صورت دریافت مجوزهای لازم از سوی کاربر، میتواند تنظیمات مورد نظر را بهطور خودکار اعمال کند.
بر اساس اعلام مایکروسافت، این قابلیت فعلاً فقط از دستورات انگلیسی پشتیبانی میکند، اما قرار است در آینده زبانهای بیشتری به آن افزوده شود. این ویژگی در حال حاضر برای رایانههای مجهز به تراشههای اسنپدراگون فعال شده و بهزودی برای دستگاههای دارای پردازندههای اینتل و AMD نیز در دسترس قرار خواهد گرفت.
ارتقاء قابلیتهای Copilot با "Click to Do"
مایکروسافت همچنین عملکرد Copilot را از طریق ویژگی جدیدی به نام Click to Do گسترش داده است. این ویژگی به Copilot امکان میدهد تعامل مستقیم با محتوای روی صفحهنمایش داشته باشد؛ مثلاً:
ساخت فهرست از متون انتخابشده
تهیه پیشنویس برای نرمافزار Word
تنظیم قرار ملاقات
ارسال پیام در Microsoft Teams
انتقال دادهها به Microsoft Excel
این بهروزرسانیها نشاندهنده گام جدید مایکروسافت در جهت ادغام عمیقتر هوش مصنوعی با سیستمعامل ویندوز و افزایش بهرهوری کاربران است.
کوین سیستروم، یکی از بنیانگذاران اینستاگرام، در تازهترین سخنان خود درباره جهتگیری فعلی توسعه چتباتهای هوش مصنوعی ابراز نگرانی کرده و گفته است که بسیاری از این ابزارها بهجای ارائه پاسخهای دقیق و مفید، صرفاً با هدف افزایش تعامل کاربران طراحی شدهاند.
چتباتها یا ابزارهای تعاملسازی؟
به گزارش تکناک، سیستروم که در رویداد StartupGrind سخنرانی میکرد، گفت:
«بهنظر میرسد شرکتهای فعال در حوزه هوش مصنوعی، همان اشتباه شرکتهای پلتفرممحور را تکرار میکنند؛ جایی که هدف اصلی، بالا بردن زمان حضور کاربر و آمار تعامل است، نه کمک واقعی به او.»
او اشاره کرد که بسیاری از چتباتها پس از پاسخدادن به یک سؤال، خودشان سؤال دیگری مطرح میکنند تا گفتوگو ادامه یابد. از نگاه او، این رویکرد نه تنها کاربر را سردرگم میکند، بلکه نوعی رفتار عمدی و طراحیشده برای بالا بردن شاخصهای سطحی مانند "زمان استفاده روزانه" است.
انتقاد از رویکرد رایج در طراحی چتباتها
سیستروم این طراحی را «نیرویی آسیبزننده» توصیف کرد و تأکید کرد:
«این یک باگ نیست؛ بلکه ویژگیای هدفمند است. شرکتهای هوش مصنوعی باید کیفیت پاسخ را اولویت قرار دهند، نه اینکه صرفاً کاربران را در گفتوگویی بیپایان نگه دارند.»
پاسخ OpenAI به این انتقادات
در واکنش به این سخنان، شرکت OpenAI در گفتگو با رسانه تککرانچ اعلام کرد:
«مدلهای ما گاهی برای ارائه پاسخ دقیقتر نیاز به اطلاعات بیشتر دارند. با اینحال، چتباتها موظفاند حتی با دادههای ناقص، بهترین پاسخ ممکن را ارائه داده و در صورت لزوم، شفافسازی کنند که اطلاعات بیشتری نیاز دارند.»
این بیانیه پس از آن منتشر شد که برخی منتقدان نیز عملکرد بیشازحد محتاطانه و مودبانهی ChatGPT را مورد انتقاد قرار داده بودند.
نتیجهگیری
هرچند کوین سیستروم نام شرکت خاصی را مطرح نکرده، اما سخنان او زنگ هشداری برای شرکتهای فعال در حوزه هوش مصنوعی است که ممکن است در دام اولویتدادن به تعامل سطحی بهجای ارزش واقعی برای کاربر گرفتار شوند.
هوش مصنوعی پیشرفته گوگل با ثبت دستاوردی تاریخی، توانست بازی کلاسیک Pokémon Blue را با موفقیت به پایان برساند؛ بازیای که از زمان عرضهاش در سال ۱۹۹۶، بهعنوان یکی از نمادهای گیمبوی شناخته میشود.
به گزارش ایتنا به نقل از تککرانچ، ساندار پیچای، مدیرعامل گوگل، با انتشار پستی در پلتفرم ایکس (توییتر سابق) این موفقیت را جشن گرفت و نوشت:
«چه پایان خارقالعادهای! Gemini 2.5 Pro همین حالا بازی Pokémon Blue رو تموم کرد!»
پروژهای مستقل با پشتیبانی گوگل
این پروژه با عنوان Gemini Plays Pokémon توسط مهندس نرمافزار مستقلی به نام جوئل زد اجرا شده است. اگرچه او مستقیماً با گوگل همکاری ندارد، اما این ابتکار با استقبال تیمهای هوش مصنوعی گوگل مواجه شده است.
پیشتر، لوگان کیلپاتریک، مدیر محصول در استودیوی هوش مصنوعی گوگل، اعلام کرده بود که جمینای موفق به کسب پنج نشان در بازی شده؛ عددی که مدلهای پیشین از جمله ChatGPT و Claude به آن نرسیده بودند.
چرا Pokémon؟
در فوریه گذشته، شرکت آنتروپیک از عملکرد خوب مدل Claude در نسخهی «Pokémon Red» خبر داد. این مدل با بهرهگیری از آموزشهای استراتژیک، توانسته بود در مسیر بازی پیشروی قابلتوجهی داشته باشد.
اکنون، گوگل با جمینای یک گام فراتر رفته و کل بازی را به پایان رسانده است.
لازم به ذکر است که Pokémon Red و Blue در واقع نسخههای متفاوتی از یک بازی کلاسیک هستند که نخستینبار در سال ۱۹۹۶ روی کنسول Game Boy منتشر شدند.
آیا جمینای واقعاً بهتر از Claude است؟
گرچه جمینای موفق به پایان کامل بازی شده، اما مقایسه مستقیم آن با Claude کاملاً دقیق نیست. جوئل زد در این رابطه توضیح داده:
«هر دو مدل از ابزارها و دادههای متفاوتی بهره میبرند. هدف این پروژه رقابت نبود، بلکه نمایش ظرفیتهای بالقوه هوش مصنوعی در تعامل با محیطهای پویا و بازیمحور است.»
نقش انسان در پشت صحنه
جمینای برای انجام بازی بهتنهایی عمل نکرده است. یک سیستم عامل (Agent Framework) تصاویر زندهی بازی و دادههای تکمیلی را در اختیار مدل قرار میداد تا جمینای بتواند فرمان مناسب برای کنترل بازی صادر کند.
جوئل زد همچنین تأیید کرده که در طول بازی مداخلات محدودی انجام داده، از جمله یادآوری یک باگ قدیمی که برای پیشروی نیاز به صحبت دوباره با یک شخصیت داشت. با این حال، او تأکید کرد که هیچ راهنمای قدمبهقدمی ارائه نشده و این مداخلات «تقلب» به حساب نمیآیند.
آینده چه در انتظار ماست؟
دستاورد جمینای در Pokémon Blue نشانهای از پیشرفت چشمگیر هوش مصنوعی در تعامل با محیطهای پیچیده و پویا است. هرچند هنوز برای رسیدن به استقلال کامل فاصله دارد، این موفقیت گامی دیگر در مسیر توسعه مدلهای عمومی هوش مصنوعی بهشمار میرود.
آیا روزی شاهد هوش مصنوعیای خواهیم بود که بدون کمک انسان، استاد تمام بازیها شود؟
پاسخ این سؤال، تنها در آینده روشن خواهد شد.
به گزارش ایتنا به نقل از تککرانچ، ساندار پیچای، مدیرعامل گوگل، با انتشار پستی در پلتفرم ایکس (توییتر سابق) این موفقیت را جشن گرفت و نوشت:
«چه پایان خارقالعادهای! Gemini 2.5 Pro همین حالا بازی Pokémon Blue رو تموم کرد!»
پروژهای مستقل با پشتیبانی گوگل
این پروژه با عنوان Gemini Plays Pokémon توسط مهندس نرمافزار مستقلی به نام جوئل زد اجرا شده است. اگرچه او مستقیماً با گوگل همکاری ندارد، اما این ابتکار با استقبال تیمهای هوش مصنوعی گوگل مواجه شده است.
پیشتر، لوگان کیلپاتریک، مدیر محصول در استودیوی هوش مصنوعی گوگل، اعلام کرده بود که جمینای موفق به کسب پنج نشان در بازی شده؛ عددی که مدلهای پیشین از جمله ChatGPT و Claude به آن نرسیده بودند.
چرا Pokémon؟
در فوریه گذشته، شرکت آنتروپیک از عملکرد خوب مدل Claude در نسخهی «Pokémon Red» خبر داد. این مدل با بهرهگیری از آموزشهای استراتژیک، توانسته بود در مسیر بازی پیشروی قابلتوجهی داشته باشد.
اکنون، گوگل با جمینای یک گام فراتر رفته و کل بازی را به پایان رسانده است.
لازم به ذکر است که Pokémon Red و Blue در واقع نسخههای متفاوتی از یک بازی کلاسیک هستند که نخستینبار در سال ۱۹۹۶ روی کنسول Game Boy منتشر شدند.
آیا جمینای واقعاً بهتر از Claude است؟
گرچه جمینای موفق به پایان کامل بازی شده، اما مقایسه مستقیم آن با Claude کاملاً دقیق نیست. جوئل زد در این رابطه توضیح داده:
«هر دو مدل از ابزارها و دادههای متفاوتی بهره میبرند. هدف این پروژه رقابت نبود، بلکه نمایش ظرفیتهای بالقوه هوش مصنوعی در تعامل با محیطهای پویا و بازیمحور است.»
نقش انسان در پشت صحنه
جمینای برای انجام بازی بهتنهایی عمل نکرده است. یک سیستم عامل (Agent Framework) تصاویر زندهی بازی و دادههای تکمیلی را در اختیار مدل قرار میداد تا جمینای بتواند فرمان مناسب برای کنترل بازی صادر کند.
جوئل زد همچنین تأیید کرده که در طول بازی مداخلات محدودی انجام داده، از جمله یادآوری یک باگ قدیمی که برای پیشروی نیاز به صحبت دوباره با یک شخصیت داشت. با این حال، او تأکید کرد که هیچ راهنمای قدمبهقدمی ارائه نشده و این مداخلات «تقلب» به حساب نمیآیند.
آینده چه در انتظار ماست؟
دستاورد جمینای در Pokémon Blue نشانهای از پیشرفت چشمگیر هوش مصنوعی در تعامل با محیطهای پیچیده و پویا است. هرچند هنوز برای رسیدن به استقلال کامل فاصله دارد، این موفقیت گامی دیگر در مسیر توسعه مدلهای عمومی هوش مصنوعی بهشمار میرود.
آیا روزی شاهد هوش مصنوعیای خواهیم بود که بدون کمک انسان، استاد تمام بازیها شود؟
پاسخ این سؤال، تنها در آینده روشن خواهد شد.
شرکت متا از اپلیکیشن مستقل دستیار هوش مصنوعی خود با نام Meta AI رونمایی کرده است؛ اقدامی که این شرکت را وارد رقابت مستقیمتری با غولهایی مانند OpenAI و گوگل میکند.
این اپلیکیشن جدید در حالی عرضه شده که دستیار هوش مصنوعی متا پیشتر در پلتفرمهایی نظیر واتساپ، اینستاگرام، فیسبوک و مسنجر نیز در دسترس کاربران قرار گرفته بود. با راهاندازی اپ جداگانه، متا در تلاش است تا استفاده از این دستیار را گسترش دهد و تجربهای اختصاصیتر برای کاربران فراهم کند.
قابلیتهای شخصیسازی پیشرفته
برخلاف نسخههای قبلی که درون سایر اپها قرار داشتند، نسخه مستقل Meta AI با تحلیل اطلاعات کاربران از طریق حسابهای فیسبوک و اینستاگرام، پاسخهایی شخصیسازیشدهتر ارائه میدهد. این امکان به دستیار اجازه میدهد تعامل هوشمندتری با کاربران برقرار کند و به نیازهای خاص هر فرد بهتر پاسخ دهد.
پشتیبانی از مدل زبانی Llama 4
قدرت این اپلیکیشن بر پایه مدل زبانی جدید Llama 4 است که جدیدترین نسخه از سری مدلهای هوش مصنوعی متا محسوب میشود. این مدل برای رقابت با نسخههای پیشرفته شرکتهایی مانند OpenAI، گوگل، DeepSeek و Anthropic توسعه یافته و از قابلیتهای بالاتری در استدلال، عملکرد چندزبانه و کارایی برخوردار است.
همچنین، این اپلیکیشن با عینک هوش مصنوعی متا و اپلیکیشن همراه آن نیز یکپارچه شده و تجربهای چندمنظوره و پیوسته برای کاربران ایجاد میکند.
گامی استراتژیک در رقابت هوش مصنوعی
این اقدام نشاندهنده تلاشهای مداوم مارک زاکربرگ، مدیرعامل متا، برای تقویت موقعیت این شرکت در رقابت فشرده میان توسعهدهندگان هوش مصنوعی است. با معرفی این اپ مستقل، متا گامی دیگر برای تثبیت جایگاه خود در این میدان پرشتاب برداشته است.
گوگل با رونمایی از سه ابزار جدید مبتنی بر هوش مصنوعی، روند یادگیری زبان را شخصیتر، کاربردیتر و واقعیتر کرده است. این ابزارها با تکیه بر مدل زبانی «جمینای» توسعه یافتهاند و با تمرکز بر موقعیتهای واقعی، به کاربران کمک میکنند زبانهای جدید را بهتر فرا بگیرند.
معرفی ابزارها:
۱. Tiny Lesson:
این ابزار به کاربران اجازه میدهد با ارائهی سناریوهایی خاص، مانند «گم کردن گذرنامه»، واژگان و ساختارهای گرامری مرتبط را یاد بگیرند. همچنین پاسخهایی پیشنهادی مانند «نمیدانم کجا گمش کردم» یا «میخواهم به پلیس گزارش بدهم» ارائه میدهد که در موقعیتهای واقعی قابل استفاده هستند.
۲. Slang Hang:
این ابزار برای آموزش اصطلاحات و زبان محاورهای طراحی شده و مکالمات بومی را شبیهسازی میکند. هدف آن کمک به کاربران برای فاصله گرفتن از زبان رسمی و صحبتکردن شبیه یک فرد محلی است. کاربران میتوانند با کلیک روی واژههای ناآشنا، معنا و کاربرد آنها را ببینند. البته گوگل هشدار داده که ممکن است گاهی این ابزار از اصطلاحات نادرست یا ساختگی استفاده کند.
۳. ابزار سوم (نامگذاری نشده):
در متن اصلی اشاره مستقیمی به ابزار سوم نشده است، اما انتظار میرود این ابزار نیز در راستای تقویت مهارتهای زبانی و ارتباطی کاربران با استفاده از هوش مصنوعی عمل کند.
با این نوآوریها، گوگل گامی مهم در جهت تحول آموزش زبانهای خارجی با بهرهگیری از فناوری هوش مصنوعی برداشته است.
بررسیهای فنی جدیدترین مدلهای هوش مصنوعی شرکت OpenAI نشان میدهد، اگرچه این سیستمها از تواناییهای خیرهکنندهای برخوردارند، اما در برخی موارد رفتارهایی غیرقابل پیشبینی از خود نشان میدهند؛ مسألهای که بهگفتهی کارشناسان، بر لزوم توجه بیشتر به چالشهای پیشروی این فناوری نوین تأکید دارد.
معرفی مدلهای جدید: o3 و o4-mini
OpenAI بهتازگی از دو مدل جدید خود با نامهای o3 و o4-mini رونمایی کرده است. مدل o3 که بهعنوان یکی از پیشرفتهترین نمونهها معرفی شده، توانسته در ارزیابیهای اولیه توجه متخصصان را جلب کند؛ بهویژه به دلیل:
توانایی در استدلال چندمرحلهای
حل مسائل پیچیده
قابلیت جستوجوی خودکار در اینترنت
پردازش حرفهای تصویر و شناسایی مکانها در عکس
چالشها و محدودیتها
با وجود عملکرد چشمگیر، مدل o3 با چالشهایی جدی مواجه است. از جمله:
نرخ خطای بالاتر در مقایسه با نسخههای قبلی
دقت پایین در تحلیلهای مالی (حدود ۴۸ درصد موفقیت)
هزینه بالای پردازش هر پاسخ (میانگین ۳.۶۹ دلار)
دیدگاه کارشناسان درباره نقاط قوت و ضعف
تایلر کاون، اقتصاددان سرشناس، معتقد است که این مدلها نشانههایی اولیه از ظهور هوش مصنوعی عمومی (AGI) را به نمایش گذاشتهاند. در مقابل، اتان مولیک آن را نمونهای از «مرز ناهموار عملکرد» میداند؛ مدلی که در برخی حوزهها توانایی فرابشری دارد، اما در موارد دیگر دچار اشتباهات ابتدایی میشود.
ساختن یک ساختمان یا پرورش یک کودک؟
کارشناسان بر این باورند که توسعه هوش مصنوعی، برخلاف ساخت یک محصول نرمافزاری سنتی، بیشتر به پرورش یک موجود زنده شباهت دارد تا ساخت یک پل یا ساختمان. این ماهیت غیرخطی و تا حدی غیرقابل پیشبینی باعث شده که توسعه مدلهای هوش مصنوعی نهتنها فرصتی عظیم، بلکه چالشی علمی و اخلاقی نیز محسوب شود.
آیندهای در حال شکلگیری
OpenAI تأکید کرده است که برای درک کامل رفتار این مدلها، تحقیقات بیشتری لازم است و مسیر توسعه فعلاً در مراحل ابتدایی خود قرار دارد. این مسیر، با وجود موانع و پیچیدگیهایش، نویدبخش تحولاتی بنیادین در فناوری و نحوه تعامل انسان با ماشین است.
با وجود سرمایهگذاریهای هنگفت و تبلیغات گسترده، مایکروسافت و اپل هنوز نتوانستهاند در حوزه هوش مصنوعی رضایت کاربران و تحلیلگران را جلب کنند. این در حالی است که رقبایی چون گوگل و متا پیشرفتهای قابل توجهی در این زمینه داشتهاند.
چالشهای مایکروسافت در ارائه Copilot
مایکروسافت سرویس Copilot خود را بر پایه مدل GPT-4 عرضه کرد، اما این ابزار با انتقاداتی از جمله دقت پایین پاسخها و یکپارچهسازی ناقص با محصولاتی مانند آفیس مواجه شده است. برخی کاربران گزارش دادهاند که Copilot گاهی پاسخهای نامربوط یا نادرست ارائه میدهد.
با این حال، مایکروسافت اخیراً تغییراتی در تیم رهبری بخش هوش مصنوعی خود ایجاد کرده که نشاندهنده تلاش این شرکت برای رفع مشکلات موجود است.
مشکلات اپل در توسعه سرویسهای هوش مصنوعی
اپل دیرتر از رقبا وارد رقابت هوش مصنوعی شد و با معرفی "Apple Intelligence" تلاش کرد جایگاه خود را پیدا کند. با این حال، سرویسهای این شرکت هنوز به سطح قابل توجهی نرسیدهاند. گزارشها نشان میدهد که مدل داخلی اپل موسوم به Ajax در تستها عملکردی ضعیفتر از ChatGPT و Gemini داشته است.
کارشناسان انتظار دارند اپل در کنفرانس توسعهدهندگان WWDC 2025 جزئیات بیشتری درباره استراتژیهای هوش مصنوعی خود ارائه کند.
پیشتازی گوگل و متا
در مقابل، گوگل با معرفی Gemini 1.5 و متا با عرضه مدل Llama 3 توانستهاند کیفیت و کاربردپذیری هوش مصنوعی خود را بهبود بخشند. گوگل همچنین در زمینه ادغام هوش مصنوعی با موتور جستوجو و ابزارهای تولید محتوا موفقتر عمل کرده است.
نتیجهگیری
مایکروسافت و اپل برای تثبیت جایگاه خود در حوزه هوش مصنوعی تحت فشار فزایندهای قرار دارند. در حالی که این دو شرکت بیشتر بر ادغام هوش مصنوعی با سیستمهای موجود تمرکز کردهاند، رقبای آنها سرمایهگذاری سنگینی بر توسعه مدلهای پیشرفتهتر انجام دادهاند.
موفقیت آینده مایکروسافت و اپل به توانایی آنها در رفع سریع مشکلات و ارائه محصولات کاربرپسند بستگی دارد.
هوش مصنوعی دیگر صرفاً یک ابزار پیشرفته نیست؛ به همدم و راهنمایی برای انسانها تبدیل شده که به حل چالشهای روانی و سازماندهی زندگی کمک میکند. تحلیلهای جدید نشان میدهد این فناوری فراتر از مرزهای تکنولوژی رفته و به ابزاری تاثیرگذار در کشف هدف و افزایش خلاقیت بدل شده است.
یافتههای تحقیق
بر اساس مطالعهای که مارک زائو-ساندرز برای هاروارد بیزینس ریویو انجام داده، با تحلیل هزاران پست انجمنی، سه کاربرد اصلی هوش مصنوعی در سال ۲۰۲۵ مشخص شده است:
درمانگری و همراهی
سازماندهی زندگی
یافتن هدف
این نتایج نشان میدهد که هوش مصنوعی به ابزاری کلیدی برای مدیریت احساسات و زندگی شخصی تبدیل شده است.
نکات کلیدی
حمایت عاطفی در صدر: درمانگری و همراهی توسط هوش مصنوعی به جایگزینی نسبی برای کمبود خدمات سلامت روان تبدیل شده است.
کاهش محبوبیت جستجو: محبوبیت جستجوی مبتنی بر هوش مصنوعی ۱۰ رده کاهش یافته که احتمالاً بهدلیل ادغام "جمینای" (Gemini) در جستجوی گوگل است.
یادگیری و خلاقیت همچنان پایدار: کاربردهایی مانند تقویت یادگیری، تولید کد و خلاقیت هنری همچنان در میان کاربران محبوبیت بالایی دارند.
دغدغههای اخلاقی: استفاده بیش از حد از هوش مصنوعی ممکن است منجر به افزایش احساس تنهایی و تضعیف روابط انسانی شود.
تحلیل روندها
۱. سلامت روان در اولویت: بحران تنهایی و کمبود بودجه خدمات روانشناختی باعث شده که هوش مصنوعی به ابزاری جذاب برای آموزش ذهنآگاهی و رفتاردرمانی شناختی تبدیل شود.
۲. سازماندهی زندگی: دستیاران دیجیتال مبتنی بر هوش مصنوعی مدیریت وظایف، زمانبندی و برنامهریزی روزانه را متحول کردهاند.
۳. یافتن هدف: الگوریتمها با تحلیل علایق و ارزشهای افراد، آنها را در تعیین اهداف شخصی یاری میکنند.
چالشها و هشدارها
جایگزینی روابط انسانی: افراط در استفاده از هوش مصنوعی میتواند ارتباطات انسانی را تضعیف کند.
خطاهای الگوریتمی: اتکای کامل به توصیههای هوش مصنوعی ممکن است منجر به تصمیمگیریهای نادرست شود.
امنیت دادهها: ذخیره اطلاعات حساس روانی، نگرانیهای جدی درباره حریم خصوصی ایجاد کرده است.
ردهبندی ۱۰ کاربرد برتر هوش مصنوعی در سال ۲۰۲۵
رتبه کاربرد دستهبندی
۱ درمانگری و همراهی حمایت
۲ سازماندهی زندگی حمایت
۳ یافتن هدف حمایت
۴ تقویت یادگیری آموزش
۵ تولید کد کمک فنی
۶ تولید ایدهها تولید محتوا
۷ سرگرمی و تفریح خلاقیت
۸ بهبود کد کمک فنی
۹ خلاقیت هنری تولید محتوا
۱۰ زندگی سالم حمایت
چشمانداز آینده
پیشبینی میشود هوش مصنوعی نقش پررنگتری در حوزههایی چون پزشکی شخصیسازیشده و آموزش تطبیقی ایفا کند. با این حال، تنظیم مقررات اخلاقی و افزایش شفافیت الگوریتمها به چالشهای مهمی برای توسعه این فناوری تبدیل خواهد شد. نمونههایی همچون Woebot و Replika که با گفتوگوهای متنی به ارائه مشاوره میپردازند، از کاربردهای اولیهی این روند هستند.
مدل جدید DeepSeek R2 با معماری پیشرفته و هزینهای ۹۷ درصد کمتر نسبت به مدلهای پیشرفتهای چون GPT-4 بهزودی معرفی میشود.
یک افشاگر چینی اعلام کرده است که استارتاپ دیپسیک (DeepSeek) در آستانه رونمایی از مدل جدید خود به نام DeepSeek R2 قرار دارد. پس از موفقیت مدل R1، که نشان داد چین در توسعه مدلهای پیشرفته هوش مصنوعی عقب نمانده است، مدل R2 میتواند بار دیگر توجهات جهانی را به خود جلب کند.
این مدل از معماری ترکیبی Mixture of Experts (MoE) بهره میبرد؛ نسخهای پیشرفتهتر از معماریهای فعلی که احتمالا شامل مکانیزمهای گیتینگ هوشمند یا ترکیبی از لایههای MoE و Dense برای بهینهسازی پردازشهای سنگین خواهد بود.
DeepSeek R2 با ۱.۲ تریلیون پارامتر عرضه خواهد شد؛ عددی که آن را در سطح مدلهایی چون GPT-4 Turbo و Gemini 2.0 Pro قرار میدهد. همچنین هزینه پردازش در R2 به میزان قابل توجهی کمتر است: حدود ۰.۰۷ دلار برای یک میلیون توکن ورودی و ۰.۲۷ دلار برای یک میلیون توکن خروجی. این کاهش هزینه میتواند R2 را به گزینهای بسیار مقرونبهصرفه برای سازمانها و کسبوکارها تبدیل کند.
از دیگر نکات قابل توجه، استفاده از خوشه پردازشی مبتنی بر تراشه Ascend 910B شرکت هواوی با توان پردازشی ۵۱۲ پتافلاپس (با دقت FP16) است. این امر نشان میدهد دیپسیک توانسته زنجیره تأمین هوش مصنوعی خود را بهطور کامل بر منابع داخلی متکی کند.
لازم به ذکر است که این اطلاعات هنوز به صورت رسمی تأیید نشدهاند و احتمال تغییر در مشخصات نهایی وجود دارد.
هوش مصنوعی مولد در سال ۲۰۲۵ نقش پررنگتری در حمایت روانی، سازماندهی زندگی و حتی افزایش اعتماد به نفس افراد ایفا کرده و انتظار میرود این روند در سالهای آینده نیز ادامه یابد.
مارک زائو-ساندرز در تحلیلی برای Harvard Business Review با بررسی هزاران پست منتشرشده در انجمنهای آنلاین طی سال گذشته، روند تغییر کاربری هوش مصنوعی مولد را ارزیابی کرده است.
طبق این گزارش، در سال ۲۰۲۵ سه کاربرد اصلی هوش مصنوعی شامل «درمان و همصحبتی»، «سازماندهی زندگی» و «یافتن هدف» شده است؛ موضوعاتی که همگی در حوزه حمایت عاطفی و روانی قرار میگیرند و نسبت به سال گذشته رشد چشمگیری داشتهاند.
این دادهها نشان میدهد کاربران به جای تمرکز صرف بر تولید محتوا یا جستجوی اطلاعات، بیش از پیش از هوش مصنوعی برای مدیریت احساسات، زندگی شخصی و مسائل روانی خود استفاده میکنند.
در مقابل، کاربردهایی مانند «تولید ایده»، «جستجوی خاص» و «ویرایش متن» که در سال ۲۰۲۴ در صدر استفادهها قرار داشتند، جای خود را به کاربردهای حمایتی دادهاند.
علاوه بر این، حوزههایی همچون «تولید کد» و «ایجاد تصاویر» نیز با رشد قابل توجهی مواجه شدهاند. این تحولات نشاندهنده بلوغ کاربران و حرکت از بهرهگیریهای فنی و بهرهوری به سمت استفادههای انسانیتر و شخصیتر از هوش مصنوعی است.
به طور کلی، پیشبینی میشود که هوش مصنوعی مولد در آیندهای نزدیک، نقش مهمتری در بهبود کیفیت زندگی افراد ایفا کند و به ابزاری برای حمایت عاطفی و روانی تبدیل شود.
نسخهی سبکتری از ابزار Deep Research را با نام o4-mini برای کاربران رایگان ChatGPT منتشر کرد. این نسخه با پاسخهای کوتاهتر و محدودیت پنج پرسش در ماه، در دسترس عموم قرار گرفته است.
گسترش دسترسی به دیپ ریسرچ
به گزارش تکناک، این تصمیم در راستای گسترش دسترسی عمومی به فناوریهای تحقیقاتی OpenAI اتخاذ شده است تا کاربران بیشتری امکان استفاده از قابلیتهای پژوهشی عمیق را داشته باشند.
حدود دو ماه پیش، OpenAI ابزار دیپ ریسرچ را معرفی کرد؛ دستیار هوشمندی که با جستوجو در صدها منبع اینترنتی، اطلاعات را جمعآوری، تحلیل و ترکیب کرده و گزارشی جامع با ذکر منابع معتبر ارائه میدهد. ابتدا، این ابزار فقط برای کاربران اشتراکی (Plus، Team، Edu و Enterprise) فعال شده بود و سطح دسترسی بسته به نوع اشتراک متفاوت بود.
معرفی نسخه سبک بر پایه مدل جدید
طبق گزارش نئووین، نسخه اصلی دیپ ریسرچ بر پایه مدل پیشرفته o3 توسعه یافته که بهطور ویژه برای مرور وب و تحلیل دادهها طراحی شده است. این مدل توانایی پاسخگویی به سؤالات پیچیده و تحلیلهای تخصصی را دارد.
نسخه سبکتر جدید با موتور o4-mini عرضه شده که با هدف کاهش هزینههای پردازشی و تسهیل ارائه خدمات تحقیقاتی برای تعداد بیشتری از کاربران توسعه یافته است. اگرچه پاسخهای این نسخه نسبت به نسخه کامل کوتاهتر هستند، OpenAI تأکید کرده است که همچنان «بخش زیادی از عمق و کیفیت» نسخه اصلی حفظ شده است.
جزئیات دسترسی کاربران
نسخه سبک دیپ ریسرچ اکنون برای کاربران سرویسهای:
Plus
Team
Pro
فعال شده و کاربران رایگان نیز به آن دسترسی دارند.
OpenAI اعلام کرده است که کاربران سازمانی و آموزشی نیز بهزودی به نسخه سبک دسترسی پیدا خواهند کرد و سهمیهای مشابه کاربران Team خواهند داشت.
قدمی دیگر به سوی دموکراتیزهکردن تحقیق آنلاین
با این اقدام، OpenAI گامی دیگر در مسیر عمومیتر کردن فناوریهای پیشرفته هوش مصنوعی برداشته و امکان انجام تحقیقات دقیق و مستند را برای طیف وسیعتری از کاربران فراهم کرده است.
نزدیک به یک سال پس از معرفی، مایکروسافت سرانجام قابلیت جنجالی Recall را بهطور عمومی عرضه کرد. این ویژگی تنها روی رایانههای Copilot Plus که به نسل جدید ویندوز ۱۱ تعلق دارند، در دسترس خواهد بود.
Recall چگونه کار میکند؟
قابلیت Recall بهطور مداوم از فعالیتهای کاربر اسکرینشات میگیرد، محتوای متنی را استخراج و همه دادهها را در پایگاه دادهای قابل جستوجو ذخیره میکند. همین عملکرد، نگرانیهای جدی درباره امنیت و حریم خصوصی ایجاد کرده است؛ چرا که افراد با دسترسی به این پایگاه داده، میتوانند به تقریباً تمام فعالیتهای کاربر روی رایانه دسترسی پیدا کنند.
عرضه اولیه Recall با واکنشهای تند و مشکلات امنیتی متعددی روبهرو شد. مایکروسافت در مسیر عرضه این ویژگی، بارها با انتقادهای شدید مواجه شد و ناچار به بازنویسی کدها، افزودن فیلترهای محتوایی و پنج ماه آزمایش در برنامه Windows Insider شد.
اقدامات مایکروسافت برای رفع نگرانیها
آزمایشهای منابع معتبری مانند ArsTechnica و پژوهشگران امنیتی نشان میدهد که مایکروسافت بسیاری از ضعفهای امنیتی Recall را برطرف کرده است. با این حال، فیلترهای محتوایی اضافهشده همچنان عملکردی کاملاً یکنواخت ندارند.
نکته مهم اینکه Recall اکنون بهصورت پیشفرض غیرفعال است و فعالسازی آن تنها با انتخاب کاربر انجام میشود. همچنین، امکان حذف کامل این قابلیت نیز وجود دارد.
دیگر قابلیتهای جدید در Copilot Plus
بهروزرسانی جدید علاوه بر Recall، چند ویژگی جدید دیگر را نیز برای رایانههای Copilot Plus به ارمغان آورده است:
نسخهی جدید ابزار جستجوی ویندوز با توانایی درک بهتر معنای کلمات و عبارات، که جستجو را طبیعیتر و شهودیتر میکند.
معرفی قابلیت Click to Do که امکان کپی متن از تصاویر، جستجو روی صفحه و خلاصهسازی یا بازنویسی سریع محتوا را فراهم میکند. این ابزار با فشردن کلید Windows و کلیک روی صفحه فعال میشود.
پیشنیازهای سختافزاری
برای استفاده از قابلیتهای Copilot Plus، رایانه باید دارای واحد پردازش عصبی (NPU) با توان بالای ۴۰ تریلیون عملیات در ثانیه (TOPS) باشد. این مشخصات امکان اجرای محلی مدلهای هوش مصنوعی را بدون نیاز به ارسال داده به سرورهای مایکروسافت فراهم میکند.
در حال حاضر، پردازندههای پشتیبانیکننده شامل:
اسنپدراگون ایکس الیت و پلاس از کوالکام
سری Core Ultra 200V اینتل (با کد Lunar Lake)
سری Ryzen AI 300 از AMD
هستند.
برخی قابلیتهای Click to Do فعلاً تنها برای رایانههای مبتنی بر آرم در دسترس است، در حالی که قابلیتهای Recall و جستجوی بهبودیافته برای هر دو پلتفرم آرم و x86 قابل استفاده خواهند بود.
مدلهای جدید هوش مصنوعی OpenAI حالا میتوانند موقعیت مکانی عکسها را تنها از روی جزئیات تصویری با دقتی چشمگیر شناسایی کنند. قابلیتی که به گفته OpenAI «گامی بزرگ در درک بصری ماشین» است، اکنون در نسخههای جدید ChatGPT نیز در دسترس کاربران قرار گرفته و تحولی تازه در کاربردهای عمومی هوش مصنوعی ایجاد کرده است.
تحلیل بصری با زنجیره استدلال
در این قابلیت که به نوعی «جستجوی معکوس موقعیت» (reverse geo-location) تلقی میشود، کاربران میتوانند تصویر دلخواه خود را بارگذاری کرده و از ChatGPT بخواهند محل ثبت آن را حدس بزند. مدل با تحلیل دقیق عناصر موجود در تصویر، از تابلوها و علائم گرفته تا جزئیات معماری و متادیتای آشکار، نتیجهای همراه با استدلال منطقی ارائه میدهد.
در یکی از نمونههای جالب، کاربری به نام «Yumi» در شبکه اجتماعی X، تصویری از کتابی در یک کتابخانه منتشر کرد. مدل فقط با استفاده از کدی روی برچسب کتاب، مکان دقیق را شناسایی کرد: دانشگاه ملبورن. در مثالی دیگر، تصویری از خانهای در سورینام (احتمالاً از Google Earth) نیز بهدرستی توسط مدل مکانیابی شد.
مدل جدید o3 عملکرد دقیقتری دارد
مدل جدید OpenAI با نام o3 عملکردی بهمراتب بهتر از نسخه پیشین GPT-4o دارد. در تستی که توسط خبرنگاران انجام شد، از هر دو مدل خواسته شد تا محل ثبت تصویر خودروی الکتریکی جدید سوبارو را تشخیص دهند.
GPT-4o موفق شد بهصورت تقریبی مکان را شناسایی کرده و به درستی به سه شهر بزرگ آمریکا (نیویورک، لسآنجلس، شیکاگو) اشاره کند. اما در نام خودرو دچار خطا شد و آن را به اشتباه «Trailspeed» معرفی کرد.
در مقابل، مدل o3 پس از حدود ۱ دقیقه و ۴۰ ثانیه تحلیل، پاسخ دقیقتری ارائه داد: «کراساوور آبی رنگ، مدل Trailseeker ۲۰۲۶، معرفیشده در نمایشگاه بینالمللی خودروی نیویورک ۲۰۲۵ در مرکز همایشهای Jacob Javits منهتن.»
این مدل با بررسی تطبیقی طراحی غرفه نمایشگاه، حضور خودرو و اطلاعات وبسایت رسمی سوبارو، استنتاج کرد که مکان تصویر دقیقاً نمایشگاه نیویورک بوده است.
فناوریای با تبعات گسترده
هرچند ابزارهای مکانیابی تصویری پیشتر نیز وجود داشتند، اما ورود این قابلیت به مدل عمومی ChatGPT و دسترسی کاربران عادی به آن، نقطه عطفی در فراگیر شدن این نوع فناوری محسوب میشود.
در کنار کاربردهای مثبت در سفر، آموزش، یا جستجوی محتوای بصری، نگرانیهایی نیز درباره حریم خصوصی و امکان ردیابی ناخواسته موقعیتها مطرح شده است. کارشناسان میگویند توجه به ملاحظات اخلاقی در توسعه این نوع فناوریها، بیش از گذشته ضروری بهنظر میرسد.
شرکت ادوبی امروز از نسخههای جدید مدلهای هوش مصنوعی تصویرساز Firefly رونمایی کرد. این مدلها اکنون توانایی تولید تصاویری بسیار باکیفیت، پیچیده و با جزئیات بالا را دارند و در کنار آن، نسخهی تازهای از وباپلیکیشن Firefly نیز معرفی شده است که دسترسی به این مدلها را برای کاربران فراهم میکند.
طبق اعلام ادوبی، مدل جدید Firefly Image Model 4 نسبت به نسلهای قبل، در مواردی چون کیفیت خروجی، سرعت پردازش، و میزان کنترل بر ساختار و سبک تصویر، زوایای دوربین و زوم ارتقا یافته و قادر است تصاویر با وضوح تا 2K تولید کند.
همچنین نسخهی پیشرفتهتری با نام Image Model 4 Ultra نیز معرفی شده که میتواند صحنههای پیچیده با عناصر ریز و جزئیات فراوان را خلق کند.
قابلیتهای کلیدی مدلهای جدید Firefly:
خلق تصاویر با جزئیات بالا و ساختار پیچیده
تولید متن در تصاویر با دقت و وضوح بیشتر
امکان کنترل زوایای دوربین و سبک بصری
وضوح تصویر تا 2K
دسترسی به مدل از طریق وباپلیکیشن جدید Firefly
به گفتهی الکساندر کاستین، معاون هوش مصنوعی مولد ادوبی، مدلهای جدید با سطح بالاتری از منابع محاسباتی آموزش دیدهاند تا بتوانند نتایجی دقیقتر و نزدیکتر به خواست کاربران ارائه دهند.
مدل ویدیویی Firefly و دسترسی گستردهتر
ادوبی همچنین اعلام کرده مدل ویدیویی Firefly که پیشتر در نسخه بتا عرضه شده بود، اکنون بهصورت عمومی در دسترس قرار گرفته است. کاربران میتوانند با استفاده از دستورات متنی یا تصویری، کلیپهای کوتاه بسازند و عناصر بصری مانند زاویهی دوربین را نیز تنظیم کنند.
وباپلیکیشن Firefly حالا امکان استفاده از مدلهای تصویری شرکتهای دیگر نظیر OpenAI، Imagen 3 و Veo 2 از گوگل را نیز فراهم کرده است. کاربران میتوانند بنا به نیاز، از میان این مدلها یکی را انتخاب و استفاده کنند.
قابلیتهای جدید دیگر:
Firefly Boards: ابزاری برای ایدهپردازی بصری کاربران
انتشار عمومی APIهای Text-to-Image و آواتارسازی
ارائهی نسخه بتای API جدید Text-to-Video
ادوبی تأکید کرده که مدلهای بیشتری در آینده به این پلتفرم اضافه خواهد شد تا قدرت انتخاب و خلاقیت کاربران افزایش یابد.
پژوهشگران با بهرهگیری از نور بهجای جریان برق، موفق به توسعه پلتفرمی نوآورانه برای شتابدهی به هوش مصنوعی شدهاند؛ پلتفرمی که میتواند تحولی بنیادین در آینده این فناوری ایجاد کند.
به نقل از SciTechDaily، دانشمندان با طراحی سامانهای مبتنی بر مدارهای مجتمع فوتونی (Photonic Integrated Circuits - PIC) از نیمهرساناهای پیشرفته III-V، موفق شدهاند به سطحی از بهرهوری انرژی و سرعت پردازش دست یابند که بهمراتب از پردازندههای گرافیکی سنتی فراتر میرود.
فوتونیک؛ گزینهای برتر برای آینده هوش مصنوعی
در مقالهای منتشرشده در نشریه IEEE Journal of Selected Topics in Quantum Electronics، پژوهشگران پلتفرمی فوتونی معرفی کردهاند که با ترکیب سیلیکون و نیمهرساناهای III-V، بهصورت ویژه برای شتابدهندههای هوش مصنوعی طراحی شده است. این پلتفرم برخلاف سامانههای متداول الکترونیکی که از جریان برق بهره میبرند، بر پایهی نور عمل میکند و از شبکههای عصبی نوری برای پردازش اطلاعات استفاده میکند.
دکتر باسم طسّون، پژوهشگر ارشد در آزمایشگاههای هیولت پاکارد، میگوید:
«فناوری ما از طریق ترکیب فوتونیک سیلیکونی و نیمهرساناهای III-V، بستری فراهم میکند که هم از نظر مقیاسپذیری و هم کارایی انرژی، فراتر از آن چیزی است که سامانههای مبتنی بر سیلیکون قادر به ارائه آن هستند.»
فرآیند ساخت و مزایای کلیدی
ساخت این پلتفرم از ویفرهای SOI (سیلیکون-روی-عایق) آغاز شده و با تکنیکهایی نظیر لیتوگرافی، حکاکی خشک، دوپینگ دقیق و رشد انتخابی سیلیکون و ژرمانیوم ادامه یافته است. سپس نیمهرساناهایی مانند InP یا GaAs روی ویفر سیلیکونی متصل شدهاند تا لیزرها و تقویتکنندههای نوری بهطور یکپارچه در تراشه گنجانده شوند.
این فرآیند منجر به ساخت تراشههایی کاملاً فوتونی شده که شامل تمام اجزای لازم برای اجرای شبکههای عصبی نوری هستند؛ از جمله لیزرهای درونتراشهای، مدولاتورها، تقویتکنندهها، آشکارسازهای نوری و فازشیفترهای غیرفرار.
انقلابی در بهرهوری انرژی
به گفته دکتر طسّون، شتابدهندههای ساختهشده با این پلتفرم میتوانند تا ۲۹۰ برابر بهرهوری انرژی بیشتری نسبت به سایر پلتفرمهای فوتونی و ۱۴۰ برابر بهرهوری بالاتری نسبت به بهترین سامانههای دیجیتال الکترونیکی فعلی داشته باشند.
آیندهای روشن برای محاسبات نوری
این فناوری نهتنها موجب کاهش چشمگیر مصرف انرژی در پردازشهای سنگین هوش مصنوعی میشود، بلکه زمینهساز شکلگیری نسل جدیدی از سامانههای هوشمند نوری در مراکز داده، دستگاههای لبهای و کاربردهای پیشرفته صنعتی خواهد بود.
این دستاورد بیتردید یکی از نقاط عطف مهم در مسیر تکامل سختافزار هوش مصنوعی بهشمار میرود.
شرکت xAI رسماً از افزودن قابلیت جدیدی به چتبات هوش مصنوعی خود خبر داد: Grok Vision. این قابلیت به Grok امکان میدهد تصاویر محیط اطراف را از طریق دوربین گوشی شناسایی و تحلیل کند.
کاربران میتوانند با استفاده از دوربین گوشی خود، آن را به سمت اشیاء، تابلوها، اسناد یا هر محتوای دیداری دیگر بگیرند و سوالاتی درباره آن بپرسند. Grok پاسخ را با تحلیل بلادرنگ تصویر ارائه میدهد. این قابلیت فعلاً بهصورت انحصاری برای کاربران iOS عرضه شده و هنوز برای نسخه اندروید در دسترس نیست.
GROK میبیند آنچه تو میبینی—دقیقاً!
در توییتی از Mario Nawfal آمده:
«حالت صوتی Grok با دسترسی به دوربین گوشی، به کاربر اجازه میدهد تا از آن بپرسد: “من دارم به چی نگاه میکنم؟”»
قابلیت Grok Vision از لحاظ عملکرد مشابه امکانات دیداری در مدلهای پیشرفتهی Gemini گوگل و ChatGPT OpenAI است و رقابت در حوزهی هوش مصنوعی مولد با قدرت درک بصری را وارد مرحلهای تازه کرده است.
دیگر ویژگیهای جدید Grok
در کنار Grok Vision، xAI قابلیتهای زیر را نیز به این چتبات افزوده است:
پشتیبانی صوتی چندزبانه (از جمله اسپانیایی، فرانسوی، ترکی، ژاپنی، هندی)
جستوجوی بلادرنگ در حالت صوتی
این ویژگیها در حال حاضر تنها در نسخه اندروید برای مشترکین پلن ۳۰ دلاری SuperGrok فعال هستند.
xAI در ماههای اخیر روند توسعهی Grok را با سرعت بالا ادامه داده است. از جمله بهروزرسانیهای پیشین میتوان به:
امکان استفاده از حافظه برای بازیابی اطلاعات مکالمات قبلی
افزودن ابزاری شبیه بوم دیجیتال برای ایجاد اسناد و اپلیکیشنها
اشاره کرد.
Grok: نه فقط شنونده، بلکه بینندهای تحلیلگر
افزودن قابلیت Grok Vision، چتبات Grok را از یک دستیار صرف گفتوگویی فراتر برده است؛ این هوش مصنوعی اکنون میتواند دنیای واقعی را "ببیند" و "درک کند". گامی بزرگ به سمت ادغام هوش مصنوعی با زندگی روزمره که میتواند نحوه تعامل انسان با فناوری را متحول کند.
پس از اعمال محدودیتهای صادراتی از سوی ایالات متحده، گزارشهایی منتشر شده که نشان میدهد شرکت انویدیا در حال بررسی امکان همکاری با استارتاپ چینی دیپسیک برای تولید تراشههای سفارشی هوش مصنوعی در چین است.
وزارت بازرگانی آمریکا اخیراً صادرات تراشههای H20 انویدیا را به چین مشروط به دریافت مجوزهای خاص کرده است. حال، طبق گزارشی از نشریه Ctee، انویدیا ممکن است با هدف دور زدن این محدودیتها، به طراحی تراشههایی ویژه و با تکیه کامل بر زنجیره تأمین داخلی چین روی بیاورد.
گفته میشود در صورت اجرایی شدن این همکاری، انویدیا از زیرساختهایی نظیر حافظههای HBM، فرآیندهای تولید بومی و امکانات بستهبندی داخلی استفاده خواهد کرد. همچنین احتمال راهاندازی یک مرکز تحقیق و توسعه در خاک چین نیز مطرح شده است.
فشارهای سیاسی و نگرانیهای امنیتی
ایالات متحده نگران است از تراشههای انویدیا برای توسعه ابرکامپیوترها و برنامههای پیشرفته نظامی در چین استفاده شود. تراشههای H20 که مختص بازار چین طراحی شدهاند، قدرت پردازشی کمتری نسبت به مدلهای دیگر دارند، اما همچنان تقاضای زیادی در میان شرکتهای چینی برای استفاده در آموزش مدلهای هوش مصنوعی و دیتاسنترها دارند.
چین در حال حاضر یکی از بزرگترین بازارهای انویدیا به شمار میرود؛ بهطوری که حدود ۱۳ درصد از کل فروش سال مالی گذشته این شرکت به چین اختصاص داشته است. همچنین انویدیا در سال جاری موفق به انعقاد قراردادهایی به ارزش ۱۸ میلیارد دلار برای فروش تراشههای H20 در چین شده بود؛ هرچند با توجه به محدودیتهای جدید، آینده این قراردادها در هالهای از ابهام قرار دارد.
انویدیا هشدار داده که این محدودیتها ممکن است زیانی بالغ بر ۵.۵ میلیارد دلار برای این شرکت به همراه داشته باشد.
در حال حاضر همکاری انویدیا با دیپسیک تنها در حد گمانهزنی رسانهای است و هیچگونه تأیید رسمی از سوی شرکتها منتشر نشده است. با توجه به تنشهای سیاسی میان واشنگتن و پکن، حتی در صورت تمایل انویدیا به این همکاری، جلب رضایت نهادهای نظارتی آمریکایی یک مانع جدی خواهد بود.
شرکت متا اعلام کرده است که دامنهی استفاده از هوش مصنوعی برای شناسایی کاربران نوجوان و مقابله با ثبتنامهای جعلی سن را گسترش داده است. این اقدام در راستای افزایش ایمنی فضای مجازی برای کاربران کمسن، بهویژه در پلتفرمهایی مانند اینستاگرام صورت گرفته است.
به گزارش خبرنگار فناوری ایونا به نقل از خبرگزاری برنا و به استناد وبسایت Interesting Engineering، متا توضیح داده که الگوریتمهای هوش مصنوعی این شرکت با بررسی علایق کاربران، اطلاعات موجود در پروفایل و تاریخ ایجاد حساب، میتوانند سن تقریبی کاربران را تخمین بزنند. در مواردی که سیستم به این نتیجه برسد که کاربری نوجوان است، حتی اگر سن او هنگام ثبتنام بهدرستی اعلام نشده باشد، حساب بهصورت خودکار به «حساب نوجوان» تغییر وضعیت داده میشود.
این حسابها مشمول محدودیتهای ایمنی ویژهای خواهند بود؛ از جمله:
خصوصی بودن حساب بهصورت پیشفرض
محدودیت در پیامرسانی، تنها به مخاطبانی که پیشتر تعامل داشتهاند
محدودسازی دسترسی به محتوای حساس مانند ویدیوهای خشونتآمیز یا تبلیغات مرتبط با جراحیهای زیبایی
متا هدف از این اقدام را حفظ امنیت نوجوانان و تجربهای امنتر برای کاربران جوان در فضای مجازی عنوان کرده است.
مدل هوش مصنوعی جدید OpenAI با نام O3 که در آذرماه ۱۴۰۳ رونمایی شد، برخلاف ادعای اولیه شرکت، در ارزیابیهای مستقل نتوانسته عملکرد چشمگیری از خود نشان دهد.
در زمان معرفی، OpenAI اعلام کرده بود که O3 قادر است به بیش از ۲۵ درصد سؤالات چالشبرانگیز ریاضی مجموعه FrontierMath پاسخ صحیح دهد؛ رقمی قابل توجه که آن را بالاتر از بسیاری از مدلهای هوش مصنوعی موجود قرار میداد. اما بررسیهای جدید مؤسسه مستقل Epoch AI، این ادعا را زیر سؤال برده است.
طبق گزارش Epoch، مدل O3 تنها حدود ۱۰ درصد از سؤالات FrontierMath را با موفقیت پاسخ داده است؛ رقمی بسیار کمتر از آنچه OpenAI در ابتدا مطرح کرده بود.
این اختلاف فاحش، بار دیگر بحثهایی را درباره شفافیت ارزیابیها و روشهای بنچمارکگیری شرکتهای توسعهدهنده هوش مصنوعی به راه انداخته است. گمان میرود نسخهای که در بنچمارکهای اولیه استفاده شده، با نسخه عمومی منتشرشده تفاوت داشته و از منابع پردازشی بیشتری برخوردار بوده است.
تفاوت نسخه عمومی و نسخه بنچمارک
بنیاد ARC Prize نیز در واکنش به این موضوع اعلام کرد که نسخه عمومی مدل O3 با آنچه در بنچمارکهای اولیه استفاده شده تفاوت دارد. به گفته این بنیاد، مدل نهایی برای کاربردهای روزمره مانند چت و تولید متن بهینهسازی شده و عملکرد روانتری در دنیای واقعی دارد، هرچند که در آزمونهای سنگین ریاضی، امتیاز کمتری کسب میکند.
واکنش OpenAI
OpenAI نیز در بیانیهای تأیید کرد که برای بهینهسازی هزینه و سرعت پاسخدهی، مدل O3 دستخوش تغییراتی شده و همین موضوع میتواند منجر به تفاوت عملکرد در ارزیابیها شود. این شرکت همچنین وعده داده که بهزودی نسخه پیشرفتهتری از این مدل با نام O3-Pro را منتشر خواهد کرد.
ماجرای اختلاف عملکرد مدل O3 نشان میدهد که بنچمارکهای هوش مصنوعی، بهویژه زمانی که توسط شرکتهای توسعهدهنده منتشر میشوند، همیشه معیار قابل اعتمادی نیستند. در شرایط رقابتی فعلی، گاهی شرکتها برای جلب توجه، بخشی از واقعیت را با گزینشهای خاص به نمایش میگذارند.
هوش مصنوعی گراک (Grok)، چتبات توسعهیافته توسط استارتاپ xAI متعلق به ایلان ماسک، حالا به قابلیتی تازه به نام Vision مجهز شده است؛ ابزاری که میتواند تصاویر را «ببیند»، متنهای داخل آنها را تشخیص دهد و ترجمهی لحظهای و دقیق ارائه دهد.
گام جدید در مسیر یادگیری زبان با هوش مصنوعی
قابلیت Vision به کاربران امکان میدهد با گرفتن عکس از نوشتههایی مانند تابلوها، منوها یا بستهبندیها، نهتنها ترجمهای آنی از آن متن دریافت کنند، بلکه توضیحاتی تکمیلی دربارهی مفهوم و کاربرد آن نیز ببینند. این ویژگی میتواند فرآیند یادگیری و تمرین زبانهای خارجی را برای زبانآموزان در دنیای واقعی بسیار سادهتر کند.
پشتیبانی از ۲۷۰ زبان با پاسخهای شخصیسازیشده
گراک با پشتیبانی از بیش از ۲۷۰ زبان و بهرهگیری از الگوریتمهای یادگیری تطبیقی، پاسخهایی ارائه میدهد که با نیاز و سطح دانش هر کاربر هماهنگ هستند. این یعنی چه برای یک زبانآموز مبتدی و چه برای کاربر حرفهای، تجربهای کارآمد و متناسب فراهم خواهد شد.
قابلیت هنوز در دسترس همه نیست
با اینکه این قابلیت نوآورانه معرفی شده، اما فعلاً بهصورت عمومی برای تمامی کاربران فعال نشده و انتظار میرود بهتدریج در اختیار کاربران منتخب قرار گیرد.
توسعههای قبلی Grok
پیش از این نیز Grok به ابزارهایی مانند Grok Studio برای تولید و ویرایش اسناد و اپلیکیشنهای ساده مجهز شده بود؛ حرکتی دیگر در راستای ساخت پلتفرمی جامع برای کاربران شخصی و حرفهای.