دنیای هوش مصنوعی در یک هفته: از دستیار بازی ایکس‌باکس تا پلتفرم ملی هوش مصنوعی ایران

زمان تقریبی مطالعه 5 دقیقه

دنیای هوش مصنوعی در یک هفته: از دستیار بازی ایکس‌باکس تا پلتفرم ملی هوش مصنوعی ایران

سلام به همراهان همیشگی! امیدوارم حالتون عالی باشه.
امروز شنبه است و با یک خبر هفتگی دیگه اومدیم تا نگاهی بندازیم به دنیای پرشتاب هوش مصنوعی و تکنولوژی و ببینیم چه اتفاقات مهمی در هفته گذشته رخ داده.
هفته‌ای که گذشت، پر بود از خبرهای جذاب، مخصوصاً از طرف گوگل. پس بدون معطلی بریم سراغ اصل مطلب. فقط قبلش، لایک، کامنت و سابسکرایب یادتون نره!

فـــهرست مطالبـــــــ

1. دستیار همه‌کاره OpenAI برای ساخت Agentها:

اولین خبر از OpenAI شروع می‌کنیم که ابزار جدیدی رو برای ساخت Agent (عامل) معرفی کرده. با این ابزار، شما می‌تونید Agentهای شخصی‌سازی‌شده خودتون رو بسازید و اون‌ها رو به APIها و امکانات OpenAI متصل کنید. اسم این ابزار ResponseAI API هست و قراره امکانات متنوعی رو در اختیار شما قرار بده تا بتونید با Agentهای خودتون تعامل داشته باشید. در واقع، Agentهای شما می‌تونن با مدل‌های OpenAI ارتباط برقرار کنن.

اما این ابزار چه امکاناتی داره؟ توضیحات کاملی در وب‌سایت OpenAI موجوده که می‌تونید با مراجعه به لینکی که در بخش توضیحات قرار دادیم، اون رو مطالعه کنید (مخصوصاً اگه برنامه‌نویس هستید، نمونه کدها هم ارائه شده). اما به طور خلاصه، امکانات زیر رو در اختیار شما قرار می‌ده:

دسترسی به LLM (مدل‌های زبانی بزرگ): می‌تونید با Agentهای خودتون چت کنید.
جستجوی وب: امکان جستجو در اینترنت رو فراهم می‌کنه (نمونه کدهاش هم موجوده).
جستجوی فایل: می‌تونید داخل فایل‌هایی که روی سیستم آپلود کردید، جستجو کنید.
کنترل کامپیوتر: می‌تونید روی کامپیوتر یک سری اقدامات انجام بدید، مثل باز کردن مرورگر و جستجو در اون.
Agentهای استیکی (Sticky Agents): می‌تونید از Agentهای آماده و استیکی‌های مختلف با قابلیت‌های متنوع استفاده کنید (مثل تقویم، آب‌وهوا و…). این Agentها با قدرت LLMها کار می‌کنن.

2. مدل جدید OpenAI برای مقاله‌نویسی:

خبر بعدی هم از OpenAI هست. به نظر می‌رسه که این شرکت یک مدل جدید رو توسعه داده و آموزش داده که اختصاصاً برای مقاله‌نویسی طراحی شده. سم آلتمن، مدیرعامل OpenAI، هم در توییتر خودش این خبر رو اعلام کرد و یک نمونه از کار این مدل رو به اشتراک گذاشت. این خبر با استقبال‌های متفاوتی روبرو شد.

برخی معتقد بودند که مقاله خیلی خوبه، اما چون با هوش مصنوعی نوشته شده، ارزش کمتری داره. به نظر من، این دیدگاه به مرور زمان تغییر می‌کنه. الان مردم کمی نسبت به محتوای تولیدشده توسط هوش مصنوعی گارد دارن، اما کم‌کم بهش عادت می‌کنیم و دیگه تفاوتی بین محتوای تولیدشده توسط انسان و هوش مصنوعی قائل نمی‌شیم.

3. پیش‌بینی مدیرعامل Anthropic درباره آینده برنامه‌نویسی:

قبل از اینکه بریم سراغ Gemini 3، دو تا خبر کوتاه دیگه رو هم بگیم. مدیرعامل Anthropic این هفته در مصاحبه‌ای اعلام کرد که در ۶ ماه آینده، 90% کدها توسط هوش مصنوعی نوشته می‌شه و در ۱۲ ماه آینده، این رقم به 100% می‌رسه و این باعث نابودی برنامه‌نویسی می‌شه!

نظر شخصی من اینه که به احتمال زیاد، بخش عمده‌ای از کدنویسی به سمت هوش مصنوعی می‌ره. اینکه در ۱۲ ماه بتونیم ۱۰۰% کدها رو با هوش مصنوعی بنویسیم یا نه، نمی‌دونم، ولی احتمالش بالاست. اما نکته مهم اینه که برنامه‌نویسی فقط کدنویسی نیست و جنبه‌های دیگه‌ای هم داره. درسته که هوش مصنوعی داره به این جنبه‌ها هم نفوذ می‌کنه، اما چیزی که من می‌بینم اینه که مدل برنامه‌نویسی و شغل برنامه‌نویسی قراره عوض بشه. برنامه‌نویس‌ها باید خودشون رو با شرایط جدید تطبیق بدن و این غیرقابل انکاره. اما اینکه دقیقاً چه اتفاقی می‌افته، باید صبر کنیم و ببینیم.

4. آواتارهای هوشمند CapCut با حرکات طبیعی:

یکی از مشکلات تولید ویدیو با هوش مصنوعی، مخصوصاً برای شبکه‌های اجتماعی، آواتارها هستن. قبلاً آواتارهایی تولید می‌شدن که هر چقدر هم طبیعی بودن، باز هم اون حس واقعی رو منتقل نمی‌کردن. اما CapCut، همون اپلیکیشنی که برای زیرنویس خودکار ویدیوها استفاده می‌شه، یک به‌روزرسانی جدید برای ابزار آواتار خودش ارائه داده.

این به‌روزرسانی چیه؟ آواتار همزمان که صحبت می‌کنه، لب‌هاش با صدا هماهنگه و حرکات سر و بدنش هم طبیعیه. یعنی مثل یک آدم واقعی که موقع حرف زدن، حرکات بدنش با صحبت‌هاش هماهنگه.

(در اینجا، ویدیویی از آواتار جدید CapCut نمایش داده می‌شود.)

5. معرفی Gemini 3: مدل کوچک اما قدرتمند گوگل:

و اما می‌رسیم به خبر مهم گوگل: معرفی Gemini 3. یک مدل جذاب و کوچک، اما قدرتمند. در تصویر، رتبه‌بندی Chatbot Arena رو می‌بینید که Gemini 3 بعد از DeepSeek-Coder-Instruct، رتبه دوم رو داره. اما نکته مهم چیه؟ DeepSeek-Coder-Instruct با 67.1 میلیارد پارامتر، رتبه اول رو داره، در حالی که Gemini 3 با 27 میلیارد پارامتر، رتبه دوم رو کسب کرده و فقط روی یک GPU H100 (نه کارت گرافیک معمولی، بلکه GPUهای قدرتمند) راه‌اندازی شده. این نشون می‌ده که با سخت‌افزار خیلی کمتری، نتایج بسیار خوبی رو ارائه می‌ده.

Gemini 3 چه ویژگی‌های دیگه‌ای داره؟

چندوجهی (Multimodal): برخلاف Gemini 2 که فقط روی متن کار می‌کرد، Gemini 3 تصویر، صدا و متن رو می‌تونه درک کنه.
کوچک و جمع‌وجور: مدل‌های کوچک‌تری هم داره (1 میلیارد، 4 میلیارد، 12 میلیارد و 27 میلیارد پارامتری) که برای موبایل بهینه‌سازی شدن.
استفاده از مدل تقطیر (Distillation): برای آموزش این مدل، از مدل‌های بزرگ‌تر استفاده شده و پارامترهای پرکاربرد و مهم، به این مدل منتقل شدن.
پشتیبانی از 140 زبان: فارسی هم جزو این زبان‌هاست.

6. به‌روزرسانی‌های جدید گوگل برای Gemini و Google Studio:

اضافه شدن قابلیت تصویرسازی به Gemini در Google Studio: می‌تونید به صورت رایگان از این قابلیت استفاده کنید.
چند نمونه از قابلیت‌های تصویرسازی:
- ساخت نقشه بازی بر اساس آیتم‌های داده‌شده.
- ساخت تصاویر سه‌بعدی و جدید از تصاویر دوبعدی با حفظ ثبات کاراکتر (Consistency).
- حفظ کاراکتر در فریم‌های مختلف انیمیشن.
رایگان شدن برخی قابلیت‌ها: Deep Research (با محدودیت 5 جستجو در روز)، تصویرسازی و Gemini (برای ساخت چت‌بات‌های کوچک تخصصی).

7. رونمایی از سکوی ملی متن‌باز هوش مصنوعی ایران:

یک خبر هم از ایران بگیم. به نظر می‌رسه که “سکوی ملی متن‌باز هوش مصنوعی ایران” داره رونمایی می‌شه. اسمش کمی پرطمطراقه، اما کاری که داره انجام می‌شه، کار درست و خوبیه. همه کشورها در دنیا باید پلتفرم هوش مصنوعی خودشون رو داشته باشن؛ سرویس‌هایی که مبتنی بر فرهنگ، زبان و نیازهای اون کشور باشه.

اما این پلتفرم چه کاری انجام می‌ده؟ قراره یک پلتفرم داخلی باشه که هوش مصنوعی‌های مختلف (از جمله هوش مصنوعی‌های اختصاصی ایرانی) در اون قرار بگیرن و کسب‌وکارهای ایرانی بتونن از اون استفاده کنن (بدون نگرانی از تحریم و…). احتمالاً اطلاعات اقتصادی و فارسی هم برای این پلتفرم، Fine-tune شده باشه.

بهار 1404: آغاز تست بهینه‌سازی محصول.
تابستان 1404: دسترسی دانشگاهی.
شهریور 1404: رونمایی نسخه بتا.
اسفند 1404: انتشار نسخه تکمیل‌شده و پایدار.

8. قابلیت جدید Buildt برای طراحی اپلیکیشن از روی طرح Figma:

اگر از کاربران Buildt هستید (برای طراحی اپلیکیشن موبایل، وب‌سایت و… بدون برنامه‌نویسی)، خبر خوبی براتون دارم. به Buildt یک قابلیت جدید اضافه شده که می‌تونید Figma رو هم بهش متصل کنید.
یعنی اپلیکیشن شما بر اساس طرح Figma که طراح بهتون داده، طراحی می‌شه (با دقت بسیار بالا و Pixel-perfect).

9. به‌روزرسانی جدید NotebookLM با Gemini 2 Flash و Sinking:

تولید پادکست‌های جذاب‌تر.
جستجوی بهتر محتوا.
جستجوی دقیق‌تر در اسناد.

10. اضافه شدن دکمه “Add to Calendar” به Gmail با استفاده از Gemini:

اگر تقویمتون رو به Gmail وصل کرده باشید (که معمولاً وصله)، می‌تونید با زدن این دکمه، قرار ملاقات‌های موجود در ایمیل‌ها رو به تقویمتون اضافه کنید. Gemini ایمیل رو تحلیل می‌کنه و قرار ملاقات رو براتون تنظیم می‌کنه (یا پیشنهادهای بهتری می‌ده).

11. ارائه نسخه ویندوز Perplexity:

کاربران ویندوز می‌تونن از Perplexity (یک موتور جستجوی قوی مبتنی بر هوش مصنوعی) استفاده کنن. این ابزار می‌تونه به آفیس، Outlook و ابزارهای دیگه ویندوز متصل بشه.

12. دستیار هوش مصنوعی مایکروسافت برای ایکس‌باکس:

مایکروسافت روی ایکس‌باکس، دستیار هوش مصنوعی خودش رو ارائه داده که در بازی‌ها به شما کمک می‌کنه:

راهنمایی برای انجام بهتر بازی.
کمک در مراحل سخت.
یادآوری اتفاقات بازی.
پاسخ به سؤالات (مثلاً نحوه کشتن یک غول خاص).
پیدا کردن جوایز و Achievementها.

جمع‌بندی:

این بود از خبرهای مهم این هفته در دنیای هوش مصنوعی.
اتفاقات جالبی افتاد، از معرفی Gemini 3 تا دستیار هوش مصنوعی ایکس‌باکس و پلتفرم ملی هوش مصنوعی ایران. هر هفته، خبرهای جدید و جذابی منتشر می‌شه که انتخاب مهم‌ترین‌هاشون واقعاً کار سختیه!