هوش مصنوعی

معرفی ایده نو ظهوری در هوش مصنوعی

معرفی ایده نو ظهوری در هوش مصنوعی

غیر منتظره را در آغوش بگیرید: با آموزش هوش مصنوعی در مورد نحوه مدیریت شرایط جدید، قوانین بازی را تغییر دهید.


من و همکارانم یک نسخه دیجیتالی Monopoly را به گونه ای تغییر دادیم تا به جای این که هر بار بازیکن Go  را پاس می کند 200 دلار آمریکا دریافت کند، از او یک مالیات ثروت گرفته شود. ما این کار را برای کسب مزیت یا فریب کسی نکردیم. هدف این است که یک پرتاب توپ قوس دار به سمت عوامل هوش مصنوعی که بازی را انجام می دهند داشته باشیم.
 
هدف ما کمک به عوامل یا کارگزاران برای یادگیری مدیریت حوادث غیر منتظره است، چیزی که هوش مصنوعی تا به امروز در آن بد عمل کرده است. دادن این نوع سازگاری به هوش مصنوعی برای سیستم های آینده مانند روبات های جراحی مهم است، اما همچنین الگوریتم های موجود در این جا و اکنون که تصمیم می گیرند چه کسی باید وثیقه دریافت کند، چه کسی برای کارت اعتباری تأیید می شود و یا رزومه اش به مدیر استخدام می رسد مهم هستند. عدم تعامل خوب با موارد غیر منتظره در هر یک از این شرایط می تواند عواقب فاجعه باری داشته باشد.
 شاید آن روز دور نباشد که هوش مصنوعی بتواند نه تنها انسان ها را در بازی های موجود شکست دهد، بلکه به سرعت با هر نسخه از آن بازی هایی که انسان می تواند تصور کند، سازگار شودعوامل هوش مصنوعی نیاز دارند به توانایی شناسایی، توصیف و انطباق با تازگی یا نو ظهوری از راه های انسان مانند. یک وضعیت، جدید است اگر به طور مستقیم یا غیر مستقیم یک مدل کارگزار از جهان خارجی را که شامل عوامل دیگر، محیط و تعاملات آنها است، به چالش بکشد.
 
در حالی که اکثر مردم با نو ظهوری در  کامل ترین شکل ممکن آن سر و کار ندارند، اما می توانند از اشتباهات خود درس بگیرند و خود را سازگار کنند. در صورت مواجهه با یک مالیات بر ثروت در Monopoly، یک بازیکن انسانی ممکن است متوجه شود که هنگام نزدیک شدن به Go باید پول نقد دستی برای سازمان امور مالیاتی (IRS) داشته باشد. یک بازیکن هوش مصنوعی که به شدت متمایل به کسب املاک و انحصارات است، ممکن است نتواند تعادل مناسب بین پول نقد و دارایی های غیر نقد را تحقق بخشد قبل از این که خیلی دیر شود.
 سازگار شدن با تازگی یا نو ظهوری در دنیای باز
یاد گیری تقویت، حوزه ای است که عمدتاً مسئول عوامل هوش مصنوعیِ بازی کننده "فوق بشری" و برنامه هایی کاربردی از نوع اتومبیل های خود ران است. یاد گیری تقویت با استفاده از پاداش و مجازات به عوامل هوش مصنوعی اجازه می دهد تا با آزمون و خطا بیاموزند. این بخشی از زمینه هوش مصنوعی بزرگترِ یادگیری ماشین است.
 
یاد گیری در یاد گیریِ ماشین به این معنی است که چنین سیستم هایی از قبل قادر به سر و کار داشتن با انواع محدودی از تازگی هستند. سیستم های یادگیری ماشینی تمایل دارند که روی داده های ورودی که از نظر آماری مشابه هستند، اگر چه یکسان نیستند، با داده هایی که در ابتدا آموزش دیده اند، خوب عمل کنند. در عمل، نقض این شرط تنها تا زمانی درست است که اتفاق غیر منتظره ای نیفتد.
 
چنین سیستم هایی می توانند در دنیای باز با مشکل رو به رو شوند. همان طور که از نامش پیداست، جهان های باز را نمی توان به طور کامل و صریح تعریف کرد. اتفاق غیر منتظره می تواند رخ دهد و حادث شود.. از همه مهم تر، دنیای واقعی یک جهان باز است.
 
به هر حال، هوش مصنوعی "فوق بشری" برای کنترل موقعیت های بسیار غیر منتظره در یک جهان باز طراحی نشده است. این  ممکن است یک دلیل برای استفاده از خود یاد گیری تقویت کننده مدرن باشد، که در نهایت منجر به بهینه سازی هوش مصنوعی برای محیط های خاص که هوش مصنوعی در آنها واقع می شود شده است. در زندگی واقعی، تضمینی برای واقع نشدن غیر منتظره ها وجود ندارد. هوش مصنوعی که برای زندگی واقعی ساخته شده است باید بتواند در دنیای باز با تازگی یا نو ظهوری سازگار شود.
 نو ظهوری به عنوان یک شهروند درجه یک
با بازگشت به Monopoly، تصور کنید که برخی از املاک تحت موضوع قانون کنترل اجاره باشند. یک بازیکن خوب، انسانی یا هوش مصنوعی، این املاک را به عنوان یک سرمایه گذاری بد، در مقایسه با املاکی که می توانند اجاره بهای بیشتری برای او کسب کنند، تشخیص می دهد و آنها را نمی خرد. با این حال، هوش مصنوعی ای که قبلاً این وضعیت، یا موارد مشابه آن، را ندیده است احتمالاً قبل از سازگاری نیاز به انجام بازی های زیادی خواهد داشت.
 
قبل از این که دانشمندان کامپیوتر حتی بتوانند نظریه پردازی در مورد چگونگی ساخت چنین عوامل "تطبیقی ​​جدید" را شروع کنند، برای ارزیابی آنها به یک روش دقیق نیاز دارند. به طور سنتی، بیشتر سیستم های هوش مصنوعی توسط همان افرادی که آنها را می سازند آزمایش می شوند. گر چه رقابت ها بی طرفانه ترند، اما تا به امروز، هیچ مسابقه ای سیستم های هوش مصنوعی را در چنان شرایط غیر منتظره ای که حتی طراحان سیستم نیز نتوانند آنها را پیش بینی کنند ارزیابی نکرده است. چنین ارزشیابی استاندارد طلایی آزمایش AI بر روی نو ظهوری، مشابه آزمایشات کنترل شده تصادفی برای ارزیابی داروهاست.
انتظار می رود این تحقیقات منجر به ایجاد عوامل هوش مصنوعی ای شود که قادر به مدیریت تازگی یا نو ظهوری در محیط های مختلف هستند.در سال 2019، آژانس پروژه های تحقیقاتی پیشرفته دفاعی ایالات متحده برنامه ای را با نام علم هوش مصنوعی و یاد گیری برای نو ظهوری یا تازگی در جهان باز آغاز کرد که به اختصار SAIL-ON نامیده می شود، و در حال حاضر بودجه بسیاری از گروه ها، از جمله گروه من در دانشگاه کالیفرنیای جنوبی، را برای تحقیق در مورد اقتباس جدید در دنیای باز تأمین می کند.
 
یکی از راه های ابتکاری در این برنامه این است که یک تیم می تواند یک عامل هوش مصنوعی ایجاد کند که با نو ظهوری سر و کار داشته باشد و آن را به کار گیرد، یا یک محیط جهان باز برای ارزیابی چنین عواملی طراحی کند، اما نه هر دو. تیم هایی که یک فضای جهان باز ایجاد می کنند همچنین باید در مورد جدید بودن در آن محیط نظریه پردازی کنند. آنها تئوری های خود را آزمایش می کنند و عوامل ساخته شده توسط گروه دیگر را با تولید یک ژنراتور جدید ارزیابی می کنند. از این ژنراتورها می توان برای تزریق عناصر غیر منتظره به محیط استفاده کرد.
 
تحتSAIL-ON ، من و همکارانم اخیراً یک شبیه ساز به نام Generating Novelty in Open-world Multi-agent Environment  یا GNOME ایجاد کردیم. GNOME برای آزمایش انطباق تازگی یا نو ظهوری هوش مصنوعی در بازی های رو میزی استراتژیک طراحی شده است که عناصر دنیای واقعی را ضبط می کنند.
   
نمودار یک بازی Monopoly با نمادهایی که نشان دهنده بازیکنان، خانه ها و هتل هاست. نسخه Monopoly  از محیط تازگی یا نو ظهوری هوش مصنوعی ارائه شده نویسنده می تواند با معرفی مالیات بر ثروت، کنترل اجاره و سایر عوامل غیر منتظره، هوشِ هوش مصنوعی ای که بازی را انجام می دهد را افزایش دهد. مایانک کجریوال ، CC BY-ND
 
اولین نسخه GNOME ما از بازی تخته ای کلاسیک Monopoly استفاده می کند. ما اخیراً GNOME مبتنی بر Monopoly را در یک کنفرانس برتر یاد گیری ماشین به نمایش گذاشتیم. ما به شرکت کنندگان این امکان را دادیم که چیزهای جدیدی تزریق کنند و خودشان ببینند عوامل هوش مصنوعی از قبل برنامه ریزی شده چه عملکردی دارند. به عنوان مثال ، GNOME  می تواند نوظهوری های مالیات بر ثروت یا کنترل کرایه را که قبلاً ذکر شد، معرفی کند و هوش مصنوعی را پس از تغییر ارزیابی کند.
 یاد گیری تقویت با استفاده از پاداش و مجازات به عوامل هوش مصنوعی اجازه می دهد تا با آزمون و خطا بیاموزند.با مقایسه نحوه عملکرد هوش مصنوعی قبل و بعد از تغییر قاعده، GNOME  می تواند تعیین کند که چقدر نو ظهوری یا تازگی در بازی هوش مصنوعی دخیل بوده است. اگر GNOME دریابد که هوش مصنوعی قبل از معرفی این نو ظهوری 80٪ از بازی ها را برنده بوده است و اکنون فقط 25٪ از بازی ها را برنده است، AI را به عنوان یکی از مواردی که برای پیشرفت جای کار زیادی دارد علامت گذاری می کند.
 آینده: آیا یک یک علم نو ظهوری است؟
قبلاً از GNOME برای ارزیابی عوامل هوش مصنوعی سازگار با تازگی، ساخته شده توسط سه سازمان مستقل که همچنین تحت برنامه DARPA تأمین وجه می شوند، استفاده شده است. ما همچنینGNOME ها را بر اساس پوکر و "بازی های جنگی" ساخته ایم که شبیه Battleship هستند. در سال آینده، ما همچنین در حال کشف GNOME برای سایر بازی های روی صفحه استراتژیک مانند Risk و Catan خواهیم بود. انتظار می رود این تحقیقات منجر به ایجاد عوامل هوش مصنوعی ای شود که قادر به مدیریت تازگی یا نو ظهوری در محیط های مختلف هستند.
 
شکل دادن به نو ظهوری به عنوان یک کانون مرکزی تحقیق و ارزیابی هوش مصنوعی مدرن، محصول جانبی تولید مجموعه ای اولیه از کار در حمایت از علم نو ظهوری است. نه تنها محققانی مانند خود ما در حال بررسی تعاریف و نظریه های جدید هستند، بلکه ما در حال بررسی سؤالاتی هستیم که می توانند پیامدهای اساسی داشته باشند. به عنوان مثال، تیم ما در حال بررسی این سؤال است که چه زمانی انتظار می رود که یک نو ظهوری برای هوش مصنوعی در حد غیر ممکن مشکل باشد. در دنیای واقعی، اگر چنین شرایطی به وجود آید، هوش مصنوعی آن را تشخیص می دهد و یک اپراتور انسانی را برای حل مسأله فرا می خواند.
 یک وضعیت، جدید است اگر به طور مستقیم یا غیر مستقیم یک مدل کارگزار از جهان خارجی را که شامل عوامل دیگر، محیط و تعاملات آنها است، به چالش بکشد.در جستجوی پاسخ به این سؤالات و سؤالات دیگر ، دانشمندان کامپیوتر در حال تلاش برای فعال کردن هوش های مصنوی ای هستند که می توانند به درستی به موارد غیر منتظره واکنش نشان دهند، از جمله حوادث غیر قابل پیش بینی ای مانند شیوع COVID-19. شاید آن روز دور نباشد که هوش مصنوعی بتواند نه تنها انسان ها را در بازی های موجود شکست دهد، بلکه به سرعت با هر نسخه از آن بازی هایی که انسان می تواند تصور کند، سازگار شود. حتی ممکن است توانایی سازگاری با شرایطی را داشته باشد که امروز نمی توانیم تصور کنیم.
 
منبع: مایانک کِجریوال، University of Southern California

مطالب مرتبط

تگ‌ها

مطالب پربیننده

پربیننده
آخرین مطالب

عضویت در خبرنامه