AI يدخن 5 أبطال بوكر في وقت واحد في عدم الحدود مع 'الاتساق لا هوادة فيه'

AI يدخن 5 أبطال بوكر في وقت واحد في عدم الحدود مع 'الاتساق لا هوادة فيه'


أثبتت الآلات تفوقها في ألعاب فردية مثل لعبة الشطرنج والذهاب وحتى البوكر-ولكن في إصدارات متعددة اللاعبين من لعبة الورق احتفظ البشر بحافة ... حتى الآن. إن تطور آخر وكيل من الذكاء الاصطناعى إلى Flummox Poker Pros بشكل فردي هو الآن بشكل حاسم في ألعاب ستة أشخاص على غرار البطولة. استدعاء Pluribus يتفوق بشكل موثوق على خمسة لاعبين بوكر محترفين في نفس اللعبة أو محترف واحد ضد خمس نسخ مستقلة من نفسها. إنها قفزة كبيرة إلى الأمام في القدرة على الآلات كما أنها أكثر فاعلية من الوكلاء السابقين أيضًا. إن الطبيعة ذات الصفر من ذلك (كل ما تخسره يحصل اللاعب الآخر) يجعله عرضة لبعض الاستراتيجيات التي يمكن لجهاز الكمبيوتر القادر على حسابها على حد سواء أن تضع نفسه في ميزة. لكن أضف أربعة لاعبين آخرين في هذا المزيج وأصبحت الأمور معقدة حقيقية بسرعة حقيقية.


Carnegie Mellon تنشئ منظمة العفو الدولية التي تلعب لعبة البوكر التي يمكنها التغلب على الإيجابيات

إن اللاعبين وإمكانيات اليدين والرهانات والنتائج المحتملة عديدة لدرجة أنه من المستحيل فعليًا حسابهم جميعًا خاصة في دقيقة واحدة أو أقل. سيكون الأمر مثل محاولة توثيق كل حبة من الرمال على شاطئ بين الأمواج.

ومع ذلك فإن أكثر من 10000 يديًا لعبت مع الأبطال تمكنت Pluribus من الفوز بالمال بمعدل ثابت ولا تكشف عن نقاط ضعف أو عادات لها يمكن للمعارضين الاستفادة من. ما هو السر؟ عشوائية ثابتة.
حتى أجهزة الكمبيوتر لديها ندم

تم تدريب Pluribus مثل العديد من وكلاء الذكاء الاصطناعى الذين يلعبون اللعبة في هذه الأيام ليس من خلال دراسة كيفية لعب البشر ولكن من خلال اللعب ضد نفسه. في البداية ربما يكون هذا مثل مشاهدة الأطفال أو لهذا الأمر لعب البوكر - أخطاء مستمرة ولكن على الأقل يتعلمهم الذكاء الاصطناعى والأطفال منهم.
التقليل. يبدو أنه عندما يتناول ويسكي لتناول الإفطار بعد أن فقدت قميصك في الكازينو وبطريقة ما-على غرار التعلم الآلي.

تقليل الأسف يعني فقط أنه عندما ينتهي النظام (ضد نفسه تذكر) بعد ذلك سوف يلعب ذلك مرة أخرى بطرق مختلفة واستكشاف ما قد يحدث لو تم فحصه هنا بدلاً من رفعه مطوي بدلاً من الاتصال به وما إلى ذلك. (لأنه لم يحدث بالفعل إنه معاكس ورقة تجدها ثم اختيار أفضل ما بمجرد أن تعتقد أنك تسلق بما فيه الكفاية.

اختر من. ولكن إذا قمت بدمجها مع وظيفة الأسف فأنت تبحث من خلال كتالوج من الطرق الممكنة التي يمكن أن تسير فيها اللعبة ومراقبة ما كان سيكون له أفضل نتيجة.
طريقة للتحقيق بشكل منهجي في ما قد يحدث لو كان الكمبيوتر قد تصرف بشكل مختلف وضبط نموذجه حول كيفية اللعب وفقًا لذلك.

اللعبة التي لعبت في الأصل كما ترى على اليسار بخسارة. لكن المحرك يستكشف السبل الأخرى التي قد تكون أفضل. لقد فازت بهذه اليد الكبيرة إذا كان لديك ثمانية كيكر بدلاً من سبعة. وهنا يكمن أيضًا في الأسف الشديد وهو النوع الذي يبقيك في الفراش في غرفتك في فندقك حتى الغداء الماضي.

الحقيقة هي أن هذه التغييرات البسيطة مهمة لذا نادراً ما يمكن تجاهل الاحتمال تمامًا. لن يهم أبدًا أن تراهن على باك إضافي - لذلك يمكن اعتبار أي رهان على سبيل المثال 70 و 130 هو نفسه تمامًا بواسطة compu

اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي