AI Poker Bot Pluribus ชนะข้อเสนอยอดนิยมใน NLHE Multiplayer โดยมีต้นทุนเพียง $ 144 ในการรัน

What You Should Do If You Win the Lottery



เรือเกมโป๊กเกอร์ใหม่ได้รับการพัฒนาโดยนักวิจัยกลุ่มเดียวกับที่นำเสนอ Libratus ในปี 2560 และคราวนี้สามารถเอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำในเกม NLHE 6 มือได้ Facebook กำลังร่วมมือกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งบุกเบิกโดยศาสตราจารย์ Tuomas Sandholm ของ CMU และ Noam Brown นักศึกษาระดับบัณฑิตศึกษาของเขาซึ่งกำหนดเวลาการแสดงที่มีซูเปอร์คอมพิวเตอร์ AI โป๊กเกอร์เวอร์ชันล่าสุดที่เรียกว่า “Pluribus” เทียบกับผู้เล่นโป๊กเกอร์ชั้นนำบางคนใน อุตสาหกรรมและผลการวิจัยที่ตีพิมพ์เมื่อต้นเดือนที่ผ่านมาในวารสาร Science เป็นเรื่องเหลือเชื่อ เรือสามารถเอาชนะคู่ต่อสู้ซึ่งเป็นสิ่งที่ AI อื่น ๆ ไม่เคยทำได้ (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) หวังว่าผลของโครงการนี้จะมีผลอย่างมากต่อการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่ครอบคลุมความท้าทายของข้อมูลที่ซ่อนอยู่ได้เป็นอย่างดีดังนั้นนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามไม่มีเครื่องจักรใดที่สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ได้จริงในการจัดเท็กซัสโฮลเอ็มแบบไม่ จำกัด (ผู้เล่นหลายคนที่ได้รับความนิยมมากที่สุดในการเล่นโป๊กเกอร์) จนกระทั่งพลูริบัสปรากฏ Pluribus ต่อสู้กับมืออาชีพโป๊กเกอร์ที่ดีที่สุดในรูปแบบ NLHE 6-max มืออาชีพเป็นผู้เชี่ยวชาญ 6-max ซึ่งได้รับรางวัลอย่างน้อย 1 ล้านเหรียญในอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสได้รับการทดสอบสองครั้งที่แตกต่างกัน ในการทดลองครั้งแรกมนุษย์ห้าคนและ AI หนึ่งคน (5H + 1AI) แข่งขันกันในขณะที่ในการทดลองครั้งที่สองมีมนุษย์เพียงคนเดียวเท่านั้นที่เผชิญหน้ากับโคลนพลูริบัส 5 ตัว (1H + 5AI) โดยพิจารณาว่าเรือไม่ได้รับอนุญาตให้สื่อสารและพวกมัน ไม่รู้ว่าพวกเขาเล่นกับใครเพื่อหลีกเลี่ยงไม่ให้เกิดการชนกัน ผลการทดลองทั้งสองครั้งแสดงให้เห็นว่าอัตราการชนะของพลูริบัสสูงกว่าของผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์มาก ผู้เล่นบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage โดยผู้เล่นแต่ละคนจะใช้ชื่อ ปลอมตัวขณะเล่น ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือเป็นเวลา 12 วันในขณะที่ในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์ Darren Elias และ Chris Ferguson เล่น 5,000 มือต่อ Pluribus ห้าสำเนา เมื่อคำนวณผลลัพธ์ปรากฎว่าเรือสามารถเอาชนะมนุษย์ได้ประมาณ 5 เหรียญต่อมือและเกือบ 1,000 เหรียญต่อชั่วโมงตามบล็อกโพสต์ของ AI Noam Brown บน Facebook วิดีโอสาธิต Pluribus vs Pro: ข้อดีของโป๊กเกอร์คิดอย่างไรกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองพูดเกี่ยวกับเรือโป๊กเกอร์รุ่นล่าสุด Seth Davies: “สิ่งที่น่าตื่นเต้นที่สุดเมื่อเล่นกับ Pluribus คือการตอบสนองต่อกลยุทธ์ preflop ที่ซับซ้อน Pluribus ใช้พรีฟล็อปขนาดต่าง ๆ ซึ่งแตกต่างจากมนุษย์การพยายามตอบสนองระยะทางเปิดที่ไม่เป็นเส้นเป็นความท้าทายที่สนุกสนานซึ่งแตกต่างจากเกมของมนุษย์” Jason Les: “มันเป็นสัตว์ประหลาดบลัฟเฟอร์แน่นอนฉันอยากจะบอกว่ามันเป็นบลัฟเฟอร์ที่มีประสิทธิภาพมากกว่ามนุษย์ทั่วไปมากและนั่นคือสิ่งที่ทำให้ยากที่จะจับคู่คุณอยู่ในสถานการณ์ที่กดดันมากจน AI เรียกเก็บเงินจากคุณ คุณรู้ว่านี่น่าจะเป็นการกลั่นแกล้งที่นี่มากที่สุด “Jimmy Chou:” ทุกครั้งที่ฉันเล่นเรือฉันรู้สึกอยากหยิบอะไรใหม่ ๆ มาใส่ในเกมในฐานะมนุษย์ฉันคิดว่าเรามักจะทำให้เกมง่ายขึ้นสำหรับตัวเราเอง นำไปใช้และจดจำได้ง่ายขึ้นเรือไม่ใช้ทางลัดใด ๆ เหล่านี้และมีโครงสร้างเกมที่ซับซ้อน / สมดุลมากสำหรับการตัดสินใจทุกครั้ง “คริสเฟอร์กูสัน:” พลูริบัสเป็นคู่ต่อสู้ที่จับคู่ได้ยากมากมันยากมากที่จะวางมันลงในสิ่งที่ เขายังเก่งมากในการเดิมพันมูลค่าเล็กน้อยในแม่น้ำเขาถอนตัวได้ดีมาก คุณค่าของความดี มือ. “Darren Elias:” มีเพียงฉันและเรือโป๊กเกอร์ AI รุ่นนี้ห้ารุ่นซึ่งฉันจะเล่นทุกวันหลายพันมือ มันพัฒนาขึ้นอย่างรวดเร็วจากการเป็นผู้เล่นระดับปานกลางไปจนถึงผู้เล่นโป๊กเกอร์ระดับโลกในเวลาไม่กี่วันและหลายสัปดาห์ ซึ่งน่ากลัวมาก. “Pluribus ในระยะสั้นสำหรับตอนนี้มันปลอดภัยที่จะกล่าวได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์แกนหลักของ Pluribus หรือกลยุทธ์พิมพ์เขียวถูกสร้างขึ้นผ่านเกมเองหรือการแข่งขันกับโคลน นี่คือวิธีการเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมของเครือข่ายประสาทเทียม 5 เครือข่ายที่ฝึกฝนมานาน 45,000 ปีและเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้สำเร็จ Pluribus สอนตัวเองตั้งแต่เริ่มต้นโดยใช้ประเภทของ การเรียนรู้การเสริมกำลังที่ใช้โดย Go AI ของ DeepMind AlphaZero เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อตัดสินใจว่าการกระทำใดได้รับเงินมากที่สุดแต่ละมือจะจดจำวิธีการเล่นและไตร่ตรองว่าจะทำเงินได้มากขึ้นด้วยการกระทำที่แตกต่างกันหรือไม่เช่นการเพิ่ม แทนที่จะเดิมพันต่อไปหากทางเลือกอื่นนำไปสู่ผลลัพธ์ที่ l โดยเฉพาะอย่างยิ่งมักจะเลือกหนึ่งในสถานการณ์ในอนาคต ด้วยการเล่นโป๊กเกอร์หลายล้านมือกับตัวเอง Pluribus ได้กำหนดกลยุทธ์พื้นฐานที่ตามมาในการแข่งขัน สำหรับทุกการตัดสินใจของเขา Pluribus จะเปรียบเทียบสถานะของเกมกับพิมพ์เขียวและคาดการณ์ขั้นตอนล่วงหน้าเพื่อดูว่าเกมดำเนินไปอย่างไร จากนั้นจะตัดสินใจว่าสามารถปรับปรุงได้หรือไม่ Pluribus เรียนรู้ด้วยตนเองโดยไม่ต้องป้อนข้อมูลจากมนุษย์ใช้กลยุทธ์หลายอย่างที่ผู้เล่นที่เป็นมนุษย์ไม่เคยคิดมาก่อน ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ ในขณะที่เล่นโป๊กเกอร์จะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) เพียงสองหน่วยซึ่งแตกต่างจากซีพียู Libratus 100 ตัวและ DeepMind Go Go รุ่นดั้งเดิมที่ใช้ซีพียูเกือบ 2,000 ตัวเมื่อพวกเขาเอาชนะผู้เล่นมืออาชีพอันดับต้น ๆ เมื่อพลูริบัสเล่นกันเองมันจะเล่นในเวลาประมาณ 20 วินาทีเร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่น่าสนใจอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญเท่านั้นในการทำงาน ในการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการทำงาน แน่นอนว่าการทดลองนี้ไม่ได้จบลงแค่โป๊กเกอร์ แม้ว่าจะเป็นความสำเร็จที่ยอดเยี่ยมที่สามารถเอาชนะมืออาชีพโป๊กเกอร์ที่เก่งที่สุดในเกมหกมือได้ แต่สิ่งนี้แสดงให้เห็นว่าพลังของการคำนวณสามารถมีจุดประสงค์ที่แตกต่างกันไปนอกเหนือจากการเล่นไพ่ ผลการวิจัยพิสูจน์ให้เห็นความจริงที่ว่า AI สามารถทำงานได้ในระดับ ‘เหนือมนุษย์’ ในสถานการณ์ที่มีหัวข้อที่หลากหลายและการเข้าถึงข้อมูลที่ จำกัด และอาจใช้ได้ทุกที่ตั้งแต่วาณิชธนกิจและกลยุทธ์การให้คำปรึกษาไปจนถึงเทคโนโลยีรถยนต์ขับเคลื่อนด้วยตนเองตามที่ Brown กล่าว ตอนนี้ Pluribus เข้าร่วมกับเกมประเภทต่างๆเช่น Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกต้องพ่ายแพ้ด้วยปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


คาสิโน มาเก๊า
คาสิโน ปอยเปต ออนไลน์
คาสิโน UFABET
คาสิโน 66
คาสิโน66

Leave a Reply

Your email address will not be published. Required fields are marked *