Hướng dẫn chạy code tháng 9: Hệ thống chơi game một người

Trong các game đã có các hàm normal_main_2, numba_main_2

Các game đã có: Splendor_v2,Century, MachiKoro, Sheriff, Splendor, TLMN, TLMN_v2, SushiGo

normal_main_2(function, number_of_matches)
'''
  Hàm chạy thuật toán của người chơi ở chế độ 1 người nhưng có thể không dùng numba trong agent
  file_per trong hệ thống đã quy định là 0, file_per = 0
    Args:
        function: thuật toán của người chơi
        file_per: file_per đầu vào, phải quy định định dạng từ đầu và không được thay đổi trong khi chạy
        number_of_matches: Số trận chạy thuật toán
    Returns: 
        Win: Số trận thắng
        file_per: file per của người chơi đó
'''

numba_main_2(function, file_per, number_of_matches)
'''
  Hàm chạy thuật toán của người chơi ở chế độ 1 người nhưng có thể không dùng numba trong agent
    Args:
        function: thuật toán của người chơi
        file_per: file_per đầu vào, phải quy định định dạng từ đầu và không được thay đổi trong khi chạy
        number_of_matches: Số trận chạy thuật toán
    Returns: 
        Win: Số trận thắng
        file_per: file per của người chơi đó
'''

Ví dụ

from base.MachiKoro.env import *
@njit()
def p0(state,temp,per):
    if per[3][0][0] == 0:
        a = per[2][0]
        choice = np.where(a == np.min(a))[0][0]
        if np.sum(per[2][0])> 1000:
            choice = np.argmax(per[1][0]/per[2][0])
        per[3][0][0] = choice
    idmt = int(per[3][0][0])
    mt = per[0][idmt]
    actions = getValidActions(state)
    actions *= mt
    action = np.argmax(actions)
    if getReward(state) == 1:
        per[1][0][idmt] += 1
        per[3][0][0] = 0
    if getReward(state) == 0:
        per[2][0][idmt] += 1
        per[3][0][0] = 0
    return action,temp,per


def test2(state,temp,per):
    if per[3][0][0] == 0:
        a = per[2][0]
        choice = np.where(a == np.min(a))[0][0]
        if np.sum(per[2][0])> 100:
            choice = np.argmax(per[1][0]/per[2][0])
        per[3][0][0] = choice
    idmt = int(per[3][0][0])
    mt = per[0][idmt]
    actions = getValidActions(state)
    actions *= mt
    action = np.argmax(actions)
    if getReward(state) == 1:
        per[1][0][idmt] += 1
        per[3][0][0] = 0
    if getReward(state) == 0:
        per[2][0][idmt] += 1
        per[3][0][0] = 0
    return action,temp,per

    perx = [np.array([np.random.rand(getActionSize()) for _ in range(100)]),np.zeros((1,100)),np.zeros((1,100)),np.zeros((1,100))]
    win1, x = normal_main_2(test2, perx, 1000)
    win, x = numba_main_2(p0, perx , 1000)
    print(win, win1)

Clone and run code

Google colab
- Kết nối với drive
- Tạo nơi muốn lưu hệ thống này(lưu data đã train lên drive để sau này sử dụng)
```
%cd path_vừa_tạo
%git clone https://github.com/ngoxuanphong/GAME.git
%cd GAME
```
- Chỉnh sửa trong setup.py
```
!python main.py
```
- chạy code bằng hàm
- LƯU Ý:
  - Mỗi lần mở drive lên để chạy nhớ %cd đến thư mục và pull lại hệ thống vì có thể có update
  - Nhớ lưu ý đẩy folder của mình vào Agent, trong hệ thống đã có Agent mẫu

Run code

players: list player muốn truyền vào
- ở chế độ Train thì sẽ train đa luồng tương ứng số người chơi
- chế độ Test nếu truyền vào không đủ người chơi thì sẽ tự động thêm random vào
games_name = ['Splendor_v2','Century', 'MachiKoro', 'Sheriff', 'Splendor', 'TLMN', 'TLMN_v2', 'SushiGo',]
game_name: Tên game, có thể lấy ở games_name
time_run_game = Thời gian chạy game ở chế độ train, xong thời gian tự động dừng
Thay đổi game, time_train và list_agent ở setup.py

  type_run_code = 'Test' #'Train' or 'Test'
  players = ['Trang', 'Trang1'] 
  game_name = 'Splendor_OnlyPlayerView'
  time_run_game = 1000

Chạy hàm main.py để train và test với random
Trong hệ thống đã có sẵn code chị Trang để mọi người tham khảo

Agent

Mỗi người là một folder, đặt tên theo quy tắc tên_ngàynạpcode ví dụ: Phong_08_12_2022
Trong mỗi folder sẽ có:
- file Agent_player.py: Lưu thuật toán của mọi người(chỉ có hàm)

Agent_Player.py Tham khảo folder Trang có sẵn trong hệ thống

Có 2 hàm bắt buộc:
- train(n) n là tham số đầu vào(1 là 10000 ván, ...)
- test() là hàm đọc file để test với random và người chơi khác

Chú ý:

Trong thuật toán list_player phải dựa vào getAgentSize() tại vì các game thì số lượng người chơi khác nhau
player phải là tên folder của người chơi

Thêm đoạn code này trong hàm Test

  player = 'NhatAnh_0822' #Tên folder
  path_save_player = f'Agent/{player}/Data/{game_name}_{time_run_game}/' #Path để đọc file Test
  #Sau đó đọc file test như bình thường

Thêm đoạn code này vào trong file thuật toán để import game và khởi tạo path lưu và đọc data

import os
import sys
from setup import game_name,time_run_game
sys.path.append(os.path.abspath(f"base/{game_name}"))
from env import *

player = 'Trang'  #Tên folder của người chơi
path_data = f'Agent/{player}/Data'
if not os.path.exists(path_data):
    os.mkdir(path_data)
path_save_player = f'Agent/{player}/Data/{game_name}_{time_run_game}/'
if not os.path.exists(path_save_player):
    os.mkdir(path_save_player)

ngoxuanphong / GAME

Hướng dẫn chạy code tháng 9: Hệ thống chơi game một người

Clone and run code

Run code

Agent

Game

About

Languages