AI人工智能 用Python構(gòu)建一個(gè)學(xué)習(xí)代理

2020-09-24 11:09 更新

對(duì)于構(gòu)建強(qiáng)化學(xué)習(xí)代理,我們將使用如下所示的 OpenAI Gym 包 -

import gym
env = gym.make('CartPole-v0')
for _ in range(20):
   observation = env.reset()
   for i in range(100):
      env.render()
      print(observation)
      action = env.action_space.sample()
      observation, reward, done, info = env.step(action)
      if done:
         print("Episode finished after {} timesteps".format(i+1))
         break

觀察小推車可以平衡。

img

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)