增強式學習

前言

增強式學習是機器學習中的個領域,強調如何基於環境而行動,以取得最大化的預期利益,其靈感來源於心理學中的行為主義理論。

即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。

指導老師 念家興

chnien@pu.edu.tw

財工四 丁竹松

s1051807@pu.edu.tw

財工四 王佑鈞

s1050708@pu.edu.tw

財工四 王煒齊

s1050697@pu.edu.tw

財工四 鄧健志

s1050693@pu.edu.tw

財工四 劉俊佑

s1050686@pu.edu.tw

Agent就是智能,透過像人類一樣的類神經網路進行學習,為了獲得最大的利益,

智能將採取不同的行動做用在環境下, 環境也會給予不同的情形,根據情形判斷行動會得到獎勵或懲罰。

有關增強式學習的應用,電腦科學、神經學、心理學、

經濟學、數學、工程學這些都能和增強式學習結合。

透過Python的Selenium套件,Selenium 是為瀏覽器自動化需求所設計,

讓程式可以直接驅動瀏覽器進行各種操作,藉此通過CNN去訓練Agent的動作。

圖為訓練片段之截圖

.

以上為程式碼之截圖

結論

實際上不只我們讓恐龍自主學習,目前網路上有很多人訓練程序已經完成,

不間斷的訓練可以讓遊戲在半年內不間斷的運行,訓練過程中也要針對環境的回饋而去調整模型。