版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們
魯家鈺:強(qiáng)化學(xué)習(xí)之遺傳算法[2]
中國(guó)自動(dòng)化學(xué)會(huì)
中國(guó)自動(dòng)化學(xué)會(huì)是我國(guó)最早成立的國(guó)家一級(jí)學(xué)術(shù)群眾團(tuán)體之一。
視頻簡(jiǎn)介:
遺傳算法是一個(gè)經(jīng)典的強(qiáng)化學(xué)習(xí)的算法,因其模擬了生物界中的遺傳演化的過(guò)程,因此而得名。在本節(jié)課中,你首先將了解到機(jī)器學(xué)習(xí)三大范式之一強(qiáng)化學(xué)習(xí)的主要特點(diǎn)、基本概念和應(yīng)用場(chǎng)景。 然后通過(guò)分析生物演化的過(guò)程和原理, 理解如何使用遺傳算法來(lái)實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)。 最后,你也將通過(guò)一個(gè)專(zhuān)門(mén)為本課程研發(fā)的《吃豆子》小游戲,直觀(guān)地看到遺傳算法是如何工作的,以及知道影響遺傳算法訓(xùn)練效果的若干關(guān)鍵參數(shù)。