
決策與控制是指針對(duì)具體問題,針對(duì)不同環(huán)境下,根據(jù)特定算法,有組織地調(diào)整機(jī)械或系統(tǒng),以達(dá)到特定目標(biāo)的行為策略。決策與控制可以簡(jiǎn)單地理解為決策部分就是確定將采取的行動(dòng),而控制部分則是處理環(huán)境變化,決策與控制可以將系統(tǒng)被視為決策主體,在規(guī)定的環(huán)境中,明確你的目標(biāo),并且選擇最佳的行動(dòng)來達(dá)到最佳結(jié)果。
決策與控制是機(jī)器學(xué)習(xí)領(lǐng)域重要的一環(huán),它涉及到搜索、估價(jià)函數(shù)、決策理論、有限狀態(tài)機(jī)、反饋控制和模糊邏輯。它的應(yīng)用領(lǐng)域包括計(jì)算機(jī)系統(tǒng)以及機(jī)器人、專家系統(tǒng)等,用于解決復(fù)雜問題,從而實(shí)現(xiàn)特定的運(yùn)動(dòng)目標(biāo)。
拓展:在機(jī)器學(xué)習(xí)的決策與控制進(jìn)程中,監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是兩種重要的機(jī)器學(xué)習(xí)技術(shù),其中,監(jiān)督學(xué)習(xí)是一種有窮自變量空間,即模型輸入空間,輸入變量與輸出變量之間有清晰規(guī)律,可以通過大量樣本進(jìn)行訓(xùn)練,從而提高學(xué)習(xí)效果,而強(qiáng)化學(xué)習(xí)則是基于模仿學(xué)習(xí)技術(shù),它使用行動(dòng)函數(shù)、獎(jiǎng)勵(lì)函數(shù)和狀態(tài)函數(shù),通過不斷學(xué)習(xí)并根據(jù)反饋找到最優(yōu)行動(dòng),從而達(dá)到最終目標(biāo)。












官方

0
粵公網(wǎng)安備 44030502000945號(hào)


