主講人:崔澤 上海大學(xué)副教授
時(shí)間:2024年5月20日13:30
地點(diǎn):二教439室
舉辦單位:數(shù)理學(xué)院
主講人介紹:崔澤,博士,上海大學(xué)機(jī)電工程與自動化學(xué)院副教授,碩士生導(dǎo)師。長期從事智能裝備研發(fā)、工業(yè)機(jī)器人應(yīng)用等領(lǐng)域。發(fā)表論文20余篇,授權(quán)發(fā)明專利20余項(xiàng)。
內(nèi)容介紹:對機(jī)械臂自學(xué)習(xí)相關(guān)問題進(jìn)行闡述,針對兩個(gè)主要問題開展研究,第一個(gè)問題:如何縮短智能體(策略網(wǎng)絡(luò))在虛擬環(huán)境中學(xué)習(xí)任務(wù)的訓(xùn)練收斂時(shí)間。在處理復(fù)雜任務(wù)時(shí),使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練可能需要大量時(shí)間來使模型收斂;第二個(gè)問題 :如何將虛擬環(huán)境中訓(xùn)練好的智能體遷移到真實(shí)環(huán)境中,從而縮短智能體在真實(shí)環(huán)境中的訓(xùn)練時(shí)間,最后結(jié)合演示學(xué)習(xí),實(shí)現(xiàn)機(jī)械臂自主抓取以及開門等操作。