您現(xiàn)在的位置:首頁(yè) > 背景提升 > 密集項(xiàng)目:人工智能與數(shù)據(jù)科學(xué)專(zhuān)題: AlphaGo的算法原理:強(qiáng)化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)(GNN)研究【大學(xué)組】
驗(yàn)證碼

獲取驗(yàn)證碼

國(guó)外小組科研—密集項(xiàng)目:人工智能與數(shù)據(jù)科學(xué)專(zhuān)題: AlphaGo的算法原理:強(qiáng)化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)(GNN)研究【大學(xué)組】

開(kāi)始日期:

2023年7月8日

專(zhuān)業(yè)方向:

計(jì)算機(jī)與人工智能

導(dǎo)師:

Pietro (劍橋大學(xué) University of Cambridge 終身正教授)

課程周期:

4周在線小組科研學(xué)習(xí)+2周不限時(shí)論文指導(dǎo)學(xué)習(xí)

語(yǔ)言:

英文

建議學(xué)生年級(jí):

大學(xué)生


項(xiàng)目產(chǎn)出:

4周在線小組科研學(xué)習(xí)+2周不限時(shí)論文指導(dǎo)學(xué)習(xí) 共125課時(shí) 項(xiàng)目報(bào)告 優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級(jí)別索引國(guó)際會(huì)議全文投遞與發(fā)表指導(dǎo)(可用于申請(qǐng)) 結(jié)業(yè)證書(shū) 成績(jī)單


項(xiàng)目介紹:

項(xiàng)目?jī)?nèi)容涉及強(qiáng)化學(xué)習(xí)核心理論和技能,具體包括遺傳算法、強(qiáng)化學(xué)習(xí)框架、Q-learning、行動(dòng)者-批評(píng)(actor-critic;AC)模型、馬爾可夫決策過(guò)程、優(yōu)化控制、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動(dòng)機(jī)器學(xué)習(xí)(Auto ML)等。學(xué)生通過(guò)項(xiàng)目了解如何開(kāi)發(fā)基于強(qiáng)化學(xué)習(xí)的生產(chǎn)力軟件,在結(jié)束時(shí)提交項(xiàng)目個(gè)性化研究課題報(bào)告,進(jìn)行成果展示。 個(gè)性化研究課題參考: 強(qiáng)化學(xué)習(xí)在博弈論中的應(yīng)用:類(lèi)alpha算法開(kāi)發(fā) 利用經(jīng)驗(yàn)留存解決強(qiáng)化學(xué)習(xí)所需樣本太多問(wèn)題的可行性分析 強(qiáng)化學(xué)習(xí)中的機(jī)器獎(jiǎng)勵(lì)設(shè)置方法迭代 為強(qiáng)化學(xué)習(xí)過(guò)擬合的特定場(chǎng)景重新建模的自動(dòng)過(guò)程研究 具有精確尺度估計(jì)的動(dòng)作-評(píng)價(jià)網(wǎng)絡(luò)結(jié)構(gòu)與強(qiáng)化學(xué)習(xí)優(yōu)勢(shì)函數(shù)

更多課程分類(lèi)
驗(yàn)證碼

獲取驗(yàn)證碼