強化學習是近年來在人工智能技術中較高的一種研究方法,是一種接近人類及動物在大自然中所表現(xiàn)出的學習方式,通過人們不斷實踐和總結,形成了強化學習這一人工智能研究方法。

隨著深度學習技術的流行,深度學習中的一些主流技術,如深度卷積神經(jīng)網(wǎng)絡、序列建模、記憶管理等與強化學習在許多應用場景上出現(xiàn)了結合點,例如使用DQN實現(xiàn)AI自動玩FlappyBird。強化學習技術目前仍面臨訓練環(huán)境與計算能力的瓶頸,相信隨著科技的進一步發(fā)展,在未來十年它一定會成為人工智能領域的核心技術之一。本課程通過理論與案例實踐相結合的方法,讓學習者可以從最專業(yè)的角度來接觸強化學習,學會使用這種先進的人工智能技術來應用于實際工作和學習中。

主辦單位:北京市計算中心有限公司

協(xié)辦單位:

北京市基因測序與功能分析工程技術研究中心

云計算關鍵技術與應用北京市重點實驗室

工業(yè)和信息化人才培養(yǎng)工程培訓基地

北京市大數(shù)據(jù)教學實踐基地

舉 辦 地:北京市海淀區(qū)豐賢中路7號北科產(chǎn)業(yè)3號樓

課程安排:2022年5月6日-7日(周五–周六) 上午9:30-11:30 ?下午13:30-17:00

時間 主題 授課內容 備注
第一天
上午
python入門 1、Python基礎 理論
強化學習入門 2、強化學習基本概念
3、強化學習與其他機器學習的關系
4、Gym實驗環(huán)境基礎知識
理論
第一天
下午
強化學習算法入門 5、馬爾可夫決策過程
6、動態(tài)規(guī)劃
7、蒙特卡洛方法
8、時序差分
理論+
實操
第二天
上午
強化學習算法進階 9、值函數(shù)逼近(DQN算法)
10、隨機策略梯度(REINFORCE算法)
11、確定性策略梯度(DDPG算法)
12、AC算法及變種
理論+
實操
第二天
下午
強化學習綜合實踐 13、博弈強化學習
14、蒙特卡洛樹搜索
15、AlphaGo基本原理
16、AlphaGo?Zero原理
理論+
實操

注:內容以實際發(fā)生為準;若調,會提前通知。

報名費用

注冊費:2800元/人(含當期聽課費、資料費、證書費、考試費(如有))。培訓期間,食宿自理。

提供當期視頻回放以供復習使用(羽林學院平臺)。

開具增值稅發(fā)票,提供蓋章通知、結業(yè)證書等相關材料。

報名優(yōu)惠政策

1、3人以上團體報名每人可減少300元;

2、4+1團報,可免費贈送一個名額;

3、上面優(yōu)惠政策不能同時享受,只能享受其中一種;

老學員參加及推薦學員參加均可額外優(yōu)惠200元。

培訓以收到學員培訓費為成功報名,培訓座位按收到費用先后順序安排。

付費方式

現(xiàn)金、支票、銀行轉賬、銀行匯款、現(xiàn)場刷卡

單位全稱:北京市計算中心有限公司

賬號:0200151819100023937

開戶銀行:中國工商銀行股份有限公司北京永豐支行

(匯款信息備注:“生物計算——您的姓名”,個人匯款請備注單位名稱)

注:款項支出后,請?zhí)峁└犊罨貓?zhí)給工作人員,方便核實到賬、開具發(fā)票。

咨詢請聯(lián)系

QQ號:659230635

微信號:vicolee2021