技術文章 | 台灣美食網

強化學習(Reinforcementlearning)潛力無窮，能解決許多開發應用上面臨的艱難決策...以此範例來說，訓練是透過一個訓練演算法(trainingalgorithm)來監督。

By Emmanouil Tzorakoleftherakis, MathWorks

強化學習(Reinforcement learning)潛力無窮，能解決許多開發應用上面臨的艱難決策問題，包括產業自動化、自主駕駛、電玩競技遊戲以及機器人等，因此備受矚目。

強化學習是機器學習(Machine learning)的一種，指的是電腦透過與一個動態(dynamic)環境不斷重複地互動，來學習正確地執行一項任務。這種嘗試錯誤(trial-and-error)的學習方法，使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下，就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo，它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。

強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料，像是天氣或交通流量。強化學習演算法的目標，即是於找出能夠產生最佳結果的策略。強化學習之所以能達成目標，是藉著軟體當中被稱為主體 (agent)的部分在環境中進行探索、互動和學習的方法。

自動駕駛範例

自助停車(self-parking)是自動駕駛功能中極為重要的一環，目標是要讓車輛中的電腦(主體，agent)能準確地尋找位置並將車輛停入正確的停車格。在以下的範例中，環境(environment)指的是主體之外的所有事物—比如車輛本身的動態、附近的車輛、天候條件等等。訓練過程中，主體使用從各種感測器如攝影機、GPS、光學雷達(LiDAR)以及其他感測器讀取的資料來產生駕駛、煞車、與加速指令(動作，action)。為了學習如何從觀察去產生正確的動作(也就是策略調整，policy tuning)，主體會不斷反覆地嘗試錯誤來試著停車，而正確的動作會得到一個獎賞(reward)(強化，reinforced)以數值訊號表示(圖1)。

圖1. 強化學習概要圖

以此範例來說，訓練是透過一個訓練演算法(training algorithm)來監督。這個訓練演算法（即主體的大腦）負責根據從感測器收集而來的資料...

#2.1 简单例子(强化学习Reinforcement Learning 教学) | 台灣美食網

这一次我们会用tabular Q-learning 的方法实现一个小例子, 例子的环境是一个一维世界, 在世界 ... Read More

Open AI Gym 簡介與Q learning 演算法實作 | 台灣美食網

2017年11月4日 — 一開始學習，範例總是越簡單越好，這樣才會有開始上手的成就感。 import gym env = gym.make('CartPole-v0') env.reset() ... Read More

Reinforcement Learning 健身房：OpenAI Gym | 台灣美食網

2018年6月1日 — 網路上有非常多建立在CartPole 的範例，這邊把常見演算法整合，進階的Deep Q-Network 則留到下一篇。 cart pole. GitHub 完整程式碼：https:// ... Read More

[Day | 台灣美食網

今天我們來聊聊增強式學習(Reinforcement learning)，一個最近也很“潮” 的 ... 能透過一個Deep learning 、 Machine learning的演算法，能擊敗最強的圍棋手。 Read More

[機器學習ML NOTE] Reinforcement Learning 強化學習(DQN ... | 台灣美食網

2018年8月17日 — 前言. “[機器學習ML NOTE] Reinforcement Learning 強化學習(DQN原理)” is published by GGWithRabitLIFE in 雞雞與兔兔的工程世界. Read More

強化學習 | 台灣美食網

Reinforcement Learning (強化學習/ 增強式學習)是以環 ... 手算範例. 有一間房子的隔局如下圖，共有5個房間(A~E)，房外空. 間設為F，B與E房可直通房外。 Read More

强化学习的三种范例（Three Paradigms of Reinforcement ... | 台灣美食網

2019年11月1日 — 强化学习的三种范例（Three Paradigms of Reinforcement Learning） ... Dong等人已经开始将该概念形式化，证明存在许多MDP，其策略和Q ... Read More

技術文章 | 台灣美食網

強化學習(Reinforcement learning)潛力無窮，能解決許多開發應用上面臨的艱難決策 ... 以此範例來說，訓練是透過一個訓練演算法(training algorithm)來監督。 Read More

用Q learning 實現最簡單走迷宮程式@ 我的小小AI 天地:: 痞客邦 | 台灣美食網

2016年11月12日 — 本文要教大家如何用Q learning 實作出一個走迷宮的AI機器人，如果不知道這公式怎麼來的話可以看我之前的推導文章Q-learning 推導公式: 程式 ... Read More

相關資訊整理

桃園市中壢區【RL】店家資訊營業時間

RL是桃園市中壢區的熱門美食,2017金牌好店特色推薦：經典CHEDDAR牛肉堡、Avocat酪梨塔RL為ChefRui&ChefLo的縮寫，兩位主...

技術文章 | 台灣美食網

#2.1 简单例子(强化学习Reinforcement Learning 教学) | 台灣美食網

Open AI Gym 簡介與Q learning 演算法實作 | 台灣美食網

Reinforcement Learning 健身房：OpenAI Gym | 台灣美食網

[Day | 台灣美食網

[機器學習ML NOTE] Reinforcement Learning 強化學習(DQN ... | 台灣美食網

強化學習 | 台灣美食網

强化学习的三种范例（Three Paradigms of Reinforcement ... | 台灣美食網

技術文章 | 台灣美食網

用Q learning 實現最簡單走迷宮程式@ 我的小小AI 天地:: 痞客邦 | 台灣美食網

桃園市中壢區【RL】店家資訊營業時間

嘉義市東區【一間茶屋】店家資訊營業時間

基隆市中正區【和平島35號海鮮餐廳】店家資訊營業時間

桃園市蘆竹區【川門子美食時尚餐廳】店家資訊營業時間

新北市鶯歌區【昭和園】店家資訊營業時間

嘉義市東區【芙甜法式點心坊】店家資訊營業時間

南投縣水里鄉【水里鵝肉大王】店家資訊營業時間

桃園市大園區【正福伯活海鮮】店家資訊營業時間

嘉義縣竹崎鄉【龍雲休閒農場】店家資訊營業時間

彰化縣彰化市【歐可冷茶(歐可茶葉科技有限公司)】店家資訊營業時間

桃園市大溪區【賴媽媽豆花】店家資訊營業時間

基隆市中正區【海宴赤燒火烤兩吃】店家資訊營業時間

臺中市龍井區【粉紅捲捲】店家資訊營業時間

高雄市新興區【冒煙的喬Smokey Joe's美式墨西哥餐廳】店家資訊營業時間

新北市淡水區【淡水漁會】店家資訊營業時間

臺南市佳里區【佳里農會邊切仔麵】店家資訊營業時間