W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗(yàn)值獎勵
上兩節(jié)介紹了動態(tài)規(guī)劃問題的主要特征,接下來我們一起探究兩個更加實(shí)用的問題。
總的來說,如果一個問題包含重疊子問題、最優(yōu)子結(jié)構(gòu),并滿足無后效性,那么它通常就適合用動態(tài)規(guī)劃求解。然而,我們很難從問題描述上直接提取出這些特性。因此我們通常會放寬條件,先觀察問題是否適合使用回溯(窮舉)解決。
適合用回溯解決的問題通常滿足“決策樹模型”,這種問題可以使用樹形結(jié)構(gòu)來描述,其中每一個節(jié)點(diǎn)代表一個決策,每一條路徑代表一個決策序列。
換句話說,如果問題包含明確的決策概念,并且解是通過一系列決策產(chǎn)生的,那么它就滿足決策樹模型,通??梢允褂没厮輥斫鉀Q。
在此基礎(chǔ)上,動態(tài)規(guī)劃問題還有一些判斷的“加分項(xiàng)”。
相應(yīng)地,也存在一些“減分項(xiàng)”。
如果一個問題滿足決策樹模型,并具有較為明顯的“加分項(xiàng)“,我們就可以假設(shè)它是一個動態(tài)規(guī)劃問題,并在求解過程中驗(yàn)證它。
動態(tài)規(guī)劃的解題流程會因問題的性質(zhì)和難度而有所不同,但通常遵循以下步驟:描述決策,定義狀態(tài),建立
為了更形象地展示解題步驟,我們使用一個經(jīng)典問題“最小路徑和”來舉例。
Question
給定一個 grid
,網(wǎng)格中的每個單元格包含一個非負(fù)整數(shù),表示該單元格的代價(jià)。機(jī)器人以左上角單元格為起始點(diǎn),每次只能向下或者向右移動一步,直至到達(dá)右下角單元格。請返回從左上角到右下角的最小路徑和。
圖 14-10 展示了一個例子,給定網(wǎng)格的最小路徑和為
圖 14-10 最小路徑和示例數(shù)據(jù)
第一步:思考每輪的決策,定義狀態(tài),從而得到
本題的每一輪的決策就是從當(dāng)前格子向下或向右一步。設(shè)當(dāng)前格子的行列索引為
狀態(tài)
至此,我們就得到了圖 14-11 所示的二維
圖 14-11 狀態(tài)定義與 dp 表
Note
動態(tài)規(guī)劃和回溯過程可以被描述為一個決策序列,而狀態(tài)由所有決策變量構(gòu)成。它應(yīng)當(dāng)包含描述解題進(jìn)度的所有變量,其包含了足夠的信息,能夠用來推導(dǎo)出下一個狀態(tài)。
每個狀態(tài)都對應(yīng)一個子問題,我們會定義一個
第二步:找出最優(yōu)子結(jié)構(gòu),進(jìn)而推導(dǎo)出狀態(tài)轉(zhuǎn)移方程
對于狀態(tài)
根據(jù)以上分析,可推出圖 14-12 所示的狀態(tài)轉(zhuǎn)移方程:
圖 14-12 最優(yōu)子結(jié)構(gòu)與狀態(tài)轉(zhuǎn)移方程
Note
根據(jù)定義好的
一旦我們找到了最優(yōu)子結(jié)構(gòu),就可以使用它來構(gòu)建出狀態(tài)轉(zhuǎn)移方程。
第三步:確定邊界條件和狀態(tài)轉(zhuǎn)移順序
在本題中,首行的狀態(tài)只能從其左邊的狀態(tài)得來,首列的狀態(tài)只能從其上邊的狀態(tài)得來,因此首行
如圖 14-13 所示,由于每個格子是由其左方格子和上方格子轉(zhuǎn)移而來,因此我們使用采用循環(huán)來遍歷矩陣,外循環(huán)遍歷各行、內(nèi)循環(huán)遍歷各列。
圖 14-13 邊界條件與狀態(tài)轉(zhuǎn)移順序
Note
邊界條件在動態(tài)規(guī)劃中用于初始化
狀態(tài)轉(zhuǎn)移順序的核心是要保證在計(jì)算當(dāng)前問題的解時(shí),所有它依賴的更小子問題的解都已經(jīng)被正確地計(jì)算出來。
根據(jù)以上分析,我們已經(jīng)可以直接寫出動態(tài)規(guī)劃代碼。然而子問題分解是一種從頂至底的思想,因此按照“暴力搜索
從狀態(tài)
min_path_sum.cpp
/* 最小路徑和:暴力搜索 */
int minPathSumDFS(vector<vector<int>> &grid, int i, int j) {
// 若為左上角單元格,則終止搜索
if (i == 0 && j == 0) {
return grid[0][0];
}
// 若行列索引越界,則返回 +∞ 代價(jià)
if (i < 0 || j < 0) {
return INT_MAX;
}
// 計(jì)算從左上角到 (i-1, j) 和 (i, j-1) 的最小路徑代價(jià)
int left = minPathSumDFS(grid, i - 1, j);
int up = minPathSumDFS(grid, i, j - 1);
// 返回從左上角到 (i, j) 的最小路徑代價(jià)
return min(left, up) != INT_MAX ? min(left, up) + grid[i][j] : INT_MAX;
}
圖 14-14 給出了以 grid
的尺寸變大而急劇增多。
本質(zhì)上看,造成重疊子問題的原因?yàn)椋?strong>存在多條路徑可以從左上角到達(dá)某一單元格。
圖 14-14 暴力搜索遞歸樹
每個狀態(tài)都有向下和向右兩種選擇,從左上角走到右下角總共需要
我們引入一個和網(wǎng)格 grid
相同尺寸的記憶列表 mem
,用于記錄各個子問題的解,并將重疊子問題進(jìn)行剪枝。
min_path_sum.cpp
/* 最小路徑和:記憶化搜索 */
int minPathSumDFSMem(vector<vector<int>> &grid, vector<vector<int>> &mem, int i, int j) {
// 若為左上角單元格,則終止搜索
if (i == 0 && j == 0) {
return grid[0][0];
}
// 若行列索引越界,則返回 +∞ 代價(jià)
if (i < 0 || j < 0) {
return INT_MAX;
}
// 若已有記錄,則直接返回
if (mem[i][j] != -1) {
return mem[i][j];
}
// 左邊和上邊單元格的最小路徑代價(jià)
int left = minPathSumDFSMem(grid, mem, i - 1, j);
int up = minPathSumDFSMem(grid, mem, i, j - 1);
// 記錄并返回左上角到 (i, j) 的最小路徑代價(jià)
mem[i][j] = min(left, up) != INT_MAX ? min(left, up) + grid[i][j] : INT_MAX;
return mem[i][j];
}
如圖 14-15 所示,在引入記憶化后,所有子問題的解只需計(jì)算一次,因此時(shí)間復(fù)雜度取決于狀態(tài)總數(shù),即網(wǎng)格尺寸
圖 14-15 記憶化搜索遞歸樹
基于迭代實(shí)現(xiàn)動態(tài)規(guī)劃解法。
min_path_sum.cpp
/* 最小路徑和:動態(tài)規(guī)劃 */
int minPathSumDP(vector<vector<int>> &grid) {
int n = grid.size(), m = grid[0].size();
// 初始化 dp 表
vector<vector<int>> dp(n, vector<int>(m));
dp[0][0] = grid[0][0];
// 狀態(tài)轉(zhuǎn)移:首行
for (int j = 1; j < m; j++) {
dp[0][j] = dp[0][j - 1] + grid[0][j];
}
// 狀態(tài)轉(zhuǎn)移:首列
for (int i = 1; i < n; i++) {
dp[i][0] = dp[i - 1][0] + grid[i][0];
}
// 狀態(tài)轉(zhuǎn)移:其余行列
for (int i = 1; i < n; i++) {
for (int j = 1; j < m; j++) {
dp[i][j] = min(dp[i][j - 1], dp[i - 1][j]) + grid[i][j];
}
}
return dp[n - 1][m - 1];
}
圖 14-16 展示了最小路徑和的狀態(tài)轉(zhuǎn)移過程,其遍歷了整個網(wǎng)格,因此時(shí)間復(fù)雜度為
數(shù)組 dp
大小為
圖 14-16 最小路徑和的動態(tài)規(guī)劃過程
由于每個格子只與其左邊和上邊的格子有關(guān),因此我們可以只用一個單行數(shù)組來實(shí)現(xiàn)
請注意,因?yàn)閿?shù)組 dp
只能表示一行的狀態(tài),所以我們無法提前初始化首列狀態(tài),而是在遍歷每行中更新它。
min_path_sum.cpp
/* 最小路徑和:空間優(yōu)化后的動態(tài)規(guī)劃 */
int minPathSumDPComp(vector<vector<int>> &grid) {
int n = grid.size(), m = grid[0].size();
// 初始化 dp 表
vector<int> dp(m);
// 狀態(tài)轉(zhuǎn)移:首行
dp[0] = grid[0][0];
for (int j = 1; j < m; j++) {
dp[j] = dp[j - 1] + grid[0][j];
}
// 狀態(tài)轉(zhuǎn)移:其余行
for (int i = 1; i < n; i++) {
// 狀態(tài)轉(zhuǎn)移:首列
dp[0] = dp[0] + grid[i][0];
// 狀態(tài)轉(zhuǎn)移:其余列
for (int j = 1; j < m; j++) {
dp[j] = min(dp[j - 1], dp[j]) + grid[i][j];
}
}
return dp[m - 1];
}
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: