288

ascoders · ascoders · commit edb9fcce083c · 2023-10-23T09:49:46.000+08:00
diff --git a/readme.md b/readme.md
@@ -6,7 +6,7 @@
 
 前端界的好文精读，每周更新！
 
-最新精读：<a href="./前沿技术/287.%E7%B2%BE%E8%AF%BB%E3%80%8AVisActor%20%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96%E5%B7%A5%E5%85%B7%E3%80%8B.md">287.精读《VisActor 数据可视化工具》</a>
+最新精读：<a href="./算法/288.%E7%B2%BE%E8%AF%BB%E3%80%8A%E7%AE%97%E6%B3%95%E9%A2%98%20-%20%E7%BC%96%E8%BE%91%E8%B7%9D%E7%A6%BB%E3%80%8B.md">288.精读《算法题 - 编辑距离》</a>
 
 素材来源：[周刊参考池](https://github.com/ascoders/weekly/issues/2)
 
@@ -306,6 +306,7 @@
 - <a href="./算法/284.%E7%B2%BE%E8%AF%BB%E3%80%8A%E7%AE%97%E6%B3%95%E9%A2%98%20-%20%E7%BB%9F%E8%AE%A1%E5%8F%AF%E4%BB%A5%E8%A2%AB%20K%20%E6%95%B4%E9%99%A4%E7%9A%84%E4%B8%8B%E6%A0%87%E5%AF%B9%E6%95%B0%E7%9B%AE%E3%80%8B.md">284.精读《算法题 - 统计可以被 K 整除的下标对数目》</a>
 - <a href="./算法/285.%E7%B2%BE%E8%AF%BB%E3%80%8A%E7%AE%97%E6%B3%95%E9%A2%98%20-%20%E6%9C%80%E5%B0%8F%E8%A6%86%E7%9B%96%E5%AD%90%E4%B8%B2%E3%80%8B.md">285.精读《算法题 - 最小覆盖子串》</a>
 - <a href="./算法/286.%E7%B2%BE%E8%AF%BB%E3%80%8A%E7%AE%97%E6%B3%95%E9%A2%98%20-%20%E5%9C%B0%E4%B8%8B%E5%9F%8E%E6%B8%B8%E6%88%8F%E3%80%8B.md">286.精读《算法题 - 地下城游戏》</a>
+- <a href="./算法/288.%E7%B2%BE%E8%AF%BB%E3%80%8A%E7%AE%97%E6%B3%95%E9%A2%98%20-%20%E7%BC%96%E8%BE%91%E8%B7%9D%E7%A6%BB%E3%80%8B.md">288.精读《算法题 - 编辑距离》</a>
 
 ### 可视化搭建
 
diff --git a/算法/288.精读《算法题 - 编辑距离》.md b/算法/288.精读《算法题 - 编辑距离》.md
@@ -0,0 +1,130 @@
+今天我们看一道 leetcode hard 难度题目：[编辑距离](https://leetcode.cn/problems/edit-distance/description/)。
+
+## 题目
+
+给你两个单词 `word1` 和 `word2`， 请返回将 `word1` 转换成 `word2` 所使用的最少操作数。
+
+你可以对一个单词进行如下三种操作：
+
+- 插入一个字符
+- 删除一个字符
+- 替换一个字符
+
+示例1：
+
+```
+输入：word1 = "horse", word2 = "ros"
+输出：3
+解释：
+horse -> rorse (将 'h' 替换为 'r')
+rorse -> rose (删除 'r')
+rose -> ros (删除 'e')
+```
+
+## 思考
+
+看到题目的第一感觉是按照人的直觉做题，比如示例中 `horse` 与 `ros` 其中都有 `os`，那么最短编辑距离肯定要维持 `os` 相对位置不变。但该方法可能更适合大模型用直觉做题，而不是和用代码编写，背后有太多无法固化的逻辑。
+
+看来只能用动态规划暴力解决，但如何定义变量呢？
+
+如果我们仅用一个变量，只有两种定义方法：
+
+- `dp(i)` 返回 `word1` 下标为 `i` 时最短编辑距离。
+- `dp(i)` 返回 `word2` 下标为 `i` 时最短编辑距离。
+
+对第一种定义，我们的目标是计算出 `dp(word1.length-1)`，其中 `dp(-1)` 即 `word1` 从空字符串转换为 `word2` 需要的编剧距离显然是 `word2.length`，即把 `word2` 依次添加到 `word1`。但严重的问题是 `dp(i)` 与 `dp(i-1)` 的关系没有意义，因为从 `dp(-1)` 开始，就已经全部完成了 `word1` 到 `word2` 的转换，如果要计算 `dp(0)`，就只能删除 `word1` 的第 `i` 项，依此类推，这样无法模拟各种可能的操作。对第二中定义也类似。
+
+这种想法的根本问题是，将 `word1` 到 `word2` 转换时，要么一次从空字符串转换为完整的 `word2`，要么从完整的 `word1` 转换为空字符串，这背后无法体现一个一个字符的考虑，所以必须用两个变量，分别定义 `i`、`j` 下标才行。
+
+## 动态规划
+
+有了上面的思考，动态规划的定义就清楚了：
+
+定义 `i` 为 `word1` 下标，`j` 为 `word2` 下标，`dp(i,j)` 返回 `word1` 下标为 `i`，且 `word2` 下标为 `j` 时最短编辑距离。
+
+让我们再审视一下 `dp(i,j)` 的含义：除了返回最短编辑距离外，正因为我们知道了最短编辑距离，所以无论操作步骤、过程如何，**都可以假设我们只要做了若干步操作，下标分别截止到 `i`、`j` 的 `word1`、`word2` 内容就完全相同了**！这真是太优美了，一下就把复杂的问题简单化了，我们只要考虑当前步骤，也要清晰的知道之前步骤的状态代表什么含义。
+
+接下来考虑状态转移，由于没有任何操作限制，我们必须把所有可能的转移都考虑进去，包括：
+
+- `i-1,j`
+- `i,j-1`
+- `i-1,j-1`
+
+也许会有新手问，为什么没有考虑 `i-2,j`、`i-3,j-1` 等等情况？这是因为函数是递归调用的，`i-2,j` 等价于 `i-1,j` + `i-1,j`，为了简化代码复杂度，只考虑一层转换的心智负担最低，又能通过递归实现所有操作可能性。
+
+此时老手可能会问，那 `i-1,j-1` 不就等价于 `i-1,j` + `i,j-1` 吗？这么列出来不是重复了吗？说的很对，我们要意识到这一点，但同时还要进一步意识到每一步操作都有成本，本题还支持替换字符串操作，该操作可以一步实现 `i-1,j` + `i,j-1` 两步行为，考虑它可以减少操作步骤，肯定会影响到最终答案。
+
+接着我们要思考状态转移方程是什么，仔细阅读下面的思考过程：
+
+对于 `i-1,j`，因为 `i-1,j` 经过 `dp(i-1,j)` 次数的操作后，`word1[0,i-1]` 与 `word2[0,j]` 已经完全相同了，我们的目的就是让两边字符串相同，所以 `word1[i]` 这个多出来的字符串需要毫不留情的删除，删除需要一步，因此 `dp(i,j) = dp(i-1,j) + 1`，该步是删除。
+
+对于 `i,j-1`，因为 `i,j-1` 经过 `dp(i,j-1)` 次数的操作后，`word1[0,i]` 与 `word2[0,j-1]` 已经完全相同了，我们的目的就是让两边字符串相同，所以 `word2[j]` 这个字符是截止到 `word1[0,i]` 需要新增上去的，因此 `dp(i,j) = dp(i,j-1) + 1`，该步是新增。
+
+对于 `i-1,j-1`，因为 `i-1,j-1` 经过 `dp(i-1,j-1)` 次数的操作后，`word1[0,i-1]` 与 `word2[0,j-1]` 已经完全相同了，我们的目的就是让两边字符串相同，所以对于 `word1[i]` 到 `word2[j]` 来说，如果它俩字符相同，则不需要操作，如果不相同，执行一次替换操作即可，因此在 `word1[i]` 与 `word2[j]` 不同是，`dp(i,j) = dp(i,j-1) + 1`，该步是替换。
+
+对 `i-1,j-1` 的思考让我们意识到需要优先考虑 `word1[i]` 与 `word2[j]` 相同的情况，这种情况只要看前一个字符的结果就行，不需要产生额外的操作，因此转移方程是：`dp(i,j) = dp(i-1,j-1)`。
+
+最后再考虑一下边界情况，当 `word1` 与 `word2` 任意为空时，只要执行非空字符串长度次数的增或删就行了。
+
+```ts
+function minDistance(word1: string, word2: string): number {
+  // 任意一个字符串为空时，执行非空字符串长度次数的增或删
+  if(word1 === '' || word2 === '') {
+    return word1.length + word2.length
+  }
+
+  const dp = new Map()
+
+  function getDp(i: number, j: number) {
+    return dp.get(`${i},${j}`)
+  }
+
+  function calcDp(i: number, j: number) {
+    // 兼容下边界情况
+    if (i === 0 && j === 0) {
+      return word1[0] === word2[0] ? 0 : 1
+    }
+
+    if (word1[i] === word2[j]) {
+      return getDp(i-1, j-1)
+    }
+
+    return Math.min(
+      // i-1, j: 删除第 i 项
+      getDp(i-1, j) + 1,
+      // i, j-1: 增加第 i 项
+      getDp(i, j-1) + 1,
+      // i-1, j-1: 替换第 i 项
+      getDp(i-1, j-1) + 1
+    )
+  }
+
+  for (let i = 0; i < word1.length; i++) {
+    dp.set(`${i},-1`, i + 1)
+  }
+
+  for (let j = 0; j < word2.length; j++) {
+    dp.set(`-1,${j}`, j + 1)
+  }
+
+  for (let i = 0; i < word1.length; i++) {
+    for (let j = 0; j < word2.length; j++) {
+      dp.set(`${i},${j}`, calcDp(i, j))
+    }  
+  }
+
+  return getDp(word1.length-1, word2.length-1)
+};
+```
+
+其中花了我一些时间的地方在于边界情况处理，比如当 `i=0` 时，`dp(i-1,j)` 就出现了 `i=-1` 的情况，因此对于 `i`、`j` 都要提前计算一下为 `-1` 时的值，而当下标为 `-1` 时，等价于该字符串为空，那么空字符串如何转换为 `word2`，或 `word1` 如何转换为空字符串呢？只要执行对方下标 + 1 次的增或删就行了。
+
+## 总结
+
+当意识到该题没有捷径时，就要考虑动态规划方案了，而动态规划第一难点在于定义参数，第二难点在于写状态转移方程，而只要定义对了参数，状态转移方程也就呼之欲出了，因此最难的一步就是定义参数，对这道题参数定义还有疑问的小伙伴可以回到 思考 章节重新阅读一下。
+
+> 讨论地址是：[精读《算法 - 编辑距离》· Issue #501 · dt-fe/weekly](https://github.com/dt-fe/weekly/issues/501)
+
+**如果你想参与讨论，请 [点击这里](https://github.com/dt-fe/weekly)，每周都有新的主题，周末或周一发布。前端精读 - 帮你筛选靠谱的内容。**
+
+> 版权声明：自由转载-非商用-非衍生-保持署名（[创意共享 3.0 许可证](https://creativecommons.org/licenses/by-nc-nd/3.0/deed.zh)）