美文网首页
算法-动态规划(2)最长公共子串

算法-动态规划(2)最长公共子串

作者: li_礼光 | 来源:发表于2021-01-12 12:17 被阅读0次

上一篇初步了解 算法-动态规划(1)最大子序和问题

巩固一遍

适用原则 :

最优解
无后效性
子问题的重叠性

动态规划使用规则

确定状态
确定边值
确定状态转换方程





题目 :

求两个字符串最长公共连续子串长度
例如 : 字符串1 : "ABC" , 字符串2 : "A" , 公共子串 : "A", 长度1
例如 : 字符串1 : "ABC" , 字符串2 : "BCA" , 公共子串 : "BC", 长度2
例如 : 字符串1 : "ABCDEDCBA" , 字符串2 : "DED" , 公共子串 : "DED", 长度3

分析步骤
  • 第一步 : 确定状态
  • 第二步 : 确定边值
  • 第三步 : 确定状态转移方程


第一步 : 确定状态

确定状态就要回归到动态规划的特性, 推导的特性, 从0到n.
因为这里是比较两个字符串, 所以需要用到两个数组, 关于最优解dp就是dp[i][j].

如果是比较一个数组里面的内容就是dp[i],
如果是比较三个数组里面的内容就是dp[i][j][k].
如果是比较N个数组里面的内容就是dp[i][j][k][..][..][..].....

从题意看, 我们需要从左往右遍历, 从上往下遍历两个字符串中的每一个字符.
因为这里将字符串拆分数组, 遍历的时候, 遍历条件也是一个一个的字符遍历,

这里遍历str1Arr和str2Arr , 从0到n推导 , dp[][] = new int[3][3]

比如 :

str1 = "ABC" ;
str2 = "BCA" ;   
char[] str1Arr = str1.toCharArray();
char[] str2Arr = str2.toCharArray();

这里n代表str1Arr中对应的坐标索引,
这里m代表str2Arr中对应的坐标索引,
分析dp[n][m].
(PS : n和m可以用i和j替换也可以, 一个意思)

n = 0, str2Arr[0] = "B"
dp[0][0] = 0 , dp[0][1] = 1, dp[0][2] = 0;

分析 : 因为"B"只有一个并且和str1中的第二个"B"相同, 所以dp[0][1] = 1.

n = 1, str2Arr[1] = "C"
dp[1][0] = 0 , dp[1][1] = 1, dp[1][2] = 2;

分析 :
因为"C"是第二个字符, 前面一个已经是"B", 如果前面的"B"已经有相等,并且紧接着后面的"C"也相等,也就是在上一个基础上加一, 这里的前一个的选择是对应的是"B","B"对应的是d[i-1][j-1], 所以dp[1][2] = dp[0][1] + 1 = 2;

如果能在上一个基础上加一, 也就是当前的字符跟上一个字符拼接得到的新字符串, 就是str1完整字符串的子串.肯定相等

简单粗暴分析 : 就是所以dp[i][j] = 最大值. 这个最大值就是当前最长的连续子串

n = 2, str2Arr[2] = "A"
dp[1][0] = 1 , dp[1][1] = 0, dp[1][2] = 0;

分析 : 同n=1

所以这里相等的话就在前一个基础上+1, 不相等就跳过.

PS : 这里主要是理解上一个基础上加一 , 这个上一个的选择.
也就是说 dp[i][j] 是 str1Arr 以[0 , i - 1]的范围内, str2Arr 以[0 , j - 1]的范围内的最优解
Str1 A B C
Str2 - - - -
B - 0 1 0
C - 0 0 2
A - 1 0 0


第二步 : 确定边值

这里主要考虑第一个和最后一个的情况. 在代码中的判断注意下



第三步 : 确定状态转移方程

从第一步分析中.
因为"C"是第二个字符, 前面一个已经是"B", 如果前面的"B"已经有相等,并且紧接着后面的"C"也相等,也就是在上一个基础上加一, 这里的前一个的选择是对应的是"B","B"对应的是d[i-1][j-1], 所以dp[1][2] = dp[0][1] + 1 = 2;

也就是

if 判断当前字符相等 {
    dp[i][j] = dp[i-1][j-1] + 1;
} else {
    dp[i][j] = 0;// 默认初始化数组就是为0, 直接用continue代替
}


代码实现

  public static int LCSubSting(String str1, String str2) {
    char[] str1Arr = str1.toCharArray();
    char[] str2Arr = str2.toCharArray();

    int[][] dp = new int[str1Arr.length][str2Arr.length];
    int max = 0; // 记录最大值

    for (int i = 0; i < str1.length(); i++) {
      for (int j = 0; j < str2.length(); j++) {
        //比较规则
        if (str1Arr[i] == str2Arr[j]) {
          // 这里注意的是i=0,j=0的情况
          if (i == 0 || j == 0) {
            dp[i][j] = 1;
          } else {
            dp[i][j] = dp[i-1][j-1] +1;
          }
        } else {
          continue;
        }
        //最后比较最大的一个
        max = Math.max(max,dp[i][j]);
      }
    }
    return max;
  }

测试

例如 : 字符串1 : "ABC" , 字符串2 : "A" , 公共子串 : "A", 长度1


测试1

例如 : 字符串1 : "ABC" , 字符串2 : "BCA" , 公共子串 : "BC", 长度2


测试2

例如 : 字符串1 : "ABCDEDCBA" , 字符串2 : "DED" , 公共子串 : "DED", 长度3


测试3


如果两个长度特别长, 有需要打印其中最长的子串是什么. 稍微修改 :

public static String LCSubSting2(String str1, String str2) {
    char[] str1Arr = str1.toCharArray();
    char[] str2Arr = str2.toCharArray();

    int[][] dp = new int[str1Arr.length][str2Arr.length];
    int endIndex = 0 , max = 0;
    for (int i = 0; i < str1.length(); i++) {
      for (int j = 0; j < str2.length(); j++) {
        if (str1Arr[i] == str2Arr[j]) {
          if (i == 0 || j == 0) {
            dp[i][j] = 1;
          } else {
            dp[i][j] = dp[i-1][j-1] +1;
          }
        } else {
          continue;
        }

        if (max < dp[i][j]) {
          endIndex = j;
          max = dp[i][j];
        }
      }
    }
    if (max == 0) {
      return "";
    } else {
      return str2.substring(endIndex-max + 1,endIndex + 1);
    }
  }
打印子串

复杂度分析

时间复杂度 , 两个for循环 , o(str1Arr.length * str2Arr.length)




总结 :

对于动态规划, 最主要的是dp, dp就是最优解, 对于dp怎么确定状态, 应该是比较抽象, 不太好理解. 那么就根据题意来从0推导.

自己总结 :

  • 从0到n推导, 因为从0开始, 首先确定最基本的逻辑, 根据题意判断用多少个for循环.
  • 不考虑中间值, 比如dp[i][j]代表什么意思, 如果是遍历一个数组, 那就dp是一维数组, 如果是遍历两个数组, 那dp就是二维数组. 以此类推.
  • 从0到n推导后, 从中分析dp的状态转移方程.
  • 确定判断条件.
  • 写出对应的代码

相关文章

  • 算法-理解动态规划

    算法-动态规划(1)最大子序和问题[/p/7e787a287876]算法-动态规划(2)最长公共子串[/p/7ba...

  • python求最长公共子串

    最长公共子串的动态规划公式:

  • 字符串

    1 最长无重复字符子串 2 最长上升子序列(动态规划) 3 最长公共子序列的长度(动态规划) 4 对于一个字符串,...

  • 字符串的动态规划问题(Java)

    动态规划问题基本就是用空间换时间 1.最长公共子串[1] ①定义 最长公共子串(Longest Common Su...

  • 算法-动态规划(2)最长公共子串

    上一篇初步了解 算法-动态规划(1)最大子序和问题[https://www.jianshu.com/p/7e787...

  • 秋招记录-百度核心搜索部

    一面:1、链表反转2、字符串的最长公共子序列(输出该子序列,用的动态规划)动态规划的思路: 3、介绍项目4、XGB...

  • 最长回文子串

    动态规划典型题目思考1、字符串相关知识2、遍历回文子串的方法3、可以求逆串,然后找最长公共子串 lc 5 之前记长...

  • 2018-08-09

    动态规划之最长公共子序列 问题描述 给定两个字符串,求解两个字符串的最长公共子序列。比如字符串1:BDCABA;字...

  • 最大公共连续子串

    给定一组字符串,找到最长公共连续子串;动态规划转移方程str1[i] == str2[j]: dp[i][j] =...

  • 最长公共子序列LCS类的问题

    概述 最长公共子序列(LCS)是字符串动态规划算法里比较经典的问题了。 该问题如下:给定两个字符串,如abcd 和...

网友评论

      本文标题:算法-动态规划(2)最长公共子串

      本文链接:https://www.haomeiwen.com/subject/pcmsaktx.html