链接:
443. String Compression
443. 压缩字符串
443. 压缩字符串
给定一组字符,使用原地算法将其压缩。
压缩后的长度必须始终小于或等于原数组长度。
数组的每个元素应该是长度为1 的字符(不是 int 整数类型)。
在完成原地修改输入数组后,返回数组的新长度。
示例 1:
输入:
[“a”,”a”,”b”,”b”,”c”,”c”,”c”]
输出:
返回6,输入数组的前6个字符应该是:[“a”,”2”,”b”,”2”,”c”,”3”]
说明:
“aa”被”a2”替代。”bb”被”b2”替代。”ccc”被”c3”替代。
示例 2:
输入:
[“a”]
输出:
返回1,输入数组的前1个字符应该是:[“a”]
说明:
没有任何字符串被替代。
示例 3:
输入:
[“a”,”b”,”b”,”b”,”b”,”b”,”b”,”b”,”b”,”b”,”b”,”b”,”b”]
输出:
返回4,输入数组的前4个字符应该是:[“a”,”b”,”1”,”2”]。
说明:
由于字符”a”不重复,所以不会被压缩。”bbbbbbbbbbbb”被“b12”替代。
注意每个数字在数组中都有它自己的位置。
进阶:
你能否仅使用O(1) 空间解决问题?
题解:
实现O(1)的空间复杂度,需要建一个索引cur
,直接修改原串,记录压缩后的字符串。遍历字符串,逐个找
字符连续出现的范围。先将该字符拷贝到原串的cur
上,如果该字符出现一次,不再操作,如果多次,则将
该字符的次数追加到cur
之后,修改cur
。
例如:["a","b","b","c","c","c"]
开始cur = 0
,“a”
出现一次,无需压缩。chars[cur++] = chars[0]
即可。接着"b"
出现2
次,
则有chars[cur++] = chars[1]
, chars[cur++] = chars[2]
。原串中chars[2]
变为"2"
,
cur = 3
,类似地,有chars[cur++] = chars[3]
, chars[cur++] = chars[4]
。chars[4]
变为
"3"
,此时cur = 5,即为压缩后的字符串长度。原串压缩为["a","b","2","c","3"]
。
这种压缩方式,字符连续出现频率高,才能有较好的压缩效果。
C++
class Solution {
public:
int compress(vector<char>& chars) {
int n = chars.size();
int cur = 0; // 记录当前字符的索引,最后为压缩字符串的长度
for(int i = 0; i < n; ) {
int j = i;
while( j < n - 1 && chars[j] == chars[j+1]) {// 查找字符连续相同的个数
j++;
}
chars[cur++] = chars[i];// 将当前字符写入原字符串中
if(i != j) {
string times = to_string(j - i + 1);// 字符连续相同的个数
int tLen = times.length();
for(int k = 0; k < tLen; k++) {//把字符连续相同个数写入字符串,用来压缩
chars[cur++] = times[k];
}
}
i = j + 1;//接着处理下一个字符
}
return cur;
}
};
Java
class Solution {
public int compress(char[] chars) {
int n = chars.length;
int cur = 0; // 当前处理字符的索引,最后是压缩串的长度
for(int i = 0; i < n; ) {
int j = i;
while(j < n - 1 && chars[j] == chars[j+1]) {// 找相同字符的连续个数
j++;
}
chars[cur++] = chars[i];// 记录当前字符
if(i != j) {
String times = (j - i + 1) + "";// 当前字符的连续重复次数
int tLen = times.length();
for(int k = 0; k < tLen; k++) {//将字符的重复次数写入原串中,用以压缩字符串
chars[cur++] = times.charAt(k);
}
}
i = j + 1;
}
return cur;
}
}
Python
class Solution(object):
def compress(self, chars):
"""
:type chars: List[str]
:rtype: int
"""
n = len(chars)
cur = 0 # 当前字符的索引,用以压缩原字符串
i = 0
while i < n:
j = i
while j < n - 1 and chars[j] == chars[j+1]:# 找字符连续出现的次数
j += 1
chars[cur] = chars[i] # 记录当前处理的字符
cur += 1
if i != j:
times = str(j-i+1) # 将字符的次数写入原串中
tLen = len(times)
for k in range(tLen):
chars[cur+k] = times[k]
cur += tLen
i = j + 1 # 处理下一个字符
return cur