博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
leetcode-49-字母异位词分组(神奇的哈希)
阅读量:6721 次
发布时间:2019-06-25

本文共 2672 字,大约阅读时间需要 8 分钟。

题目描述:

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入: ["eat", "tea", "tan", "ate", "nat", "bat"],输出:[  ["ate","eat","tea"],  ["nat","tan"],  ["bat"]]

说明:

  • 所有输入均为小写字母。
  • 不考虑答案输出的顺序。

    给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

    示例:

    输入: ["eat", "tea", "tan", "ate", "nat", "bat"],输出:[  ["ate","eat","tea"],  ["nat","tan"],  ["bat"]]

    说明:

    • 所有输入均为小写字母。
    • 不考虑答案输出的顺序。

 

要完成的函数:

vector<vector<string>> groupAnagrams(vector<string>& strs)

 

说明:

1、给定一个vector,里面装着多个string,要求把这些string进行分组。

两个字符串拥有相同的字母,就是同一组。(题目说字母相同,顺序不同,但测试样例中出现了字母相同顺序也相同的,也在同一组)

字符串只含有小写字母。

每一组存在一维vector中,所有组存放在二维vector中,最终返回二维vector。

 

2、这道题笔者最开始想用一个双重循环,外层循环对每个字符串进行迭代,内层循环判断当前字符串跟前面的字符串,有没有哪个是相同字母的。

关于内层循环的判断,笔者最开始想用异或来处理,但后来发现it和ro这四个不同的字母,i^t^r^o的结果为0……

也就是我们不能用异或结果是不是0来判断字母是不是相同。

异或应该只是适用于只有一个字母不同,而其他字母都相同的情况。

 

那不能用异或,那就用普通的“空间换时间”,我们建立长度为26的vector,在内层循环中判断两个字符串是否拥有相同字母。

在对长度为26的vector进行操作前,我们先判断两个字符串的长度是否相等,这可以省去很多时间。

代码如下:(附详解)

bool judge(string a,string b)//判断两个字符串是否拥有相同的字母    {        vector
table(26,0),t1(26,0); for(char i:a) table[i-'a']++; for(char i:b) table[i-'a']--; if(table!=t1)return false;//如果table不是全为0,返回false return true;//否则返回true } vector
> groupAnagrams(vector
& strs) { vector
>res={ {strs[0]}};//初始化最终要返回的二维vector bool flag; for(int i=1;i

上述代码也可以通过测试,但是实测1228ms,beats 2.20% of cpp submissions……太低了

那肯定还有更好的办法==

 

我们分析一下上述代码,发现耗费时间的地方在于:

①双重循环,如果可以改成单重循环就最好了。

②二维vector的不断申请空间、不断插入

第二点似乎很难避免,我们要初始化res拥有多长的长度?跟给定的一维vector strs一样长?那多出来那部分怎么处理……

不断地pop_back()?这也是一个方法,但看了一下普遍的时间花费是36ms左右,我这样改可能效果也不会很大……

那第一点要怎么改善?外层循环肯定不可少了,内层循环改成O(1)的时间复杂度?

 

我们想一下,如果是数字串而不是字母串,我们会怎样判断当前数字串有没有出现过?

比如12,32,12,当前数字是第三个数字12,我们可以用vector,前面有了vector[12]=1,vector[32]=1,此时我们再查询一下当前数字12的对应vector[12],是不是0。

如果是0,那么没有出现过,如果不是0,那么出现过。

这个时候我们不用一个个地去循环,去遍历,直接就访问了。

那可不可以同样利用这种方法来处理字母串呢?

答案是可以的,我们可以用哈希表。

 

哈希表其实就是数组+链表的结构,在c++中,笔者觉得map这种数据结构可能就是实现了哈希表的算法。

哈希表结合了数组的快速访问、修改和链表的无限长度两个特点,可以参考下面这张图。

左边是数组,快速访问和修改,右边的链表延伸出去,无限长度。

 我们以字母串作为键值,像用vector查看数字串一样去判断。

 

但有的同学可能有想法,比如“ate”和“eat”这两个键值都不一样,你怎么判断?

“ate”和“eat”是不一样,但它们有共性,那就是拥有的字母相同,我们可以对它们的字母排下序,就可以转化为相同的键值了。

代码如下:(附详解)

vector
> groupAnagrams(vector
& strs) { vector
>res;//最终要返回的二维vector unordered_map
m1;//定义一个map作为哈希表 int index=0; vector
strs1=strs;//用于重新排序strs中的每个字符串,strs是原本 for(int i=0;i

上述代码实测28ms,beats 93.68% of cpp submissions。

哈希表其实就是我们平时常用的vector的升级版本,用map实现时,既可以实现快速访问,又有好的哈希函数,使得空间充足。

神奇神奇~

转载于:https://www.cnblogs.com/chenjx85/p/9477896.html

你可能感兴趣的文章
第 四 十 二 天:Tomcat 的 相 关 问 题
查看>>
mysql主从状态监测
查看>>
11.18 Apache用户认证;11.19-11.20 域名跳转(上下);11.21 Apache
查看>>
B/S开发中浏览器的工具利器
查看>>
产品体验报告-美团APP
查看>>
运维工程师必会的109个Linux命令(4)
查看>>
sql 执行事务中,查询表数据
查看>>
centos7.3部署memcached服务
查看>>
[JSOI2007]文本生成器
查看>>
[POJ] Financial Management
查看>>
assert()函数用法
查看>>
10大主流压力测试工具推荐
查看>>
如何变相的绕过QQ邮箱订阅的繁琐核审
查看>>
mousedown和click冲突事件
查看>>
【Javascript第二重境界】函数
查看>>
转: Beautiful Numbers (费马小定理)
查看>>
Python 匿名函数
查看>>
(转)分布式中使用Redis实现Session共享(一)
查看>>
知识点疑问
查看>>
【UbuntuPhone开发实战】工具篇--Nexus4 booter unlock,获取root权限,刷CM10和刷Ubuntu...
查看>>