数据结构:数组和字符串
集合、列表和数组
集合
- 定义:由一个或多个确定的元素所构成的整体。
- 通俗的说,集合就是将一组事务组合在一起。
- 特性
- 集合里的元素类型不一定相同。
- 集合里的元素没有顺序
- 事实上,这样的集合并不直接存在于编程语言中。然而,实际编程语言中,就是在集合的基础上添加了一些规则形成的。
列表
- 定义:又称线性列表,是一种数据结构构成的有限序列, 即按照一定的线性顺序,排列而成的数据项的集合。
- 列表的概念是在集合的特征上形成的,它具有顺序,且长度是可变的。
- 在编程语言中,列表最常见的表现形式有数组和链表,而我们熟悉的栈和队列则是两种特殊类型的列表。除此之外,向列表中添加、删除元素的具体实现方式会根据编程语言的不同而有所区分。
数组
数组是列表的实现方式之一,也是面试中经常涉及到的数据结构。
- 正如前面提到的,数组是列表的实现方式,它具有列表的特征,同时也具有自己的一些特征。然而,在具体的编程语言中,数组这个数据结构的实现方式具有一定差别。比如 C++ 和 Java 中,数组中的元素类型必须保持一致,而 Python 中则可以不同。Python 中的数组叫做 list,具有更多的高级功能。
那么如何从宏观上区分列表和数组呢?这里有一个重要的概念:索引。
- 首先,数组会用一些名为 索引 的数字来标识每项数据在数组中的位置,且在大多数编程语言中,索引是从 0 算起的。我们可以根据数组中的索引,快速访问数组中的元素。
而列表中没有索引,这是数组与列表最大的不同点。
其次,数组中的元素在内存中是连续存储的,且每个元素占用相同大小的内存。
相反,列表中的元素在内存中可能彼此相邻,也可能不相邻。比如列表的另一种实现方式——链表,它的元素在内存中则不一定是连续的。
数组的操作
读取元素
读取数组的元素,是通过访问索引的方式来读取的,索引一般从0开始。
在计算机中,内存可以看成一些已经排列好的格子,每个格子对应一个内存地址。一般情况下,数据会分散的存储在不同的格子中。
而对于数组,计算机会在内存中为其申请一段 连续 的空间,并且会记下索引为0的内存地址。以数组 [“C”, “O”, “D”, “E”, “R”] 为例,它的各元素对应的索引及内存地址如下图所示。
假如我们想要访问索引为 2 处的元素 “D” 时,计算机会进行以下计算:
- 找到该数组的索引 0 的内存地址: 2008;
- 将内存地址加上索引值,作为目标元素的地址,即 2008 + 2 = 2010,对应的元素为 “D”,这时便找到了目标元素。
计算内存地址这个过程是很快的,而我们一旦知道了内存地址就可以立即访问到该元素,因此它的时间复杂度是常数级别,为 O(1)。
查找元素
假如我们对数组中包含哪些元素并不了解,只是想知道其中是否含有元素 “E”,数组会如何查找元素 `”E” 呢?
与读取元素类似,由于我们只保存了索引为 0 处的内存地址,因此在查找元素时,只需从数组开头逐步向后查找就可以了。如果数组中的某个元素为目标元素,则停止查找;否则继续搜索直到到达数组的末尾。
我们发现,最坏情况下,搜索的元素为 “R”,或者数组中不包含目标元素时,我们需要查找 n 次,n 为数组的长度,因此查找元素的时间复杂度为 O(N),N。
插入元素
如果我们想将元素插入到数组的末尾,只需一步。即计算机通过数组的长度和位置计算出即将插入元素的内存地址,然后将该元素插入到指定位置即可。
然而,如果要将元素插入到数组中的其他位置,就必须要先为该元素要插入的位置 腾出 空间,然后进行插入操作。
我们发现,如果需要频繁地对数组元素进行插入操作,会造成时间的浪费。另一种数据结构,链表则可以有效解决这个问题。
删除元素
删除元素与插入元素的操作类似,当我们删除掉数组中的某个元素后,数组中会留下 空缺 的位置,而数组中的元素在内存中是连续的,这就使得后面的元素需对该位置进行 填补 操作。
- 当数组的长度为 n 时,最坏情况下,我们删除第一个元素,共需要的步骤数为 1 + (n - 1) = n 步,其中,1 为删除操作,n - 1 为移动其余元素的步骤数。删除操作具有线性时间复杂度,即时间复杂度为 O(N),N为数组的长度。
练习:寻找数组的中心索引
给你一个整数数组 nums ,请计算数组的 中心下标 。
数组 中心下标 是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和。
如果中心下标位于数组最左端,那么左侧数之和视为 0 ,因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。
如果数组有多个中心下标,应该返回 最靠近左边 的那一个。如果数组不存在中心下标,返回 -1 。
示例 1:
1 | 输入:nums = [1, 7, 3, 6, 5, 6] |
示例 2:
1 | 输入:nums = [1, 2, 3] |
示例 3:
1 | 输入:nums = [2, 1, -1] |
提示
- 1 <= nums.length <= 104
- -1000 <= nums[i] <= 1000
代码:
1 | class Solution { |
练习:搜索插入位置
给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。
请必须使用时间复杂度为 O(log n) 的算法。
示例 1:
1 | 输入: nums = [1,3,5,6], target = 5 |
示例 2:
1 | 输入: nums = [1,3,5,6], target = 2 |
示例 3:
1 | 输入: nums = [1,3,5,6], target = 7 |
提示:
- 1 <= nums.length <= 104
- -104 <= nums[i] <= 104
- nums 为 无重复元素 的 升序 排列数组
- -104 <= target <= 104
代码:
1 | class Solution { |