数据结构:数组和字符串

集合、列表和数组

集合

  • 定义:由一个或多个确定的元素所构成的整体。
  • 通俗的说,集合就是将一组事务组合在一起。
  • 特性
    • 集合里的元素类型不一定相同。
    • 集合里的元素没有顺序
  • 事实上,这样的集合并不直接存在于编程语言中。然而,实际编程语言中,就是在集合的基础上添加了一些规则形成的。

列表

  • 定义:又称线性列表,是一种数据结构构成的有限序列, 即按照一定的线性顺序,排列而成的数据项的集合。
  • 列表的概念是在集合的特征上形成的,它具有顺序,且长度是可变的。
  • 在编程语言中,列表最常见的表现形式有数组和链表,而我们熟悉的栈和队列则是两种特殊类型的列表。除此之外,向列表中添加、删除元素的具体实现方式会根据编程语言的不同而有所区分。

数组

数组是列表的实现方式之一,也是面试中经常涉及到的数据结构。

  • 正如前面提到的,数组是列表的实现方式,它具有列表的特征,同时也具有自己的一些特征。然而,在具体的编程语言中,数组这个数据结构的实现方式具有一定差别。比如 C++ 和 Java 中,数组中的元素类型必须保持一致,而 Python 中则可以不同。Python 中的数组叫做 list,具有更多的高级功能。

那么如何从宏观上区分列表和数组呢?这里有一个重要的概念:索引。

  • 首先,数组会用一些名为 索引 的数字来标识每项数据在数组中的位置,且在大多数编程语言中,索引是从 0 算起的。我们可以根据数组中的索引,快速访问数组中的元素。

  • 而列表中没有索引,这是数组与列表最大的不同点。

  • 其次,数组中的元素在内存中是连续存储的,且每个元素占用相同大小的内存。

  • 相反,列表中的元素在内存中可能彼此相邻,也可能不相邻。比如列表的另一种实现方式——链表,它的元素在内存中则不一定是连续的。


数组的操作

读取元素

读取数组的元素,是通过访问索引的方式来读取的,索引一般从0开始。

在计算机中,内存可以看成一些已经排列好的格子,每个格子对应一个内存地址。一般情况下,数据会分散的存储在不同的格子中。

而对于数组,计算机会在内存中为其申请一段 连续 的空间,并且会记下索引为0的内存地址。以数组 [“C”, “O”, “D”, “E”, “R”] 为例,它的各元素对应的索引及内存地址如下图所示。

假如我们想要访问索引为 2 处的元素 “D” 时,计算机会进行以下计算:

  • 找到该数组的索引 0 的内存地址: 2008;
  • 将内存地址加上索引值,作为目标元素的地址,即 2008 + 2 = 2010,对应的元素为 “D”,这时便找到了目标元素。

计算内存地址这个过程是很快的,而我们一旦知道了内存地址就可以立即访问到该元素,因此它的时间复杂度是常数级别,为 O(1)。


查找元素

假如我们对数组中包含哪些元素并不了解,只是想知道其中是否含有元素 “E”,数组会如何查找元素 `”E” 呢?

与读取元素类似,由于我们只保存了索引为 0 处的内存地址,因此在查找元素时,只需从数组开头逐步向后查找就可以了。如果数组中的某个元素为目标元素,则停止查找;否则继续搜索直到到达数组的末尾。

我们发现,最坏情况下,搜索的元素为 “R”,或者数组中不包含目标元素时,我们需要查找 n 次,n 为数组的长度,因此查找元素的时间复杂度为 O(N),N。


插入元素

  • 如果我们想将元素插入到数组的末尾,只需一步。即计算机通过数组的长度和位置计算出即将插入元素的内存地址,然后将该元素插入到指定位置即可。

  • 然而,如果要将元素插入到数组中的其他位置,就必须要先为该元素要插入的位置 腾出 空间,然后进行插入操作。

  • 我们发现,如果需要频繁地对数组元素进行插入操作,会造成时间的浪费。另一种数据结构,链表则可以有效解决这个问题。


删除元素

        删除元素与插入元素的操作类似,当我们删除掉数组中的某个元素后,数组中会留下 空缺 的位置,而数组中的元素在内存中是连续的,这就使得后面的元素需对该位置进行 填补 操作。

  • 当数组的长度为 n 时,最坏情况下,我们删除第一个元素,共需要的步骤数为 1 + (n - 1) = n 步,其中,1 为删除操作,n - 1 为移动其余元素的步骤数。删除操作具有线性时间复杂度,即时间复杂度为 O(N),N为数组的长度。

练习:寻找数组的中心索引

给你一个整数数组 nums ,请计算数组的 中心下标 。

数组 中心下标 是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和。

如果中心下标位于数组最左端,那么左侧数之和视为 0 ,因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。

如果数组有多个中心下标,应该返回 最靠近左边 的那一个。如果数组不存在中心下标,返回 -1 。

示例 1:

1
2
3
4
5
6
输入:nums = [1, 7, 3, 6, 5, 6]
输出:3
解释:
中心下标是 3 。
左侧数之和 sum = nums[0] + nums[1] + nums[2] = 1 + 7 + 3 = 11 ,
右侧数之和 sum = nums[4] + nums[5] = 5 + 6 = 11 ,二者相等。

示例 2:

1
2
3
4
输入:nums = [1, 2, 3]
输出:-1
解释:
数组中不存在满足此条件的中心下标。

示例 3:

1
2
3
4
5
6
输入:nums = [2, 1, -1]
输出:0
解释:
中心下标是 0 。
左侧数之和 sum = 0 ,(下标 0 左侧不存在元素),
右侧数之和 sum = nums[1] + nums[2] = 1 + -1 = 0 。

提示

  • 1 <= nums.length <= 104
  • -1000 <= nums[i] <= 1000

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
class Solution {
public int pivotIndex(int[] nums) {
int sum=0,left=0,left2=0;
for(int i=0;i<nums.length;i++){
sum += nums[i];
}
if(sum - nums[0] == 0){
return 0;
}
for(int j=0;j<nums.length;j++){
left += nums[j];
if(j != 0){
left2 = left - nums[j];
}
if(left2 == sum - left){
return j;
}
}
return -1;
}
}

练习:搜索插入位置

给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。

请必须使用时间复杂度为 O(log n) 的算法。

 

示例 1:

1
2
输入: nums = [1,3,5,6], target = 5
输出: 2

示例 2:

1
2
输入: nums = [1,3,5,6], target = 2
输出: 1

示例 3:

1
2
输入: nums = [1,3,5,6], target = 7
输出: 4

提示:

  • 1 <= nums.length <= 104
  • -104 <= nums[i] <= 104
  • nums 为 无重复元素 的 升序 排列数组
  • -104 <= target <= 104

代码:

1
2
3
4
5
6
7
8
9
10
class Solution {
public int searchInsert(int[] nums, int target) {
for(int i=0;i<nums.length;i++){
if(nums[i] >= target){
return i;
}
}
return nums.length;
}
}

本文参考:https://leetcode.cn/