数据结构:数组和字符串

Posted on 2022-07-23

集合、列表和数组

集合

定义：由一个或多个确定的元素所构成的整体。
通俗的说，集合就是将一组事务组合在一起。

特性
- 集合里的元素类型不一定相同。
- 集合里的元素没有顺序

事实上，这样的集合并不直接存在于编程语言中。然而，实际编程语言中，就是在集合的基础上添加了一些规则形成的。

列表

定义：又称线性列表，是一种数据结构构成的有限序列，即按照一定的线性顺序，排列而成的数据项的集合。
列表的概念是在集合的特征上形成的，它具有顺序，且长度是可变的。
在编程语言中，列表最常见的表现形式有数组和链表，而我们熟悉的栈和队列则是两种特殊类型的列表。除此之外，向列表中添加、删除元素的具体实现方式会根据编程语言的不同而有所区分。

数组

数组是列表的实现方式之一，也是面试中经常涉及到的数据结构。

正如前面提到的，数组是列表的实现方式，它具有列表的特征，同时也具有自己的一些特征。然而，在具体的编程语言中，数组这个数据结构的实现方式具有一定差别。比如 C++ 和 Java 中，数组中的元素类型必须保持一致，而 Python 中则可以不同。Python 中的数组叫做 list，具有更多的高级功能。

那么如何从宏观上区分列表和数组呢？这里有一个重要的概念：索引。

首先，数组会用一些名为索引的数字来标识每项数据在数组中的位置，且在大多数编程语言中，索引是从 0 算起的。我们可以根据数组中的索引，快速访问数组中的元素。

而列表中没有索引，这是数组与列表最大的不同点。
其次，数组中的元素在内存中是连续存储的，且每个元素占用相同大小的内存。
相反，列表中的元素在内存中可能彼此相邻，也可能不相邻。比如列表的另一种实现方式——链表，它的元素在内存中则不一定是连续的。

数组的操作

读取元素

读取数组的元素，是通过访问索引的方式来读取的，索引一般从0开始。

在计算机中，内存可以看成一些已经排列好的格子，每个格子对应一个内存地址。一般情况下，数据会分散的存储在不同的格子中。

而对于数组，计算机会在内存中为其申请一段连续的空间，并且会记下索引为0的内存地址。以数组 [“C”, “O”, “D”, “E”, “R”] 为例，它的各元素对应的索引及内存地址如下图所示。

假如我们想要访问索引为 2 处的元素 “D” 时，计算机会进行以下计算：

找到该数组的索引 0 的内存地址： 2008；
将内存地址加上索引值，作为目标元素的地址，即 2008 + 2 = 2010，对应的元素为 “D”，这时便找到了目标元素。

计算内存地址这个过程是很快的，而我们一旦知道了内存地址就可以立即访问到该元素，因此它的时间复杂度是常数级别，为 O(1)。

查找元素

假如我们对数组中包含哪些元素并不了解，只是想知道其中是否含有元素 “E”，数组会如何查找元素 `”E” 呢？

与读取元素类似，由于我们只保存了索引为 0 处的内存地址，因此在查找元素时，只需从数组开头逐步向后查找就可以了。如果数组中的某个元素为目标元素，则停止查找；否则继续搜索直到到达数组的末尾。

我们发现，最坏情况下，搜索的元素为 “R”，或者数组中不包含目标元素时，我们需要查找 n 次，n 为数组的长度，因此查找元素的时间复杂度为 O(N)，N。

插入元素

如果我们想将元素插入到数组的末尾，只需一步。即计算机通过数组的长度和位置计算出即将插入元素的内存地址，然后将该元素插入到指定位置即可。
然而，如果要将元素插入到数组中的其他位置，就必须要先为该元素要插入的位置腾出空间，然后进行插入操作。
我们发现，如果需要频繁地对数组元素进行插入操作，会造成时间的浪费。另一种数据结构，链表则可以有效解决这个问题。

删除元素

删除元素与插入元素的操作类似，当我们删除掉数组中的某个元素后，数组中会留下空缺的位置，而数组中的元素在内存中是连续的，这就使得后面的元素需对该位置进行填补操作。

当数组的长度为 n 时，最坏情况下，我们删除第一个元素，共需要的步骤数为 1 + (n - 1) = n 步，其中，1 为删除操作，n - 1 为移动其余元素的步骤数。删除操作具有线性时间复杂度，即时间复杂度为 O(N)，N为数组的长度。

练习：寻找数组的中心索引

给你一个整数数组 nums ，请计算数组的中心下标。

数组中心下标是数组的一个下标，其左侧所有元素相加的和等于右侧所有元素相加的和。

如果中心下标位于数组最左端，那么左侧数之和视为 0 ，因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。

如果数组有多个中心下标，应该返回最靠近左边的那一个。如果数组不存在中心下标，返回 -1 。

示例 1：

输入：nums = [1, 7, 3, 6, 5, 6]
输出：3
解释：
中心下标是 3 。
左侧数之和 sum = nums[0] + nums[1] + nums[2] = 1 + 7 + 3 = 11 ，
右侧数之和 sum = nums[4] + nums[5] = 5 + 6 = 11 ，二者相等。

示例 2：

输入：nums = [1, 2, 3]
输出：-1
解释：
数组中不存在满足此条件的中心下标。

示例 3：

输入：nums = [2, 1, -1]
输出：0
解释：
中心下标是 0 。
左侧数之和 sum = 0 ，（下标 0 左侧不存在元素），
右侧数之和 sum = nums[1] + nums[2] = 1 + -1 = 0 。

提示

1 <= nums.length <= 104
-1000 <= nums[i] <= 1000

代码：

class Solution {
    public int pivotIndex(int[] nums) {
        int sum=0,left=0,left2=0;
        for(int i=0;i<nums.length;i++){
            sum += nums[i];
        }
        if(sum - nums[0] == 0){
            return 0;
        }
        for(int j=0;j<nums.length;j++){
            left += nums[j];
            if(j != 0){
                left2 = left - nums[j];
            }
            if(left2 == sum - left){
                return j;
            }
        }
        return -1;
    }
}

练习：搜索插入位置

给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。

请必须使用时间复杂度为 O(log n) 的算法。

示例 1:

1 2	输入: nums = [1,3,5,6], target = 5 输出: 2

示例 2:

1 2	输入: nums = [1,3,5,6], target = 2 输出: 1

示例 3:

1 2	输入: nums = [1,3,5,6], target = 7 输出: 4

提示:

1 <= nums.length <= 104
-104 <= nums[i] <= 104
nums 为无重复元素的升序排列数组
-104 <= target <= 104

代码：

class Solution {
    public int searchInsert(int[] nums, int target) {
        for(int i=0;i<nums.length;i++){
            if(nums[i] >= target){
                return i;
            }
        }
        return nums.length;
    }
}

本文参考：https://leetcode.cn/