title: 【转载】关于切片操作的技巧
date: 2021-08-11 10:47:54
comment: false
toc: true
category:
- Golang
tags: - 转载
- Go
- 切片
- 操作
本文转载自:[译] 关于切片操作的技巧 | 李文周的博客
本文翻译自官方 wiki,整理了 Go 语言中关于切片操作的一些技巧。
备注:由于行文需要,一些细节与原文存在些许出入。
切片操作常用技巧#
复制#
将切片 a 中的元素复制到切片 b 中。
最简单的、最常用的方法就是使用内置的copy
函数。
b = make([]T, len(a)) // 一次将内存申请到位
copy(b, a)
除了使用内置的copy
函数外,还有下面两种使用append
函数复制切片的方法。
b = append([]T(nil), a...)
b = append(a[:0:0], a...)
这两种方法通常比使用copy
函数复制的方法要慢一些,但是如果在复制之后有更多的元素要添加到 b 中,那么它们的效率会更高。
剪切#
将切片 a 中索引 i~j 位置的元素剪切掉。
可以按照下面的方式,使用append
函数完成。
a = append(a[:i], a[j:]...)
删除#
将切片 a 中索引位置为 i 的元素删除。
同样可以按照上面剪切的方式使用append
函数完成删除操作。
a = append(a[:i], a[i+1:]...)
或者搭配copy
函数使用切片表达式完成删除操作。
a = a[:i+copy(a[i:], a[i+1:])]
此外,如果只需要删除掉索引为 i 的元素,无需保留切片元素原有的顺序,那么还可以使用下面这种简单的方式进行删除。
a[i] = a[len(a)-1] // 将最后一个元素移到索引i处
a = a[:len(a)-1] // 截掉最后一个元素
剪切或删除操作可能引起的内存泄露#
需要特别注意的是。如果切片 a 中的元素是一个指针类型或包含指针字段的结构体类型(需要被垃圾回收),上面剪切和删除的示例代码会存在一个潜在的内存泄漏问题:一些具有值的元素仍被切片 a 引用,因此无法被垃圾回收机制回收掉。下面的代码可以解决这个问题。
剪切#
copy(a[i:], a[j:])
for k, n := len(a)-j+i, len(a); k < n; k++ {
a[k] = nil // 或类型T的零值
}
a = a[:len(a)-j+i]
删除#
copy(a[i:], a[i+1:])
a[len(a)-1] = nil // 或类型T的零值
a = a[:len(a)-1]
删除但不保留元素原有顺序#
a[i] = a[len(a)-1]
a[len(a)-1] = nil
a = a[:len(a)-1]
内部扩张#
在切片 a 的索引 i 之后扩张 j 个元素。
使用两个append
函数完成,即先将索引 i 之后的元素追加到一个长度为 j 的切片后,再将这个切片中的所有元素追加到切片 a 的索引 i 之后。
a = append(a[:i], append(make([]T, j), a[i:]...)...)
扩张的这一部分元素为 T 类型的零值。
尾部扩张#
将切片 a 的尾部扩张 j 个元素的空间。
a = append(a, make([]T, j)...)
扩张的这一部分元素同样为 T 类型的零值。
过滤#
按照一定的规则将切片 a 中的元素进行就地过滤。
这里假设过滤的条件已封装为keep
函数,使用for range
遍历切片 a 的所有元素逐一调用keep
函数进行过滤。
n := 0
for _, x := range a {
if keep(x) {
a[n] = x // 保留该元素
n++
}
}
a = a[:n] // 截取切片中需保留的元素
插入#
将元素 x 插入切片 a 的索引 i 处。
还是使用两个append
函数完成插入 x 的操作。
a = append(a[:i], append([]T{x}, a[i:]...)...)
第二个append
函数创建了一个具有自己底层数组的新切片,并将a[i:]
中的元素复制到该切片,然后由第一个append
函数将这些元素复制回切片 a。
我们可以通过使用另一种方法来避免新切片的创建(以及由此产生的内存垃圾)和第二个副本:
a = append(a, 0 /* 这里应使用元素类型的零值 */)
copy(a[i+1:], a[i:])
a[i] = x
追加#
将元素 x 追加到切片 a 的最后。
这里使用append
函数即可。
a = append(a, x)
弹出#
将切片 a 的最后一个元素弹出。
这里使用切片表达式完成弹出操作。
x, a = a[len(a)-1], a[:len(a)-1]
弹出切片 a 的第一个元素。
x, a = a[0], a[1:]
前插#
将元素 x 前插到切片 a 的开始。
a = append([]T{x}, a...)
其他技巧#
过滤而不分配内存#
此技巧使用了一个事实,即切片 b 与原始切片 a 共享相同的底层数组和容量,因此原存储空间已重新用于过滤后的切片。当然原始切片的内容被修改了。
b := a[:0]
for _, x := range a {
if f(x) {
b = append(b, x)
}
}
对于必须被垃圾回收的元素,在完成上述操作后可以添加以下代码:
for i := len(b); i < len(a); i++ {
a[i] = nil // 或T类型的零值
}
翻转#
将切片 a 的元素顺序翻转。
通过迭代两两互换元素完成。
for i := len(a)/2-1; i >= 0; i-- {
opp := len(a)-1-i
a[i], a[opp] = a[opp], a[i]
}
同样的操作:
for left, right := 0, len(a)-1; left < right; left, right = left+1, right-1 {
a[left], a[right] = a[right], a[left]
}
洗牌#
打乱切片 a 中元素的顺序。
Fisher–Yates 算法:
for i := len(a) - 1; i > 0; i-- {
j := rand.Intn(i + 1)
a[i], a[j] = a[j], a[i]
}
从 go1.10 开始,可以使用math/rand.Shuffle。
rand.Shuffle(len(a), func(i, j int) {
a[i], a[j] = a[j], a[i]
})
使用最小分配进行批处理#
如果你想对一个大型切片 a 的元素分批进行处理,这会很有用。
actions := []int{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
batchSize := 3
batches := make([][]int, 0, (len(actions) + batchSize - 1) / batchSize)
for batchSize < len(actions) {
actions, batches = actions[batchSize:], append(batches, actions[0:batchSize:batchSize])
}
batches = append(batches, actions)
得到的效果如下:
[[0 1 2] [3 4 5] [6 7 8] [9]]
原地删除重复元素(元素可比较)#
import "sort"
in := []int{3,2,1,4,3,2,1,4,1} // 切片元素可以是任意可排序的类型
sort.Ints(in)
j := 0
for i := 1; i < len(in); i++ {
if in[j] == in[i] {
continue
}
j++
// 需要保存原始数据时
// in[i], in[j] = in[j], in[i]
// 只需要保存需要的数据时
in[j] = in[i]
}
result := in[:j+1]
fmt.Println(result) // [1 2 3 4]
存在就移到前面,不存在就插入到前面#
如果给定的元素在切片中存在则把该元素移到切片的头部,如果不存在则将该元素插入到切片的头部。
// moveToFront 把needle移动或添加到haystack的前面
func moveToFront(needle string, haystack []string) []string {
if len(haystack) != 0 && haystack[0] == needle {
return haystack
}
prev := needle
for i, elem := range haystack {
switch {
case i == 0:
haystack[0] = needle
prev = elem
case elem == needle:
haystack[i] = prev
return haystack
default:
haystack[i] = prev
prev = elem
}
}
return append(haystack, prev)
}
haystack := []string{"a", "b", "c", "d", "e"} // [a b c d e]
haystack = moveToFront("c", haystack) // [c a b d e]
haystack = moveToFront("f", haystack) // [f c a b d e]
滑动窗口#
将切片 input 生成 size 大小的滑动窗口。
func slidingWindow(size int, input []int) [][]int {
// 返回入参的切片作为第一个元素
if len(input) <= size {
return [][]int{input}
}
// 以所需的精确大小分配切片
r := make([][]int, 0, len(input)-size+1)
for i, j := 0, size; j <= len(input); i, j = i+1, j+1 {
r = append(r, input[i:j])
}
return r
}
示例:
a := []int{1, 2, 3, 4, 5}
res := slidingWindow(2, a)
fmt.Println(res)
输出:
[[1 2] [2 3] [3 4] [4 5]]