切片(slice)性能及陷阱 | Go 语言高性能编程 | 极客兔兔

Question

切片(slice)性能及陷阱 | Go 语言高性能编程 | 极客兔兔

geektutu opened this issue 4 years ago · comments

https://geektutu.com/post/hpg-slice.html

Go 语言/golang 高性能编程，Go 语言进阶教程，Go 语言高性能编程(high performance go)。详细介绍了切片(slice) 常用的几种操作 append、copy 等的性能及原理。并且介绍了切片的陷阱，即什么情况下会产生大量内存被占用，而没法释放的情况。

空白 commented 4 years ago

牛批！

BapiGso commented 2 years ago

学到了

Dai Jie · Answer 1 · Wed Dec 16 2020 09:27:03 GMT+0800 (China Standard Time)

@chocolateszz 笔芯 ღ( ´･ᴗ･` ) 😋

bestgopher · Answer 2 · Wed Dec 16 2020 15:15:04 GMT+0800 (China Standard Time)

大佬爱你，上班看得停不下来

Dai Jie · Answer 3 · Wed Dec 16 2020 15:17:52 GMT+0800 (China Standard Time)

大佬爱你，上班看得停不下来

@bestgopher 大E了啊，没有闪，武林要和为贵。

bo-er · Answer 4 · Tue Mar 16 2021 19:04:40 GMT+0800 (China Standard Time)

我跟兔兔可以成为好朋友！🥰

Zhen Wang · Answer 5 · Mon Mar 29 2021 08:38:59 GMT+0800 (China Standard Time)

例如表达式 s[n] 访问数组的第 n 个元素 这段应该是 访问数组中下标为 n 的元素 吧

callmePicacho · Answer 6 · Fri Apr 23 2021 16:41:17 GMT+0800 (China Standard Time)

总结：

GO 中的数组变量属于值类型，当数组变量被赋值或传递时，实际上会复制整个数组
切片本质是数组片段的描述，包括数组的指针，片段的长度和容量，切片操作并不复制切片指向的元素，而是复用原来切片的底层数组
- 长度是切片实际拥有的元素，使用 len 可得到切片长度
- 容量是切片预分配的内存能够容纳的元素个数，使用 cap 可得到切片容量
  - 当 append 之后的元素小于等于 cap，将会直接利用底层元素剩余的空间
  - 当 append 后的元素大于 cap，将会分配一块更大的区域来容纳新的底层数组，在容量较小的时候，通常是以 2 的倍数扩大
可能存在只使用了一小段切片，但是底层数组仍被占用，得不到使用，推荐使用 copy 替代默认的 re-slice

jieqiyue · Answer 7 · Tue Oct 26 2021 11:30:19 GMT+0800 (China Standard Time)

刚刚看了Java中对于string的优化，和这个还是有几分相似之处的。

Hypen Zou · Answer 8 · Wed Dec 01 2021 19:23:35 GMT+0800 (China Standard Time)

谢谢楼主的文章
有个问题想问一下, 为什么我这样写:

package main

import (
	"fmt"
	"math/rand"
	"runtime"
	"time"
)

func printMem() {
	var rtm runtime.MemStats
	runtime.ReadMemStats(&rtm)
	fmt.Printf("%f MB\n", float64(rtm.Alloc)/1024./1024.)
}
func makeArr() []int {
	arr := make([]int, 8000000)
	return arr
}
func main() {
	arr := makeArr()
	rand.Seed(time.Now().UnixNano())
	for i := 0; i < len(arr); i++ {
		arr[i] = rand.Int()
	}
	arr=arr[:5]
	printMem()//61.218254 MB
	runtime.GC()
	printMem()//0.184059 MB
	fmt.Println(len(arr))
}

得出来的结果, 发现在调用runtime.GC之后内存使用明显减少,回收了部分底层数组呢?
想请教一下这个测试为什么会是这样的结果。谢谢！

灵茶山艾府 · Answer 9 · Wed Dec 01 2021 19:28:59 GMT+0800 (China Standard Time)

谢谢楼主的文章有个问题想问一下, 为什么我这样写:

package main

import (
	"fmt"
	"math/rand"
	"runtime"
	"time"
)

func printMem() {
	var rtm runtime.MemStats
	runtime.ReadMemStats(&rtm)
	fmt.Printf("%f MB\n", float64(rtm.Alloc)/1024./1024.)
}
func makeArr() []int {
	arr := make([]int, 8000000)
	return arr
}
func main() {
	arr := makeArr()
	rand.Seed(time.Now().UnixNano())
	for i := 0; i < len(arr); i++ {
		arr[i] = rand.Int()
	}
	arr=arr[:5]
	printMem()//61.218254 MB
	runtime.GC()
	printMem()//0.184059 MB
	fmt.Println(len(arr))
}

得出来的结果, 发现在调用runtime.GC之后内存使用明显减少,回收了部分底层数组呢? 想请教一下这个测试为什么会是这样的结果。谢谢！

因为你最后只用到了 arr 的长度，没有使用 arr 底层数组，所以底层数组直接被回收掉了。

你可以在代码最后加上 arr[0] = 1 看看，这样打印出来的结果就一样了。

Hypen Zou · Answer 10 · Wed Dec 01 2021 19:49:31 GMT+0800 (China Standard Time)

@EndlessCheng

因为你最后只用到了 arr 的长度，没有使用 arr 底层数组，所以底层数组直接被回收掉了。

你可以在代码最后加上 arr[0] = 1 看看，这样打印出来的结果就一样了。

谢谢回复
还是有个疑问，
我理解的， arr切片本质上是个结构体，这个结构体应该是在栈上的，没有被垃圾回收，那它指向的底层数组为什么会被回收呢？

灵茶山艾府 · Answer 11 · Wed Dec 01 2021 20:35:49 GMT+0800 (China Standard Time)

@EndlessCheng

因为你最后只用到了 arr 的长度，没有使用 arr 底层数组，所以底层数组直接被回收掉了。
你可以在代码最后加上 arr[0] = 1 看看，这样打印出来的结果就一样了。

谢谢回复还是有个疑问，我理解的， arr切片本质上是个结构体，这个结构体应该是在栈上的，没有被垃圾回收，那它指向的底层数组为什么会被回收呢？

看上去和编译优化有关，你的代码加上 -gcflags='-N' 编译后打印的结果就变成一样的了。

Hypen Zou · Answer 12 · Wed Dec 01 2021 22:05:52 GMT+0800 (China Standard Time)

@EndlessCheng

@EndlessCheng

因为你最后只用到了 arr 的长度，没有使用 arr 底层数组，所以底层数组直接被回收掉了。
你可以在代码最后加上 arr[0] = 1 看看，这样打印出来的结果就一样了。

谢谢回复还是有个疑问，我理解的， arr切片本质上是个结构体，这个结构体应该是在栈上的，没有被垃圾回收，那它指向的底层数组为什么会被回收呢？

看上去和编译优化有关，你的代码加上 -gcflags='-N' 编译后打印的结果就变成一样的了。

明白了, 谢谢大佬

恋喵大鲤鱼 · Answer 13 · Thu Feb 24 2022 20:01:00 GMT+0800 (China Standard Time)

博主，请问改电子书是如何部署搭建的？

恋喵大鲤鱼 · Answer 14 · Thu Feb 24 2022 20:01:42 GMT+0800 (China Standard Time)

博主，其中有一个例子：

func lastNumsBySlice(origin []int) []int {
return origin[len(origin)-2:]
}

last num 最后一个元素应该是 origin[len(origin)-1:] 吧

crazy-cpu · Answer 15 · Fri Apr 08 2022 16:55:48 GMT+0800 (China Standard Time)

有个问题哈，事先知道slice长度的情况下最好先预设长度会比不预设快，但是实际我benchmark测试结果如下（golang 1.18），结果恰恰相反，这是怎么回事？

goos: windows

goarch: amd64

pkg: demo

cpu: Intel(R) Core(TM) i5-9400 CPU @ 2.90GHz

BenchmarkSlice1-6 181 6142071 ns/op

BenchmarkSlice2-6 150 7996002 ns/op

PASS ok

demo 3.832s

代码如下：

func slice1() {
	var s []int
	for i := 0; i < 1000000; i++ {
		s = append(s, i)
	}
}

//事先分配
func slice2() {
	var s []int = make([]int, 1000000)
	for i := 0; i < 1000000; i++ {
		s = append(s, i)
	}
}

Zhen Wang · Answer 16 · Fri Apr 08 2022 20:20:20 GMT+0800 (China Standard Time)

有个问题哈，事先知道slice长度的情况下最好先预设长度会比不预设快，但是实际我benchmark测试结果如下（golang 1.18），结果恰恰相反，这是怎么回事？

goos: windows

goarch: amd64

pkg: demo

cpu: Intel(R) Core(TM) i5-9400 CPU @ 2.90GHz

BenchmarkSlice1-6 181 6142071 ns/op

BenchmarkSlice2-6 150 7996002 ns/op

PASS ok

demo 3.832s

代码如下：
func slice1() {
	var s []int
	for i := 0; i < 1000000; i++ {
		s = append(s, i)
	}
}

//事先分配
func slice2() {
	var s []int = make([]int, 1000000)
	for i := 0; i < 1000000; i++ {
		s = append(s, i)
	}
}

@programmer-liu slice2 里应该是 make([]int, 0, 1000000)。

lunule · Answer 17 · Wed Sep 14 2022 16:09:58 GMT+0800 (China Standard Time)

请教博主，为什么我将gc移到for循环外，两种方法的内存占用都会变得很小呢？

func testLastChars(t *testing.T, f func([]int) []int) {
	t.Helper()
	ans := make([][]int, 0)
	for k := 0; k < 100; k++ {
		origin := generateWithCap(128 * 1024) // 1M
		ans = append(ans, f(origin))
	}
	runtime.GC() // 两个方法都是 0.17M
	printMem(t)
	_ = ans
}

苏黎世的海角 · Answer 18 · Thu Apr 13 2023 21:01:03 GMT+0800 (China Standard Time)

@thetacoding
请教博主，为什么我将gc移到for循环外，两种方法的内存占用都会变得很小呢？
func testLastChars(t *testing.T, f func([]int) []int) {
	t.Helper()
	ans := make([][]int, 0)
	for k := 0; k < 100; k++ {
		origin := generateWithCap(128 * 1024) // 1M
		ans = append(ans, f(origin))
	}
	runtime.GC() // 两个方法都是 0.17M
	printMem(t)
	_ = ans
}

因为你的ans在后面

@thetacoding
请教博主，为什么我将gc移到for循环外，两种方法的内存占用都会变得很小呢？
func testLastChars(t *testing.T, f func([]int) []int) {
	t.Helper()
	ans := make([][]int, 0)
	for k := 0; k < 100; k++ {
		origin := generateWithCap(128 * 1024) // 1M
		ans = append(ans, f(origin))
	}
	runtime.GC() // 两个方法都是 0.17M
	printMem(t)
	_ = ans
}

因为你的ans在GC代码之后没有继续使用了，所以会被直接回收，你可以在后面加一个ans[0] = []int{1}

cd365 · Answer 19 · Mon Jun 12 2023 18:40:18 GMT+0800 (China Standard Time)

这个结果是不是有点问题？

8 printLenCap(nums) // len: 5, cap: 8 [1 2 3 4 50]