字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
String类型你一定不陌生,毕竟每一位coder都是从var str1 = “Hello World”过来的。
但它真的就只是如此吗?听我娓娓道来。
一、思考
在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?
如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。
二、1 个字符串变量占用多少内存?
方法 1:MemoryLayout
首先,可以借助 Swift 自带的 MemoryLayout 来测试一下
方法 2:汇编
另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储
跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下
如果你的反汇编经验十足,根据第 16、17 行的汇编就可以推敲出来,String 是占用 16 个字节
- 因为它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的
汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。
三、字符串的底层存储
窥探内存
此前我写了个可以窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems
字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
拼接
可以发现,当对 str1 进行拼接 "ABCDE" 的时候
-
它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中
-
最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
-
可以看得出来,目前 16 个字节已经存满了,那如果再拼接 1 个字符呢?
可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了,
-
那里面的 16 字节具体是什么含义呢?
- 所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?
其他情况
如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?
相信你能猜到是这个结果
- 这 16 个字节里面并没有出现任何一个字符的 ASCII 值
- 而且这 16 个字节跟
第27行的str1
还是有所区别
- 虽然它们的字符串内容都是"0123456789ABCDEF"
如果对 str2 进行拼接操作
不难发现:这时 str2 的 16 字节又发生了变化,跟 第27行的str1
是有点相似的
如何解决上述疑问?
上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看
-
链接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
-
视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看
-
看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面。
四、最后
最后想多说一句:汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法也是如此),比如你还能玩转软件破解、外挂等,这是我此前用【汇编\C++】编写的一个外挂:https://github.com/CoderMJLee/SeemygoPVZCheater
汇编语言是最接近于机器语言的编程语言。如果说机器语言是计算机操作的本质,那么汇编语言就是最最接近本质的语言。汇编语言能够让你更好的理解高级语言,学会汇编后,你可以通过修改高级语言的代码来提高算法所不能提高的效率。
在编程领域,字符串虽然是所有编程语言中最重要的部分之一,但它也仅仅是这片领域的一隅。对程序员而言,唯有不断的探索学习更多技术,才能在这片领域中纵横遨游。
以上就是我的技术分享,感觉意犹未尽还想学的朋友,送福利了!!想获取更多技术提升秘籍,欢迎×××:×××,我在这里为你随时解答。这里有很多如 iOS、数据结构与算法等编程技巧的免费视频和学习资料。