如何通过汇编揭开String中数据结构神秘面纱

这篇文章主要介绍了如何通过汇编揭开String中数据结构神秘面纱,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

成都创新互联公司坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站制作、成都网站设计、外贸营销网站建设、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的共和网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!


⼀、思考
在 Swift 开发使⽤字符串的过程中,你是否有思考过以下问题?
1 个字符串变量占⽤多少内存?
字符串 str1、str2 的底层存储有什么不同?
如何通过汇编揭开String中数据结构神秘面纱
如果对 str1、str2 进⾏拼接操作,str1、str2 的底层存储⼜会发⽣什么变化?
如何通过汇编揭开String中数据结构神秘面纱
如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是⽐较了解的。
⼆、1 个字符串变量占⽤多少内存?

⽅法 1:MemoryLayout
⾸先,可以借助 Swift ⾃带的 MemoryLayout 来测试⼀下
如何通过汇编揭开String中数据结构神秘面纱
⽅法 2:汇编
另外,我们也可以借助⼀个强有⼒的底层分析助⼿—汇编语⾔,来窥探⼀下 String 的底层存储实际上分析其他语法、系统库的底层,都可以借助汇编语⾔

⽐如多态的原理、泛型的原理、Array 的底层、枚举的底层等等
另外,不仅仅是 Swift,C、C++、OC 的底层分析,依然可以借助汇编语⾔
毕竟你写的每⼀⾏有效代码,最终都是要转成机器指令(0 和 1)
⽽机器指令是跟汇编指令⼀⼀对应的,每⼀条机器指令都能翻译成与之对应的汇编指令
能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在⼲嘛(操作了什么寄存器,操作了哪块内存)
本教程的代码是直接跑在 Mac 的命令⾏(CommandLineTools)项⽬上
因此展示的汇编代码是基于 X64 的 AT&T 格式汇编,并⾮ iOS 真机设备的 ARM 汇编其实不同种类的汇编之间有极⼤的相似性,只是有些指令的叫法不⼀样
跟微软的 Visual Studio ⼀样,Xcode 也内置了⾮常⽅便的反汇编功能,可以轻松查看每⼀句代码对应的汇编指令,打开反汇编界⾯的步骤如下
在某⼀⾏需要调试的代码打上断点(反汇编界⾯会在断点调试状态下显示出来)

菜单: Debug >

译为汇编,

译为反汇编

如何通过汇编揭开String中数据结构神秘面纱

运⾏程序,看到反汇编界⾯

如何通过汇编揭开String中数据结构神秘面纱

如果你的反汇编经验⼗⾜,根据第 16、17 ⾏的汇编就可以推敲出来,String 是占⽤ 16 个字节因为它⽤了 rax、rdx 寄存器存放字符串 str 的内容,⽽ rax、rdx 都是 8 字节的
汇编的内容太多了,因为时间和篇幅关系,⽂章⾥并不会对每⼀句汇编指令进⾏详细地讲解,更多的是        想说明汇编的重要性。
三、字符串的底层存储

窥探内存
此前我写了个可以窥探 Swift  变量内存的⼩⼯具:https://github.com/CoderMJLee/Mems 现在⽤它来窥探下字符串的 16 字节⾥⾯,究竟存储着什么数据
默认情况下按照 8 个字节⼀组来显示内存数据

传递参数

是按照 1 个字节⼀组来显示内存数据

如何通过汇编揭开String中数据结构神秘面纱

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
它直接将所有字符的 ASCII 值存储在 str1 的 16 字节中
最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接
如何通过汇编揭开String中数据结构神秘面纱

可以发现,当对 str1 进⾏拼接 "ABCDE" 的时候
它最终是将 "0123456789ABCDE"⼗五个字符的 ASCII 值都存储在了 str1 的 16 字节中最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
可以看得出来,⽬前 16 个字节已经存满了,那如果再拼接 1 个字符呢?
如何通过汇编揭开String中数据结构神秘面纱
可以看到,str1 ⾥⾯存储的数据发⽣了⾮常⼤的变化,每⼀个字符的 ASCII 值不⻅了, 那⾥⾯的 16 字节具体是什么含义呢?
所有字符('0'~'9'、'A' 到 'F')的 ASCII 值⼜存到哪去了呢?
其他情况
如果⼀开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?
如何通过汇编揭开String中数据结构神秘面纱
相信你能猜到是这个结果
这 16 个字节⾥⾯并没有出现任何⼀个字符的 ASCII 值

⽽且这 16 个字节跟

还是有所区别

虽然它们的字符串内容都是"0123456789ABCDEF" 如果对 str2 进⾏拼接操作

如何通过汇编揭开String中数据结构神秘面纱

不难发现:这时 str2 的 16 字节⼜发⽣了变化,跟
如何解决上述疑问?

是有点相似的

上述的种种疑问,光看打印出来的内存数据是⽆法解决的,但是都可以利⽤【!!!汇编!!!】来解决,分析汇编指令,⽴⻢就得出结论。

感谢你能够认真阅读完这篇文章,希望小编分享的“如何通过汇编揭开String中数据结构神秘面纱”这篇文章对大家有帮助,同时也希望大家多多支持创新互联,关注创新互联行业资讯频道,更多相关知识等着你来学习!


网页名称:如何通过汇编揭开String中数据结构神秘面纱
转载源于:http://scjbc.cn/article/ihecch.html

其他资讯