继续更新个人的学习笔记,
别的笔记传送门
逆向基础笔记一 进制篇
逆向基础笔记二 数据宽度和逻辑运算
逆向基础笔记三 通用寄存器和内存读写
逆向基础笔记四 堆栈篇
逆向基础笔记五 标志寄存器
逆向基础笔记六 汇编跳转和比力指令
逆向基础笔记七 堆栈图(重点)
逆向基础笔记八 反汇编分析C语言
逆向基础笔记九 C语言内联汇编和调用协定
逆向基础笔记十 汇编探求C步伐入口
逆向基础笔记十一 汇编C语言基本类型
逆向基础笔记十二 汇编 全局和局部 变量
逆向基础笔记十三 汇编C语言类型转换
逆向基础笔记十四 汇编嵌套if else
逆向基础笔记十五 汇编比力三种循环
逆向基础笔记十六 汇编一维数组
逆向基础笔记十七 汇编二维数组 位移 乘法
逆向基础笔记十九 汇编switch比力if else
逆向基础笔记二十 汇编 指针(一)
逆向基础笔记二十一 汇编 指针(二)
逆向基础笔记二十二 汇编 指针(三)
逆向基础笔记二十三 汇编 指针(四)
逆向基础笔记二十四 汇编 指针(五) 系列完结
结构体
C语言中的结构体是一种自定义的数据类型,一个结构体里可由别的各种类型组合而成
声明结构体
举个简朴的例子,自定义一个为player的类型,如下:
struct Player{ float hp; //人物血量 float mp; //人物魔量 int money; //人物款项 int atk; //人物攻击力 char name[20]; //人物昵称 float x; //人物x坐标 float y; //人物y坐标};结构体的初始化
初始化
使用自定义的结构体,然后初始化
#include "stdafx.h"#include struct Player{ float hp; //人物血量 float mp; //人物魔力值 int money; //人物款项 int atk; //人物攻击力 char name[10]; //人物昵称 float x; //人物x坐标 float y; //人物y坐标};int main(int argc, char* argv[]){ Player player; player.hp=100; player.mp=50; player.money=1000; player.atk=10; strcpy(player.name,"lyl610abc"); player.x=600; player.y=100; return 0;}对应汇编代码
21: Player player;22:23: player.hp=100;00401028 mov dword ptr [ebp-24h],42C80000h24: player.mp=50;0040102F mov dword ptr [ebp-20h],42480000h25: player.money=1000;00401036 mov dword ptr [ebp-1Ch],3E8h26: player.atk=10;0040103D mov dword ptr [ebp-18h],0Ah27: strcpy(player.name,"lyl610abc");00401044 push offset string "lyl610abc" (0042601c)00401049 lea eax,[ebp-14h]0040104C push eax0040104D call strcpy (00401090)00401052 add esp,828: player.x=600;00401055 mov dword ptr [ebp-8],44160000h29: player.y=100;0040105C mov dword ptr [ebp-4],42C80000h结构体成员含义对应地址占用空间(单元字节)hp血量ebp-24h4mp魔力值ebp-20h4money款项ebp-1Ch4atk攻击ebp-18h4name昵称ebp-14h12xx坐标ebp-84yy坐标ebp-44不丢脸出结构体的成员的存储和数组并无差别,依旧是从低地址开始连续存储
此中要注意到,name成员实际占用空间为12字节,比声明的char name[10],多了2字节,为内存对齐的结果
结构体作为参数传递
参数传递
#include "stdafx.h"#include struct Player{ float hp; //人物血量 float mp; //人物魔量 int money; //人物款项 int atk; //人物攻击力 char name[10]; //人物昵称 float x; //人物x坐标 float y; //人物y坐标};void getStruct(struct Player player){}int main(int argc, char* argv[]){ Player player; getStruct(player); return 0;}对应汇编代码
28: getStruct(player);004106D8 sub esp,24h004106DB mov ecx,9004106E0 lea esi,[ebp-24h]004106E3 mov edi,esp004106E5 rep movs dword ptr [edi],dword ptr [esi]004106E7 call @ILT+5(getStruct) (0040100a)004106EC add esp,24h分析流程
1.提升堆栈24h(为结构体的巨细)
004106D8 sub esp,24h2.将9赋值给ecx(作为计数器使用,也就是要循环9次)
004106DB mov ecx,93.将结构体的首地址传址给esi
004106E0 lea esi,[ebp-24h]4.将esp赋值给edi,也就是将栈顶地址赋给edi
004106E3 mov edi,esp5.重复9次(重复直到ecx为0),将esi里的值赋值给edi里的值,每次ecx都会自减1,esi和edi自增4(增或减取决于DF标志位)
为什么是循环9次?
前面提升的堆栈为24h,对应十进制为36,这里每次循环都会让esi和edi自增4,36/4=9,所以要循环9次
004106E5 rep movs dword ptr [edi],dword ptr [esi]结合前面的esi=结构体首地址,edi为栈顶,这行代码就是将结构体复制到堆栈中
6.调用以结构体为参数的函数
004106E7 call @ILT+5(getStruct) (0040100a)7.函数调用竣过后举行堆栈外平衡,将之前提升的堆栈恢复
004106EC add esp,24h小总结
通过前面的分析可以知道,将结构体作为参数来传递是将整个结构体赋值到堆栈中来举行传递的
结构体作为返回值传递
返回值传递
#include "stdafx.h"#include struct Player{ float hp; //人物血量 float mp; //人物魔量 int money; //人物款项 int atk; //人物攻击力 char name[10]; //人物昵称 float x; //人物x坐标 float y; //人物y坐标};Player retStruct(){ Player player; return player;}int main(int argc, char* argv[]){ Player player; player=retStruct(); return 0;}对应汇编代码
函数外部
30: Player player;31: player=retStruct();0040107E lea eax,[ebp-6Ch]00401081 push eax00401082 call @ILT+0(retStruct) (00401005)00401087 add esp,40040108A mov esi,eax0040108C mov ecx,900401091 lea edi,[ebp-48h]00401094 rep movs dword ptr [edi],dword ptr [esi]00401096 mov ecx,90040109B lea esi,[ebp-48h]0040109E lea edi,[ebp-24h]004010A1 rep movs dword ptr [edi],dword ptr [esi]可以看到,函数明明是个无参的函数,但是却在函数前push了eax,并且eax是ebp-6C的地址
为什么明明是无参函数,却仍然push了 eax?
这里的eax是作为返回值来使用的,要将整个结构体作为返回值来传递,只用一个eax肯定是不够存储的,数据应该存在堆栈中,而这里就是用eax来生存 要存储返回结构体的堆栈地址的
函数内部
前面所说可能有些抽象,来结合函数里面返回的内容分析:
19: Player player;20: return player;00401038 mov ecx,90040103D lea esi,[ebp-24h]00401040 mov edi,dword ptr [ebp+8]00401043 rep movs dword ptr [edi],dword ptr [esi]00401045 mov eax,dword ptr [ebp+8]21: }00401048 pop edi00401049 pop esi0040104A pop ebx0040104B mov esp,ebp0040104D pop ebp0040104E ret先看前面几行代码
00401038 mov ecx,90040103D lea esi,[ebp-24h]00401040 mov edi,dword ptr [ebp+8]00401043 rep movs dword ptr [edi],dword ptr [esi]发现和前面将结构体作为参数传递的代码差不多,就是将结构体的数据复制到堆栈中,此时复制的堆栈的起始地址为ebp+8
再看关键语句
00401045 mov eax,dword ptr [ebp+8]这里就是将ebp+8也就是前面复制的堆栈的起始位置 赋值给 eax,eax作为返回值来传递数据
剩下的内容就是恢复现场和返回,这里就不再过多赘述
返回后
00401087 add esp,40040108A mov esi,eax0040108C mov ecx,900401091 lea edi,[ebp-48h]00401094 rep movs dword ptr [edi],dword ptr [esi]00401096 mov ecx,90040109B lea esi,[ebp-48h]0040109E lea edi,[ebp-24h]004010A1 rep movs dword ptr [edi],dword ptr [esi]返回后首先举行堆栈外平衡,由于先前push了一个eax
00401087 add esp,4然后就是认识的操作
0040108A mov esi,eax0040108C mov ecx,900401091 lea edi,[ebp-48h]00401094 rep movs dword ptr [edi],dword ptr [esi]00401096 mov ecx,90040109B lea esi,[ebp-48h]0040109E lea edi,[ebp-24h]004010A1 rep movs dword ptr [edi],dword ptr [esi]先将eax这个返回值赋值给esi
然后就是把返回值复制到现在的堆栈中
再接着就是把堆栈中的数据复制给暂时变量player,对应player=retStruct();
小总结
将结构体作为返回值,会将返回值eax压入堆栈中,阐明确push 的内容不一定是参数,也可以是返回值
内存对齐
内存对齐也称作字节对齐
前面或多或少都有提到过内存对齐,但没有具体睁开,现在来谈谈内存对齐
为什么要内存对齐
性能原因
寻址时进步效率,采用了以空间换时间的头脑
当寻址的内存的单元和本机宽度一致时,寻址的效率最高
举个例子:
- 在32位的呆板上,一次读32位(4字节)的内存 效率最高
- 在64位的呆板上,一次读64位(8字节)的内存 效率最高
平台原因(移植原因)
不是所有的硬件平台都能访问恣意地址上的恣意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
内存对齐例子
前面其实已经有过不少内存对齐的例子,就比如上面的
char name[10];实际占用的空间为12,12=4 × 3 ,这里的4就是本机宽度,单元为字节,实际占用的空间为本机宽度的整数倍
再看看结构体的内存对齐:
#include "stdafx.h"#include struct S1{ char a; int b; char c;};struct S2{ int a; char b; char c;};int main(int argc, char* argv[]){ S1 s1; S2 s2; printf("%d\n",sizeof(s1)); printf("%d\n",sizeof(s2)); return 0;}运行结果
分析
可与看到,明明结构体里的参数类型是一样的,都是两个char和一个int,但其占用的空间却不一样,这就是内存对齐的结果
此时的对齐参数为默认值8
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s14(char)4(int)4(char)12s24(int)2(char)2(char)8对齐参数
上面有提到对齐参数,什么是对齐参数?
对齐参数:n为字节对齐数,其取值为1、2、4、8,(默认值取决于编译器)VC++6.0中n 默认是8个字节
对齐数=编译器默认的一个对齐数与该成员巨细的较小值
再看看下面的例子,对比上面对齐参数默认为8时的结果
修改对齐参数
可以通过
#pragma pack(n)//设置对齐参数#pragma pack())//取消设置的默认对齐参数,还原为默认来指定对齐参数
为上面的例子指定对齐参数:
#pragma pack(1)struct S1{ char a; int b; char c;};#pragma pack()#pragma pack(1)struct S2{ int a; char b; char c;};#pragma pack()对齐参数为1
可以看到,分配的空间都变成了6字节,2个char 各占用1字节,int占用4字节
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s1\s21(char)4(int)1(char)6对齐参数为2
将对齐参数改为2,结果如下:
此时空间占用情况如下:
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s12(char)4(int)2(char)8s24(int)1(char)1(char)6内存对齐的规则
- 数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset(偏移)为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值(或默认值)和)数据成员类型长度中,比力小的那个举行,也就是min{对齐参数,sizeof(数据成员)},在上一个对齐后的地方开始探求能被当前对齐数值整除的地址
- 结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要举行对齐.重要体现在,最后一个元素对齐后,后面是否填补空字节,如果填补,填补多少.对齐将按照#pragma pack指定的数值(或默认值)和结构(或联合)最大数据成员类型长度中,比力小的那个举行,也就是min{对齐参数,最大数据成员类型长度}
- 结合1、2推断:当#pragma pack的n值等于或凌驾所有数据成员类型长度的时候,这个n值的巨细将不产生任何效果
用规则分析结果
只看规则描述可能还是有些抽象,拿上面对齐参数为2的例子举行分析
先上完整的代码:
#include "stdafx.h"#include #pragma pack(2)struct S1{ char a; int b; char c;};#pragma pack()#pragma pack(2)struct S2{ int a; char b; char c;};#pragma pack()S1 s1;S2 s2;int main(int argc, char* argv[]){ s1.a=1; s1.b=2; s1.c=3; s2.a=4; s2.b=5; s2.c=6; printf("%d\n",sizeof(s1)); printf("%d\n",sizeof(s2)); return 0;}这里将s1和s2声明为全局变量,方便检察偏移
分析结果
29: s1.a=1;0040D7C8 mov byte ptr [s1 (00427e48)],130: s1.b=2;0040D7CF mov dword ptr [s1+2 (00427e4a)],231: s1.c=3;0040D7D9 mov byte ptr [s1+6 (00427e4e)],332:33: s2.a=4;0040D7E0 mov dword ptr [s2 (00427e40)],434: s2.b=5;0040D7EA mov byte ptr [s2+4 (00427e44)],535: s2.c=6;0040D7F1 mov byte ptr [s2+5 (00427e45)],6通过反汇编得到各个成员所占用的内存空间(之前的数据也是如许得来的)
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s12(char)4(int)2(char)8s24(int)1(char)1(char)6数据成员的对齐
对于s1:
- 首先存储的是char类型的a,分配在00427e48这个地址(这个地址也是对齐参数的整数倍)
- 接下来要在a后面分配的是int类型的b,由于int为4字节,取min{sizeof(b),对齐参数}=min{4,2}=2;于是从上一个地址00427e48+1(a占用了1个字节)向后找可以或许被2整除的地址来存储b,也就是对应的s1+2 (00427e4a)
- 最后要在b后面分配的是char类型的c,取min{sizeof(c),对齐参数}=min{1,2}=1;于是从上一个地址00427e4a+4(b占用了4个字节)开始向后找可以或许被1整除的地址来存储c,也就是对应s1+6 (00427e4e)
对于s2:
- 首先存储的是int类型的a,分配在00427e40这个地址(这个地址也是对齐参数的整数倍)
- 接下来要在a后面分配的是char类型的b,取min{sizeof(b),对齐参数}=min{1,2}=1;于是从上一个地址00427e40+4(a占用了4个字节)向后找到可以或许被1整除的地址来存储b,也就是对应的s2+4 (00427e44)
- 最后要b后面分配的是char类型的c,取min{sizeof(c),对齐参数}=min{1,2}=1;于是从上一个地址00427e44+1(b占用了1个字节)向后找到可以或许被1整除的地址来存储c,也就是对应的s2+5 (00427e45)
结构体整体的对齐
无论是对于结构体s1还是结构体s1,对应的min{对齐参数,最大数据成员类型长度}=min{2,4}=2
对于s1:
前面数据成员对齐后的总长度为7,由于:s1+6 (00427e4e)+1(加上c所占用的空间)=s1+7
7并不是2的整数倍,于是要在后面补空字节,补1个空字节,使得总长度为8
对于s2:
前面数据成员对齐后的总长度为6,由于:s2+5 (00427e45)+1(加上c所占用的空间)=s2+6
6恰好是2的整数倍,于是无需在后面补空字节,总长度为6
补充
无论是将结构体作为参数传递还是作为返回值传递,期间都有大量的内存复制操作,显然实际使用中并适合采用如此耗费性能的操作,一般是使用指针来举行传递的
对于结构体的对齐,不但仅要思量结构体成员的对齐,还要思量结构体整体的对齐
结构体里面使用的static变量在用sizeof举行巨细计算时是不会将其算进去的,由于静态变量存放在静态数据区,和结构体的存储位置不同
来源:http://www.12558.net
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |