12558网页游戏私服论坛

 找回密码
 立即注册
游戏开服表 申请开服
游戏名称 游戏描述 开服状态 游戏福利 运营商 游戏链接
攻城掠地-仿官 全新玩法,觉醒武将,觉醒技能 每周新区 经典复古版本,长久稳定 进入游戏
巅峰新版攻 攻城掠地公益服 攻城掠地SF 新兵种、新武将(兵种) 进入游戏
攻城掠地公 散人玩家的天堂 新开 进入游戏
改版攻城掠 上线即可国战PK 稳定新区 全新改版,功能强大 进入游戏
少年江山 高福利高爆率 刚开一秒 江湖水落潜蛟龙 进入游戏
太古封魔录 开服送10亿钻石 福利多多 不用充钱也可升级 进入游戏
神魔之道 签到送元宝 稳定开新区 送豪华签到奖励 进入游戏
神奇三国 统帅三军,招揽名将 免费玩新区 激情国战,征战四方 进入游戏
龙符 三日豪礼领到爽 天天开新区 助你征战无双 进入游戏
王者之师 免费领豪华奖励 免费玩新区 6元送6888元宝 进入游戏
三国霸业 战车-珍宝-觉醒-攻城掠地SF-全新玩法 免费玩新区 攻城掠地私服 进入游戏
手游私服盒子 各类免费游戏 0.1折送海量资源 各类手游私服 进入游戏
皇家MU2 《奇迹 2:传奇》韩国网禅公司《奇迹》正统续作。 3D锁视角Mmrpg 暗黑3+传奇+流放之路+奇迹 进入游戏
查看: 261|回复: 0

逆向基础笔记十八 汇编 结构体和内存对齐

[复制链接]

60

主题

60

帖子

130

积分

实习版主

Rank: 7Rank: 7Rank: 7

积分
130
发表于 2021-5-7 23:43:10 | 显示全部楼层 |阅读模式
继续更新个人的学习笔记,
别的笔记传送门
逆向基础笔记一 进制篇
逆向基础笔记二 数据宽度和逻辑运算
逆向基础笔记三 通用寄存器和内存读写
逆向基础笔记四 堆栈篇
逆向基础笔记五 标志寄存器
逆向基础笔记六 汇编跳转和比力指令
逆向基础笔记七 堆栈图(重点)
逆向基础笔记八 反汇编分析C语言
逆向基础笔记九 C语言内联汇编和调用协定
逆向基础笔记十 汇编探求C步伐入口
逆向基础笔记十一 汇编C语言基本类型
逆向基础笔记十二 汇编 全局和局部 变量
逆向基础笔记十三 汇编C语言类型转换
逆向基础笔记十四 汇编嵌套if else
逆向基础笔记十五 汇编比力三种循环
逆向基础笔记十六 汇编一维数组
逆向基础笔记十七 汇编二维数组 位移 乘法
逆向基础笔记十九 汇编switch比力if else
逆向基础笔记二十 汇编 指针(一)
逆向基础笔记二十一 汇编 指针(二)
逆向基础笔记二十二 汇编 指针(三)
逆向基础笔记二十三 汇编 指针(四)
逆向基础笔记二十四 汇编 指针(五) 系列完结
结构体

C语言中的结构体是一种自定义的数据类型,一个结构体里可由别的各种类型组合而成
声明结构体

举个简朴的例子,自定义一个为player的类型,如下:
struct Player{    float hp;                //人物血量    float mp;                //人物魔量    int money;                //人物款项    int atk;                //人物攻击力    char name[20];        //人物昵称    float x;                //人物x坐标    float y;                //人物y坐标};结构体的初始化

初始化

使用自定义的结构体,然后初始化
#include "stdafx.h"#include struct Player{    float hp;                //人物血量    float mp;                //人物魔力值    int money;                //人物款项    int atk;                //人物攻击力    char name[10];        //人物昵称    float x;                //人物x坐标    float y;                //人物y坐标};int main(int argc, char* argv[]){        Player player;        player.hp=100;        player.mp=50;        player.money=1000;        player.atk=10;                strcpy(player.name,"lyl610abc");        player.x=600;        player.y=100;        return 0;}对应汇编代码

21:       Player player;22:23:       player.hp=100;00401028   mov         dword ptr [ebp-24h],42C80000h24:       player.mp=50;0040102F   mov         dword ptr [ebp-20h],42480000h25:       player.money=1000;00401036   mov         dword ptr [ebp-1Ch],3E8h26:       player.atk=10;0040103D   mov         dword ptr [ebp-18h],0Ah27:       strcpy(player.name,"lyl610abc");00401044   push        offset string "lyl610abc" (0042601c)00401049   lea         eax,[ebp-14h]0040104C   push        eax0040104D   call        strcpy (00401090)00401052   add         esp,828:       player.x=600;00401055   mov         dword ptr [ebp-8],44160000h29:       player.y=100;0040105C   mov         dword ptr [ebp-4],42C80000h结构体成员含义对应地址占用空间(单元字节)hp血量ebp-24h4mp魔力值ebp-20h4money款项ebp-1Ch4atk攻击ebp-18h4name昵称ebp-14h12xx坐标ebp-84yy坐标ebp-44不丢脸出结构体的成员的存储和数组并无差别,依旧是从低地址开始连续存储
此中要注意到,name成员实际占用空间为12字节,比声明的char name[10],多了2字节,为内存对齐的结果
结构体作为参数传递

参数传递

#include "stdafx.h"#include struct Player{    float hp;                //人物血量    float mp;                //人物魔量    int money;                //人物款项    int atk;                //人物攻击力    char name[10];        //人物昵称    float x;                //人物x坐标    float y;                //人物y坐标};void getStruct(struct Player player){}int main(int argc, char* argv[]){        Player player;        getStruct(player);        return 0;}对应汇编代码

28:       getStruct(player);004106D8   sub         esp,24h004106DB   mov         ecx,9004106E0   lea         esi,[ebp-24h]004106E3   mov         edi,esp004106E5   rep movs    dword ptr [edi],dword ptr [esi]004106E7   call        @ILT+5(getStruct) (0040100a)004106EC   add         esp,24h分析流程

1.提升堆栈24h(为结构体的巨细)
004106D8   sub         esp,24h2.将9赋值给ecx(作为计数器使用,也就是要循环9次)
004106DB   mov         ecx,93.将结构体的首地址传址给esi
004106E0   lea         esi,[ebp-24h]4.将esp赋值给edi,也就是将栈顶地址赋给edi
004106E3   mov         edi,esp5.重复9次(重复直到ecx为0),将esi里的值赋值给edi里的值,每次ecx都会自减1,esi和edi自增4(增或减取决于DF标志位)
为什么是循环9次?
前面提升的堆栈为24h,对应十进制为36,这里每次循环都会让esi和edi自增4,36/4=9,所以要循环9次
004106E5   rep movs    dword ptr [edi],dword ptr [esi]结合前面的esi=结构体首地址,edi为栈顶,这行代码就是将结构体复制到堆栈中
6.调用以结构体为参数的函数
004106E7   call        @ILT+5(getStruct) (0040100a)7.函数调用竣过后举行堆栈外平衡,将之前提升的堆栈恢复
004106EC   add         esp,24h小总结

通过前面的分析可以知道,将结构体作为参数来传递是将整个结构体赋值到堆栈中来举行传递的
结构体作为返回值传递

返回值传递

#include "stdafx.h"#include struct Player{    float hp;                //人物血量    float mp;                //人物魔量    int money;                //人物款项    int atk;                //人物攻击力    char name[10];        //人物昵称    float x;                //人物x坐标    float y;                //人物y坐标};Player retStruct(){        Player player;        return player;}int main(int argc, char* argv[]){        Player player;        player=retStruct();        return 0;}对应汇编代码

函数外部

30:       Player player;31:       player=retStruct();0040107E   lea         eax,[ebp-6Ch]00401081   push        eax00401082   call        @ILT+0(retStruct) (00401005)00401087   add         esp,40040108A   mov         esi,eax0040108C   mov         ecx,900401091   lea         edi,[ebp-48h]00401094   rep movs    dword ptr [edi],dword ptr [esi]00401096   mov         ecx,90040109B   lea         esi,[ebp-48h]0040109E   lea         edi,[ebp-24h]004010A1   rep movs    dword ptr [edi],dword ptr [esi]可以看到,函数明明是个无参的函数,但是却在函数前push了eax,并且eax是ebp-6C的地址
为什么明明是无参函数,却仍然push了 eax?
这里的eax是作为返回值来使用的,要将整个结构体作为返回值来传递,只用一个eax肯定是不够存储的,数据应该存在堆栈中,而这里就是用eax来生存 要存储返回结构体的堆栈地址的
函数内部

前面所说可能有些抽象,来结合函数里面返回的内容分析:
19:       Player player;20:       return player;00401038   mov         ecx,90040103D   lea         esi,[ebp-24h]00401040   mov         edi,dword ptr [ebp+8]00401043   rep movs    dword ptr [edi],dword ptr [esi]00401045   mov         eax,dword ptr [ebp+8]21:   }00401048   pop         edi00401049   pop         esi0040104A   pop         ebx0040104B   mov         esp,ebp0040104D   pop         ebp0040104E   ret先看前面几行代码
00401038   mov         ecx,90040103D   lea         esi,[ebp-24h]00401040   mov         edi,dword ptr [ebp+8]00401043   rep movs    dword ptr [edi],dword ptr [esi]发现和前面将结构体作为参数传递的代码差不多,就是将结构体的数据复制到堆栈中,此时复制的堆栈的起始地址为ebp+8
再看关键语句
00401045   mov         eax,dword ptr [ebp+8]这里就是将ebp+8也就是前面复制的堆栈的起始位置 赋值给 eax,eax作为返回值来传递数据
剩下的内容就是恢复现场和返回,这里就不再过多赘述
返回后

00401087   add         esp,40040108A   mov         esi,eax0040108C   mov         ecx,900401091   lea         edi,[ebp-48h]00401094   rep movs    dword ptr [edi],dword ptr [esi]00401096   mov         ecx,90040109B   lea         esi,[ebp-48h]0040109E   lea         edi,[ebp-24h]004010A1   rep movs    dword ptr [edi],dword ptr [esi]返回后首先举行堆栈外平衡,由于先前push了一个eax
00401087   add         esp,4然后就是认识的操作
0040108A   mov         esi,eax0040108C   mov         ecx,900401091   lea         edi,[ebp-48h]00401094   rep movs    dword ptr [edi],dword ptr [esi]00401096   mov         ecx,90040109B   lea         esi,[ebp-48h]0040109E   lea         edi,[ebp-24h]004010A1   rep movs    dword ptr [edi],dword ptr [esi]先将eax这个返回值赋值给esi
然后就是把返回值复制到现在的堆栈中
再接着就是把堆栈中的数据复制给暂时变量player,对应player=retStruct();
小总结

将结构体作为返回值,会将返回值eax压入堆栈中,阐明确push 的内容不一定是参数,也可以是返回值
内存对齐

内存对齐也称作字节对齐
前面或多或少都有提到过内存对齐,但没有具体睁开,现在来谈谈内存对齐
为什么要内存对齐

性能原因

寻址时进步效率,采用了以空间换时间的头脑
当寻址的内存的单元和本机宽度一致时,寻址的效率最高
举个例子:

  • 在32位的呆板上,一次读32位(4字节)的内存 效率最高
  • 在64位的呆板上,一次读64位(8字节)的内存 效率最高
平台原因(移植原因)

不是所有的硬件平台都能访问恣意地址上的恣意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
内存对齐例子

前面其实已经有过不少内存对齐的例子,就比如上面的
char name[10];实际占用的空间为12,12=4 × 3 ,这里的4就是本机宽度,单元为字节,实际占用的空间为本机宽度的整数倍
再看看结构体的内存对齐:
#include "stdafx.h"#include struct S1{        char a;        int b;        char c;};struct S2{        int a;        char b;        char c;};int main(int argc, char* argv[]){        S1 s1;        S2 s2;        printf("%d\n",sizeof(s1));        printf("%d\n",sizeof(s2));        return 0;}运行结果


分析

可与看到,明明结构体里的参数类型是一样的,都是两个char和一个int,但其占用的空间却不一样,这就是内存对齐的结果
此时的对齐参数为默认值8
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s14(char)4(int)4(char)12s24(int)2(char)2(char)8对齐参数

上面有提到对齐参数,什么是对齐参数?
对齐参数:n为字节对齐数,其取值为1、2、4、8,(默认值取决于编译器)VC++6.0中n 默认是8个字节
对齐数=编译器默认的一个对齐数与该成员巨细的较小值
再看看下面的例子,对比上面对齐参数默认为8时的结果
修改对齐参数

可以通过
#pragma pack(n)//设置对齐参数#pragma pack())//取消设置的默认对齐参数,还原为默认来指定对齐参数
为上面的例子指定对齐参数:
#pragma pack(1)struct S1{        char a;        int b;        char c;};#pragma  pack()#pragma pack(1)struct S2{        int a;        char b;        char c;};#pragma  pack()对齐参数为1


可以看到,分配的空间都变成了6字节,2个char 各占用1字节,int占用4字节
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s1\s21(char)4(int)1(char)6对齐参数为2

将对齐参数改为2,结果如下:

此时空间占用情况如下:
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s12(char)4(int)2(char)8s24(int)1(char)1(char)6内存对齐的规则


  • 数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset(偏移)为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值(或默认值)和)数据成员类型长度中,比力小的那个举行,也就是min{对齐参数,sizeof(数据成员)},在上一个对齐后的地方开始探求能被当前对齐数值整除的地址
  • 结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要举行对齐.重要体现在,最后一个元素对齐后,后面是否填补空字节,如果填补,填补多少.对齐将按照#pragma pack指定的数值(或默认值)和结构(或联合)最大数据成员类型长度中,比力小的那个举行,也就是min{对齐参数,最大数据成员类型长度}
  • 结合1、2推断:当#pragma pack的n值等于或凌驾所有数据成员类型长度的时候,这个n值的巨细将不产生任何效果
用规则分析结果

只看规则描述可能还是有些抽象,拿上面对齐参数为2的例子举行分析
先上完整的代码:
#include "stdafx.h"#include #pragma pack(2)struct S1{        char a;        int b;        char c;};#pragma  pack()#pragma pack(2)struct S2{        int a;        char b;        char c;};#pragma  pack()S1 s1;S2 s2;int main(int argc, char* argv[]){        s1.a=1;        s1.b=2;        s1.c=3;        s2.a=4;        s2.b=5;        s2.c=6;        printf("%d\n",sizeof(s1));        printf("%d\n",sizeof(s2));        return 0;}这里将s1和s2声明为全局变量,方便检察偏移
分析结果

29:       s1.a=1;0040D7C8   mov         byte ptr [s1 (00427e48)],130:       s1.b=2;0040D7CF   mov         dword ptr [s1+2 (00427e4a)],231:       s1.c=3;0040D7D9   mov         byte ptr [s1+6 (00427e4e)],332:33:       s2.a=4;0040D7E0   mov         dword ptr [s2 (00427e40)],434:       s2.b=5;0040D7EA   mov         byte ptr [s2+4 (00427e44)],535:       s2.c=6;0040D7F1   mov         byte ptr [s2+5 (00427e45)],6通过反汇编得到各个成员所占用的内存空间(之前的数据也是如许得来的)
结构体a占用空间\数据类型b用空间\数据类型c占用空间\数据类型总占用空间s12(char)4(int)2(char)8s24(int)1(char)1(char)6数据成员的对齐

对于s1:

  • 首先存储的是char类型的a,分配在00427e48这个地址(这个地址也是对齐参数的整数倍)
  • 接下来要在a后面分配的是int类型的b,由于int为4字节,取min{sizeof(b),对齐参数}=min{4,2}=2;于是从上一个地址00427e48+1(a占用了1个字节)向后找可以或许被2整除的地址来存储b,也就是对应的s1+2 (00427e4a)
  • 最后要在b后面分配的是char类型的c,取min{sizeof(c),对齐参数}=min{1,2}=1;于是从上一个地址00427e4a+4(b占用了4个字节)开始向后找可以或许被1整除的地址来存储c,也就是对应s1+6 (00427e4e)
对于s2:

  • 首先存储的是int类型的a,分配在00427e40这个地址(这个地址也是对齐参数的整数倍)
  • 接下来要在a后面分配的是char类型的b,取min{sizeof(b),对齐参数}=min{1,2}=1;于是从上一个地址00427e40+4(a占用了4个字节)向后找到可以或许被1整除的地址来存储b,也就是对应的s2+4 (00427e44)
  • 最后要b后面分配的是char类型的c,取min{sizeof(c),对齐参数}=min{1,2}=1;于是从上一个地址00427e44+1(b占用了1个字节)向后找到可以或许被1整除的地址来存储c,也就是对应的s2+5 (00427e45)
结构体整体的对齐

无论是对于结构体s1还是结构体s1,对应的min{对齐参数,最大数据成员类型长度}=min{2,4}=2
对于s1:
前面数据成员对齐后的总长度为7,由于:s1+6 (00427e4e)+1(加上c所占用的空间)=s1+7
7并不是2的整数倍,于是要在后面补空字节,补1个空字节,使得总长度为8
对于s2:
前面数据成员对齐后的总长度为6,由于:s2+5 (00427e45)+1(加上c所占用的空间)=s2+6
6恰好是2的整数倍,于是无需在后面补空字节,总长度为6
补充

无论是将结构体作为参数传递还是作为返回值传递,期间都有大量的内存复制操作,显然实际使用中并适合采用如此耗费性能的操作,一般是使用指针来举行传递的
对于结构体的对齐,不但仅要思量结构体成员的对齐,还要思量结构体整体的对齐
结构体里面使用的static变量在用sizeof举行巨细计算时是不会将其算进去的,由于静态变量存放在静态数据区,和结构体的存储位置不同

来源:http://www.12558.net
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
楼主热帖
回复

使用道具 举报

*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|12558网页游戏私服论坛 |网站地图

GMT+8, 2024-11-24 19:47 , Processed in 0.093750 second(s), 31 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表