offsetof 宏

beyes · 发表于 2009-8-17 17:26:59

在 <stddef.h> 中定义了个 offsetof(s,m)宏，这个宏用来取得结构体中元素的偏移量很方便，下面是此宏的具体定义：

#define offsetof(s, m) (size_t)&(((s *)0)->m)

ofssetof(s, m) 其中，s 是结构体名，m 是它的一个成员。s 和 m 同是宏  offsetof() 的形参，这个宏返回的是结构体 s 的成员 m 在结构体中的偏移地址。

(s *)0  :  这里的用法实际上是欺骗了编译器，使编译器认为 "0" 就是一个指向 s 结构体的指针(地址)，换句话说 s 结构体就是位于 0x0 这个地址处。

(s *)0-> m : 自然就是指向这个结构体的 m 元素。

&((s *)0)->m :  表示 m 元素的地址。这里，如上面所说，因为编译器认为结构体 s 被认为是处于 0x0 地址处，所以 m 的地址自然的就是 m 在 s 中的偏移地址了。

最后将这个偏移值转化为 size_t 类型。

可能会感到迷惑，这样强制转换后的结构指针怎么可以用来访问结构体字段？呵呵，其实这个表达式根本没有也不打算访问m字段。ANSIC标准允许任何值为0的常量被强制转换成任何一种类型的指针，并且转换结果是一个NULL指针，因此((s*)0)的结果就是一个类型为s*的NULL指针。如果利用这个NULL指针来访问s的成员当然是非法的，但&(((s*)0)->m)的意图并非想存取s字段内容，而仅仅是计算当结构体实例的首址为((s*)0)时m字段的地址。聪明的编译器根本就不生成访问m的代码，而仅仅是根据s的内存布局和结构体实例首址在编译期计算这个(常量)地址，这样就完全避免了通过NULL指针访问内存的问题。又因为首址的值为0，所以这个地址的值就是字段相对于结构体基址的偏移。

size_t是针对系统定制的一种数据类型。它不是固定位数，在不同的系统里这个值都有可能不同( 它实际上是 unsigned int 类型 )；而且在内存里，对于数据是高位对齐存储还是低位对齐存储各系统都不一样。所以，为了提高代码的可移植性，就有必要定议这样的数据类型。一般这种类型都会定义到它具体占几位内存等。当然，有些是编译器或系统已经给定义好的。具体要查看技手册。

下面是自定义 offsetof() 宏的测试代码：

#include <stdio.h>

struct demo {
   char c;
   int  i;
   int  k;
   char u;
   char name[10];
};

int main()
{

   size_t pos;

   pos = (size_t)&(((struct demo *)0)->k);


   printf("%d\n",pos);
   return 0;
}

运行及输出：

beyes@linux-beyes:~/C/base> ./offsetof.exe
8

为什么是 8 而不是 char c (1) + int i (4) = 5 呢？这是因为计算机为了方便存储数据进行了数据对齐，把 char 类型也再另外填充了 3 个字节变成了 4 个字节。
参考：http://www.groad.net/bbs/read.php?tid=1037

		自动登录	找回密码
密码			立即注册