Chaofan

Bonvenon al la blogo

作者： qcf

cJSON源码分析－实现
好了好了，这篇文章拖了真久啊，活活三个月。不过之前承诺要经常更新博客的，所以先把这个烂尾的坑给填了。

之前提到了cJSON这个C语言写成的JSON解析库的接口，也就是头文件里的内容。这一次我们来分析一下实现。上车吧。

还是按照源代码的逻辑走。我们发现cJSON最开始有一个全局的字符指针ep，以及一个用以返回ep的函数。可以看出，这个ep是用来存储错误信息的。这种实现是C语言的常用手法，即把一些状态用static的方式隐藏在单个文件中，并实现一些函数当作接口。
```
static const char *ep;
const char *cJSON_GetErrorPtr(void) {return ep;}
```
下面是一个大小写无关的字符串比较函数。看后面的源码可以发现这个函数用在了JSON对象名的查找当中。实现没有什么特别的难点，所以就不提了。顺便说一句，在C++里要实现这个大小写无关比较，可以用STL里的一个方法叫做lexicographical_compare，搭配lambda表达式可以轻松达到目的。

作者把负责动态内存分配和释放的函数直接「填」成了标准库的malloc和free，像C++的allocator一样。如果担心内存碎片的问题，可以自己再当个二道贩子，实现一个内存池，不过那有点背离本文的主题了。作者自己实现了一个版本的strdup，里面也是用这个用户可以更换的cJSON_malloc进行内存分配的。

新建JSON和释放JSON的工作不难，前者就是内存分配的问题，后者就判断一下JSON的type，如果是基本类型就直接释放，如果是数组或者对象就递归删除（类似二叉树）。

目前好戏来了。第一个函数是解析数的。写过词法分析器的就懂，这个用自动机很容易描述，不过这里实在是没有什么好的能在电脑上绘制自动机图的工具，所以用列表表示这个过程，看看应该能体会。
1. 开头有负号吗？有就记下来，向前走。
2. 第一个数字是0吗？是就前进，反正默认的结果都是0.
3. 这是小数点以前的部分，一位一位地循环解析就好了，到第一个非数字的字符为止。
4. 有点并且点后面有数字吗？有就把小数部分也解析了加上去。
5. 有E或者e吗？有就算10的幂次方。
简单吧？我们接着往下走。看到一个…奇怪的函数。
```
static int pow2gt (int x)
{
    --x;
    x|=x>>1;
    x|=x>>2;
    x|=x>>4;
    x|=x>>8;
    x|=x>>16;
    return x+1;
}
```
看见这个函数心里大概会想——什么鬼？名字看不懂，内容也看不懂。唔，不过看在它参数和返回值都是简单的int类型，不妨写个小程序测试一下结果。（限于篇幅省略结果）跑完之后我们猜测，这个函数的目的大概是返回一个不小于x的2的整数次幂。（对2的整数次幂还不敏感吗？）那我们来根据代码验证一下。

先略过这个减1的过程，看看位运算。我们假设整数的二进制形式从右向左，最后一个值为1的位是第n位，那么运算的过程是：
1. 首轮，第n位右移1位，经过按位或运算，第n和n-1位（n右边那一位）确保为1.
2. 第二轮，类似地，n和n-1都右移2位，所以n-3到n都是1.
3. 第三轮，同样，此时n-7到n位都可以确保为1.
4. 第四第五轮后，从1到n位都是1了。右移到16截止是因为这里的整数只有32位。
最后往这n位连续的1上再加个1，就是1后n个0，即2^n了。起来这个过程有点故弄玄虚的意思，因为我们也可以用循环的方式来解决。不过这里作者巧妙利用了整数位数的限制，用五次位运算达成了对任意整数都有效的效果。为什么要减1呢？因为不减1再加回去的话，对一个已经是2^n的数进行运算会得到2^(n+1)，不符合我们的预期。实际上，这样的位运算技巧在《高效算法的奥秘》和《深入理解计算机系统》中都有相关的阐述。

这个函数有什么用呢？搜索一下就会发现。它只用在了一个地方，就是下面这个ensure函数。继续追踪可以发现，这个函数包括下面的update以及printbuffer这个结构体，都是用来存储缓冲区的。在缓冲区里面空间成2倍地扩大。不过我们的重点在字符串解析和内部的数据结构。

到这里，我们回过头来整理一下思路。JSON的类型有6种，而操作又都有解析和输出两种。
- null和bool，由于bool只有两种固定的值，所以对于这两者，输出和解析都是简单的strcmp、strcpy就可以。
- string，解析本身难度不是太大，去掉两端引号中间的就是字符串内容。但是有两个（或者说就是一个）问题，一是要注意反斜杠’\’开头的转义字符，二是字符串涉及到utf16到utf8的转换。输出的话不是什么太大问题。
- number的解析前面已经说过了，浮点数输出要考虑一下精度，IEEE754标准和utf8都是坑。
- array和object都是递归解析。如果要按格式输出，缩进是一个问题。
唔，好尴尬，写到这里突然不知道怎么继续了。在这里贴一下主要的解析函数parse_value的代码。
```
/* Parser core - when encountering text, process appropriately. */
static const char *parse_value(cJSON *item,const char *value)
{
   if (!value)         return 0;   /* Fail on null. */
   if (!strncmp(value,"null",4))   { item->type=cJSON_NULL;  return value+4; }
   if (!strncmp(value,"false",5))  { item->type=cJSON_False; return value+5; }
   if (!strncmp(value,"true",4))   { item->type=cJSON_True; item-&gt;valueint=1;    return value+4; }
   if (*value=='\"')               { return parse_string(item,value); }
   if (*value=='-' || (*value>='0' && *value<='9')){ return parse_number(item,value); }
   if (*value=='[')                { return parse_array(item,value); }
   if (*value=='{')                { return parse_object(item,value); }
   ep=value;return 0;  /* failure. */
}
```
跟我前面的分类一样，很清楚了。至于空格，这个函数在每次被调用之前都会先调用一次skip函数，用来跳过空白的：
```
/* Utility to jump whitespace and cr/lf */
static const char *skip(const char *in)
{
    while (in && *in && (unsigned char)*in<=32)
        in++;
    return in;
}
```
查看ASCII码表就可以知道32之前的基本都是不可见的控制字符或者空白，这里的条件判断真是简单粗暴。

parse_array的过程已经说得比较清楚了，就是不断地跳过空格、读取逗号、再跳过空格、读取一个新的对象的循环……直到遇到反方括号。前面那个指针ep的用途也明白了，就是指向读取失败的地方。parse_object类似，只是每次循环还要插入一个读名字的过程。

输出部分没有什么特别值得提的地方（其实是懒），要注意的就是输出array和object的时候需要控制一下缩进。总的来说，cJSON的代码逻辑就是这个样子。阅读这样「接地气」的代码，好处在于能够快速学到很多这门语言的最佳实践，但是繁杂的工程细节也会让人厌烦。好在大一些的项目往往在抽象上做得更好，方便我们抽丝剥茧，寻得新知。
2016-08-01
夏夜怨记

大概真的有很久没有认真写过一篇日志了。

拖延症想来真是可怕的一件事，从高考、到生日、到搬嘉定，一直想记录下这些时刻，然而最后都因为各种原因忘掉了。

本来说，这次回家，要好好看书，复习物理，认真把之前没做的事情做完。可没想到睡着睡着这暑假就睡过快一半了。从现在开始大概还来得及，但是真的有机会让我意思到「快来不及」吗？

从去年七月底学籍变更开始算起，转到软件学院基本上算整整一年了。说没学到什么东西，那是假的。但是能不能合上当初对于大一的预期呢？恐怕这里不是个问号，甚至都应该是感叹号了。

大一开学第一门课好似一记闷锤，重重地把暑假群里的欢声笑语打得不知所踪。我本是个好为人师的人，也因此，有不少人认识了我。虽说常常觉得会有人因为此对我颇有微词，但是更多的时候笑一笑，只是觉得帮助别人挺好的，足矣。

说Deadline是第一生产力，这话我同意一半。Deadline只能带来产品，带不来作品。除了紧迫感以外，要创造出作品必须的还有一种「渴望」。这样的「渴望」是发自内心的，但对于常人而言，要利用它创造作品，恐怕这期限得是无穷远加上一个epsilon，所以它和期限交织在一起，就是促发我们为作品拼命的动力。

既然半年混一混就过去了，那再来半年似乎就更不是问题了。下半个学期过得更加无趣和无所事事。Cocos已经足够不能带给人成就感了，更何况一个拖了许久需求一删再删的半成品游戏。年级群也在变得越发沉闷，只有俱乐部还能带给人些许慰藉。

其实说到底，这些问题都是自己没有规划没有坚持造成的。规划是简单的，大不了发现有问题再改。难的是坚持。你说每天写一篇日志容不容易？好像也不难。但是甫一打开后台，脑子里各种毛病就来了。觉得浪费时间也好，质量不高也好，一天天就混吃等死推过去了。吹牛的时候我老喜欢提自己初中就学编程的事，然而到今天有太大正面影响吗？还真的没啥。

这并不需什么天才，那个年纪就是能自学那种程度的知识和技能。问题是环境是否容许，例如放学后去办公室搞到午夜才回家，同时学业成绩不能太差。

在知乎上看见Milo谈小孩子学编程的时候说的话，深以为然。如果时间能够给我再一次机会，我真的会做出不一样的选择吗？

在软件这一年，有收获，有遗憾，但这段经历比不上大一一年带来的震撼。回头看自己一直以来的读书经历，好像也能总结出一个道理：

永远不要试图框定自己的界限。否则，你总会发现外面还有所遗漏。

2016-07-31
汶川地震八年记

看见今天各大新闻的头条，不知不觉，那场地震已经过去八年了。

尽管身为离四川很近的重庆人，然而每次跟别人聊起地震的时候，我都无比确信我那个时候真的毫无震感。而一切的记忆都是那么清晰而真切，虽说不上就像在昨日发生一般，却也成了生命光影里深深定格的镜头。那个时候刚刚上美术课，被我们调侃过无数次的美术老师让我去隔壁的办公室拿一盒彩色粉笔。还没等我走到办公室门口，就见到人们一窝蜂冲了出去往楼下跑。我当时并不知道怎么回事，也确未感知到地震的来临，所以满脸不解的表情，甚至还以为是马蜂来袭，同学们集体外撤。大概等到人已经冲出一半了，我才听见有人喊到一声「地震了」。此刻的我虽然紧张却更不愿往下跑了——老师不是教育过我们，地震来临要躲在桌子下面吗？不过几乎所有人都跑出去了，外加城乡结合部小学的建筑质量确实也不太能让人信赖，我还是跟着下楼，成了最后出去的人。

可能我对事故的嗅觉从来都是人群里最迟钝的那一类，地震是，外滩踩踏亦是。大家都下撤到教学楼下的操场以后，老师开始点名，看有没有遗漏的人。（尽管我一直觉得，如果地震真的把那教学楼震踏了，我们在球场上根本不能幸免）点名完毕后就组织回家，联系家长。我走出学校，径直走向家附近的一家商店，将近十个中老年人围着一个电视机说着什么。我也凑上去看，才知道刚刚是四川汶川地震了。电视台一次又一次修正地震的震级，不过对当时的我来说，就是知道那很厉害而已了，而对于震源地的死亡，也实在没有概念。

我清楚地记得那天的一切，记得我回去还玩了一把无双大蛇，还看了一集记单词教程。还有工人们坐在路边的聊天。我都记得。不过，对于不幸的朋友而言，可能所有的记忆到那一刻就完全停止了。一个小学生大概真的不太容易明白如此巨大地震的后果。意识到这是一件会打破正常学校生活秩序的大事以后，心里反而有些许奇怪的兴奋感。当然，那段时间的电视新闻永远只有这一个主题。无数的故事，生离死别，当时的我不太能体会这种沉重，但对失去亲人的悲怆，我也有具体的想象。

重庆人都喜欢开玩笑说重庆是一个安全的地方，水火不侵。不过一当有传言曰大余震要来了，市民们也紧张得很。那天晚上社区的家家户户都收拾睡具到球场上过了一夜。我睡不着，于是夜游，那经历甚是有趣。当然夜游的经历不只这一次，不过每次，似乎都跟死亡有那么点点关联。

再然后就是全国哀悼日了。那几天网游什么的都是不能玩的。唔，不过我也没有什么兴趣。小伙伴在楼下唤我出来，做什么我忘了，大概也是吹牛吧。毕竟那是一个放学之后到同学家门口就能吹一个小时的年纪啊。

说了这么多，似乎都是无病呻吟，没什么实在的意义。是。只是借此回忆一下，回忆一下那时那个对初中生活还有充分幻想的我自己。毕竟这个时间节点实在是太特殊。当然，许多无辜的生命，就突然停止在那个时刻，他们的故事再也没有机会被续写。活着的人呢，也许素不相识，因为一场地震而相遇。人生实在是太神奇。地震灾后的修复也许早已完成，但它的回音，似乎远未结束。

谁也不知道未来会发生什么。

2016-05-13
cJSON源码分析－接口
最近因为各种忙碌，博客一直没有更新。下半学期的ACM/ICPC报名已经过去了，我没有参加，因为觉得自己对这种比赛没有什么特别的兴趣。其实话说回来，要和人「当面比」的事情，我很多都不喜欢。大概是因为从小到大的不自信导致的。这边Rails的项目快要写完了，收获不少，会找个时候专门用一篇博文记述。喜欢编程，所以就总是停不下来，想找点事情做。大家都说，提升编程能力要做项目。这话不假。但是编程就像写作文，初中生洋洋洒洒写个小说，很可能只会被成年人看作是幼稚文章。编程作为一门手艺，阅读他人的源码也是很重要的。感谢自由软件运动让我们有大量的源码可以用来学习，也感谢GitHub这样的平台能让我们更加方便地获取和发布源代码。所以最近可能会陆陆续续地更新一些程序的分析，也借这个过程提高一下自己细粒度层面的编程水平。希望不会烂尾。（flag已立！）

要分析呢，就从最熟悉的语言开始吧，也就是C咯。然后找一个简单的开源项目。好啦，中央已经决定了，就是cJSON了。同济2014级软件学院的C语言期末作业就是要求写一个cJSON解析器，后来我才发现那个提供的头文件就是cJSON里的……

软件的第一要义就是，它创造出来必须有用。那cJSON，顾名思义，就是一个程序，它能够：
1. 将文本化的JSON转化为C语言可以操作的数据结构（解析）
2. 将内存里的数据结构输出为格式化的JSON字符串（序列化）
具体JSON是什么格式，不用我再多说了吧。在JavaScript流行的今天，JSON由于其简单的语法和支持嵌套的特点，得到了广泛应用。许多框架的配置文件什么的，都是用的JSON格式。也有许多人试图用JSON逐渐取代XML语言。

我们先来看源码的文件结构：
- cJSON.c
- cJSON.h
- test.c
- README.md
- LICENSE
- CMakeLists.txt
- Makefile
- cJSON_Utils.h
- cJSON_Utils.c
- test_utils.c
- test/
其中末尾带util的都是针对JSON做的一些扩展（RFC6901和RFC6902），我们先略去不谈。其实作为库，核心部分就两个文件，一个cJSON.h声明，一个cJSON.c实现。那么我们就先来看看头文件，cJSON到底提供了哪些接口。
```
/* cJSON Types: */
#define cJSON_False  (1 << 0)
#define cJSON_True   (1 << 1)
#define cJSON_NULL   (1 << 2)
#define cJSON_Number (1 << 3)
#define cJSON_String (1 << 4)
#define cJSON_Array  (1 << 5)
#define cJSON_Object (1 << 6)

#define cJSON_IsReference 256
#define cJSON_StringIsConst 512

/* The cJSON structure: */
typedef struct cJSON {
    struct cJSON *next,*prev;   /* next/prev allow you to walk array/object chains. Alternatively, use GetArraySize/GetArrayItem/GetObjectItem */
    struct cJSON *child;        /* An array or object item will have a child pointer pointing to a chain of the items in the array/object. */

    int type;                   /* The type of the item, as above. */

    char *valuestring;          /* The item's string, if type==cJSON_String */
    int valueint;               /* The item's number, if type==cJSON_Number */
    double valuedouble;         /* The item's number, if type==cJSON_Number */

    char *string;               /* The item's name string, if this item is the child of, or is in the list of subitems of an object. */
} cJSON;

typedef struct cJSON_Hooks {
      void *(*malloc_fn)(size_t sz);
      void (*free_fn)(void *ptr);
} cJSON_Hooks;
```
整个分成三个部分，一个是标记Type的宏，包括了cJSON结构体里type成员的所有取值。它在这里额外增加了IsReference和StringIsConst两个类型标记。我们注意到作者表示cJSON的类型不是用的正常的自然数的顺序排布，而是利用位移运算构成了等比数列。为什么要这样呢？因为这样的话一个类型就可以和IsReference和StringIsConst叠加了。这是C语言里的常用技巧。

再往下，我们可以看到作者定义了一个叫做cJSON_Hooks的结构，包含了malloc_fn和free_fn两个函数指针作为成员。很容易看出来这两个函数指针的原型也刚好对应malloc和free的函数原型。虽然还没有开始阅读源代码，不过我们自信地猜想，这个结构的作用类似于C++ STL中的allocator，负责标准分配之外的分配方式。话说我一开始写maolang的容器的时候也用过这个方法，但是后来觉得太累赘而放弃了。

再看下面的代码。
```
/* Supply malloc, realloc and free functions to cJSON */
extern void cJSON_InitHooks(cJSON_Hooks* hooks);

/* Supply a block of JSON, and this returns a cJSON object you can interrogate. Call cJSON_Delete when finished. */
extern cJSON *cJSON_Parse(const char *value);
/* Render a cJSON entity to text for transfer/storage. Free the char* when finished. */
extern char  *cJSON_Print(cJSON *item);
/* ... */

/* Returns the number of items in an array (or object). */
extern int    cJSON_GetArraySize(cJSON *array);
/* ... */
/* For analysing failed parses. This returns a pointer to the parse error. You'll probably need to look a few chars back to make sense of it. Defined when cJSON_Parse() returns 0. 0 when cJSON_Parse() succeeds. */
extern const char *cJSON_GetErrorPtr(void);
```
限于篇幅，把更多的函数声明省略了。函数声明前面加上extern关键字是可选的，仅仅是标注它是一个外部链接的函数而已。然后是一堆用以创建、删除、插入、修改JSON结构的函数，更详细的内容在头文件里。
```
/* Duplicate a cJSON item */
extern cJSON *cJSON_Duplicate(cJSON *item,int recurse);
/* Duplicate will create a new, identical cJSON item to the one you pass, in new memory that will
need to be released. With recurse!=0, it will duplicate any children connected to the item.
The item->next and ->prev pointers are always zero on return from Duplicate. */
```
复制的函数有一个额外参数，表示是否选择递归复制（深拷贝）。这里还有一些函数，我们分析实现的时候再说。在头文件的最后还有一个有趣的宏：
```
/* Macro for iterating over an array */
#define cJSON_ArrayForEach(pos, head) \
    for(pos = (head)->child; pos != NULL; pos = pos->next)
```
虽然仅仅是简陋的宏替换，不过还真是搞出了现代语言的感觉呢。

看完头文件之后，我们发现，cJSON这个简单的解析器，名堂却不小，提供了不少实用的接口。至于这些接口内部实现的细节，我们下一篇文章再来讨论啦。
2016-04-27
计协，南京和其他

这篇日志本来是想周四晚上写的，结果拖着拖着拖到了现在。

虽然学籍上仍然是个大一学生，但是已经是在计算机协会的第四个学期了。计协的活动，前前后后在时间线上串起来，大概就是我将近两年的大学生活。大一的时候，班上女生多，上海女生尤其多，本来班级活动也少，大家待了大半个学期都不认识。计协反而成了寄托。如今回头看那个时候的照片，还会惊叹——原来这些事情都是第一个学期发生的啊！要知道，彼时我还每周认真写高数作业，还没有想好要去软件还是计算机。往后的日子就如眨眼般过去了，连我自己也到了要去嘉定的时候。

大一初到上海，陌生的城市，陌生的人，未知的未来，都在不断地敲打自己。那个时候被「抓进」医院住院，在病房里坐着看着窗外的赤峰路。嘉定是什么样子呢？大四的时候……哦大四还好遥远呢？殊不知，如果我没有留级的话，这四年已将近走完一半了。实话说，在我不知道同济计协的时候我就有加入这类组织的想法了。我记得初中的时候学校就有跟编程有关的社团，可惜那是高中部没法加入。在网上发现一位高我一年级的VB高手，两人还一见如故惺惺相惜。可惜后来断了联系，也不知他现在在哪里。高中的时候呢，觉得老师太蠢，于是把OI放弃了，后来还是有那么点后悔的。可是后悔这种东西没有意义，让我回到那个时候再选一次大概还是一样的决定。

说来好笑，在病房里看贴吧关于百团大战的贴子，把所有跟计算机有关的社团全部默默记了下来。所以第一次百团的时候一下看到了计协就报了名。有趣的是，我拿传单的瞬间还刚好被拍下来了。

面试的时间在十月七日，如今都还历历在目。国庆第一天就去了南京，第一次一个人坐火车还是挺有意思的体验。第一个夜晚到了南京还不觉得，第二天开始就有了一种深深的无力感，用自己的话说就像是在住院。现在想来，大概是因为第一次来到一个谁也不认识的城市，住在酒店里，感到自己对身边的一切毫无掌控力。人类就是这样盲目乐观的动物，看上去，一切都秩序井然。殊不知人类创造的很多规则和理念都是很脆弱的。大众都为大城市的繁华而惊叹，倘若是战争一来，几千万人的大城市一失去秩序就是人类历史上难以想象的灾难。地狱当然是存在的，比如1945年的柏林。

又说远了。面试当然是没问题，见着这些学长还挺激动。那个学期的活动还挺丰富的，从义诊到活动周到计协十周年，我还混过一个小组长当，哈哈哈。后来是下学期的参观七牛，计协一刻钟……说到这里语词混乱也不知道该再讲什么了。只是，真的想感叹一下时间的流逝。一年前我就告诉自己要好好抓紧时间多看点书，结果一年过去了还是明日复明日明日何其多。可惜没有办法，谁叫我是大一呢？谁叫我还要学这么多不得不学的乱七八糟的课呢？哎，已经是毕业生的心了，却还是个新生的籍。

过去了两天，当时的那种心情已经被冲淡了许多。那天晚上看到老照片，真的好想好想感叹。室友问我，「你对这个社团看来很有感情啊」。「当然」。

2016-03-26
C语言里的void类型
今天去图书馆坐了坐，看罢《Essential C++》，觉得过分基础，实在没什么意思。碰巧包里还有一本神作《C标准库》，详述了实现ANSI C标准库的所有过程。第一章讲的便是assert.h的实现。这个宏本身没有什么难度，无非是在一个函数的基础上包装一下，说不定GCC或者Clang直接把这个函数做成builtin了。不过不管是书上还是musl库的代码，都有一个让我注意到的地方：
```
#ifdef NDEBUG
#define    assert(x) (void)0
#else
#define assert(x) ((void)((x) || (__assert_fail(#x, __FILE__, __LINE__, __func__),0)))
#endif
```
这里的这个__assert_fail就如同我上文所说，是一个用于输出内容的函数，作用是输出错误信息然后调用abort函数退出。

关键在于这里有个奇怪的(void)0表达式。首先我们可以判定表达式的类型是void，对吧？不过这个void类型的表达式有什么意义呢？我们学习C语言的教材对这一点基本都语焉不详。我尝试了一下，把(void)0赋给一个int类型的变量，编译器是这样给我抱怨的：
```
test.c:3:9: error: initializing 'int' with an expression of incompatible type 'void'
  int i = (void)0;
      ^   ~~~~~~~
```
反正意思就是无法把这个类型转换成匹配的int啦。

那我们转念一想，尝试用void来定义一个变量呢？得到这样的错误提示：
```
test.c:4:10: error: variable has incomplete type 'void'
  void j;
       ^
```
等等！incomplete type？哪里见过这个？对啦！如果在一个结构体内部定义一个以这个结构体为类型的对象，编译器就会抱这个错误，提示类型还没有定义完。所以写链表或者二叉树的时候，里面存储的其实是「指向节点的指针」。

继续带着疑惑，我查询了C11的标准草案（正式版是收费的，不过两者在这些基础问题上相差无几），其中有三处提到了我想知道的「void类型」：

…The void type comprises an empty set of values; it is an incomplete object type that cannot be completed…
…An lvalue is an expression (with an object type other than void) that potentially designates an object…
The (nonexistent) value of a void expression (an expression that has type void) shall not be used in any way, and implicit or explicit conversions (except to void) shall not be applied to such an expression. If an expression of any other type is evaluated as a void expression, its value or designator is discarded. (A void expression is evaluated for its side effects.)

而《C程序设计语言》里这样描述：

void对象的（不存在的）值不能够以任何方式使用，也不能被显式或隐式转换为任一非空类型。因为空（void）表达式表示一个不存在的值，这样的表达式只可以用在不需要值的地方，例如作为一个表达式语句（参见A.9.2节）或作为逗号运算符的左操作数（参见A.7.18节）。
可以通过强制类型转换将表达式转换为void类型。例如，在表达式语句中，一个空的强制类型转换将丢掉函数调用的返回值。

这下终于明白了！那么稍微总结一下：
1. 在C语言中，void可以作为一个合法表达式的类型，亦即它在语法结构里可以作为一个表达式
2. void类型的表达式不能转换为其他任何类型的表达式，也就没有了赋值的可能
3. 编译器会特殊看待void类型，将其作为一个「未被定义完整」的类型，也就没有了定义变量的可能
4. 尽管void未被定义完整，但是如同其他结构体一样，我们是可以正常使用void*的，并且直接对一个void*解引用，结果是void类型的表达式
5. void类型和其他类型不相容，但是该有的表达式副作用还是会有
可以说这里面的逻辑是非常自洽且合理的。所以不得不佩服设计C语言和C++的人，这些概念就像物理定律，看上去复杂，但是用这套逻辑推导下去很多看似不同的东西都可以得到统一解释。

现在回头看assert宏的实现代码，不难理解啦。因为__assert_fail函数的返回值类型是void，但是它需要被用在一个逻辑表达式里。于是它巧妙地结合了逗号运算符，配合短路求值的规定实现了assert需要的效果。至于把最后的表达式类型也转换为void，是为了不让它作为值被赋给变量。而在定义了NDEBUG的状态下，用(void)0占位也比什么也不写来得好，编译器会提示类型不相容，而直接替换成空的话，在代码复杂的地方错误类型也许会莫名其妙。
2016-03-12
要开始做点实事了

这个寒假过得太快，一转眼，又是开学了。

本来进学生会是为了写二手书管理系统，结果到现在封面文章代码什么都干过，结果二手书还是没写好，真是有趣。开学的这段时间恰逢女生节，忙得飞起，连高数作业都没得交。收获其中之一是人生中第一次当了第一次面试官，哈哈。

我这个人就是喜欢拖延，或者说懒。写这个文章的目的也是想好好告诉自己，是时候每天记录一点东西了。技术也好，非技术也好。这个博客访问量最大的时候是上学期C语言大作业完成期间。当时贴了一点东西上去，没想到还真的有人在答辩的时候照抄过去了。我不想把这个博客当成一个纯粹装逼的地方。因为说实话，这样子装逼也装不了几次。而且大部分人其实也会厌烦的啊。

好吧，想去参加GSoC的一个项目，关于FreeBSD的（真是合我的技能点啊）。目标大致是把一个叫musl的C库从Linux移植到BSD上，大概也要让它在Clang下能过编译。这下有活干，有得学了。

好吧今天就这样。一打开博客半天加载不出来吓死我了。结果发现是博客会去自动加载googleapis的字体，想了一下发现还是直接改apache的配置文件最好。不过现在累了，还是明天干吧。有个例子在这里。

希望这是一个新的开始。

2016-03-10
C语言要考试了，你应该问问自己什么？
呐，这次我又来装逼了。我保证，这是这学期最后一次。

如果从我在百度C++吧的第一次发言（2009年7月2日）到今天，日子已经过去了2380天，然而我之前还没有考过一次C语言。好慌……好了好了，打住，不然待会儿真被当成装逼了。不过我说我初学的时候用while包住过main你信？至少你没有这样干过吧。

那么，我尽力，把自己带入2380个日子前，努力以一个初学者的视角来想一下C语言到底包含着什么知识点。我承认这种方法充满了应试色彩，而且对于上机写代码这种形式的考试可能并没有十分显著的作用。不过我是真的希望每个看到这篇文章的读者，即使以后不靠C语言吃饭，写不出优秀的C代码，也至少能对C语言有一个正确的理解。那我即使是背上装逼的骂名，也心满意足了。（其实我会告诉你我是因为不想复习物理了吗）

关于新手指引之类的内容，我都写在了那个「C指引」的文档里，点击打开它的GitHub页面。外加精力有限，因此不想再重复那些内容。所以我会列一些问题，并且不会给出答案。希望能迫使你思考。这些问题可能会带有我自己的主观色彩，不喜欢就点关闭咯。

先从初级开始。
1. C语言代码文件的后缀名是什么？这类文件可以用哪些工具打开和浏览？
2. 什么是可执行文件？它需要另外的软件打开它吗？
3. C语言文件从源代码到可执行文件的过程叫做什么？这个过程中发生过什么？
4. 如果我要输出Hello, world!，我需要在程序的第一行写上什么？如果不写有什么后果？
5. 为什么程序执行时候的窗口会一闪而过？那个黑色的窗口究竟是什么？
6. main是什么？我把代码写在main外面会有什么后果？
7. main前面应该是void还是int？
8. 变量的存在有什么意义？C语言里的变量有哪些类型？
9. 我怎么去获取来自用户在命令行的输入？接受输入的函数跟输出的函数在调用方式上有什么区别？
10. 既然一个字符串在代码里不能跨很多行书写，那么我怎么在字符串里表示换行？制表符呢？
11. while语句和do…while语句的区别在哪里？
12. switch…case语句里的break有什么作用？它和if语句比有什么局限性？
13. 对于if语句括号里的内容来说，一个等号和两个等号有什么差别？两个等号中间能有空格吗？
14. 如果变量a是double类型，那a=5/2之后a的值应该是多少？
什么，觉得太简单了是吧？那来中级的问题：
1. 如下的代码会按何种方式执行？会输出什么结果？
```
int sample = 1, ok = 0;
if (sample == 1)
    if (ok)
        puts("Ok.\n");
else
    puts("No.\n");
```
1. goto语句是如何使用的？为什么我们提倡不使用goto语句？
2. 什么时候程序需要函数声明？函数声明应该放在哪里？
3. 到底什么是EOF？EOF可以用在我们输入的什么地方？
4. i++和++i有什么不同？i+++++i这种表达式有意义吗？
5. 应该如何安全地读取一个文件里的内容？写文件呢？
6. 说出数组和指针的区别（至少三个）
7. 字符类型有数值吗？strcmp的返回值有什么含义？
8. static和extern关键字有什么用？
啊哈，还是不满足吗？我们来看看高级篇：
1. 为什么在main函数里定义一个非常大的数组，程序可能会崩掉，而我放到外面就不会了？
2. char *const和const char*的区别在哪里？对于声明const char *s=”abcd”，这个指针s到底「指向」什么地方？
3. 如果我像这样定义：
```
typedef char* sptr;
const sptr b;
```
```
这里的b到底是什么类型？是const char*吗？
```
1. 考虑这样一个结构体：
```
struct sample {
    int  a;
    char b;
};
```
那sizeof(struct sample)的值会是多少？为什么？
2016-01-07
记一次失败的装逼经历
呐，文如标题，这次要说的是一次十分失败的装逼经历，或者说，一场惨痛的人生教训。有那么严重么？至少，对于新年的第一天和第二天的我来说，是这样的。

讲道理，在我看来，其实装逼本身就可以说是失败的。真正的强者不需要装逼，他们的强势永远都是一种自然的流露。当然，在弱者，或者说特定圈子之外的人，可能也会把这样的行为当成是装逼。就像，知乎上的很多习惯和流露的价值观，对于知乎社区的活跃用户来说，是无比正常的事情。但是对于一些微博或者贴吧上的网友而言，这些思维方式和语言习惯必是装逼无疑。

那我为什么还要说自己是装逼呢？

废话，因为我失败了啊。

事情是这样的，我再叙述一遍。软件学院大一上的C期末作业要求我们写一个解释器，要解释的语言被称作Mao，包含int和double两类变量的声明、表达式求值和print变量。其实一开始接到这个项目我是很高兴的。因为比起去年的JSON Parser来说，这个项目可以扩展的地方太多了。语言确实没有办法描述我的心情。那是一个星期二，下午无课，我跑到图书馆看了一个下午的编译原理。

「我要做一门真正的编程语言。」

从那天开始，直到2015年结束，可以说，我的脑子里从来没有忘过这事，偶尔梦里也梦到过。以至于我11月去无锡给我朋友过生日的时候，在路上因为突然想通了Mao语言的上下文无关文法，而突然哈哈大笑起来。

然后就是紧锣密鼓的设计和写代码。其实我不是一个执行力很强的人，很多想法都停留在脑海里要拖延很久才会去实现。这带来了很多问题。递归下降的语法解析器我从十二月下旬才开始写，由于是第一次写，代码删删改改，自己觉得满意了，结果对了（我当时是怎么判断出结果对的呢？）就停下来了。好，停下来之后又开始写对象系统，整个活生生朝着PHP的方向做。直到2015年的最后一天，我把对象的运算做好了之后，输入1+1+1测试，然后……

是的，我就是这么后知后觉。

我写的递归下降语法分析器，在解析表达式的时候，因为要考虑优先级，所以把包含相同优先级的运算式，划到上下文无关文法中同一类的非终结符里。举个例子，就像很多编译原理教材都会讲的一样，两个表达式加减的结果叫做term，两个表达式乘除的结果叫做factor，一个term可以这样定义：
```
term = term op-1 factor
     | factor

op-1 = '+'
     | '-'
```
在理论上，这是一个十分完美的结构，从这样的语法结构构造出的表达式树，也可以按照正确的执行顺序进行计算。比方说1-1-1，先算左边的1-1得0，再做0-1，最后得结果是-1. 因此第二个减号是树根，第一个减号是左子树的树根。这是左结合性的运算符。那么对于右结合性的运算符，比如乘方符号^，或者说赋值号=，这些是先算右边的，那么我们修改一下语法即可：
```
assignment = identifier assign-op assignment
           | expr

power = expr exponent-op power
      | expr

assign-op = '='

exponent-op = '^'
```
当我们计算表达式2^3^4的时候，顺序并不是跟加减乘除一样的，而是先算右边的3^4，得81，然后整个表达式的值是2^81，结果就不说了，因为写不下。

但是这样做有一个很大的缺陷，那就是我们的LL(k)解析器无法解析左递归的情况，会陷入无限循环。什么是左递归呢？就是上文提到的描绘左结合性运算符的文法形式。一个term是一个term加或减一个factor，但是这个term到底到哪里为止呢？我们的递归下降解析器，至少是理论上，做不到的。所以从文法上，我们需要移除左递归。当然，如果解析器是从右向左读的，那么也处理不了右递归。

移除左递归的过程可以说是范式化的，引入一个新的非终结符，修改一下规则，像这样：
```
term = factor term-rest

term-rest = null
          | op-1 term
```
这个看上去也很好啊，能够解决我们的问题。然而两者合在一起，问题出现了——移除左递归之后，程序解析到的树，结合性出现了问题！而事实上，我写得更蠢：
```
term = factor op-1 factor
     | factor
```
这样的递归下降解析器根本无法解析1+1+1这样的式子！它到第二个1处就停下来了！而当我发现这个问题的时候，时间已然是2015年的最后一个晚上了。

没有办法了，第二天早上起来试图改进，发现越改问题越过。中午决定放弃，推倒表达式解析重来。其他像for、while等写好的语法也暂时搁置下来。撸了一个下午到晚上，在1月2日前完成了作业。

然而好景不长，第二天晚上当我写好文档准备交的时候，又发现bug了！我的程序不能正确处理表达式开头的负号。简单说就是，我的程序会自动“分划”输入的表达式。为了解决负号的问题，程序会判断当前表达式开头是不是有负号，如果有的话，就整个表达式取负。出发点是对的，但是后面一遇到加减或者各种叠加的括号，问题就来了，比如会把-1+2的结果当成-3.

剩下二十分钟，真没办法了，先交吧。

然后我改到了两点。

讲道理，我感觉自己真的没有资格参加答辩。

就是这样。
2016-01-03
半颗卤蛋

真是诸事不顺的一天。

首先是中午去吃饭的时候中途突然下了雨。回来之后改代码也各种不对。好不容易等到下午可以抢票的时候，一打开客户端，下单都点了，准备支付的时候发现卡里余额不足。支付宝现在不支持银行卡和账户余额混合支付了。于是我只有去充值。充值完发现票已经被抢完了。然后写物理实验报告把手抄了个麻，匆匆忙忙跑去上物理实验课。上完去吃饭掏出手机看群，发现大麦又放票了。简直了。冲回去又打开抢，这次是显示有，结果一点击又没了。真是哔了狗了。

晚上突然发现OJ又多了个新作业，写链表的。本来觉得，哼，简单嘛。结果小bug没发现，测试数据也是奇葩，20个，全是Runtime Error，服。发现大家平安夜都出去玩去了没人提交，我一个人在那个位置停留了很久。截个图纪念下嘛。

好，这不截图不要紧，一截图发空间就有好事的人散布出去了，于是我就理所当然地成为了“王”。呵呵呵呵。不过我这个人，自认为，至少在自己的专业方面，还是不怕什么打脸的。有不对就说出来嘛，有什么不好意思的，又不是什么三流职高里流传的黑客江湖。

平安夜其实真没什么意思，反正也不放假，不如元旦来得给力。出去走了走，吃了面，面里放了好久没吃过的卤蛋，虽然只有半颗，味道不错。讲道理，在这边放不放假，节不节日，真的都没有什么感觉了。还是回家好。

至少回家，我可以想吃多少卤蛋吃多少。

是吧？

2015-12-25