关于命令行参数的那些事

事情是这样的。这学期的C语言课程期末的大作业(说实话我不太愿意称其为“项目”……),就像我的前几篇博文里提到的,要求编写一个程序,可以读入一串字符,包含声明变量、求值、打印的功能。如何进行词法分析和构建表达式树的过程在前两篇文章我已经说过了,这里不再赘述。那么很多同学问起来的一个问题是,在作业的要求里面,有一项是“从第一个命令行参数读入文件名”——这个到底是什么意思?

有些同学把它理解成了从标准输入获取一个文件名的字符串。大错特错啦。不过也难怪,我们这个年代的人小时候接触DOS的机会不多了,可能从小到大根本就没有在计算机上敲过命令,以至于第一次写C程序的时候看到那个黑漆漆的窗口还大失所望。

不过现在好了,至少你晓得了电脑上某一个“角落”存在着这样一个“黑框”,你可以在上面输入东西。在Windows系统上,我们可以通过开始-运行(没有开始菜单的话就按Win+R键),弹出“运行”窗口,输入cmd然后回车。这样我们就打开了一个“命令提示符”窗口。(什么,你用的是Linux?用Linux还不知道命令参数是什么,我劝你还是卸了吧)

这个窗口在Windows NT系统里可以作为对DOS界面的一种模拟,因为不是所有的Windows应用程序都有图形界面的,比如我们现在写的C程序就没有,所谓的标准输入和输出只能在cmd模拟器里面跑。(如果你对命令行窗口仍有疑惑,可以参考我在知乎上的这个回答)在黑窗下,我们可以尝试敲敲一些命令:

  • dir,列出当前所在目录下的文件
  • cd,进入某个目录,cd ..表示回到上一层目录
  • 盘符,进入某个分区,比如输入D:回车表示进入D盘
  • exit,退出命令提示符
  • del,删除某个文件(注意可没有回收站让你反悔)
  • 把文件拖动到命令窗口,命令会自动显示这个文件的路径,直接输入文件名回车系统会调用适合的程序打开它

好了,基本的操作我们已经熟悉了。这样已经够了。对啊,比如说我们用del命令的时候,del a.txt,这里的a.txt就是del命令的命令行参数!在Windows下,我们的程序最后会编译成某个.exe文件,IDE执行它是自动启动的,不会给我们输入命令行参数的机会(讲道理的话是可以设置的)。假设我们编译成某个可执行程序,放在当前所在的目录下,比如说,叫mao.exe吧,然后源文件名叫做mao.mao,我们这样输入:

mao.exe mao.mao

系统会给mao.exe应用程序的main函数传入argv参数。不过前提是你要写对main函数的原型,像这样:

int main(int argc, char *argv[])
{
    /* 代码在这里 */
    return 0;
}

那么对于上面的例子,我们的两个参数的值应该是这样的:argc=2,argv[0]="mao.exe",argv[1]="mao.mao".(唔也有可能是完整路径,懒得测了)然后我们打开文件的话,像这样打开就行了:

#include <stdio.h>

int main(int argc, char *argv[])
{
    if (argc &gt; 1) {
        FILE *fp;
        if ((fp = fopen(argv[1], "r")) == NULL) {
            printf("Open file failed.\n");
        } else {
            /* 打开之后的操作在这里 */
            fclose(fp);
            /* 不要忘记了关闭 */
        }
    } else {
        printf("Not enough parameters!\n");
    }
    return 0;
}

当然我的代码仅仅只作为一个参考,抄去说不定程序会崩哦。

好了,如何操作我们就先说到这里。你可能会纳闷——为什么要弄得这么麻烦?

  • 普通回答:为了让同学们熟悉一下文件操作和命令行参数的知识,提高自己查找知识解决问题的能力
  • 二逼回答:因为助教用的是Linux,这样做会很方便
  • 文艺回答:每一个C程序员都要对Unix系系统有亲近感,这是培养亲近感的很好的方式

好吧,今天就说到这里,如果你们对Linux有兴趣,下次可以专门聊聊。

Linux下程序创建进程

进程是操作系统中运行的程序实例。而多进程程序和多线程程序相比,具有更健壮,更简单的特点。

在GNU/Linux操作系统中,创建一个新进程,可以使用fork,clone函数以及使用exec函数族调用其他程序替换当前进程镜像。

这里主要讲fork函数。

fork函数的原型为:

#include <unistd.h>

pid_t fork(void);

pid_t是系统定义的类型,一般被定义为short int。

这里看一个最简单的调用示例。

#include <stdio.h>

#include <unistd.h>

int main(void)
{
    pid_t pid;
    pid = fork();
    printf("My process ID is %d.\n", getpid());
    return 0;
}

这样就最简单的创建了一个子进程,并且打印出了进程的pid。

fork函数是分裂执行的,这也就是fork(分叉)命名的原因吧。如何理解这个“分裂”呢,看这段程序。

#include <stdio.h>
#include <unistd.h>

int main(void)
{
    pid_t pid;
    pid = fork();
    if (pid > 0) {
        printf("I'm parent process.\n");
        /* 父进程的pid大于0 */
    } else if (pid == 0) {
        printf("I'm child process.\n");
        /* 子进程的pid等于0 */
    } else {
        printf("Cannot create process.\n");
        /* 如果pid小于0,表示出错 */
    }
    return 0;
}

内核在第一次调用fork()时,将当前进程的所有内存空间和文件描述符等资源复制一份给创建的子进程(实际上采用了“Copy-on-write”(写时复制),第一次试图对内存进行写操作的时候才复制,提高了效率)。所以fork调用后有2个进程在同时执行后面的代码。如何区分呢?

在父进程中,pid变量被标记为一个正整数;而子进程的pid被标记为0;当然,当pid为负数时,系统只有1个进程运行,表示创建进程出错。

如何证明这一点呢?看下面这个程序:

#include <stdio.h>
#include <unistd.h>

int main(void)
{
    pid_t pid1, pid2, pid3;
    pid1 = fork();
    pid2 = fork();
    pid3 = fork();
    printf("I'm a process.\n");
    return 0;
}

这个程序会打印出几个”I’m a process.”字符串?答案是8个(2的3次方)。如果再加一个fork答案就会是16个(2的4次方)。运行结果证明了这一点。第一次fork调用产生一个子进程,第二次两个进程各产生一个,第三次四个进程各又产生一个……所以结果是2*2*2=8个。(fork炸弹?哈哈)

现在你会发现,调用fork()的程序需要ctrl+c才能退出。这是因为父进程在等待子进程退出。如果父进程在子进程结束之前退出了,那么子进程就会成为所谓的“僵尸进程”。

要结束子进程可以使用wait函数。

#include <unistd.h>

pid_t wait(int * status);

返回退出子进程的pid。调用后可以从status了解到wait的调用状态。

以下的宏可以用来校验status变量。

WIFEXITED正常退出,值为true
WEXITSTATUS返回子进程exit状态,为int
WIFSIGNALED子进程是否因为信号结束,是则为true
WTERMSIG返回子进程退出的信号号(上个宏为true时才有意义)
评估wait状态所用的宏

如果当前有多个子进程,系统怎么能知道我要结束哪一个呢?所以,有了waitpid函数。

#include <unistd.h>

pid_t waitpid(pid_t pid, int * status, int options);

pid参数表示需要等待结束的子进程。几种值的情况如下:

>0等待pid的进程退出
0等待任何一个与调用进程组ID相同的子进程退出
-1等待任何一个子进程退出(相当于wait())
<-1等待任何一个组ID与pid参数绝对值相同的子进程退出
waitpid的pid参数值

options提供了一些额外的选项来控制waitpid,目前只支持WNOHANG和WUNTRACED两个选项,可以用|连接起来。

WNOHANG,如果没有子进程退出,它也会立即返回,不会一直等下去。

WUNTRACED,用于跟踪调试。

如果不想用options,可以传一个参数0。

waitpid的status多了两个校验的宏,不过仅在设置WUNTRACED后可用。

WIFSTOPPED如果子进程已经停止,返回true
WSTOPSIG返回使子进程停止的型号(上个宏为true时才有意义)
waitpid增加的校验宏

如果调用出错,返回-1,并且errno被设置成特定的值;如果WNOHANG被设置且没有子进程退出,返回0;否则返回子进程的pid号。

不过,有时候不需要这么麻烦。

#include <unistd.h>
#include <signal.h>

int kill(pid_t pid, int sig_num);

kill用于向进程发送信号。pid的各种值情况如下表:

>0信号发送到pid指定的进程
0信号发送到调用进程同组的所有进程
-1信号发送到除init外的所有进程
<0信号发送到pid绝对值指定进程组中所有进程
kill函数的参数pid的值

还有函数raise,用于给自己发信号。

#include <unistd.h>
#include <signal.h>

int raise(int sig_num);
/* 等价于 kill(getpid(), sig_num); */

所以,终止子进程也可以这样:

#include <unistd.h>
#include <signal.h>

int main(void)
{
    pid_t pid = fork();
    kill(pid, SIGKILL);
    return 0;
}

这里讲了fork函数创建子进程的一些用法。关于exec函数族和信号,将会在以后的文章里说到。

希望这篇文章能带给您以收获!