易码技术论坛

 找回密码
 加入易码
搜索
查看: 1500|回复: 13

[教程] [转载]C语言高效编程的几招

[复制链接]
发表于 2008-2-24 15:44:12 | 显示全部楼层 |阅读模式
引 言:

   编写高效简洁的C语言代码,是许多软件工程师追求的目标。本文就工作中的一些体会和经验做相关的阐述,不对的地方请各位指教。

第1招:以空间换时间

   计算机程序中最大的矛盾是空间和时间的矛盾,那么,从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1招――以空间换时间。
例如:字符串的赋值。

方法A,通常的办法:

#define LEN 32
char string1 [LEN];
memset (string1,0,LEN);
strcpy (string1,“This is a example!!");
方法B:
const char string2[LEN] =“This is a example!”;
char * cp;
cp = string2 ;
(使用的时候可以直接用指针来操作。)

   从上面的例子可以看出,A和B的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候,A具有更好的灵活性;如果采用方法B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。

   如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。
   该招数的变招――使用宏函数而不是函数。举例如下:
方法C:

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
int BIT_MASK(int __bf)
{
return ((1U << (bw ## __bf)) - 1) << (bs ## __bf);
}
void SET_BITS(int __dst, int __bf, int __val)
{
__dst = ((__dst) & ~(BIT_MASK(__bf))) | \
(((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))
}
SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);

方法D:

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)
#define BIT_MASK(__bf) (((1U << (bw ## __bf)) - 1) << (bs ## __bf))
#define SET_BITS(__dst, __bf, __val) \
((__dst) = ((__dst) & ~(BIT_MASK(__bf))) | \
(((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))
SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);
   函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。
   D方法是我看到的最好的置位操作函数,是ARM公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。

第2招:数学方法解决问题

   现在我们演绎高效C语言编写的第二招――采用数学方法来解决问题。
   数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。
举例如下,求 1~100的和。

方法E:

int I , j;
for (I = 1 ;I<=100; I ++){
j += I;
}
方法F:

int I;
I = (100 * (1+100)) / 2

   这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 N×(N+1)/ 2 来解决这个问题。方法E循环了100次才解决问题,也就是说最少用了100个赋值,100个判断,200个加法(I和j);而方法F仅仅用了1个加法,1 次乘法,1次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。

第3招:使用位操作

   实现高效的C语言编写的第三招――使用位操作,减少除法和取模的运算。
   在计算机程序中,数据的位是可以操作的最小数据单位,理论上可以用“位运算”来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例如下:
方法G:

int I,J;
I = 257 /8;
J = 456 % 16;

方法H:

int I,J;
I = 257 >>3;
J = 456 - (456 >> 4 << 4);

   在字面上好像H比G麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁,效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 来看,效率的差距还是不小。相关汇编代码就不在这里列举了。
运用这招需要注意的是,因为CPU的不同而产生的问题。比如说,在PC上用这招编写的程序,并在PC上调试通过,在移植到一个16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。

第4招:汇编嵌入

   高效C语言编程的必杀技,第四招――嵌入汇编。
   “在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾”。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法 ――嵌入汇编,混合编程。
   举例如下,将数组一赋值给数组二,要求每一字节都相符。

char string1[1024],string2[1024];

方法I:

int I;
for (I =0 ;I<1024;I++)
*(string2 + I) = *(string1 + I)

方法J:

#ifdef _PC_
int I;
for (I =0 ;I<1024;I++)
*(string2 + I) = *(string1 + I);
#else
#ifdef _ARM_
__asm
{
MOV R0,string1
MOV R1,string2
MOV R2,#0
loop:
LDMIA R0!, [R3-R11]
STMIA R1!, [R3-R11]
ADD R2,R2,#8
CMP R2, #400
BNE loop
}
#endif

   方法I是最常见的方法,使用了1024次循环;方法J则根据平台不同做了区分,在ARM平台下,用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同的CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。
   虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙,险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用。切记,切记。
   使用C语言进行高效率编程,我的体会仅此而已。在此以本文抛砖引玉,还请各位高手共同切磋。希望各位能给出更好的方法,大家一起提高我们的编程技巧。

汇编语言的优点和缺点:

汇编语言可以很直接的表达比较低层次的:

· 你可以通过汇编代码访问与机器硬件直接相关的存储器或者I/O口。
· 你可以在一些关键的代码区准确的控制某些代码的行文,避免其他方法带来的多线程共同访问或者硬件设备共享引起的死锁。
· 你可以通过使用汇编打破通常的编译器编译的结果,例如你可以根据自己的考虑优化一些东西。
· 我们可以在代码分片之间建立一些接口。
· 我们可以通过一些汇编代码使处理器进入不寻常的编程模式。例如16 bit mode to interface startup, firmware, or legacy code on Intel PCs.
· 可以优化一些代码,提高运行速度。
· 可以为特定的应该编写优化代码。
· 可以为某语言的编译器编写代码。

汇编语言是一种层次非常低的语言(仅仅高于手动编写二进制机器指令码),这就意味着:

· 开始写起来会很长而且单调
· 很容易出现bug
· 程序中的bug非常难查找
· 写出来的代码非常难懂,而且不好维护和修改
· 而且结果是不能到其他体系结构的平台上运行。
· 代码只能针对某特特定体系结构的特定型号的处理器优化。例如,在Intel兼容系列的CPU中,每一款CPU都有特殊的设计,变量也不一样,都有特定的优化考虑。CPU的时间已经有很多了,例如:Intel 386, 486, Pentium, PPro, PII, PIII, PIV; Cyrix 5x86, 6x86, M2; AMD K5, K6 (K6-2, K6-III), K7 (Athlon, Duron). 而且新的设计还不断地出现。
· 编写汇编代码时候,我们会花费很多的时间在一些细节事情上,而不能专注一些小的或者大的算法设计,而算法的优化能更快的提高程序运行的速度。例如,你可以用汇编加快一些数组的访问和管理,但是总体上讲,使用hash表会更大程度上加快访问速度。
· 一个算法上的小的改动,可能需要我们全部重新写一段很长的代码。
 楼主| 发表于 2008-2-24 15:45:50 | 显示全部楼层
转载点技术文章,做点有意义的事情
发表于 2008-2-24 15:57:34 | 显示全部楼层
此文看了很多次,转得到处都是。
发表于 2008-2-24 16:25:25 | 显示全部楼层
还是谢谢啊,毕竟LZ辛苦了啊 !
发表于 2008-2-24 16:54:02 | 显示全部楼层
以后我也写一篇,以前总结过很多的.
发表于 2008-2-26 09:31:15 | 显示全部楼层
很有意义,很经典的c语言
发表于 2008-2-26 09:56:43 | 显示全部楼层
不错的文章。
我宏用不熟,有没有人可以解释一下方法C和方法D里面的##,没看明白。
发表于 2008-2-26 11:10:52 | 显示全部楼层
方法C是简单的替换;方法D里的宏带参数,在编译预处理时展开。
发表于 2008-2-26 11:20:17 | 显示全部楼层
我是不明白##什么意思,宏我还是知道的。
有人能说说么?
发表于 2008-2-28 22:13:49 | 显示全部楼层

帮LS转了一段。。

Token-Pasting   Operator   (##)     
   
  The   double-number-sign   or   "token-pasting"   operator   (##),   which   is   sometimes   called   the   "merging"   operator,   is   used   in   both   object-like   and   function-like   macros.   It   permits   separate   tokens   to   be   joined   into   a   single   token   and   therefore   cannot   be   the   first   or   last   token   in   the   macro   definition.   
   
  If   a   formal   parameter   in   a   macro   definition   is   preceded   or   followed   by   the   token-pasting   operator,   the   formal   parameter   is   immediately   replaced   by   the   unexpanded   actual   argument.   Macro   expansion   is   not   performed   on   the   argument   prior   to   replacement.     
   
  Then,   each   occurrence   of   the   token-pasting   operator   in   token-string   is   removed,   and   the   tokens   preceding   and   following   it   are   concatenated.   The   resulting   token   must   be   a   valid   token.   If   it   is,   the   token   is   scanned   for   possible   replacement   if   it   represents   a   macro   name.   The   identifier   represents   the   name   by   which   the   concatenated   tokens   will   be   known   in   the   program   before   replacement.   Each   token   represents   a   token   defined   elsewhere,   either   within   the   program   or   on   the   compiler   command   line.   White   space   preceding   or   following   the   operator   is   optional.   
   
  This   example   illustrates   use   of   both   the   stringizing   and   token-pasting   operators   in   specifying   program   output:   
   
      Copy   Code     
  #define   paster(   n   )   printf_s(   "token"   #n   "   =   %d",   token##n   )   
  int   token9   =   9;   
      
   
  If   a   macro   is   called   with   a   numeric   argument   like   
   
      Copy   Code     
  paster(   9   );   
      
   
  the   macro   yields   
   
      Copy   Code     
  printf_s(   "token"   "9"   "   =   %d",   token9   );   
      
   
  which   becomes   
   
      Copy   Code     
  printf_s(   "token9   =   %d",   token9   );   

  Example   
      Copy   Code     
  //   preprocessor_token_pasting.cpp   
  #include   <stdio.h>   
  #define   paster(   n   )   printf_s(   "token"   #n   "   =   %d",   token##n   )   
  int   token9   =   9;   
  int   main()   
  {   
        paster(9);   
  }   
  Output   
  token9   =   9
发表于 2008-2-28 23:19:31 | 显示全部楼层
##起连接作用
发表于 2008-2-29 14:39:23 | 显示全部楼层
连接?
发表于 2008-2-29 19:11:39 | 显示全部楼层
连接
 楼主| 发表于 2008-3-2 12:35:15 | 显示全部楼层
##:在处理宏定义中,将##去掉后,把##前后连接的两个词连到一起组成一个词。
您需要登录后才可以回帖 登录 | 加入易码

本版积分规则

Archiver|手机版|小黑屋|EMAX Studio

GMT+8, 2024-4-20 21:13 , Processed in 0.013244 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表