OSDN Git Service

* c-decl.c (struct language_function): Renamed from struct c_function.
[pf3gnuchains/gcc-fork.git] / gcc / cpp.texi
1 \input texinfo
2 @setfilename cpp.info
3 @settitle The C Preprocessor
4
5 @ifinfo
6 @dircategory Programming
7 @direntry
8 * Cpp: (cpp).                  The GNU C preprocessor.
9 @end direntry
10 @end ifinfo
11
12 @c @smallbook
13 @c @cropmarks
14 @c @finalout
15 @setchapternewpage odd
16 @ifinfo
17 This file documents the GNU C Preprocessor.
18
19 Copyright 1987, 1989, 1991-1999 Free Software Foundation, Inc.
20
21 Permission is granted to make and distribute verbatim copies of
22 this manual provided the copyright notice and this permission notice
23 are preserved on all copies.
24
25 @ignore
26 Permission is granted to process this file through Tex and print the
27 results, provided the printed document carries copying permission
28 notice identical to this one except for the removal of this paragraph
29 (this paragraph not being relevant to the printed manual).
30
31 @end ignore
32 Permission is granted to copy and distribute modified versions of this
33 manual under the conditions for verbatim copying, provided also that
34 the entire resulting derived work is distributed under the terms of a
35 permission notice identical to this one.
36
37 Permission is granted to copy and distribute translations of this manual
38 into another language, under the above conditions for modified versions.
39 @end ifinfo
40
41 @titlepage
42 @c @finalout
43 @title The C Preprocessor
44 @subtitle Last revised May 1999
45 @subtitle for GCC version 2
46 @author Richard M. Stallman
47 @page
48 @vskip 2pc
49 This booklet is eventually intended to form the first chapter of a GNU 
50 C Language manual.
51
52 @vskip 0pt plus 1filll
53 @c man begin COPYRIGHT
54 Copyright @copyright{} 1987, 1989, 1991-1999
55 Free Software Foundation, Inc.
56
57 Permission is granted to make and distribute verbatim copies of
58 this manual provided the copyright notice and this permission notice
59 are preserved on all copies.
60
61 Permission is granted to copy and distribute modified versions of this
62 manual under the conditions for verbatim copying, provided also that
63 the entire resulting derived work is distributed under the terms of a
64 permission notice identical to this one.
65
66 Permission is granted to copy and distribute translations of this manual
67 into another language, under the above conditions for modified versions.
68 @c man end
69 @end titlepage
70 @page
71
72 @node Top, Global Actions,, (DIR)
73 @chapter The C Preprocessor
74 @c man begin DESCRIPTION
75
76 The C preprocessor is a @dfn{macro processor} that is used automatically by
77 the C compiler to transform your program before actual compilation.  It is
78 called a macro processor because it allows you to define @dfn{macros},
79 which are brief abbreviations for longer constructs.
80
81 The C preprocessor provides four separate facilities that you can use as
82 you see fit:
83
84 @itemize @bullet
85 @item
86 Inclusion of header files.  These are files of declarations that can be
87 substituted into your program.
88
89 @item
90 Macro expansion.  You can define @dfn{macros}, which are abbreviations
91 for arbitrary fragments of C code, and then the C preprocessor will
92 replace the macros with their definitions throughout the program.
93
94 @item
95 Conditional compilation.  Using special preprocessing directives, you
96 can include or exclude parts of the program according to various
97 conditions.
98
99 @item
100 Line control.  If you use a program to combine or rearrange source files into
101 an intermediate file which is then compiled, you can use line control
102 to inform the compiler of where each source line originally came from.
103 @end itemize
104
105 C preprocessors vary in some details.  This manual discusses the GNU C
106 preprocessor, the C Compatible Compiler Preprocessor.  The GNU C
107 preprocessor provides a superset of the features of ANSI Standard C@.
108
109 ANSI Standard C requires the rejection of many harmless constructs commonly
110 used by today's C programs.  Such incompatibility would be inconvenient for
111 users, so the GNU C preprocessor is configured to accept these constructs
112 by default.  Strictly speaking, to get ANSI Standard C, you must use the
113 options @samp{-trigraphs}, @samp{-undef} and @samp{-pedantic}, but in
114 practice the consequences of having strict ANSI Standard C make it
115 undesirable to do this.  @xref{Invocation}.
116
117 The C preprocessor is designed for C-like languages; you may run into
118 problems if you apply it to other kinds of languages, because it assumes
119 that it is dealing with C@.  For example, the C preprocessor sometimes
120 outputs extra white space to avoid inadvertent C token concatenation,
121 and this may cause problems with other languages.
122 @c man end
123
124 @menu
125 * Global Actions::    Actions made uniformly on all input files.
126 * Directives::        General syntax of preprocessing directives.
127 * Header Files::      How and why to use header files.
128 * Macros::            How and why to use macros.
129 * Conditionals::      How and why to use conditionals.
130 * Combining Sources:: Use of line control when you combine source files.
131 * Other Directives::  Miscellaneous preprocessing directives.
132 * Output::            Format of output from the C preprocessor.
133 * Invocation::        How to invoke the preprocessor; command options.
134 * Concept Index::     Index of concepts and terms.
135 * Index::             Index of directives, predefined macros and options.
136 @end menu
137
138 @node Global Actions, Directives, Top, Top
139 @section Transformations Made Globally
140
141 Most C preprocessor features are inactive unless you give specific directives
142 to request their use.  (Preprocessing directives are lines starting with
143 @samp{#}; @pxref{Directives}).  But there are three transformations that the
144 preprocessor always makes on all the input it receives, even in the absence
145 of directives.
146
147 @itemize @bullet
148 @item
149 All C comments are replaced with single spaces.
150
151 @item
152 Backslash-Newline sequences are deleted, no matter where.  This
153 feature allows you to break long lines for cosmetic purposes without
154 changing their meaning.
155
156 @item
157 Predefined macro names are replaced with their expansions
158 (@pxref{Predefined}).
159 @end itemize
160
161 The first two transformations are done @emph{before} nearly all other parsing
162 and before preprocessing directives are recognized.  Thus, for example, you
163 can split a line cosmetically with Backslash-Newline anywhere (except
164 when trigraphs are in use; see below).
165
166 @example
167 /*
168 */ # /*
169 */ defi\
170 ne FO\
171 O 10\
172 20
173 @end example
174
175 @noindent
176 is equivalent into @samp{#define FOO 1020}.  You can split even an escape
177 sequence with Backslash-Newline.  For example, you can split @code{"foo\bar"}
178 between the @samp{\} and the @samp{b} to get
179
180 @example
181 "foo\\
182 bar"
183 @end example
184
185 @noindent
186 This behavior is unclean: in all other contexts, a Backslash can be
187 inserted in a string constant as an ordinary character by writing a double
188 Backslash, and this creates an exception.  But the ANSI C standard requires
189 it.  (Strict ANSI C does not allow Newlines in string constants, so they
190 do not consider this a problem.)
191
192 But there are a few exceptions to all three transformations.
193
194 @itemize @bullet
195 @item
196 C comments and predefined macro names are not recognized inside a
197 @samp{#include} directive in which the file name is delimited with
198 @samp{<} and @samp{>}.
199
200 @item
201 C comments and predefined macro names are never recognized within a
202 character or string constant.  (Strictly speaking, this is the rule,
203 not an exception, but it is worth noting here anyway.)
204
205 @item
206 Backslash-Newline may not safely be used within an ANSI ``trigraph''.
207 Trigraphs are converted before Backslash-Newline is deleted.  If you
208 write what looks like a trigraph with a Backslash-Newline inside, the
209 Backslash-Newline is deleted as usual, but it is then too late to
210 recognize the trigraph.
211
212 This exception is relevant only if you use the @samp{-trigraphs}
213 option to enable trigraph processing.  @xref{Invocation}.
214 @end itemize
215
216 @node Directives, Header Files, Global Actions, Top
217 @section Preprocessing Directives
218
219 @cindex preprocessing directives
220 @cindex directives
221 Most preprocessor features are active only if you use preprocessing directives
222 to request their use.
223
224 Preprocessing directives are lines in your program that start with @samp{#}.
225 The @samp{#} is followed by an identifier that is the @dfn{directive name}.
226 For example, @samp{#define} is the directive that defines a macro.
227 Whitespace is also allowed before and after the @samp{#}.
228
229 The set of valid directive names is fixed.  Programs cannot define new
230 preprocessing directives.
231
232 Some directive names require arguments; these make up the rest of the directive
233 line and must be separated from the directive name by whitespace.  For example,
234 @samp{#define} must be followed by a macro name and the intended expansion
235 of the macro.  @xref{Simple Macros}.
236
237 A preprocessing directive cannot be more than one line in normal circumstances.
238 It may be split cosmetically with Backslash-Newline, but that has no effect
239 on its meaning.  Comments containing Newlines can also divide the
240 directive into multiple lines, but the comments are changed to Spaces
241 before the directive is interpreted.  The only way a significant Newline
242 can occur in a preprocessing directive is within a string constant or
243 character constant.  Note that
244 most C compilers that might be applied to the output from the preprocessor
245 do not accept string or character constants containing Newlines.
246
247 The @samp{#} and the directive name cannot come from a macro expansion.  For
248 example, if @samp{foo} is defined as a macro expanding to @samp{define},
249 that does not make @samp{#foo} a valid preprocessing directive.
250
251 @node Header Files, Macros, Directives, Top
252 @section Header Files
253
254 @cindex header file
255 A header file is a file containing C declarations and macro definitions
256 (@pxref{Macros}) to be shared between several source files.  You request
257 the use of a header file in your program with the C preprocessing directive
258 @samp{#include}.
259
260 @menu
261 * Header Uses::         What header files are used for.
262 * Include Syntax::      How to write @samp{#include} directives.
263 * Include Operation::   What @samp{#include} does.
264 * Once-Only::           Preventing multiple inclusion of one header file.
265 * Inheritance::         Including one header file in another header file.
266 @end menu
267
268 @node Header Uses, Include Syntax, Header Files, Header Files
269 @subsection Uses of Header Files
270
271 Header files serve two kinds of purposes.
272
273 @itemize @bullet
274 @item
275 @findex system header files
276 System header files declare the interfaces to parts of the operating
277 system.  You include them in your program to supply the definitions and
278 declarations you need to invoke system calls and libraries.
279
280 @item
281 Your own header files contain declarations for interfaces between the
282 source files of your program.  Each time you have a group of related
283 declarations and macro definitions all or most of which are needed in
284 several different source files, it is a good idea to create a header
285 file for them.
286 @end itemize
287
288 Including a header file produces the same results in C compilation as
289 copying the header file into each source file that needs it.  But such
290 copying would be time-consuming and error-prone.  With a header file, the
291 related declarations appear in only one place.  If they need to be changed,
292 they can be changed in one place, and programs that include the header file
293 will automatically use the new version when next recompiled.  The header
294 file eliminates the labor of finding and changing all the copies as well as
295 the risk that a failure to find one copy will result in inconsistencies
296 within a program.
297
298 The usual convention is to give header files names that end with
299 @file{.h}.  Avoid unusual characters in header file names, as they
300 reduce portability.
301
302 @node Include Syntax, Include Operation, Header Uses, Header Files
303 @subsection The @samp{#include} Directive
304
305 @findex #include
306 Both user and system header files are included using the preprocessing
307 directive @samp{#include}.  It has three variants:
308
309 @table @code
310 @item #include <@var{file}>
311 This variant is used for system header files.  It searches for a file
312 named @var{file} in a list of directories specified by you, then in a
313 standard list of system directories.  You specify directories to
314 search for header files with the command option @samp{-I}
315 (@pxref{Invocation}).  The option @samp{-nostdinc} inhibits searching
316 the standard system directories; in this case only the directories
317 you specify are searched.
318
319 The parsing of this form of @samp{#include} is slightly special
320 because comments are not recognized within the @samp{<@dots{}>}.
321 Thus, in @samp{#include <x/*y>} the @samp{/*} does not start a comment
322 and the directive specifies inclusion of a system header file named
323 @file{x/*y}.  Of course, a header file with such a name is unlikely to
324 exist on Unix, where shell wildcard features would make it hard to
325 manipulate.@refill
326
327 The argument @var{file} may not contain a @samp{>} character.  It may,
328 however, contain a @samp{<} character.
329
330 @item #include "@var{file}"
331 This variant is used for header files of your own program.  It
332 searches for a file named @var{file} first in the current directory,
333 then in the same directories used for system header files.  The
334 current directory is the directory of the current input file.  It is
335 tried first because it is presumed to be the location of the files
336 that the current input file refers to.  (If the @samp{-I-} option is
337 used, the special treatment of the current directory is inhibited.)
338
339 The argument @var{file} may not contain @samp{"} characters.  If
340 backslashes occur within @var{file}, they are considered ordinary text
341 characters, not escape characters.  None of the character escape
342 sequences appropriate to string constants in C are processed.  Thus,
343 @samp{#include "x\n\\y"} specifies a filename containing three
344 backslashes.  It is not clear why this behavior is ever useful, but
345 the ANSI standard specifies it.
346
347 @item #include @var{anything else}
348 @cindex computed @samp{#include}
349 This variant is called a @dfn{computed #include}.  Any @samp{#include}
350 directive whose argument does not fit the above two forms is a computed
351 include.  The text @var{anything else} is checked for macro calls,
352 which are expanded (@pxref{Macros}).  When this is done, the result
353 must fit one of the above two variants---in particular, the expanded
354 text must in the end be surrounded by either quotes or angle braces.
355
356 This feature allows you to define a macro which controls the file name
357 to be used at a later point in the program.  One application of this is
358 to allow a site-specific configuration file for your program to specify
359 the names of the system include files to be used.  This can help in
360 porting the program to various operating systems in which the necessary
361 system header files are found in different places.
362 @end table
363
364 @node Include Operation, Once-Only, Include Syntax, Header Files
365 @subsection How @samp{#include} Works
366
367 The @samp{#include} directive works by directing the C preprocessor to scan
368 the specified file as input before continuing with the rest of the current
369 file.  The output from the preprocessor contains the output already
370 generated, followed by the output resulting from the included file,
371 followed by the output that comes from the text after the @samp{#include}
372 directive.  For example, given a header file @file{header.h} as follows,
373
374 @example
375 char *test ();
376 @end example
377
378 @noindent
379 and a main program called @file{program.c} that uses the header file,
380 like this,
381
382 @example
383 int x;
384 #include "header.h"
385
386 main ()
387 @{
388   printf (test ());
389 @}
390 @end example
391
392 @noindent
393 the output generated by the C preprocessor for @file{program.c} as input
394 would be
395
396 @example
397 int x;
398 char *test ();
399
400 main ()
401 @{
402   printf (test ());
403 @}
404 @end example
405
406 Included files are not limited to declarations and macro definitions; those
407 are merely the typical uses.  Any fragment of a C program can be included
408 from another file.  The include file could even contain the beginning of a
409 statement that is concluded in the containing file, or the end of a
410 statement that was started in the including file.  However, a comment or a
411 string or character constant may not start in the included file and finish
412 in the including file.  An unterminated comment, string constant or
413 character constant in an included file is considered to end (with an error
414 message) at the end of the file.
415
416 It is possible for a header file to begin or end a syntactic unit such
417 as a function definition, but that would be very confusing, so don't do
418 it.
419
420 The line following the @samp{#include} directive is always treated as a
421 separate line by the C preprocessor even if the included file lacks a final
422 newline.
423
424 @node Once-Only, Inheritance, Include Operation, Header Files
425 @subsection Once-Only Include Files
426 @cindex repeated inclusion
427 @cindex including just once
428
429 Very often, one header file includes another.  It can easily result that a
430 certain header file is included more than once.  This may lead to errors,
431 if the header file defines structure types or typedefs, and is certainly
432 wasteful.  Therefore, we often wish to prevent multiple inclusion of a
433 header file.
434
435 The standard way to do this is to enclose the entire real contents of the
436 file in a conditional, like this:
437
438 @example
439 #ifndef FILE_FOO_SEEN
440 #define FILE_FOO_SEEN
441
442 @var{the entire file}
443
444 #endif /* FILE_FOO_SEEN */
445 @end example
446
447 The macro @code{FILE_FOO_SEEN} indicates that the file has been included
448 once already.  In a user header file, the macro name should not begin
449 with @samp{_}.  In a system header file, this name should begin with
450 @samp{__} to avoid conflicts with user programs.  In any kind of header
451 file, the macro name should contain the name of the file and some
452 additional text, to avoid conflicts with other header files.
453
454 The GNU C preprocessor is programmed to notice when a header file uses
455 this particular construct and handle it efficiently.  If a header file
456 is contained entirely in a @samp{#ifndef} conditional, then it records
457 that fact.  If a subsequent @samp{#include} specifies the same file,
458 and the macro in the @samp{#ifndef} is already defined, then the file
459 is entirely skipped, without even reading it.
460
461 @findex #pragma once
462 There is also an explicit directive to tell the preprocessor that it need
463 not include a file more than once.  This is called @samp{#pragma once},
464 and was used @emph{in addition to} the @samp{#ifndef} conditional around
465 the contents of the header file.  @samp{#pragma once} is now obsolete
466 and should not be used at all.
467
468 @findex #import
469 In the Objective C language, there is a variant of @samp{#include}
470 called @samp{#import} which includes a file, but does so at most once.
471 If you use @samp{#import} @emph{instead of} @samp{#include}, then you
472 don't need the conditionals inside the header file to prevent multiple
473 execution of the contents.
474
475 @samp{#import} is obsolete because it is not a well designed feature.
476 It requires the users of a header file---the applications
477 programmers---to know that a certain header file should only be included
478 once.  It is much better for the header file's implementor to write the
479 file so that users don't need to know this.  Using @samp{#ifndef}
480 accomplishes this goal.
481
482 @node Inheritance,, Once-Only, Header Files
483 @subsection Inheritance and Header Files
484 @cindex inheritance
485 @cindex overriding a header file
486
487 @dfn{Inheritance} is what happens when one object or file derives some
488 of its contents by virtual copying from another object or file.  In
489 the case of C header files, inheritance means that one header file 
490 includes another header file and then replaces or adds something.
491
492 If the inheriting header file and the base header file have different
493 names, then inheritance is straightforward: simply write @samp{#include
494 "@var{base}"} in the inheriting file.
495
496 Sometimes it is necessary to give the inheriting file the same name as
497 the base file.  This is less straightforward.
498
499 For example, suppose an application program uses the system header
500 @file{sys/signal.h}, but the version of @file{/usr/include/sys/signal.h}
501 on a particular system doesn't do what the application program expects.
502 It might be convenient to define a ``local'' version, perhaps under the
503 name @file{/usr/local/include/sys/signal.h}, to override or add to the
504 one supplied by the system.
505
506 You can do this by compiling with the option @samp{-I.}, and
507 writing a file @file{sys/signal.h} that does what the application
508 program expects.  But making this file include the standard
509 @file{sys/signal.h} is not so easy---writing @samp{#include
510 <sys/signal.h>} in that file doesn't work, because it includes your own
511 version of the file, not the standard system version.  Used in that file
512 itself, this leads to an infinite recursion and a fatal error in
513 compilation.
514
515 @samp{#include </usr/include/sys/signal.h>} would find the proper file,
516 but that is not clean, since it makes an assumption about where the
517 system header file is found.  This is bad for maintenance, since it
518 means that any change in where the system's header files are kept
519 requires a change somewhere else.
520
521 @findex #include_next
522 The clean way to solve this problem is to use 
523 @samp{#include_next}, which means, ``Include the @emph{next} file with
524 this name.''  This directive works like @samp{#include} except in
525 searching for the specified file: it starts searching the list of header
526 file directories @emph{after} the directory in which the current file
527 was found.
528
529 Suppose you specify @samp{-I /usr/local/include}, and the list of
530 directories to search also includes @file{/usr/include}; and suppose
531 both directories contain @file{sys/signal.h}.  Ordinary
532 @samp{#include <sys/signal.h>} finds the file under
533 @file{/usr/local/include}.  If that file contains @samp{#include_next
534 <sys/signal.h>}, it starts searching after that directory, and finds the
535 file in @file{/usr/include}.
536
537 @node Macros, Conditionals, Header Files, Top
538 @section Macros
539
540 A macro is a sort of abbreviation which you can define once and then
541 use later.  There are many complicated features associated with macros
542 in the C preprocessor.
543
544 @menu
545 * Simple Macros::    Macros that always expand the same way.
546 * Argument Macros::  Macros that accept arguments that are substituted
547                        into the macro expansion.
548 * Macro Varargs::    Macros with variable number of arguments.
549 * Predefined::       Predefined macros that are always available.
550 * Stringification::  Macro arguments converted into string constants.
551 * Concatenation::    Building tokens from parts taken from macro arguments.
552 * Undefining::       Cancelling a macro's definition.
553 * Redefining::       Changing a macro's definition.
554 * Macro Pitfalls::   Macros can confuse the unwary.  Here we explain
555                        several common problems and strange features.
556 @end menu
557
558 @node Simple Macros, Argument Macros, Macros, Macros
559 @subsection Simple Macros
560 @cindex simple macro
561 @cindex manifest constant
562
563 A @dfn{simple macro} is a kind of abbreviation.  It is a name which
564 stands for a fragment of code.  Some people refer to these as
565 @dfn{manifest constants}.
566
567 Before you can use a macro, you must @dfn{define} it explicitly with the
568 @samp{#define} directive.  @samp{#define} is followed by the name of the
569 macro and then the code it should be an abbreviation for.  For example,
570
571 @example
572 #define BUFFER_SIZE 1020
573 @end example
574
575 @noindent
576 defines a macro named @samp{BUFFER_SIZE} as an abbreviation for the text
577 @samp{1020}.  If somewhere after this @samp{#define} directive there comes
578 a C statement of the form
579
580 @example
581 foo = (char *) xmalloc (BUFFER_SIZE);
582 @end example
583
584 @noindent
585 then the C preprocessor will recognize and @dfn{expand} the macro
586 @samp{BUFFER_SIZE}, resulting in
587
588 @example
589 foo = (char *) xmalloc (1020);
590 @end example
591
592 The use of all upper case for macro names is a standard convention.
593 Programs are easier to read when it is possible to tell at a glance which
594 names are macros.
595
596 Normally, a macro definition must be a single line, like all C
597 preprocessing directives.  (You can split a long macro definition
598 cosmetically with Backslash-Newline.)  There is one exception: Newlines
599 can be included in the macro definition if within a string or character
600 constant.  This is because it is not possible for a macro definition to
601 contain an unbalanced quote character; the definition automatically
602 extends to include the matching quote character that ends the string or
603 character constant.  Comments within a macro definition may contain
604 Newlines, which make no difference since the comments are entirely
605 replaced with Spaces regardless of their contents.
606
607 Aside from the above, there is no restriction on what can go in a macro
608 body.  Parentheses need not balance.  The body need not resemble valid C
609 code.  (But if it does not, you may get error messages from the C
610 compiler when you use the macro.)
611
612 The C preprocessor scans your program sequentially, so macro definitions
613 take effect at the place you write them.  Therefore, the following input to
614 the C preprocessor
615
616 @example
617 foo = X;
618 #define X 4
619 bar = X;
620 @end example
621
622 @noindent
623 produces as output
624
625 @example
626 foo = X;
627
628 bar = 4;
629 @end example
630
631 After the preprocessor expands a macro name, the macro's definition body is
632 appended to the front of the remaining input, and the check for macro calls
633 continues.  Therefore, the macro body can contain calls to other macros.
634 For example, after
635
636 @example
637 #define BUFSIZE 1020
638 #define TABLESIZE BUFSIZE
639 @end example
640
641 @noindent
642 the name @samp{TABLESIZE} when used in the program would go through two
643 stages of expansion, resulting ultimately in @samp{1020}.
644
645 This is not at all the same as defining @samp{TABLESIZE} to be @samp{1020}.
646 The @samp{#define} for @samp{TABLESIZE} uses exactly the body you
647 specify---in this case, @samp{BUFSIZE}---and does not check to see whether
648 it too is the name of a macro.  It's only when you @emph{use} @samp{TABLESIZE}
649 that the result of its expansion is checked for more macro names.
650 @xref{Cascaded Macros}.
651
652 @node Argument Macros, Macro Varargs, Simple Macros, Macros
653 @subsection Macros with Arguments
654 @cindex macros with argument
655 @cindex arguments in macro definitions
656 @cindex function-like macro
657
658 A simple macro always stands for exactly the same text, each time it is
659 used.  Macros can be more flexible when they accept @dfn{arguments}.
660 Arguments are fragments of code that you supply each time the macro is
661 used.  These fragments are included in the expansion of the macro
662 according to the directions in the macro definition.  A macro that
663 accepts arguments is called a @dfn{function-like macro} because the
664 syntax for using it looks like a function call.
665
666 @findex #define
667 To define a macro that uses arguments, you write a @samp{#define} directive
668 with a list of @dfn{argument names} in parentheses after the name of the
669 macro.  The argument names may be any valid C identifiers, separated by
670 commas and optionally whitespace.  The open-parenthesis must follow the
671 macro name immediately, with no space in between.
672
673 For example, here is a macro that computes the minimum of two numeric
674 values, as it is defined in many C programs:
675
676 @example
677 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
678 @end example
679
680 @noindent
681 (This is not the best way to define a ``minimum'' macro in GNU C@.
682 @xref{Side Effects}, for more information.)
683
684 To use a macro that expects arguments, you write the name of the macro
685 followed by a list of @dfn{actual arguments} in parentheses, separated by
686 commas.  The number of actual arguments you give must match the number of
687 arguments the macro expects.   Examples of use of the macro @samp{min}
688 include @samp{min (1, 2)} and @samp{min (x + 28, *p)}.
689
690 The expansion text of the macro depends on the arguments you use.
691 Each of the argument names of the macro is replaced, throughout the
692 macro definition, with the corresponding actual argument.  Using the
693 same macro @samp{min} defined above, @samp{min (1, 2)} expands into
694
695 @example
696 ((1) < (2) ? (1) : (2))
697 @end example
698
699 @noindent
700 where @samp{1} has been substituted for @samp{X} and @samp{2} for @samp{Y}.
701
702 Likewise, @samp{min (x + 28, *p)} expands into
703
704 @example
705 ((x + 28) < (*p) ? (x + 28) : (*p))
706 @end example
707
708 Parentheses in the actual arguments must balance; a comma within
709 parentheses does not end an argument.  However, there is no requirement
710 for brackets or braces to balance, and they do not prevent a comma from
711 separating arguments.  Thus,
712
713 @example
714 macro (array[x = y, x + 1])
715 @end example
716
717 @noindent
718 passes two arguments to @code{macro}: @samp{array[x = y} and @samp{x +
719 1]}.  If you want to supply @samp{array[x = y, x + 1]} as an argument,
720 you must write it as @samp{array[(x = y, x + 1)]}, which is equivalent C
721 code.
722
723 After the actual arguments are substituted into the macro body, the entire
724 result is appended to the front of the remaining input, and the check for
725 macro calls continues.  Therefore, the actual arguments can contain calls
726 to other macros, either with or without arguments, or even to the same
727 macro.  The macro body can also contain calls to other macros.  For
728 example, @samp{min (min (a, b), c)} expands into this text:
729
730 @example
731 ((((a) < (b) ? (a) : (b))) < (c)
732  ? (((a) < (b) ? (a) : (b)))
733  : (c))
734 @end example
735
736 @noindent
737 (Line breaks shown here for clarity would not actually be generated.)
738
739 @cindex blank macro arguments
740 @cindex space as macro argument
741 If a macro @code{foo} takes one argument, and you want to supply an
742 empty argument, you must write at least some whitespace between the
743 parentheses, like this: @samp{foo ( )}.  Just @samp{foo ()} is providing
744 no arguments, which is an error if @code{foo} expects an argument.  But
745 @samp{foo0 ()} is the correct way to call a macro defined to take zero
746 arguments, like this:
747
748 @example
749 #define foo0() @dots{}
750 @end example
751
752 If you use the macro name followed by something other than an
753 open-parenthesis (after ignoring any spaces, tabs and comments that
754 follow), it is not a call to the macro, and the preprocessor does not
755 change what you have written.  Therefore, it is possible for the same name
756 to be a variable or function in your program as well as a macro, and you
757 can choose in each instance whether to refer to the macro (if an actual
758 argument list follows) or the variable or function (if an argument list
759 does not follow).
760
761 Such dual use of one name could be confusing and should be avoided
762 except when the two meanings are effectively synonymous: that is, when the
763 name is both a macro and a function and the two have similar effects.  You
764 can think of the name simply as a function; use of the name for purposes
765 other than calling it (such as, to take the address) will refer to the
766 function, while calls will expand the macro and generate better but
767 equivalent code.  For example, you can use a function named @samp{min} in
768 the same source file that defines the macro.  If you write @samp{&min} with
769 no argument list, you refer to the function.  If you write @samp{min (x,
770 bb)}, with an argument list, the macro is expanded.  If you write
771 @samp{(min) (a, bb)}, where the name @samp{min} is not followed by an
772 open-parenthesis, the macro is not expanded, so you wind up with a call to
773 the function @samp{min}.
774
775 You may not define the same name as both a simple macro and a macro with
776 arguments.
777
778 In the definition of a macro with arguments, the list of argument names
779 must follow the macro name immediately with no space in between.  If there
780 is a space after the macro name, the macro is defined as taking no
781 arguments, and all the rest of the line is taken to be the expansion.  The
782 reason for this is that it is often useful to define a macro that takes no
783 arguments and whose definition begins with an identifier in parentheses.
784 This rule about spaces makes it possible for you to do either this:
785
786 @example
787 #define FOO(x) - 1 / (x)
788 @end example
789
790 @noindent
791 (which defines @samp{FOO} to take an argument and expand into minus the
792 reciprocal of that argument) or this:
793
794 @example
795 #define BAR (x) - 1 / (x)
796 @end example
797
798 @noindent
799 (which defines @samp{BAR} to take no argument and always expand into
800 @samp{(x) - 1 / (x)}).
801
802 Note that the @emph{uses} of a macro with arguments can have spaces before
803 the left parenthesis; it's the @emph{definition} where it matters whether
804 there is a space.
805
806 @node Macro Varargs, Predefined, Argument Macros, Macros
807 @subsection Macros with Variable Numbers of Arguments
808 @cindex variable number of arguments
809 @cindex macro with variable arguments
810 @cindex rest argument (in macro)
811
812 In GNU C, a macro can accept a variable number of arguments, much as a
813 function can.  The syntax for defining the macro looks much like that
814 used for a function.  Here is an example:
815
816 @example
817 #define eprintf(format, args...)  \
818  fprintf (stderr, format , ## args)
819 @end example
820
821 Here @code{args} is a @dfn{rest argument}: it takes in zero or more
822 arguments, as many as the call contains.  All of them plus the commas
823 between them form the value of @code{args}, which is substituted into
824 the macro body where @code{args} is used.  Thus, we have this expansion:
825
826 @example
827 eprintf ("%s:%d: ", input_file_name, line_number)
828 @expansion{}
829 fprintf (stderr, "%s:%d: " , input_file_name, line_number)
830 @end example
831
832 @noindent
833 Note that the comma after the string constant comes from the definition
834 of @code{eprintf}, whereas the last comma comes from the value of
835 @code{args}.
836
837 The reason for using @samp{##} is to handle the case when @code{args}
838 matches no arguments at all.  In this case, @code{args} has an empty
839 value.  In this case, the second comma in the definition becomes an
840 embarrassment: if it got through to the expansion of the macro, we would
841 get something like this:
842
843 @example
844 fprintf (stderr, "success!\n" , )
845 @end example
846
847 @noindent
848 which is invalid C syntax.  @samp{##} gets rid of the comma, so we get
849 the following instead:
850
851 @example
852 fprintf (stderr, "success!\n")
853 @end example
854
855 This is a special feature of the GNU C preprocessor: @samp{##} before a
856 rest argument that is empty discards the preceding sequence of
857 non-whitespace characters from the macro definition.  (If another macro
858 argument precedes, none of it is discarded.)
859
860 It might be better to discard the last preprocessor token instead of the
861 last preceding sequence of non-whitespace characters; in fact, we may
862 someday change this feature to do so.  We advise you to write the macro
863 definition so that the preceding sequence of non-whitespace characters
864 is just a single token, so that the meaning will not change if we change
865 the definition of this feature.
866
867 @node Predefined, Stringification, Macro Varargs, Macros
868 @subsection Predefined Macros
869
870 @cindex predefined macros
871 Several simple macros are predefined.  You can use them without giving
872 definitions for them.  They fall into two classes: standard macros and
873 system-specific macros.
874
875 @menu
876 * Standard Predefined::     Standard predefined macros.
877 * Nonstandard Predefined::  Nonstandard predefined macros.
878 @end menu
879
880 @node Standard Predefined, Nonstandard Predefined, Predefined, Predefined
881 @subsubsection Standard Predefined Macros
882 @cindex standard predefined macros
883
884 The standard predefined macros are available with the same meanings
885 regardless of the machine or operating system on which you are using GNU C@.
886 Their names all start and end with double underscores.  Those preceding
887 @code{__GNUC__} in this table are standardized by ANSI C; the rest are
888 GNU C extensions.
889
890 @table @code
891 @item __FILE__
892 @findex __FILE__
893 This macro expands to the name of the current input file, in the form of
894 a C string constant.  The precise name returned is the one that was
895 specified in @samp{#include} or as the input file name argument.
896
897 @item __LINE__
898 @findex __LINE__
899 This macro expands to the current input line number, in the form of a
900 decimal integer constant.  While we call it a predefined macro, it's
901 a pretty strange macro, since its ``definition'' changes with each
902 new line of source code.
903
904 This and @samp{__FILE__} are useful in generating an error message to
905 report an inconsistency detected by the program; the message can state
906 the source line at which the inconsistency was detected.  For example,
907
908 @smallexample
909 fprintf (stderr, "Internal error: "
910                  "negative string length "
911                  "%d at %s, line %d.",
912          length, __FILE__, __LINE__);
913 @end smallexample
914
915 A @samp{#include} directive changes the expansions of @samp{__FILE__}
916 and @samp{__LINE__} to correspond to the included file.  At the end of
917 that file, when processing resumes on the input file that contained
918 the @samp{#include} directive, the expansions of @samp{__FILE__} and
919 @samp{__LINE__} revert to the values they had before the
920 @samp{#include} (but @samp{__LINE__} is then incremented by one as
921 processing moves to the line after the @samp{#include}).
922
923 The expansions of both @samp{__FILE__} and @samp{__LINE__} are altered
924 if a @samp{#line} directive is used.  @xref{Combining Sources}.
925
926 @item __DATE__
927 @findex __DATE__
928 This macro expands to a string constant that describes the date on
929 which the preprocessor is being run.  The string constant contains
930 eleven characters and looks like @w{@samp{"Feb  1 1996"}}.
931 @c After reformatting the above, check that the date remains `Feb  1 1996',
932 @c all on one line, with two spaces between the `Feb' and the `1'.
933
934 @item __TIME__
935 @findex __TIME__
936 This macro expands to a string constant that describes the time at
937 which the preprocessor is being run.  The string constant contains
938 eight characters and looks like @samp{"23:59:01"}.
939
940 @item __STDC__
941 @findex __STDC__
942 This macro expands to the constant 1, to signify that this is ANSI
943 Standard C@.  (Whether that is actually true depends on what C compiler
944 will operate on the output from the preprocessor.)
945
946 On some hosts, system include files use a different convention, where
947 @samp{__STDC__} is normally 0, but is 1 if the user specifies strict
948 conformance to the C Standard.  The preprocessor follows the host convention
949 when processing system include files, but when processing user files it follows
950 the usual GNU C convention.
951
952 This macro is not defined if the @samp{-traditional} option is used.
953
954 @item __STDC_VERSION__
955 @findex __STDC_VERSION__
956 This macro expands to the C Standard's version number,
957 a long integer constant of the form @samp{@var{yyyy}@var{mm}L}
958 where @var{yyyy} and @var{mm} are the year and month of the Standard version.
959 This signifies which version of the C Standard the preprocessor conforms to.
960 Like @samp{__STDC__}, whether this version number is accurate
961 for the entire implementation depends on what C compiler
962 will operate on the output from the preprocessor.
963
964 This macro is not defined if the @samp{-traditional} option is used.
965
966 @item __GNUC__
967 @findex __GNUC__
968 This macro is defined if and only if this is GNU C@.  This macro is
969 defined only when the entire GNU C compiler is in use; if you invoke the
970 preprocessor directly, @samp{__GNUC__} is undefined.  The value
971 identifies the major version number of GNU CC (@samp{1} for GNU CC
972 version 1, which is now obsolete, and @samp{2} for version 2).
973
974 @item __GNUC_MINOR__
975 @findex __GNUC_MINOR__
976 The macro contains the minor version number of the compiler.  This can
977 be used to work around differences between different releases of the
978 compiler (for example, if gcc 2.6.3 is known to support a feature, you
979 can test for @code{__GNUC__ > 2 || (__GNUC__ == 2 && __GNUC_MINOR__ >= 6)}).
980 The last number, @samp{3} in the
981 example above, denotes the bugfix level of the compiler; no macro
982 contains this value.
983
984 @item __GNUG__
985 @findex __GNUG__
986 The GNU C compiler defines this when the compilation language is
987 C++; use @samp{__GNUG__} to distinguish between GNU C and GNU
988 C++.
989
990 @item __cplusplus 
991 @findex __cplusplus 
992 The draft ANSI standard for C++ used to require predefining this
993 variable.  Though it is no longer required, GNU C++ continues to define
994 it, as do other popular C++ compilers.  You can use @samp{__cplusplus}
995 to test whether a header is compiled by a C compiler or a C++ compiler.
996
997 @item __STRICT_ANSI__
998 @findex __STRICT_ANSI__
999 GNU C defines this macro if and only if the @samp{-ansi} switch was
1000 specified when GNU C was invoked.  Its definition is the null string.
1001 This macro exists primarily to direct certain GNU header files not to
1002 define certain traditional Unix constructs which are incompatible with
1003 ANSI C@.
1004
1005 @item __BASE_FILE__
1006 @findex __BASE_FILE__
1007 This macro expands to the name of the main input file, in the form
1008 of a C string constant.  This is the source file that was specified
1009 as an argument when the C compiler was invoked.
1010
1011 @item __INCLUDE_LEVEL__
1012 @findex __INCLUDE_LEVEL_
1013 This macro expands to a decimal integer constant that represents the
1014 depth of nesting in include files.  The value of this macro is
1015 incremented on every @samp{#include} directive and decremented at every
1016 end of file.  For input files specified by command line arguments,
1017 the nesting level is zero.
1018
1019 @item __VERSION__
1020 @findex __VERSION__
1021 This macro expands to a string constant which describes the version number of
1022 GNU C@.  The string is normally a sequence of decimal numbers separated
1023 by periods, such as @samp{"2.6.0"}.
1024
1025 @item __OPTIMIZE__
1026 @findex __OPTIMIZE__
1027 GNU CC defines this macro in optimizing compilations.  It causes certain
1028 GNU header files to define alternative macro definitions for some system
1029 library functions.  You should not refer to or test the definition of
1030 this macro unless you make very sure that programs will execute with the
1031 same effect regardless.
1032
1033 @item __CHAR_UNSIGNED__
1034 @findex __CHAR_UNSIGNED__
1035 GNU C defines this macro if and only if the data type @code{char} is
1036 unsigned on the target machine.  It exists to cause the standard header
1037 file @file{limits.h} to work correctly.  You should not refer to this
1038 macro yourself; instead, refer to the standard macros defined in
1039 @file{limits.h}.  The preprocessor uses this macro to determine whether
1040 or not to sign-extend large character constants written in octal; see
1041 @ref{#if Directive,,The @samp{#if} Directive}.
1042
1043 @item __REGISTER_PREFIX__
1044 @findex __REGISTER_PREFIX__
1045 This macro expands to a string (not a string constant) describing the
1046 prefix applied to CPU registers in assembler code.  You can use it to
1047 write assembler code that is usable in multiple environments.  For
1048 example, in the @samp{m68k-aout} environment it expands to the null
1049 string, but in the @samp{m68k-coff} environment it expands to the string
1050 @samp{%}.
1051
1052 @item __USER_LABEL_PREFIX__
1053 @findex __USER_LABEL_PREFIX__
1054 Similar to @code{__REGISTER_PREFIX__}, but describes the prefix applied
1055 to user generated labels in assembler code.  For example, in the
1056 @samp{m68k-aout} environment it expands to the string @samp{_}, but in
1057 the @samp{m68k-coff} environment it expands to the null string.  This
1058 does not work with the @samp{-mno-underscores} option that the i386
1059 OSF/rose and m88k targets provide nor with the @samp{-mcall*} options of
1060 the rs6000 System V Release 4 target.
1061 @end table
1062
1063 @node Nonstandard Predefined,, Standard Predefined, Predefined
1064 @subsubsection Nonstandard Predefined Macros
1065
1066 The C preprocessor normally has several predefined macros that vary between
1067 machines because their purpose is to indicate what type of system and
1068 machine is in use.  This manual, being for all systems and machines, cannot
1069 tell you exactly what their names are; instead, we offer a list of some
1070 typical ones.  You can use @samp{cpp -dM} to see the values of
1071 predefined macros; see @ref{Invocation}.
1072
1073 Some nonstandard predefined macros describe the operating system in use,
1074 with more or less specificity.  For example,
1075
1076 @table @code
1077 @item unix
1078 @findex unix
1079 @samp{unix} is normally predefined on all Unix systems.
1080
1081 @item BSD
1082 @findex BSD
1083 @samp{BSD} is predefined on recent versions of Berkeley Unix
1084 (perhaps only in version 4.3).
1085 @end table
1086
1087 Other nonstandard predefined macros describe the kind of CPU, with more or
1088 less specificity.  For example,
1089
1090 @table @code
1091 @item vax
1092 @findex vax
1093 @samp{vax} is predefined on Vax computers.
1094
1095 @item mc68000
1096 @findex mc68000
1097 @samp{mc68000} is predefined on most computers whose CPU is a Motorola
1098 68000, 68010 or 68020.
1099
1100 @item m68k
1101 @findex m68k
1102 @samp{m68k} is also predefined on most computers whose CPU is a 68000,
1103 68010 or 68020; however, some makers use @samp{mc68000} and some use
1104 @samp{m68k}.  Some predefine both names.  What happens in GNU C
1105 depends on the system you are using it on.
1106
1107 @item M68020
1108 @findex M68020
1109 @samp{M68020} has been observed to be predefined on some systems that
1110 use 68020 CPUs---in addition to @samp{mc68000} and @samp{m68k}, which
1111 are less specific.
1112
1113 @item _AM29K
1114 @findex _AM29K
1115 @itemx _AM29000
1116 @findex _AM29000
1117 Both @samp{_AM29K} and @samp{_AM29000} are predefined for the AMD 29000
1118 CPU family.
1119
1120 @item ns32000
1121 @findex ns32000
1122 @samp{ns32000} is predefined on computers which use the National
1123 Semiconductor 32000 series CPU.
1124 @end table
1125
1126 Yet other nonstandard predefined macros describe the manufacturer of
1127 the system.  For example,
1128
1129 @table @code
1130 @item sun
1131 @findex sun
1132 @samp{sun} is predefined on all models of Sun computers.
1133
1134 @item pyr
1135 @findex pyr
1136 @samp{pyr} is predefined on all models of Pyramid computers.
1137
1138 @item sequent
1139 @findex sequent
1140 @samp{sequent} is predefined on all models of Sequent computers.
1141 @end table
1142
1143 These predefined symbols are not only nonstandard, they are contrary to the
1144 ANSI standard because their names do not start with underscores.
1145 Therefore, the option @samp{-ansi} inhibits the definition of these
1146 symbols.
1147
1148 This tends to make @samp{-ansi} useless, since many programs depend on the
1149 customary nonstandard predefined symbols.  Even system header files check
1150 them and will generate incorrect declarations if they do not find the names
1151 that are expected.  You might think that the header files supplied for the
1152 Uglix computer would not need to test what machine they are running on,
1153 because they can simply assume it is the Uglix; but often they do, and they
1154 do so using the customary names.  As a result, very few C programs will
1155 compile with @samp{-ansi}.  We intend to avoid such problems on the GNU
1156 system.
1157
1158 What, then, should you do in an ANSI C program to test the type of machine
1159 it will run on?
1160
1161 GNU C offers a parallel series of symbols for this purpose, whose names
1162 are made from the customary ones by adding @samp{__} at the beginning
1163 and end.  Thus, the symbol @code{__vax__} would be available on a Vax,
1164 and so on.
1165
1166 The set of nonstandard predefined names in the GNU C preprocessor is
1167 controlled (when @code{cpp} is itself compiled) by the macro
1168 @samp{CPP_PREDEFINES}, which should be a string containing @samp{-D}
1169 options, separated by spaces.  For example, on the Sun 3, we use the
1170 following definition:
1171
1172 @example
1173 #define CPP_PREDEFINES "-Dmc68000 -Dsun -Dunix -Dm68k"
1174 @end example
1175
1176 @noindent 
1177 This macro is usually specified in @file{tm.h}.
1178
1179 @node Stringification, Concatenation, Predefined, Macros
1180 @subsection Stringification
1181
1182 @cindex stringification
1183 @dfn{Stringification} means turning a code fragment into a string constant
1184 whose contents are the text for the code fragment.  For example,
1185 stringifying @samp{foo (z)} results in @samp{"foo (z)"}.
1186
1187 In the C preprocessor, stringification is an option available when macro
1188 arguments are substituted into the macro definition.  In the body of the
1189 definition, when an argument name appears, the character @samp{#} before
1190 the name specifies stringification of the corresponding actual argument
1191 when it is substituted at that point in the definition.  The same argument
1192 may be substituted in other places in the definition without
1193 stringification if the argument name appears in those places with no
1194 @samp{#}.
1195
1196 Here is an example of a macro definition that uses stringification:
1197
1198 @smallexample
1199 @group
1200 #define WARN_IF(EXP) \
1201 do @{ if (EXP) \
1202         fprintf (stderr, "Warning: " #EXP "\n"); @} \
1203 while (0)
1204 @end group
1205 @end smallexample
1206
1207 @noindent
1208 Here the actual argument for @samp{EXP} is substituted once as given,
1209 into the @samp{if} statement, and once as stringified, into the
1210 argument to @samp{fprintf}.  The @samp{do} and @samp{while (0)} are
1211 a kludge to make it possible to write @samp{WARN_IF (@var{arg});},
1212 which the resemblance of @samp{WARN_IF} to a function would make
1213 C programmers want to do; see @ref{Swallow Semicolon}.
1214
1215 The stringification feature is limited to transforming one macro argument
1216 into one string constant: there is no way to combine the argument with
1217 other text and then stringify it all together.  But the example above shows
1218 how an equivalent result can be obtained in ANSI Standard C using the
1219 feature that adjacent string constants are concatenated as one string
1220 constant.  The preprocessor stringifies the actual value of @samp{EXP} 
1221 into a separate string constant, resulting in text like
1222
1223 @smallexample
1224 @group
1225 do @{ if (x == 0) \
1226         fprintf (stderr, "Warning: " "x == 0" "\n"); @} \
1227 while (0)
1228 @end group
1229 @end smallexample
1230
1231 @noindent
1232 but the C compiler then sees three consecutive string constants and
1233 concatenates them into one, producing effectively
1234
1235 @smallexample
1236 do @{ if (x == 0) \
1237         fprintf (stderr, "Warning: x == 0\n"); @} \
1238 while (0)
1239 @end smallexample
1240
1241 Stringification in C involves more than putting doublequote characters
1242 around the fragment; it is necessary to put backslashes in front of all
1243 doublequote characters, and all backslashes in string and character
1244 constants, in order to get a valid C string constant with the proper
1245 contents.  Thus, stringifying @samp{p = "foo\n";} results in @samp{"p =
1246 \"foo\\n\";"}.  However, backslashes that are not inside of string or
1247 character constants are not duplicated: @samp{\n} by itself stringifies to
1248 @samp{"\n"}.
1249
1250 Whitespace (including comments) in the text being stringified is handled
1251 according to precise rules.  All leading and trailing whitespace is ignored.
1252 Any sequence of whitespace in the middle of the text is converted to
1253 a single space in the stringified result.
1254
1255 @node Concatenation, Undefining, Stringification, Macros
1256 @subsection Concatenation
1257 @cindex concatenation
1258 @cindex @samp{##}
1259 @dfn{Concatenation} means joining two strings into one.  In the context
1260 of macro expansion, concatenation refers to joining two lexical units
1261 into one longer one.  Specifically, an actual argument to the macro can be
1262 concatenated with another actual argument or with fixed text to produce
1263 a longer name.  The longer name might be the name of a function,
1264 variable or type, or a C keyword; it might even be the name of another
1265 macro, in which case it will be expanded.
1266
1267 When you define a macro, you request concatenation with the special
1268 operator @samp{##} in the macro body.  When the macro is called,
1269 after actual arguments are substituted, all @samp{##} operators are
1270 deleted, and so is any whitespace next to them (including whitespace
1271 that was part of an actual argument).  The result is to concatenate
1272 the syntactic tokens on either side of the @samp{##}.
1273
1274 Consider a C program that interprets named commands.  There probably needs
1275 to be a table of commands, perhaps an array of structures declared as
1276 follows:
1277
1278 @example
1279 struct command
1280 @{
1281   char *name;
1282   void (*function) ();
1283 @};
1284
1285 struct command commands[] =
1286 @{
1287   @{ "quit", quit_command@},
1288   @{ "help", help_command@},
1289   @dots{}
1290 @};
1291 @end example
1292
1293 It would be cleaner not to have to give each command name twice, once in
1294 the string constant and once in the function name.  A macro which takes the
1295 name of a command as an argument can make this unnecessary.  The string
1296 constant can be created with stringification, and the function name by
1297 concatenating the argument with @samp{_command}.  Here is how it is done:
1298
1299 @example
1300 #define COMMAND(NAME)  @{ #NAME, NAME ## _command @}
1301
1302 struct command commands[] =
1303 @{
1304   COMMAND (quit),
1305   COMMAND (help),
1306   @dots{}
1307 @};
1308 @end example
1309
1310 The usual case of concatenation is concatenating two names (or a name and a
1311 number) into a longer name.  But this isn't the only valid case.  It is
1312 also possible to concatenate two numbers (or a number and a name, such as
1313 @samp{1.5} and @samp{e3}) into a number.  Also, multi-character operators
1314 such as @samp{+=} can be formed by concatenation.  In some cases it is even
1315 possible to piece together a string constant.  However, two pieces of text
1316 that don't together form a valid lexical unit cannot be concatenated.  For
1317 example, concatenation with @samp{x} on one side and @samp{+} on the other
1318 is not meaningful because those two characters can't fit together in any
1319 lexical unit of C@.  The ANSI standard says that such attempts at
1320 concatenation are undefined, but in the GNU C preprocessor it is well
1321 defined: it puts the @samp{x} and @samp{+} side by side with no particular
1322 special results.
1323
1324 Keep in mind that the C preprocessor converts comments to whitespace before
1325 macros are even considered.  Therefore, you cannot create a comment by
1326 concatenating @samp{/} and @samp{*}: the @samp{/*} sequence that starts a
1327 comment is not a lexical unit, but rather the beginning of a ``long'' space
1328 character.  Also, you can freely use comments next to a @samp{##} in a
1329 macro definition, or in actual arguments that will be concatenated, because
1330 the comments will be converted to spaces at first sight, and concatenation
1331 will later discard the spaces.
1332
1333 @node Undefining, Redefining, Concatenation, Macros
1334 @subsection Undefining Macros
1335
1336 @cindex undefining macros
1337 To @dfn{undefine} a macro means to cancel its definition.  This is done
1338 with the @samp{#undef} directive.  @samp{#undef} is followed by the macro
1339 name to be undefined.
1340
1341 Like definition, undefinition occurs at a specific point in the source
1342 file, and it applies starting from that point.  The name ceases to be a
1343 macro name, and from that point on it is treated by the preprocessor as if
1344 it had never been a macro name.
1345
1346 For example,
1347
1348 @example
1349 #define FOO 4
1350 x = FOO;
1351 #undef FOO
1352 x = FOO;
1353 @end example
1354
1355 @noindent
1356 expands into
1357
1358 @example
1359 x = 4;
1360
1361 x = FOO;
1362 @end example
1363
1364 @noindent
1365 In this example, @samp{FOO} had better be a variable or function as well
1366 as (temporarily) a macro, in order for the result of the expansion to be
1367 valid C code.
1368
1369 The same form of @samp{#undef} directive will cancel definitions with
1370 arguments or definitions that don't expect arguments.  The @samp{#undef}
1371 directive has no effect when used on a name not currently defined as a macro.
1372
1373 @node Redefining, Macro Pitfalls, Undefining, Macros
1374 @subsection Redefining Macros
1375
1376 @cindex redefining macros
1377 @dfn{Redefining} a macro means defining (with @samp{#define}) a name that
1378 is already defined as a macro.
1379
1380 A redefinition is trivial if the new definition is transparently identical
1381 to the old one.  You probably wouldn't deliberately write a trivial
1382 redefinition, but they can happen automatically when a header file is
1383 included more than once (@pxref{Header Files}), so they are accepted
1384 silently and without effect.
1385
1386 Nontrivial redefinition is considered likely to be an error, so
1387 it provokes a warning message from the preprocessor.  However, sometimes it
1388 is useful to change the definition of a macro in mid-compilation.  You can
1389 inhibit the warning by undefining the macro with @samp{#undef} before the
1390 second definition.
1391
1392 In order for a redefinition to be trivial, the new definition must
1393 exactly match the one already in effect, with two possible exceptions:
1394
1395 @itemize @bullet
1396 @item
1397 Whitespace may be added or deleted at the beginning or the end.
1398
1399 @item
1400 Whitespace may be changed in the middle (but not inside strings).
1401 However, it may not be eliminated entirely, and it may not be added
1402 where there was no whitespace at all.
1403 @end itemize
1404
1405 Recall that a comment counts as whitespace.
1406
1407 @node Macro Pitfalls,, Redefining, Macros
1408 @subsection Pitfalls and Subtleties of Macros
1409 @cindex problems with macros
1410 @cindex pitfalls of macros
1411
1412 In this section we describe some special rules that apply to macros and
1413 macro expansion, and point out certain cases in which the rules have
1414 counterintuitive consequences that you must watch out for.
1415
1416 @menu
1417 * Misnesting::        Macros can contain unmatched parentheses.
1418 * Macro Parentheses:: Why apparently superfluous parentheses
1419                          may be necessary to avoid incorrect grouping.
1420 * Swallow Semicolon:: Macros that look like functions
1421                          but expand into compound statements.
1422 * Side Effects::      Unsafe macros that cause trouble when
1423                          arguments contain side effects.
1424 * Self-Reference::    Macros whose definitions use the macros' own names.
1425 * Argument Prescan::  Actual arguments are checked for macro calls
1426                          before they are substituted.
1427 * Cascaded Macros::   Macros whose definitions use other macros.
1428 * Newlines in Args::  Sometimes line numbers get confused.
1429 @end menu
1430
1431 @node Misnesting, Macro Parentheses, Macro Pitfalls, Macro Pitfalls
1432 @subsubsection Improperly Nested Constructs
1433
1434 Recall that when a macro is called with arguments, the arguments are
1435 substituted into the macro body and the result is checked, together with
1436 the rest of the input file, for more macro calls.
1437
1438 It is possible to piece together a macro call coming partially from the
1439 macro body and partially from the actual arguments.  For example,
1440
1441 @example
1442 #define double(x) (2*(x))
1443 #define call_with_1(x) x(1)
1444 @end example
1445
1446 @noindent
1447 would expand @samp{call_with_1 (double)} into @samp{(2*(1))}.
1448
1449 Macro definitions do not have to have balanced parentheses.  By writing an
1450 unbalanced open parenthesis in a macro body, it is possible to create a
1451 macro call that begins inside the macro body but ends outside of it.  For
1452 example,
1453
1454 @example
1455 #define strange(file) fprintf (file, "%s %d",
1456 @dots{}
1457 strange(stderr) p, 35)
1458 @end example
1459
1460 @noindent
1461 This bizarre example expands to @samp{fprintf (stderr, "%s %d", p, 35)}!
1462
1463 @node Macro Parentheses, Swallow Semicolon, Misnesting, Macro Pitfalls
1464 @subsubsection Unintended Grouping of Arithmetic
1465 @cindex parentheses in macro bodies
1466
1467 You may have noticed that in most of the macro definition examples shown
1468 above, each occurrence of a macro argument name had parentheses around it.
1469 In addition, another pair of parentheses usually surround the entire macro
1470 definition.  Here is why it is best to write macros that way.
1471
1472 Suppose you define a macro as follows,
1473
1474 @example
1475 #define ceil_div(x, y) (x + y - 1) / y
1476 @end example
1477
1478 @noindent
1479 whose purpose is to divide, rounding up.  (One use for this operation is
1480 to compute how many @samp{int} objects are needed to hold a certain
1481 number of @samp{char} objects.)  Then suppose it is used as follows:
1482
1483 @example
1484 a = ceil_div (b & c, sizeof (int));
1485 @end example
1486
1487 @noindent
1488 This expands into
1489
1490 @example
1491 a = (b & c + sizeof (int) - 1) / sizeof (int);
1492 @end example
1493
1494 @noindent
1495 which does not do what is intended.  The operator-precedence rules of
1496 C make it equivalent to this:
1497
1498 @example
1499 a = (b & (c + sizeof (int) - 1)) / sizeof (int);
1500 @end example
1501
1502 @noindent
1503 But what we want is this:
1504
1505 @example
1506 a = ((b & c) + sizeof (int) - 1)) / sizeof (int);
1507 @end example
1508
1509 @noindent
1510 Defining the macro as
1511
1512 @example
1513 #define ceil_div(x, y) ((x) + (y) - 1) / (y)
1514 @end example
1515
1516 @noindent
1517 provides the desired result.
1518
1519 Unintended grouping can result in another way.  Consider
1520 @samp{sizeof ceil_div(1, 2)}.  That has the appearance of a C expression
1521 that would compute the size of the type of @samp{ceil_div (1, 2)}, but in
1522 fact it means something very different.  Here is what it expands to:
1523
1524 @example
1525 sizeof ((1) + (2) - 1) / (2)
1526 @end example
1527
1528 @noindent
1529 This would take the size of an integer and divide it by two.  The precedence
1530 rules have put the division outside the @samp{sizeof} when it was intended
1531 to be inside.
1532
1533 Parentheses around the entire macro definition can prevent such problems.
1534 Here, then, is the recommended way to define @samp{ceil_div}:
1535
1536 @example
1537 #define ceil_div(x, y) (((x) + (y) - 1) / (y))
1538 @end example
1539
1540 @node Swallow Semicolon, Side Effects, Macro Parentheses, Macro Pitfalls
1541 @subsubsection Swallowing the Semicolon
1542
1543 @cindex semicolons (after macro calls)
1544 Often it is desirable to define a macro that expands into a compound
1545 statement.  Consider, for example, the following macro, that advances a
1546 pointer (the argument @samp{p} says where to find it) across whitespace
1547 characters:
1548
1549 @example
1550 #define SKIP_SPACES(p, limit)  \
1551 @{ register char *lim = (limit); \
1552   while (p != lim) @{            \
1553     if (*p++ != ' ') @{          \
1554       p--; break; @}@}@}
1555 @end example
1556
1557 @noindent
1558 Here Backslash-Newline is used to split the macro definition, which must
1559 be a single line, so that it resembles the way such C code would be
1560 laid out if not part of a macro definition.
1561
1562 A call to this macro might be @samp{SKIP_SPACES (p, lim)}.  Strictly
1563 speaking, the call expands to a compound statement, which is a complete
1564 statement with no need for a semicolon to end it.  But it looks like a
1565 function call.  So it minimizes confusion if you can use it like a function
1566 call, writing a semicolon afterward, as in @samp{SKIP_SPACES (p, lim);}
1567
1568 But this can cause trouble before @samp{else} statements, because the
1569 semicolon is actually a null statement.  Suppose you write
1570
1571 @example
1572 if (*p != 0)
1573   SKIP_SPACES (p, lim);
1574 else @dots{}
1575 @end example
1576
1577 @noindent
1578 The presence of two statements---the compound statement and a null
1579 statement---in between the @samp{if} condition and the @samp{else}
1580 makes invalid C code.
1581
1582 The definition of the macro @samp{SKIP_SPACES} can be altered to solve
1583 this problem, using a @samp{do @dots{} while} statement.  Here is how:
1584
1585 @example
1586 #define SKIP_SPACES(p, limit)     \
1587 do @{ register char *lim = (limit); \
1588      while (p != lim) @{            \
1589        if (*p++ != ' ') @{          \
1590          p--; break; @}@}@}           \
1591 while (0)
1592 @end example
1593
1594 Now @samp{SKIP_SPACES (p, lim);} expands into
1595
1596 @example
1597 do @{@dots{}@} while (0);
1598 @end example
1599
1600 @noindent
1601 which is one statement.
1602
1603 @node Side Effects, Self-Reference, Swallow Semicolon, Macro Pitfalls
1604 @subsubsection Duplication of Side Effects
1605
1606 @cindex side effects (in macro arguments)
1607 @cindex unsafe macros
1608 Many C programs define a macro @samp{min}, for ``minimum'', like this:
1609
1610 @example
1611 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
1612 @end example
1613
1614 When you use this macro with an argument containing a side effect,
1615 as shown here,
1616
1617 @example
1618 next = min (x + y, foo (z));
1619 @end example
1620
1621 @noindent
1622 it expands as follows:
1623
1624 @example
1625 next = ((x + y) < (foo (z)) ? (x + y) : (foo (z)));
1626 @end example
1627
1628 @noindent
1629 where @samp{x + y} has been substituted for @samp{X} and @samp{foo (z)}
1630 for @samp{Y}.
1631
1632 The function @samp{foo} is used only once in the statement as it appears
1633 in the program, but the expression @samp{foo (z)} has been substituted
1634 twice into the macro expansion.  As a result, @samp{foo} might be called
1635 two times when the statement is executed.  If it has side effects or
1636 if it takes a long time to compute, the results might not be what you
1637 intended.  We say that @samp{min} is an @dfn{unsafe} macro.
1638
1639 The best solution to this problem is to define @samp{min} in a way that
1640 computes the value of @samp{foo (z)} only once.  The C language offers no
1641 standard way to do this, but it can be done with GNU C extensions as
1642 follows:
1643
1644 @example
1645 #define min(X, Y)                     \
1646 (@{ typeof (X) __x = (X), __y = (Y);   \
1647    (__x < __y) ? __x : __y; @})
1648 @end example
1649
1650 If you do not wish to use GNU C extensions, the only solution is to be
1651 careful when @emph{using} the macro @samp{min}.  For example, you can
1652 calculate the value of @samp{foo (z)}, save it in a variable, and use that
1653 variable in @samp{min}:
1654
1655 @example
1656 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
1657 @dots{}
1658 @{
1659   int tem = foo (z);
1660   next = min (x + y, tem);
1661 @}
1662 @end example
1663
1664 @noindent
1665 (where we assume that @samp{foo} returns type @samp{int}).
1666
1667 @node Self-Reference, Argument Prescan, Side Effects, Macro Pitfalls
1668 @subsubsection Self-Referential Macros
1669
1670 @cindex self-reference
1671 A @dfn{self-referential} macro is one whose name appears in its definition.
1672 A special feature of ANSI Standard C is that the self-reference is not
1673 considered a macro call.  It is passed into the preprocessor output
1674 unchanged.
1675
1676 Let's consider an example:
1677
1678 @example
1679 #define foo (4 + foo)
1680 @end example
1681
1682 @noindent
1683 where @samp{foo} is also a variable in your program.
1684
1685 Following the ordinary rules, each reference to @samp{foo} will expand into
1686 @samp{(4 + foo)}; then this will be rescanned and will expand into @samp{(4
1687 + (4 + foo))}; and so on until it causes a fatal error (memory full) in the
1688 preprocessor.
1689
1690 However, the special rule about self-reference cuts this process short
1691 after one step, at @samp{(4 + foo)}.  Therefore, this macro definition
1692 has the possibly useful effect of causing the program to add 4 to
1693 the value of @samp{foo} wherever @samp{foo} is referred to.
1694
1695 In most cases, it is a bad idea to take advantage of this feature.  A
1696 person reading the program who sees that @samp{foo} is a variable will
1697 not expect that it is a macro as well.  The reader will come across the
1698 identifier @samp{foo} in the program and think its value should be that
1699 of the variable @samp{foo}, whereas in fact the value is four greater.
1700
1701 The special rule for self-reference applies also to @dfn{indirect}
1702 self-reference.  This is the case where a macro @var{x} expands to use a
1703 macro @samp{y}, and the expansion of @samp{y} refers to the macro
1704 @samp{x}.  The resulting reference to @samp{x} comes indirectly from the
1705 expansion of @samp{x}, so it is a self-reference and is not further
1706 expanded.  Thus, after
1707
1708 @example
1709 #define x (4 + y)
1710 #define y (2 * x)
1711 @end example
1712
1713 @noindent
1714 @samp{x} would expand into @samp{(4 + (2 * x))}.  Clear?
1715
1716 But suppose @samp{y} is used elsewhere, not from the definition of @samp{x}.
1717 Then the use of @samp{x} in the expansion of @samp{y} is not a self-reference
1718 because @samp{x} is not ``in progress''.  So it does expand.  However,
1719 the expansion of @samp{x} contains a reference to @samp{y}, and that
1720 is an indirect self-reference now because @samp{y} is ``in progress''.
1721 The result is that @samp{y} expands to @samp{(2 * (4 + y))}.
1722
1723 It is not clear that this behavior would ever be useful, but it is specified
1724 by the ANSI C standard, so you may need to understand it.
1725
1726 @node Argument Prescan, Cascaded Macros, Self-Reference, Macro Pitfalls
1727 @subsubsection Separate Expansion of Macro Arguments
1728 @cindex expansion of arguments
1729 @cindex macro argument expansion
1730 @cindex prescan of macro arguments
1731
1732 We have explained that the expansion of a macro, including the substituted
1733 actual arguments, is scanned over again for macro calls to be expanded.
1734
1735 What really happens is more subtle: first each actual argument text is scanned
1736 separately for macro calls.  Then the results of this are substituted into
1737 the macro body to produce the macro expansion, and the macro expansion
1738 is scanned again for macros to expand.
1739
1740 The result is that the actual arguments are scanned @emph{twice} to expand
1741 macro calls in them.
1742
1743 Most of the time, this has no effect.  If the actual argument contained
1744 any macro calls, they are expanded during the first scan.  The result
1745 therefore contains no macro calls, so the second scan does not change it.
1746 If the actual argument were substituted as given, with no prescan,
1747 the single remaining scan would find the same macro calls and produce
1748 the same results.
1749
1750 You might expect the double scan to change the results when a
1751 self-referential macro is used in an actual argument of another macro
1752 (@pxref{Self-Reference}): the self-referential macro would be expanded once
1753 in the first scan, and a second time in the second scan.  But this is not
1754 what happens.  The self-references that do not expand in the first scan are
1755 marked so that they will not expand in the second scan either.
1756
1757 The prescan is not done when an argument is stringified or concatenated.
1758 Thus,
1759
1760 @example
1761 #define str(s) #s
1762 #define foo 4
1763 str (foo)
1764 @end example
1765
1766 @noindent
1767 expands to @samp{"foo"}.  Once more, prescan has been prevented from
1768 having any noticeable effect.
1769
1770 More precisely, stringification and concatenation use the argument as
1771 written, in un-prescanned form.  The same actual argument would be used in
1772 prescanned form if it is substituted elsewhere without stringification or
1773 concatenation.
1774
1775 @example
1776 #define str(s) #s lose(s)
1777 #define foo 4
1778 str (foo)
1779 @end example
1780
1781 expands to @samp{"foo" lose(4)}.
1782
1783 You might now ask, ``Why mention the prescan, if it makes no difference?
1784 And why not skip it and make the preprocessor faster?''  The answer is
1785 that the prescan does make a difference in three special cases:
1786
1787 @itemize @bullet
1788 @item
1789 Nested calls to a macro.
1790
1791 @item
1792 Macros that call other macros that stringify or concatenate.
1793
1794 @item
1795 Macros whose expansions contain unshielded commas.
1796 @end itemize
1797
1798 We say that @dfn{nested} calls to a macro occur when a macro's actual
1799 argument contains a call to that very macro.  For example, if @samp{f}
1800 is a macro that expects one argument, @samp{f (f (1))} is a nested
1801 pair of calls to @samp{f}.  The desired expansion is made by
1802 expanding @samp{f (1)} and substituting that into the definition of
1803 @samp{f}.  The prescan causes the expected result to happen.
1804 Without the prescan, @samp{f (1)} itself would be substituted as
1805 an actual argument, and the inner use of @samp{f} would appear
1806 during the main scan as an indirect self-reference and would not
1807 be expanded.  Here, the prescan cancels an undesirable side effect
1808 (in the medical, not computational, sense of the term) of the special
1809 rule for self-referential macros.
1810
1811 But prescan causes trouble in certain other cases of nested macro calls.
1812 Here is an example:
1813
1814 @example
1815 #define foo  a,b
1816 #define bar(x) lose(x)
1817 #define lose(x) (1 + (x))
1818
1819 bar(foo)
1820 @end example
1821
1822 @noindent
1823 We would like @samp{bar(foo)} to turn into @samp{(1 + (foo))}, which
1824 would then turn into @samp{(1 + (a,b))}.  But instead, @samp{bar(foo)}
1825 expands into @samp{lose(a,b)}, and you get an error because @code{lose}
1826 requires a single argument.  In this case, the problem is easily solved
1827 by the same parentheses that ought to be used to prevent misnesting of
1828 arithmetic operations:
1829
1830 @example
1831 #define foo (a,b)
1832 #define bar(x) lose((x))
1833 @end example
1834
1835 The problem is more serious when the operands of the macro are not
1836 expressions; for example, when they are statements.  Then parentheses
1837 are unacceptable because they would make for invalid C code:
1838
1839 @example
1840 #define foo @{ int a, b; @dots{} @}
1841 @end example
1842
1843 @noindent
1844 In GNU C you can shield the commas using the @samp{(@{@dots{}@})}
1845 construct which turns a compound statement into an expression:
1846
1847 @example
1848 #define foo (@{ int a, b; @dots{} @})
1849 @end example
1850
1851 Or you can rewrite the macro definition to avoid such commas:
1852
1853 @example
1854 #define foo @{ int a; int b; @dots{} @}
1855 @end example
1856
1857 There is also one case where prescan is useful.  It is possible
1858 to use prescan to expand an argument and then stringify it---if you use
1859 two levels of macros.  Let's add a new macro @samp{xstr} to the
1860 example shown above:
1861
1862 @example
1863 #define xstr(s) str(s)
1864 #define str(s) #s
1865 #define foo 4
1866 xstr (foo)
1867 @end example
1868
1869 This expands into @samp{"4"}, not @samp{"foo"}.  The reason for the
1870 difference is that the argument of @samp{xstr} is expanded at prescan
1871 (because @samp{xstr} does not specify stringification or concatenation of
1872 the argument).  The result of prescan then forms the actual argument for
1873 @samp{str}.  @samp{str} uses its argument without prescan because it
1874 performs stringification; but it cannot prevent or undo the prescanning
1875 already done by @samp{xstr}.
1876
1877 @node Cascaded Macros, Newlines in Args, Argument Prescan, Macro Pitfalls
1878 @subsubsection Cascaded Use of Macros
1879
1880 @cindex cascaded macros
1881 @cindex macro body uses macro
1882 A @dfn{cascade} of macros is when one macro's body contains a reference
1883 to another macro.  This is very common practice.  For example,
1884
1885 @example
1886 #define BUFSIZE 1020
1887 #define TABLESIZE BUFSIZE
1888 @end example
1889
1890 This is not at all the same as defining @samp{TABLESIZE} to be @samp{1020}.
1891 The @samp{#define} for @samp{TABLESIZE} uses exactly the body you
1892 specify---in this case, @samp{BUFSIZE}---and does not check to see whether
1893 it too is the name of a macro.
1894
1895 It's only when you @emph{use} @samp{TABLESIZE} that the result of its expansion
1896 is checked for more macro names.
1897
1898 This makes a difference if you change the definition of @samp{BUFSIZE}
1899 at some point in the source file.  @samp{TABLESIZE}, defined as shown,
1900 will always expand using the definition of @samp{BUFSIZE} that is
1901 currently in effect:
1902
1903 @example
1904 #define BUFSIZE 1020
1905 #define TABLESIZE BUFSIZE
1906 #undef BUFSIZE
1907 #define BUFSIZE 37
1908 @end example
1909
1910 @noindent
1911 Now @samp{TABLESIZE} expands (in two stages) to @samp{37}.  (The
1912 @samp{#undef} is to prevent any warning about the nontrivial
1913 redefinition of @code{BUFSIZE}.)
1914
1915 @node Newlines in Args,, Cascaded Macros, Macro Pitfalls
1916 @subsection Newlines in Macro Arguments
1917 @cindex newlines in macro arguments
1918
1919 Traditional macro processing carries forward all newlines in macro
1920 arguments into the expansion of the macro.  This means that, if some of
1921 the arguments are substituted more than once, or not at all, or out of
1922 order, newlines can be duplicated, lost, or moved around within the
1923 expansion.  If the expansion consists of multiple statements, then the
1924 effect is to distort the line numbers of some of these statements.  The
1925 result can be incorrect line numbers, in error messages or displayed in
1926 a debugger.
1927
1928 The GNU C preprocessor operating in ANSI C mode adjusts appropriately
1929 for multiple use of an argument---the first use expands all the
1930 newlines, and subsequent uses of the same argument produce no newlines.
1931 But even in this mode, it can produce incorrect line numbering if
1932 arguments are used out of order, or not used at all.
1933
1934 Here is an example illustrating this problem:
1935
1936 @example
1937 #define ignore_second_arg(a,b,c) a; c
1938
1939 ignore_second_arg (foo (),
1940                    ignored (),
1941                    syntax error);
1942 @end example
1943
1944 @noindent
1945 The syntax error triggered by the tokens @samp{syntax error} results
1946 in an error message citing line four, even though the statement text
1947 comes from line five.
1948
1949 @node Conditionals, Combining Sources, Macros, Top
1950 @section Conditionals
1951
1952 @cindex conditionals
1953 In a macro processor, a @dfn{conditional} is a directive that allows a part
1954 of the program to be ignored during compilation, on some conditions.
1955 In the C preprocessor, a conditional can test either an arithmetic expression
1956 or whether a name is defined as a macro.
1957
1958 A conditional in the C preprocessor resembles in some ways an @samp{if}
1959 statement in C, but it is important to understand the difference between
1960 them.  The condition in an @samp{if} statement is tested during the execution
1961 of your program.  Its purpose is to allow your program to behave differently
1962 from run to run, depending on the data it is operating on.  The condition
1963 in a preprocessing conditional directive is tested when your program is compiled.
1964 Its purpose is to allow different code to be included in the program depending
1965 on the situation at the time of compilation.
1966
1967 @menu
1968 * Uses: Conditional Uses.       What conditionals are for.
1969 * Syntax: Conditional Syntax.   How conditionals are written.
1970 * Deletion: Deleted Code.       Making code into a comment.
1971 * Macros: Conditionals-Macros.  Why conditionals are used with macros.
1972 * Assertions::                  How and why to use assertions.
1973 * Errors: #error Directive.     Detecting inconsistent compilation parameters.
1974 @end menu
1975
1976 @node Conditional Uses
1977 @subsection Why Conditionals are Used
1978
1979 Generally there are three kinds of reason to use a conditional.
1980
1981 @itemize @bullet
1982 @item
1983 A program may need to use different code depending on the machine or
1984 operating system it is to run on.  In some cases the code for one
1985 operating system may be erroneous on another operating system; for
1986 example, it might refer to library routines that do not exist on the
1987 other system.  When this happens, it is not enough to avoid executing
1988 the invalid code: merely having it in the program makes it impossible
1989 to link the program and run it.  With a preprocessing conditional, the
1990 offending code can be effectively excised from the program when it is
1991 not valid.
1992
1993 @item
1994 You may want to be able to compile the same source file into two
1995 different programs.  Sometimes the difference between the programs is
1996 that one makes frequent time-consuming consistency checks on its
1997 intermediate data, or prints the values of those data for debugging,
1998 while the other does not.
1999
2000 @item
2001 A conditional whose condition is always false is a good way to exclude
2002 code from the program but keep it as a sort of comment for future
2003 reference.
2004 @end itemize
2005
2006 Most simple programs that are intended to run on only one machine will
2007 not need to use preprocessing conditionals.
2008
2009 @node Conditional Syntax
2010 @subsection Syntax of Conditionals
2011
2012 @findex #if
2013 A conditional in the C preprocessor begins with a @dfn{conditional
2014 directive}: @samp{#if}, @samp{#ifdef} or @samp{#ifndef}.
2015 @xref{Conditionals-Macros}, for information on @samp{#ifdef} and
2016 @samp{#ifndef}; only @samp{#if} is explained here.
2017
2018 @menu
2019 * If: #if Directive.     Basic conditionals using @samp{#if} and @samp{#endif}.
2020 * Else: #else Directive. Including some text if the condition fails.
2021 * Elif: #elif Directive. Testing several alternative possibilities.
2022 @end menu
2023
2024 @node #if Directive
2025 @subsubsection The @samp{#if} Directive
2026
2027 The @samp{#if} directive in its simplest form consists of
2028
2029 @example
2030 #if @var{expression}
2031 @var{controlled text}
2032 #endif /* @var{expression} */
2033 @end example
2034
2035 The comment following the @samp{#endif} is not required, but it is a good
2036 practice because it helps people match the @samp{#endif} to the
2037 corresponding @samp{#if}.  Such comments should always be used, except in
2038 short conditionals that are not nested.  In fact, you can put anything at
2039 all after the @samp{#endif} and it will be ignored by the GNU C preprocessor,
2040 but only comments are acceptable in ANSI Standard C@.
2041
2042 @var{expression} is a C expression of integer type, subject to stringent
2043 restrictions.  It may contain
2044
2045 @itemize @bullet
2046 @item
2047 Integer constants, which are all regarded as @code{long} or
2048 @code{unsigned long}.
2049
2050 @item
2051 Character constants, which are interpreted according to the character
2052 set and conventions of the machine and operating system on which the
2053 preprocessor is running.  The GNU C preprocessor uses the C data type
2054 @samp{char} for these character constants; therefore, whether some
2055 character codes are negative is determined by the C compiler used to
2056 compile the preprocessor.  If it treats @samp{char} as signed, then
2057 character codes large enough to set the sign bit will be considered
2058 negative; otherwise, no character code is considered negative.
2059
2060 @item
2061 Arithmetic operators for addition, subtraction, multiplication,
2062 division, bitwise operations, shifts, comparisons, and logical
2063 operations (@samp{&&} and @samp{||}).
2064
2065 @item
2066 Identifiers that are not macros, which are all treated as zero(!).
2067
2068 @item
2069 Macro calls.  All macro calls in the expression are expanded before
2070 actual computation of the expression's value begins.
2071 @end itemize
2072
2073 Note that @samp{sizeof} operators and @code{enum}-type values are not allowed.
2074 @code{enum}-type values, like all other identifiers that are not taken
2075 as macro calls and expanded, are treated as zero.
2076
2077 The @var{controlled text} inside of a conditional can include
2078 preprocessing directives.  Then the directives inside the conditional are
2079 obeyed only if that branch of the conditional succeeds.  The text can
2080 also contain other conditional groups.  However, the @samp{#if} and
2081 @samp{#endif} directives must balance.
2082
2083 @node #else Directive
2084 @subsubsection The @samp{#else} Directive
2085
2086 @findex #else
2087 The @samp{#else} directive can be added to a conditional to provide
2088 alternative text to be used if the condition is false.  This is what
2089 it looks like:
2090
2091 @example
2092 #if @var{expression}
2093 @var{text-if-true}
2094 #else /* Not @var{expression} */
2095 @var{text-if-false}
2096 #endif /* Not @var{expression} */
2097 @end example
2098
2099 If @var{expression} is nonzero, and thus the @var{text-if-true} is 
2100 active, then @samp{#else} acts like a failing conditional and the
2101 @var{text-if-false} is ignored.  Contrariwise, if the @samp{#if}
2102 conditional fails, the @var{text-if-false} is considered included.
2103
2104 @node #elif Directive
2105 @subsubsection The @samp{#elif} Directive
2106
2107 @findex #elif
2108 One common case of nested conditionals is used to check for more than two
2109 possible alternatives.  For example, you might have
2110
2111 @example
2112 #if X == 1
2113 @dots{}
2114 #else /* X != 1 */
2115 #if X == 2
2116 @dots{}
2117 #else /* X != 2 */
2118 @dots{}
2119 #endif /* X != 2 */
2120 #endif /* X != 1 */
2121 @end example
2122
2123 Another conditional directive, @samp{#elif}, allows this to be abbreviated
2124 as follows:
2125
2126 @example
2127 #if X == 1
2128 @dots{}
2129 #elif X == 2
2130 @dots{}
2131 #else /* X != 2 and X != 1*/
2132 @dots{}
2133 #endif /* X != 2 and X != 1*/
2134 @end example
2135
2136 @samp{#elif} stands for ``else if''.  Like @samp{#else}, it goes in the
2137 middle of a @samp{#if}-@samp{#endif} pair and subdivides it; it does not
2138 require a matching @samp{#endif} of its own.  Like @samp{#if}, the
2139 @samp{#elif} directive includes an expression to be tested.
2140
2141 The text following the @samp{#elif} is processed only if the original
2142 @samp{#if}-condition failed and the @samp{#elif} condition succeeds.
2143 More than one @samp{#elif} can go in the same @samp{#if}-@samp{#endif}
2144 group.  Then the text after each @samp{#elif} is processed only if the
2145 @samp{#elif} condition succeeds after the original @samp{#if} and any
2146 previous @samp{#elif} directives within it have failed.  @samp{#else} is
2147 equivalent to @samp{#elif 1}, and @samp{#else} is allowed after any
2148 number of @samp{#elif} directives, but @samp{#elif} may not follow
2149 @samp{#else}.
2150
2151 @node Deleted Code
2152 @subsection Keeping Deleted Code for Future Reference
2153 @cindex commenting out code
2154
2155 If you replace or delete a part of the program but want to keep the old
2156 code around as a comment for future reference, the easy way to do this
2157 is to put @samp{#if 0} before it and @samp{#endif} after it.  This is
2158 better than using comment delimiters @samp{/*} and @samp{*/} since those
2159 won't work if the code already contains comments (C comments do not
2160 nest).
2161
2162 This works even if the code being turned off contains conditionals, but
2163 they must be entire conditionals (balanced @samp{#if} and @samp{#endif}).
2164
2165 Conversely, do not use @samp{#if 0} for comments which are not C code.
2166 Use the comment delimiters @samp{/*} and @samp{*/} instead.  The
2167 interior of @samp{#if 0} must consist of complete tokens; in particular,
2168 singlequote characters must balance.  But comments often contain
2169 unbalanced singlequote characters (known in English as apostrophes).
2170 These confuse @samp{#if 0}.  They do not confuse @samp{/*}.
2171
2172 @node Conditionals-Macros
2173 @subsection Conditionals and Macros
2174
2175 Conditionals are useful in connection with macros or assertions, because
2176 those are the only ways that an expression's value can vary from one
2177 compilation to another.  A @samp{#if} directive whose expression uses no
2178 macros or assertions is equivalent to @samp{#if 1} or @samp{#if 0}; you
2179 might as well determine which one, by computing the value of the
2180 expression yourself, and then simplify the program.
2181
2182 For example, here is a conditional that tests the expression
2183 @samp{BUFSIZE == 1020}, where @samp{BUFSIZE} must be a macro.
2184
2185 @example
2186 #if BUFSIZE == 1020
2187   printf ("Large buffers!\n");
2188 #endif /* BUFSIZE is large */
2189 @end example
2190
2191 (Programmers often wish they could test the size of a variable or data
2192 type in @samp{#if}, but this does not work.  The preprocessor does not
2193 understand @code{sizeof}, or typedef names, or even the type keywords
2194 such as @code{int}.)
2195
2196 @findex defined
2197 The special operator @samp{defined} is used in @samp{#if} expressions to
2198 test whether a certain name is defined as a macro.  Either @samp{defined
2199 @var{name}} or @samp{defined (@var{name})} is an expression whose value
2200 is 1 if @var{name} is defined as macro at the current point in the
2201 program, and 0 otherwise.  For the @samp{defined} operator it makes no
2202 difference what the definition of the macro is; all that matters is
2203 whether there is a definition.  Thus, for example,@refill
2204
2205 @example
2206 #if defined (vax) || defined (ns16000)
2207 @end example
2208
2209 @noindent
2210 would succeed if either of the names @samp{vax} and @samp{ns16000} is
2211 defined as a macro.  You can test the same condition using assertions
2212 (@pxref{Assertions}), like this:
2213
2214 @example
2215 #if #cpu (vax) || #cpu (ns16000)
2216 @end example
2217
2218 If a macro is defined and later undefined with @samp{#undef},
2219 subsequent use of the @samp{defined} operator returns 0, because
2220 the name is no longer defined.  If the macro is defined again with
2221 another @samp{#define}, @samp{defined} will recommence returning 1.
2222
2223 @findex #ifdef
2224 @findex #ifndef
2225 Conditionals that test whether just one name is defined are very common,
2226 so there are two special short conditional directives for this case.
2227
2228 @table @code
2229 @item #ifdef @var{name}
2230 is equivalent to @samp{#if defined (@var{name})}.
2231
2232 @item #ifndef @var{name}
2233 is equivalent to @samp{#if ! defined (@var{name})}.
2234 @end table
2235
2236 Macro definitions can vary between compilations for several reasons.
2237
2238 @itemize @bullet
2239 @item
2240 Some macros are predefined on each kind of machine.  For example, on a
2241 Vax, the name @samp{vax} is a predefined macro.  On other machines, it
2242 would not be defined.
2243
2244 @item
2245 Many more macros are defined by system header files.  Different
2246 systems and machines define different macros, or give them different
2247 values.  It is useful to test these macros with conditionals to avoid
2248 using a system feature on a machine where it is not implemented.
2249
2250 @item
2251 Macros are a common way of allowing users to customize a program for
2252 different machines or applications.  For example, the macro
2253 @samp{BUFSIZE} might be defined in a configuration file for your
2254 program that is included as a header file in each source file.  You
2255 would use @samp{BUFSIZE} in a preprocessing conditional in order to
2256 generate different code depending on the chosen configuration.
2257
2258 @item
2259 Macros can be defined or undefined with @samp{-D} and @samp{-U}
2260 command options when you compile the program.  You can arrange to
2261 compile the same source file into two different programs by choosing
2262 a macro name to specify which program you want, writing conditionals
2263 to test whether or how this macro is defined, and then controlling
2264 the state of the macro with compiler command options.
2265 @xref{Invocation}.
2266 @end itemize
2267
2268 @ifinfo
2269 Assertions are usually predefined, but can be defined with preprocessor
2270 directives or command-line options.
2271 @end ifinfo
2272
2273 @node Assertions
2274 @subsection Assertions
2275
2276 @cindex assertions
2277 @dfn{Assertions} are a more systematic alternative to macros in writing
2278 conditionals to test what sort of computer or system the compiled
2279 program will run on.  Assertions are usually predefined, but you can
2280 define them with preprocessing directives or command-line options.
2281
2282 @cindex predicates
2283 The macros traditionally used to describe the type of target are not
2284 classified in any way according to which question they answer; they may
2285 indicate a hardware architecture, a particular hardware model, an
2286 operating system, a particular version of an operating system, or
2287 specific configuration options.  These are jumbled together in a single
2288 namespace.  In contrast, each assertion consists of a named question and
2289 an answer.  The question is usually called the @dfn{predicate}.
2290 An assertion looks like this:
2291
2292 @example
2293 #@var{predicate} (@var{answer})
2294 @end example
2295
2296 @noindent
2297 You must use a properly formed identifier for @var{predicate}.  The
2298 value of @var{answer} can be any sequence of words; all characters are
2299 significant except for leading and trailing whitespace, and differences
2300 in internal whitespace sequences are ignored.  Thus, @samp{x + y} is
2301 different from @samp{x+y} but equivalent to @samp{x + y}.  @samp{)} is
2302 not allowed in an answer.
2303
2304 @cindex testing predicates
2305 Here is a conditional to test whether the answer @var{answer} is asserted
2306 for the predicate @var{predicate}:
2307
2308 @example
2309 #if #@var{predicate} (@var{answer})
2310 @end example
2311
2312 @noindent
2313 There may be more than one answer asserted for a given predicate.  If
2314 you omit the answer, you can test whether @emph{any} answer is asserted
2315 for @var{predicate}:
2316
2317 @example
2318 #if #@var{predicate}
2319 @end example
2320
2321 @findex #system
2322 @findex #machine
2323 @findex #cpu
2324 Most of the time, the assertions you test will be predefined assertions.
2325 GNU C provides three predefined predicates: @code{system}, @code{cpu},
2326 and @code{machine}.  @code{system} is for assertions about the type of
2327 software, @code{cpu} describes the type of computer architecture, and
2328 @code{machine} gives more information about the computer.  For example,
2329 on a GNU system, the following assertions would be true:
2330
2331 @example
2332 #system (gnu)
2333 #system (mach)
2334 #system (mach 3)
2335 #system (mach 3.@var{subversion})
2336 #system (hurd)
2337 #system (hurd @var{version})
2338 @end example
2339
2340 @noindent
2341 and perhaps others.  The alternatives with
2342 more or less version information let you ask more or less detailed
2343 questions about the type of system software.
2344
2345 On a Unix system, you would find @code{#system (unix)} and perhaps one of:
2346 @code{#system (aix)}, @code{#system (bsd)}, @code{#system (hpux)},
2347 @code{#system (lynx)}, @code{#system (mach)}, @code{#system (posix)},
2348 @code{#system (svr3)}, @code{#system (svr4)}, or @code{#system (xpg4)}
2349 with possible version numbers following.
2350
2351 Other values for @code{system} are @code{#system (mvs)}
2352 and @code{#system (vms)}.
2353
2354 @strong{Portability note:} Many Unix C compilers provide only one answer
2355 for the @code{system} assertion: @code{#system (unix)}, if they support
2356 assertions at all.  This is less than useful.
2357
2358 An assertion with a multi-word answer is completely different from several
2359 assertions with individual single-word answers.  For example, the presence
2360 of @code{system (mach 3.0)} does not mean that @code{system (3.0)} is true.
2361 It also does not directly imply @code{system (mach)}, but in GNU C, that
2362 last will normally be asserted as well.
2363
2364 The current list of possible assertion values for @code{cpu} is:
2365 @code{#cpu (a29k)}, @code{#cpu (alpha)}, @code{#cpu (arm)}, @code{#cpu
2366 (clipper)}, @code{#cpu (convex)}, @code{#cpu (elxsi)}, @code{#cpu
2367 (tron)}, @code{#cpu (h8300)}, @code{#cpu (i370)}, @code{#cpu (i386)},
2368 @code{#cpu (i860)}, @code{#cpu (i960)}, @code{#cpu (m68k)}, @code{#cpu
2369 (m88k)}, @code{#cpu (mips)}, @code{#cpu (ns32k)}, @code{#cpu (hppa)},
2370 @code{#cpu (pyr)}, @code{#cpu (ibm032)}, @code{#cpu (rs6000)},
2371 @code{#cpu (sh)}, @code{#cpu (sparc)}, @code{#cpu (spur)}, @code{#cpu
2372 (tahoe)}, @code{#cpu (vax)}, @code{#cpu (we32000)}.
2373
2374 @findex #assert
2375 You can create assertions within a C program using @samp{#assert}, like
2376 this:
2377
2378 @example
2379 #assert @var{predicate} (@var{answer})
2380 @end example
2381
2382 @noindent
2383 (Note the absence of a @samp{#} before @var{predicate}.)
2384
2385 @cindex unassert
2386 @cindex assertions, undoing
2387 @cindex retracting assertions
2388 @findex #unassert
2389 Each time you do this, you assert a new true answer for @var{predicate}.
2390 Asserting one answer does not invalidate previously asserted answers;
2391 they all remain true.  The only way to remove an assertion is with
2392 @samp{#unassert}.  @samp{#unassert} has the same syntax as
2393 @samp{#assert}.  You can also remove all assertions about
2394 @var{predicate} like this:
2395
2396 @example
2397 #unassert @var{predicate}
2398 @end example
2399
2400 You can also add or cancel assertions using command options
2401 when you run @code{gcc} or @code{cpp}.  @xref{Invocation}.
2402
2403 @node #error Directive
2404 @subsection The @samp{#error} and @samp{#warning} Directives
2405
2406 @findex #error
2407 The directive @samp{#error} causes the preprocessor to report a fatal
2408 error.  The rest of the line that follows @samp{#error} is used as the
2409 error message.  The line must consist of complete tokens.
2410
2411 You would use @samp{#error} inside of a conditional that detects a
2412 combination of parameters which you know the program does not properly
2413 support.  For example, if you know that the program will not run
2414 properly on a Vax, you might write
2415
2416 @smallexample
2417 @group
2418 #ifdef __vax__
2419 #error "Won't work on Vaxen.  See comments at get_last_object."
2420 #endif
2421 @end group
2422 @end smallexample
2423
2424 @noindent
2425 @xref{Nonstandard Predefined}, for why this works.
2426
2427 If you have several configuration parameters that must be set up by
2428 the installation in a consistent way, you can use conditionals to detect
2429 an inconsistency and report it with @samp{#error}.  For example,
2430
2431 @smallexample
2432 #if HASH_TABLE_SIZE % 2 == 0 || HASH_TABLE_SIZE % 3 == 0 \
2433     || HASH_TABLE_SIZE % 5 == 0
2434 #error HASH_TABLE_SIZE should not be divisible by a small prime
2435 #endif
2436 @end smallexample
2437
2438 @findex #warning
2439 The directive @samp{#warning} is like the directive @samp{#error}, but causes
2440 the preprocessor to issue a warning and continue preprocessing.  The rest of
2441 the line that follows @samp{#warning} is used as the warning message.
2442
2443 You might use @samp{#warning} in obsolete header files, with a message
2444 directing the user to the header file which should be used instead.
2445
2446 @node Combining Sources, Other Directives, Conditionals, Top
2447 @section Combining Source Files
2448
2449 @cindex line control
2450 One of the jobs of the C preprocessor is to inform the C compiler of where
2451 each line of C code came from: which source file and which line number.
2452
2453 C code can come from multiple source files if you use @samp{#include};
2454 both @samp{#include} and the use of conditionals and macros can cause
2455 the line number of a line in the preprocessor output to be different
2456 from the line's number in the original source file.  You will appreciate
2457 the value of making both the C compiler (in error messages) and symbolic
2458 debuggers such as GDB use the line numbers in your source file.
2459
2460 The C preprocessor builds on this feature by offering a directive by which
2461 you can control the feature explicitly.  This is useful when a file for
2462 input to the C preprocessor is the output from another program such as the
2463 @code{bison} parser generator, which operates on another file that is the
2464 true source file.  Parts of the output from @code{bison} are generated from
2465 scratch, other parts come from a standard parser file.  The rest are copied
2466 nearly verbatim from the source file, but their line numbers in the
2467 @code{bison} output are not the same as their original line numbers.
2468 Naturally you would like compiler error messages and symbolic debuggers to
2469 know the original source file and line number of each line in the
2470 @code{bison} input.
2471
2472 @findex #line
2473 @code{bison} arranges this by writing @samp{#line} directives into the output
2474 file.  @samp{#line} is a directive that specifies the original line number
2475 and source file name for subsequent input in the current preprocessor input
2476 file.  @samp{#line} has three variants:
2477
2478 @table @code
2479 @item #line @var{linenum}
2480 Here @var{linenum} is a decimal integer constant.  This specifies that
2481 the line number of the following line of input, in its original source file,
2482 was @var{linenum}.
2483
2484 @item #line @var{linenum} @var{filename}
2485 Here @var{linenum} is a decimal integer constant and @var{filename}
2486 is a string constant.  This specifies that the following line of input
2487 came originally from source file @var{filename} and its line number there
2488 was @var{linenum}.  Keep in mind that @var{filename} is not just a
2489 file name; it is surrounded by doublequote characters so that it looks
2490 like a string constant.
2491
2492 @item #line @var{anything else}
2493 @var{anything else} is checked for macro calls, which are expanded.
2494 The result should be a decimal integer constant followed optionally
2495 by a string constant, as described above.
2496 @end table
2497
2498 @samp{#line} directives alter the results of the @samp{__FILE__} and
2499 @samp{__LINE__} predefined macros from that point on.  @xref{Standard
2500 Predefined}.
2501
2502 The output of the preprocessor (which is the input for the rest of the
2503 compiler) contains directives that look much like @samp{#line} directives.
2504 They start with just @samp{#} instead of @samp{#line}, but this is
2505 followed by a line number and file name as in @samp{#line}.  @xref{Output}.
2506
2507 @node Other Directives, Output, Combining Sources, Top
2508 @section Miscellaneous Preprocessing Directives
2509
2510 @cindex null directive
2511 This section describes three additional preprocessing directives.  They are
2512 not very useful, but are mentioned for completeness.
2513
2514 The @dfn{null directive} consists of a @samp{#} followed by a Newline, with
2515 only whitespace (including comments) in between.  A null directive is
2516 understood as a preprocessing directive but has no effect on the preprocessor
2517 output.  The primary significance of the existence of the null directive is
2518 that an input line consisting of just a @samp{#} will produce no output,
2519 rather than a line of output containing just a @samp{#}.  Supposedly
2520 some old C programs contain such lines.
2521
2522 @findex #pragma
2523 The ANSI standard specifies that the effect of the @samp{#pragma}
2524 directive is implementation-defined.  In the GNU C preprocessor,
2525 @samp{#pragma} directives are not used, except for @samp{#pragma once}
2526 (@pxref{Once-Only}).  However, they are left in the preprocessor output,
2527 so they are available to the compilation pass.
2528
2529 @findex #ident
2530 The @samp{#ident} directive is supported for compatibility with certain
2531 other systems.  It is followed by a line of text.  On some systems, the
2532 text is copied into a special place in the object file; on most systems,
2533 the text is ignored and this directive has no effect.  Typically
2534 @samp{#ident} is only used in header files supplied with those systems
2535 where it is meaningful.
2536
2537 @node Output, Invocation, Other Directives, Top
2538 @section C Preprocessor Output
2539
2540 @cindex output format
2541 The output from the C preprocessor looks much like the input, except
2542 that all preprocessing directive lines have been replaced with blank lines
2543 and all comments with spaces.  Whitespace within a line is not altered;
2544 however, unless @samp{-traditional} is used, spaces may be inserted into
2545 the expansions of macro calls to prevent tokens from being concatenated.
2546
2547 Source file name and line number information is conveyed by lines of
2548 the form
2549
2550 @example
2551 # @var{linenum} @var{filename} @var{flags}
2552 @end example
2553
2554 @noindent
2555 which are inserted as needed into the middle of the input (but never
2556 within a string or character constant).  Such a line means that the
2557 following line originated in file @var{filename} at line @var{linenum}.
2558
2559 After the file name comes zero or more flags, which are @samp{1},
2560 @samp{2}, @samp{3}, or @samp{4}.  If there are multiple flags, spaces separate
2561 them.  Here is what the flags mean:
2562
2563 @table @samp
2564 @item 1
2565 This indicates the start of a new file.
2566 @item 2
2567 This indicates returning to a file (after having included another file).
2568 @item 3
2569 This indicates that the following text comes from a system header file,
2570 so certain warnings should be suppressed.
2571 @item 4
2572 This indicates that the following text should be treated as C@.
2573 @c maybe cross reference NO_IMPLICIT_EXTERN_C
2574 @end table
2575
2576 @node Invocation, Concept Index, Output, Top
2577 @section Invoking the C Preprocessor
2578 @cindex invocation of the preprocessor
2579
2580 Most often when you use the C preprocessor you will not have to invoke it
2581 explicitly: the C compiler will do so automatically.  However, the
2582 preprocessor is sometimes useful on its own.
2583
2584 @ignore
2585 @c man begin SYNOPSIS
2586 cpp [@samp{-P}] [@samp{-C}] [@samp{-gcc}] [@samp{-traditional}]
2587     [@samp{-undef}] [@samp{-trigraphs}] [@samp{-pedantic}]
2588     [@samp{-W}@var{warn}...] [@samp{-I}@var{dir}...]
2589     [@samp{-D}@var{macro}[=@var{defn}]...] [@samp{-U}@var{macro}]
2590     [@samp{-A}@var{predicate}(@var{answer})]
2591     [@samp{-M}|@samp{-MM}|@samp{-MD}|@samp{-MMD} [@samp{-MG}]]
2592     [@samp{-x} @var{language}] [@samp{-std=}@var{standard}]
2593     @var{infile} @var{outfile}
2594
2595 Only the most useful options are listed here; see below for the remainder.
2596 @c man end
2597 @c man begin SEEALSO
2598 gcc(1), as(1), ld(1), and the Info entries for @file{cpp}, @file{gcc}, and
2599 @file{binutils}.
2600 @c man end
2601 @end ignore
2602
2603 @c man begin OPTIONS
2604 The C preprocessor expects two file names as arguments, @var{infile} and
2605 @var{outfile}.  The preprocessor reads @var{infile} together with any other
2606 files it specifies with @samp{#include}.  All the output generated by the
2607 combined input files is written in @var{outfile}.
2608
2609 Either @var{infile} or @var{outfile} may be @samp{-}, which as
2610 @var{infile} means to read from standard input and as @var{outfile}
2611 means to write to standard output.  Also, if either file is omitted, it
2612 means the same as if @samp{-} had been specified for that file.
2613
2614 @cindex options
2615 Here is a table of command options accepted by the C preprocessor.
2616 These options can also be given when compiling a C program; they are
2617 passed along automatically to the preprocessor when it is invoked by the
2618 compiler.
2619
2620 @table @samp
2621 @item -P
2622 @findex -P
2623 Inhibit generation of @samp{#}-lines with line-number information in
2624 the output from the preprocessor (@pxref{Output}).  This might be
2625 useful when running the preprocessor on something that is not C code
2626 and will be sent to a program which might be confused by the
2627 @samp{#}-lines.
2628
2629 @item -C
2630 @findex -C
2631 Do not discard comments: pass them through to the output file.
2632 Comments appearing in arguments of a macro call will be copied to the
2633 output before the expansion of the macro call.
2634
2635 @item -traditional
2636 @findex -traditional
2637 Try to imitate the behavior of old-fashioned C, as opposed to ANSI C@.
2638
2639 @itemize @bullet
2640 @item
2641 Traditional macro expansion pays no attention to singlequote or
2642 doublequote characters; macro argument symbols are replaced by the
2643 argument values even when they appear within apparent string or
2644 character constants.
2645
2646 @item
2647 Traditionally, it is permissible for a macro expansion to end in the
2648 middle of a string or character constant.  The constant continues into
2649 the text surrounding the macro call.
2650
2651 @item
2652 However, traditionally the end of the line terminates a string or
2653 character constant, with no error.
2654
2655 @item
2656 In traditional C, a comment is equivalent to no text at all.  (In ANSI
2657 C, a comment counts as whitespace.)
2658
2659 @item
2660 Traditional C does not have the concept of a ``preprocessing number''.
2661 It considers @samp{1.0e+4} to be three tokens: @samp{1.0e}, @samp{+},
2662 and @samp{4}.
2663
2664 @item
2665 A macro is not suppressed within its own definition, in traditional C@.
2666 Thus, any macro that is used recursively inevitably causes an error.
2667
2668 @item
2669 The character @samp{#} has no special meaning within a macro definition
2670 in traditional C@.
2671
2672 @item
2673 In traditional C, the text at the end of a macro expansion can run
2674 together with the text after the macro call, to produce a single token.
2675 (This is impossible in ANSI C@.)
2676
2677 @item
2678 Traditionally, @samp{\} inside a macro argument suppresses the syntactic
2679 significance of the following character.
2680 @end itemize
2681
2682 @cindex Fortran
2683 @cindex unterminated
2684 Use the @samp{-traditional} option when preprocessing Fortran code,
2685 so that singlequotes and doublequotes
2686 within Fortran comment lines
2687 (which are generally not recognized as such by the preprocessor)
2688 do not cause diagnostics
2689 about unterminated character or string constants.
2690
2691 However, this option does not prevent diagnostics
2692 about unterminated comments
2693 when a C-style comment appears to start, but not end,
2694 within Fortran-style commentary.
2695
2696 So, the following Fortran comment lines are accepted with
2697 @samp{-traditional}:
2698
2699 @smallexample
2700 C This isn't an unterminated character constant
2701 C Neither is "20000000000, an octal constant
2702 C in some dialects of Fortran
2703 @end smallexample
2704
2705 However, this type of comment line will likely produce a diagnostic,
2706 or at least unexpected output from the preprocessor,
2707 due to the unterminated comment:
2708
2709 @smallexample
2710 C Some Fortran compilers accept /* as starting
2711 C an inline comment.
2712 @end smallexample
2713
2714 @cindex g77
2715 Note that @code{g77} automatically supplies
2716 the @samp{-traditional} option
2717 when it invokes the preprocessor.
2718 However, a future version of @code{g77}
2719 might use a different, more-Fortran-aware preprocessor
2720 in place of @code{cpp}.
2721
2722 @item -trigraphs
2723 @findex -trigraphs
2724 Process ANSI standard trigraph sequences.  These are three-character
2725 sequences, all starting with @samp{??}, that are defined by ANSI C to
2726 stand for single characters.  For example, @samp{??/} stands for
2727 @samp{\}, so @samp{'??/n'} is a character constant for a newline.
2728 Strictly speaking, the GNU C preprocessor does not support all
2729 programs in ANSI Standard C unless @samp{-trigraphs} is used, but if
2730 you ever notice the difference it will be with relief.
2731
2732 You don't want to know any more about trigraphs.
2733
2734 @item -pedantic
2735 @findex -pedantic
2736 Issue warnings required by the ANSI C standard in certain cases such
2737 as when text other than a comment follows @samp{#else} or @samp{#endif}.
2738
2739 @item -pedantic-errors
2740 @findex -pedantic-errors
2741 Like @samp{-pedantic}, except that errors are produced rather than
2742 warnings.
2743
2744 @item -Wtrigraphs
2745 @findex -Wtrigraphs
2746 Warn if any trigraphs are encountered.  Currently this only works if you
2747 have turned trigraphs on with @samp{-trigraphs} or @samp{-ansi}; in the
2748 future this restriction will be removed.
2749
2750 @item -Wcomment
2751 @findex -Wcomment
2752 @ignore
2753 @c "Not worth documenting" both singular and plural forms of this
2754 @c option, per RMS.  But also unclear which is better; hence may need to
2755 @c switch this at some future date.  pesch@cygnus.com, 2jan92.
2756 @itemx -Wcomments
2757 (Both forms have the same effect).
2758 @end ignore
2759 Warn whenever a comment-start sequence @samp{/*} appears in a @samp{/*}
2760 comment, or whenever a Backslash-Newline appears in a @samp{//} comment.
2761
2762 @item -Wall
2763 @findex -Wall
2764 Requests both @samp{-Wtrigraphs} and @samp{-Wcomment} (but not
2765 @samp{-Wtraditional} or @samp{-Wundef}). 
2766
2767 @item -Wtraditional
2768 @findex -Wtraditional
2769 Warn about certain constructs that behave differently in traditional and
2770 ANSI C@.
2771
2772 @item -Wundef
2773 @findex -Wundef
2774 Warn if an undefined identifier is evaluated in an @samp{#if} directive.
2775
2776 @item -I @var{directory}
2777 @findex -I
2778 Add the directory @var{directory} to the head of the list of
2779 directories to be searched for header files (@pxref{Include Syntax}).
2780 This can be used to override a system header file, substituting your
2781 own version, since these directories are searched before the system
2782 header file directories.  If you use more than one @samp{-I} option,
2783 the directories are scanned in left-to-right order; the standard
2784 system directories come after.
2785
2786 @item -I-
2787 Any directories specified with @samp{-I} options before the @samp{-I-}
2788 option are searched only for the case of @samp{#include "@var{file}"};
2789 they are not searched for @samp{#include <@var{file}>}.
2790
2791 If additional directories are specified with @samp{-I} options after
2792 the @samp{-I-}, these directories are searched for all @samp{#include}
2793 directives.
2794
2795 In addition, the @samp{-I-} option inhibits the use of the current
2796 directory as the first search directory for @samp{#include "@var{file}"}.
2797 Therefore, the current directory is searched only if it is requested
2798 explicitly with @samp{-I.}.  Specifying both @samp{-I-} and @samp{-I.}
2799 allows you to control precisely which directories are searched before
2800 the current one and which are searched after.
2801
2802 @item -nostdinc
2803 @findex -nostdinc
2804 Do not search the standard system directories for header files.
2805 Only the directories you have specified with @samp{-I} options
2806 (and the current directory, if appropriate) are searched.
2807
2808 @item -nostdinc++
2809 @findex -nostdinc++
2810 Do not search for header files in the C++-specific standard directories,
2811 but do still search the other standard directories.
2812 (This option is used when building the C++ library.)
2813
2814 @item -remap
2815 @findex -remap
2816 When searching for a header file in a directory, remap file names if a
2817 file named @file{header.gcc} exists in that directory.  This can be used
2818 to work around limitations of file systems with file name restrictions.
2819 The @file{header.gcc} file should contain a series of lines with two
2820 tokens on each line: the first token is the name to map, and the second
2821 token is the actual name to use.
2822
2823 @item -D @var{name}
2824 @findex -D
2825 Predefine @var{name} as a macro, with definition @samp{1}.
2826
2827 @item -D @var{name}=@var{definition}
2828 Predefine @var{name} as a macro, with definition @var{definition}.
2829 There are no restrictions on the contents of @var{definition}, but if
2830 you are invoking the preprocessor from a shell or shell-like program you
2831 may need to use the shell's quoting syntax to protect characters such as
2832 spaces that have a meaning in the shell syntax.  If you use more than
2833 one @samp{-D} for the same @var{name}, the rightmost definition takes
2834 effect.
2835
2836 @item -U @var{name}
2837 @findex -U
2838 Do not predefine @var{name}.  If both @samp{-U} and @samp{-D} are
2839 specified for one name, whichever one appears later on the command line
2840 wins.
2841
2842 @item -undef
2843 @findex -undef
2844 Do not predefine any nonstandard macros.
2845
2846 @item -gcc
2847 @findex -gcc
2848 Define the macros @var{__GNUC__} and @var{__GNUC_MINOR__}.  These are
2849 defined automatically when you use @samp{gcc -E}; you can turn them off
2850 in that case with @samp{-no-gcc}.
2851
2852 @item -A @var{predicate}(@var{answer})
2853 @findex -A
2854 Make an assertion with the predicate @var{predicate} and answer
2855 @var{answer}.  @xref{Assertions}.
2856
2857 @noindent
2858 You can use @samp{-A-} to disable all predefined assertions; it also
2859 undefines all predefined macros and all macros that preceded it on the
2860 command line.
2861
2862 @item -dM
2863 @findex -dM
2864 Instead of outputting the result of preprocessing, output a list of
2865 @samp{#define} directives for all the macros defined during the
2866 execution of the preprocessor, including predefined macros.  This gives
2867 you a way of finding out what is predefined in your version of the
2868 preprocessor; assuming you have no file @samp{foo.h}, the command
2869
2870 @example
2871 touch foo.h; cpp -dM foo.h
2872 @end example
2873
2874 @noindent 
2875 will show the values of any predefined macros.
2876
2877 @item -dD
2878 @findex -dD
2879 Like @samp{-dM} except in two respects: it does @emph{not} include the
2880 predefined macros, and it outputs @emph{both} the @samp{#define}
2881 directives and the result of preprocessing.  Both kinds of output go to
2882 the standard output file.
2883
2884 @item -dI
2885 @findex -dI
2886 Output @samp{#include} directives in addition to the result of preprocessing.
2887
2888 @item -M [-MG]
2889 @findex -M
2890 Instead of outputting the result of preprocessing, output a rule
2891 suitable for @code{make} describing the dependencies of the main
2892 source file.  The preprocessor outputs one @code{make} rule containing
2893 the object file name for that source file, a colon, and the names of
2894 all the included files.  If there are many included files then the
2895 rule is split into several lines using @samp{\}-newline.
2896
2897 @samp{-MG} says to treat missing header files as generated files and assume
2898 they live in the same directory as the source file.  It must be specified
2899 in addition to @samp{-M}.
2900
2901 This feature is used in automatic updating of makefiles.
2902
2903 @item -MM [-MG]
2904 @findex -MM
2905 Like @samp{-M} but mention only the files included with @samp{#include
2906 "@var{file}"}.  System header files included with @samp{#include
2907 <@var{file}>} are omitted.
2908
2909 @item -MD @var{file}
2910 @findex -MD
2911 Like @samp{-M} but the dependency information is written to @var{file}.
2912 This is in addition to compiling the file as specified---@samp{-MD} does
2913 not inhibit ordinary compilation the way @samp{-M} does.
2914
2915 When invoking @code{gcc}, do not specify the @var{file} argument.
2916 @code{gcc} will create file names made by replacing ".c" with ".d" at
2917 the end of the input file names.
2918
2919 In Mach, you can use the utility @code{md} to merge multiple dependency
2920 files into a single dependency file suitable for using with the @samp{make}
2921 command.
2922
2923 @item -MMD @var{file}
2924 @findex -MMD
2925 Like @samp{-MD} except mention only user header files, not system
2926 header files.
2927
2928 @item -H
2929 @findex -H
2930 Print the name of each header file used, in addition to other normal
2931 activities.
2932
2933 @item -imacros @var{file}
2934 @findex -imacros
2935 Process @var{file} as input, discarding the resulting output, before
2936 processing the regular input file.  Because the output generated from
2937 @var{file} is discarded, the only effect of @samp{-imacros @var{file}}
2938 is to make the macros defined in @var{file} available for use in the
2939 main input.
2940
2941 @item -include @var{file}
2942 @findex -include
2943 Process @var{file} as input, and include all the resulting output,
2944 before processing the regular input file.  
2945
2946 @item -idirafter @var{dir}
2947 @findex -idirafter
2948 @cindex second include path
2949 Add the directory @var{dir} to the second include path.  The directories
2950 on the second include path are searched when a header file is not found
2951 in any of the directories in the main include path (the one that
2952 @samp{-I} adds to).
2953
2954 @item -iprefix @var{prefix}
2955 @findex -iprefix
2956 Specify @var{prefix} as the prefix for subsequent @samp{-iwithprefix}
2957 options.
2958
2959 @item -iwithprefix @var{dir}
2960 @findex -iwithprefix
2961 Add a directory to the second include path.  The directory's name is
2962 made by concatenating @var{prefix} and @var{dir}, where @var{prefix}
2963 was specified previously with @samp{-iprefix}.
2964
2965 @item -isystem @var{dir}
2966 @findex -isystem
2967 Add a directory to the beginning of the second include path, marking it
2968 as a system directory, so that it gets the same special treatment as
2969 is applied to the standard system directories.
2970
2971 @item -x c
2972 @itemx -x c++
2973 @itemx -x objective-c
2974 @itemx -x assembler-with-cpp
2975 @findex -x c
2976 @findex -x objective-c
2977 @findex -x assembler-with-cpp
2978 Specify the source language: C, C++, Objective-C, or assembly.  This has
2979 nothing to do with standards conformance or extensions; it merely
2980 selects which base syntax to expect.  If you give none of these options,
2981 cpp will deduce the language from the extension of the source file:
2982 @samp{.c}, @samp{.cc}, @samp{.m}, or @samp{.S}.  Some other common
2983 extensions for C++ and assembly are also recognized.  If cpp does not
2984 recognize the extension, it will treat the file as C; this is the most
2985 generic mode.
2986
2987 @strong{Note:} Previous versions of cpp accepted a @samp{-lang} option
2988 which selected both the language and the standards conformance level.
2989 This option has been removed, because it conflicts with the @samp{-l}
2990 option.
2991
2992 @item -std=@var{standard}
2993 @itemx -ansi
2994 @findex -std
2995 @findex -ansi
2996 Specify the standard to which the code should conform.  Currently cpp
2997 only knows about the standards for C; other language standards will be
2998 added in the future.
2999
3000 @var{standard}
3001 may be one of:
3002 @table @code
3003 @item iso9899:1990
3004 The ISO C standard from 1990.
3005
3006 @item iso9899:199409
3007 @itemx c89
3008 The 1990 C standard, as amended in 1994.  @samp{c89} is the customary
3009 shorthand for this version of the standard.
3010
3011 The @samp{-ansi} option is equivalent to @samp{-std=c89}.
3012
3013 @item iso9899:199x
3014 @itemx c9x
3015 The revised ISO C standard, which is expected to be promulgated some
3016 time in 1999.  It has not been approved yet, hence the @samp{x}.
3017
3018 @item gnu89
3019 The 1990 C standard plus GNU extensions.  This is the default.
3020
3021 @item gnu9x
3022 The 199x C standard plus GNU extensions.
3023 @end table
3024
3025 @item -Wp,-lint
3026 @findex -lint
3027 Look for commands to the program checker @code{lint} embedded in
3028 comments, and emit them preceded by @samp{#pragma lint}.  For example,
3029 the comment @samp{/* NOTREACHED */} becomes @samp{#pragma lint
3030 NOTREACHED}.
3031
3032 Because of the clash with @samp{-l}, you must use the awkward syntax
3033 above.  In a future release, this option will be replaced by
3034 @samp{-flint} or @samp{-Wlint}; we are not sure which yet.
3035
3036 @item -$
3037 @findex -$
3038 Forbid the use of @samp{$} in identifiers.  The C standard does not
3039 permit this, but it is a common extension.
3040 @end table
3041 @c man end
3042
3043 @node Concept Index, Index, Invocation, Top
3044 @unnumbered Concept Index
3045 @printindex cp
3046
3047 @node Index,, Concept Index, Top
3048 @unnumbered Index of Directives, Macros and Options
3049 @printindex fn
3050
3051 @contents
3052 @bye