OSDN Git Service

2001-04-10 Andrew MacLeod <amacleod@redhat.com>
[pf3gnuchains/gcc-fork.git] / gcc / cpp.texi
1 \input texinfo
2 @setfilename cpp.info
3 @settitle The C Preprocessor
4
5 @ifinfo
6 @dircategory Programming
7 @direntry
8 * Cpp: (cpp).                  The GNU C preprocessor.
9 @end direntry
10 @end ifinfo
11
12 @c @smallbook
13 @c @cropmarks
14 @c @finalout
15 @setchapternewpage odd
16 @ifinfo
17 This file documents the GNU C Preprocessor.
18
19 Copyright 1987, 1989, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998,
20 1999, 2000, 2001 Free Software Foundation, Inc.
21
22 Permission is granted to make and distribute verbatim copies of
23 this manual provided the copyright notice and this permission notice
24 are preserved on all copies.
25
26 @ignore
27 Permission is granted to process this file through Tex and print the
28 results, provided the printed document carries copying permission
29 notice identical to this one except for the removal of this paragraph
30 (this paragraph not being relevant to the printed manual).
31
32 @end ignore
33 Permission is granted to copy and distribute modified versions of this
34 manual under the conditions for verbatim copying, provided also that
35 the entire resulting derived work is distributed under the terms of a
36 permission notice identical to this one.
37
38 Permission is granted to copy and distribute translations of this manual
39 into another language, under the above conditions for modified versions.
40 @end ifinfo
41
42 @titlepage
43 @c @finalout
44 @title The C Preprocessor
45 @subtitle Last revised January 2001
46 @subtitle for GCC version 3
47 @author Richard M. Stallman
48 @page
49 @vskip 2pc
50 This booklet is eventually intended to form the first chapter of a GNU 
51 C Language manual.
52
53 @vskip 0pt plus 1filll
54 @c man begin COPYRIGHT
55 Copyright @copyright{} 1987, 1989, 1991, 1992, 1993, 1994, 1995, 1996,
56 1997, 1998, 1999, 2000, 2001
57 Free Software Foundation, Inc.
58
59 Permission is granted to make and distribute verbatim copies of
60 this manual provided the copyright notice and this permission notice
61 are preserved on all copies.
62
63 Permission is granted to copy and distribute modified versions of this
64 manual under the conditions for verbatim copying, provided also that
65 the entire resulting derived work is distributed under the terms of a
66 permission notice identical to this one.
67
68 Permission is granted to copy and distribute translations of this manual
69 into another language, under the above conditions for modified versions.
70 @c man end
71 @end titlepage
72 @page
73
74 @node Top, Global Actions,, (DIR)
75 @chapter The C Preprocessor
76 @c man begin DESCRIPTION
77
78 The C preprocessor is a @dfn{macro processor} that is used automatically
79 by the C compiler to transform your program before actual compilation.
80 It is called a macro processor because it allows you to define
81 @dfn{macros}, which are brief abbreviations for longer constructs.
82
83 The C preprocessor is intended only for macro processing of C, C++ and
84 Objective C source files.  For macro processing of other files, you are
85 strongly encouraged to use alternatives like M4, which will likely give
86 you better results and avoid many problems.  For example, normally the C
87 preprocessor does not preserve arbitrary whitespace verbatim, but
88 instead replaces each sequence with a single space.
89
90 For use on C-like source files, the C preprocessor provides four
91 separate facilities that you can use as you see fit:
92
93 @itemize @bullet
94 @item
95 Inclusion of header files.  These are files of declarations that can be
96 substituted into your program.
97
98 @item
99 Macro expansion.  You can define @dfn{macros}, which are abbreviations
100 for arbitrary fragments of C code, and then the C preprocessor will
101 replace the macros with their definitions throughout the program.
102
103 @item
104 Conditional compilation.  Using special preprocessing directives, you
105 can include or exclude parts of the program according to various
106 conditions.
107
108 @item
109 Line control.  If you use a program to combine or rearrange source files
110 into an intermediate file which is then compiled, you can use line
111 control to inform the compiler of where each source line originally came
112 from.
113 @end itemize
114
115 C preprocessors vary in some details.  This manual discusses the GNU C
116 preprocessor, which provides a small superset of the features of ISO
117 Standard C@.
118
119 In its default mode, the GNU C preprocessor does not do a few things
120 required by the standard.  These are features which are rarely, if ever,
121 used, and may cause surprising changes to the meaning of a program which
122 does not expect them.  To get strict ISO Standard C, you should use the
123 @samp{-std=c89} or @samp{-std=c99} options, depending on which version
124 of the standard you want.  To get all the mandatory diagnostics, you
125 must also use @samp{-pedantic}.  @xref{Invocation}.
126
127 @c man end
128
129 @menu
130 * Global Actions::       Actions made uniformly on all input files.
131 * Directives::           General syntax of preprocessing directives.
132 * Header Files::         How and why to use header files.
133 * Macros::               How and why to use macros.
134 * Conditionals::         How and why to use conditionals.
135 * Assertions::           How and why to use assertions.
136 * Line Control::         Use of line control when you combine source files.
137 * Other Directives::     Miscellaneous preprocessing directives.
138 * Output::               Format of output from the C preprocessor.
139 * Implementation::       Implementation limits and behavior.
140 * Unreliable Features::  Undefined behavior and deprecated features.
141 * Invocation::           How to invoke the preprocessor; command options.
142 * Concept Index::        Index of concepts and terms.
143 * Index::                Index of directives, predefined macros and options.
144 @end menu
145
146 @node Global Actions, Directives, Top, Top
147 @section Transformations Made Globally
148 @cindex ASCII NUL handling
149
150 Most C preprocessor features are inactive unless you give specific
151 directives to request their use.  (Preprocessing directives are lines
152 starting with a @samp{#} token, possibly preceded by whitespace;
153 @pxref{Directives}).  However, there are four transformations that the
154 preprocessor always makes on all the input it receives, even in the
155 absence of directives.  These are, in order:
156
157 @enumerate
158 @item
159 Trigraphs, if enabled, are replaced with the character they represent.
160
161 @item
162 Backslash-newline sequences are deleted, no matter where.  This
163 feature allows you to break long lines for cosmetic purposes without
164 changing their meaning.
165
166 Recently, the non-traditional preprocessor has relaxed its treatment of
167 escaped newlines.  Previously, the newline had to immediately follow a
168 backslash.  The current implementation allows whitespace in the form of
169 spaces, horizontal and vertical tabs, and form feeds between the
170 backslash and the subsequent newline.  The preprocessor issues a
171 warning, but treats it as a valid escaped newline and combines the two
172 lines to form a single logical line.  This works within comments and
173 tokens, as well as between tokens.  Comments are @emph{not} treated as
174 whitespace for the purposes of this relaxation, since they have not yet
175 been replaced with spaces.
176
177 @item
178 All comments are replaced with single spaces.
179
180 @item
181 Predefined macro names are replaced with their expansions
182 (@pxref{Predefined}).
183 @end enumerate
184
185 For end-of-line indicators, any of \n, \r\n, \n\r and \r are recognised,
186 and treated as ending a single line.  As a result, if you mix these in a
187 single file you might get incorrect line numbering, because the
188 preprocessor would interpret the two-character versions as ending just
189 one line.  Previous implementations would only handle UNIX-style \n
190 correctly, so DOS-style \r\n would need to be passed through a filter
191 first.
192
193 The first three transformations are done @emph{before} all other parsing
194 and before preprocessing directives are recognized.  Thus, for example,
195 you can split a line mechanically with backslash-newline anywhere
196 (except within trigraphs since they are replaced first; see below).
197
198 @example
199 /*
200 */ # /*
201 */ defi\
202 ne FO\
203 O 10\
204 20
205 @end example
206
207 @noindent
208 is equivalent into @samp{#define FOO 1020}.
209
210 There is no way to prevent a backslash at the end of a line from being
211 interpreted as a backslash-newline.  For example,
212
213 @example
214 "foo\\
215 bar"
216 @end example
217
218 is equivalent to @code{"foo\bar"}, not to @code{"foo\\bar"}.  To avoid
219 having to worry about this, do not use the deprecated GNU extension
220 which permits multi-line strings.  Instead, use string literal
221 concatenation:
222
223 @example
224    "foo\\"
225    "bar"
226 @end example
227
228 Your program will be more portable this way, too.
229
230 There are a few things to note about the above four transformations.
231
232 @itemize @bullet
233 @item
234 Comments and predefined macro names (or any macro names, for that
235 matter) are not recognized inside the argument of an @samp{#include}
236 directive, when it is delimited with quotes or with @samp{<} and
237 @samp{>}.
238
239 @item
240 Comments and predefined macro names are never recognized within a
241 character or string constant.
242
243 @item
244 ISO ``trigraphs'' are converted before backslash-newlines are deleted.
245 If you write what looks like a trigraph with a backslash-newline inside,
246 the backslash-newline is deleted as usual, but it is too late to
247 recognize the trigraph.
248
249 This is relevant only if you use the @samp{-trigraphs} option to enable
250 trigraph processing.  @xref{Invocation}.
251 @end itemize
252
253 The preprocessor handles null characters embedded in the input file
254 depending upon the context in which the null appears.  Note that here we
255 are referring not to the two-character escape sequence "\0", but to the
256 single character ASCII NUL.
257
258 There are three different contexts in which a null character may
259 appear:
260
261 @itemize @bullet
262 @item
263 Within comments.  Here, null characters are silently ignored.
264
265 @item
266 Within a string or character constant.  Here the preprocessor emits a
267 warning, but preserves the null character and passes it through to the
268 output file or compiler front-end.
269
270 @item
271 In any other context, the preprocessor issues a warning, and discards
272 the null character.  The preprocessor treats it like whitespace,
273 combining it with any surrounding whitespace to become a single
274 whitespace block.  Representing the null character by "^@@", this means
275 that code like
276
277 @example
278 #define X^@@1
279 @end example
280
281 is equivalent to
282
283 @example
284 #define X 1
285 @end example
286
287 and X is defined with replacement text "1".
288 @end itemize
289
290 @node Directives, Header Files, Global Actions, Top
291 @section Preprocessing Directives
292
293 @cindex preprocessing directives
294 @cindex directives
295 Most preprocessor features are active only if you use preprocessing
296 directives to request their use.
297
298 Preprocessing directives are lines in your program that start with
299 @samp{#}.  Whitespace is allowed before and after the @samp{#}.  The
300 @samp{#} is followed by an identifier that is the @dfn{directive name}.
301 For example, @samp{#define} is the directive that defines a macro.
302
303 Since the @samp{#} must be the first token on the line, it cannot come
304 from a macro expansion if you wish it to begin a directive.  Also, the
305 directive name is not macro expanded.  Thus, if @samp{foo} is defined as
306 a macro expanding to @samp{define}, that does not make @samp{#foo} a
307 valid preprocessing directive.
308
309 The set of valid directive names is fixed.  Programs cannot define new
310 preprocessing directives.
311
312 Some directive names require arguments; these make up the rest of the
313 directive line and must be separated from the directive name by
314 whitespace.  For example, @samp{#define} must be followed by a macro
315 name and the intended expansion of the macro.  @xref{Object-like
316 Macros}.
317
318 A preprocessing directive cannot cover more than one line.  It may be
319 logically extended with backslash-newline, but that has no effect on its
320 meaning.  Comments containing newlines can also divide the directive
321 into multiple lines, but a comment is replaced by a single space before
322 the directive is interpreted.
323
324 @node Header Files, Macros, Directives, Top
325 @section Header Files
326
327 @cindex header file
328 A header file is a file containing C declarations and macro definitions
329 (@pxref{Macros}) to be shared between several source files.  You request
330 the use of a header file in your program with the C preprocessing
331 directive @samp{#include}.
332
333 @menu
334 * Header Uses::         What header files are used for.
335 * Include Syntax::      How to write @samp{#include} directives.
336 * Include Operation::   What @samp{#include} does.
337 * Once-Only::           Preventing multiple inclusion of one header file.
338 * Inheritance::         Including one header file in another header file.
339 * System Headers::      Special treatment for some header files.
340 @end menu
341
342 @node Header Uses, Include Syntax, Header Files, Header Files
343 @subsection Uses of Header Files
344
345 Header files serve two kinds of purposes.
346
347 @itemize @bullet
348 @item
349 @cindex system header files
350 System header files declare the interfaces to parts of the operating
351 system.  You include them in your program to supply the definitions and
352 declarations you need to invoke system calls and libraries.
353
354 @item
355 Your own header files contain declarations for interfaces between the
356 source files of your program.  Each time you have a group of related
357 declarations and macro definitions all or most of which are needed in
358 several different source files, it is a good idea to create a header
359 file for them.
360 @end itemize
361
362 Including a header file produces the same results in C compilation as
363 copying the header file into each source file that needs it.  Such
364 copying would be time-consuming and error-prone.  With a header file,
365 the related declarations appear in only one place.  If they need to be
366 changed, they can be changed in one place, and programs that include the
367 header file will automatically use the new version when next recompiled.
368 The header file eliminates the labor of finding and changing all the
369 copies as well as the risk that a failure to find one copy will result
370 in inconsistencies within a program.
371
372 The usual convention is to give header files names that end with
373 @file{.h}.  Avoid unusual characters in header file names, as they
374 reduce portability.
375
376 @node Include Syntax, Include Operation, Header Uses, Header Files
377 @subsection The @samp{#include} Directive
378
379 @findex #include
380 Both user and system header files are included using the preprocessing
381 directive @samp{#include}.  It has three variants:
382
383 @table @code
384 @item #include <@var{file}>
385 This variant is used for system header files.  It searches for a file
386 named @var{file} in a list of directories specified by you, then in a
387 standard list of system directories.  You specify directories to search
388 for header files with the command option @samp{-I} (@pxref{Invocation}).
389 The option @samp{-nostdinc} inhibits searching the standard system
390 directories; in this case only the directories you specify are searched.
391
392 The first @samp{>} character terminates the file name.  The file name
393 may contain a @samp{<} character.
394
395 @item #include "@var{file}"
396 This variant is used for header files of your own program.  It searches
397 for a file named @var{file} first in the current directory, then in the
398 same directories used for system header files.  The current directory is
399 the directory of the current input file.  It is tried first because it
400 is presumed to be the location of the files that the current input file
401 refers to.  (If the @samp{-I-} option is used, the special treatment of
402 the current directory is inhibited. @xref{Invocation}.)
403
404 The first @samp{"} character terminates the file name.
405
406 In both these variants, the argument behaves like a string constant in
407 that comments are not recognized, and macro names are not expanded.
408 Thus, in @samp{#include <x/*y>} the @samp{/*} does not start a comment
409 and the directive specifies inclusion of a system header file named
410 @file{x/*y}.
411
412 However, in either variant, if backslashes occur within @var{file}, they
413 are considered ordinary text characters, not escape characters.  None of
414 the character escape sequences appropriate to string constants in C are
415 processed.  Thus, @samp{#include "x\n\\y"} specifies a filename
416 containing three backslashes.
417
418 @item #include @var{anything else}
419 @cindex computed @samp{#include}
420 This variant is called a @dfn{computed #include}.  Any @samp{#include}
421 directive whose argument does not fit the above two forms is a computed
422 include.  The text @var{anything else} is checked for macro calls, which
423 are expanded (@pxref{Macros}).  When this is done, the result must match
424 one of the above two variants --- in particular, the expansion must form
425 a string literal token, or a sequence of tokens surrounded by angle
426 braces. @xref{Implementation}.
427
428 This feature allows you to define a macro which controls the file name
429 to be used at a later point in the program.  One application of this is
430 to allow a site-specific configuration file for your program to specify
431 the names of the system include files to be used.  This can help in
432 porting the program to various operating systems in which the necessary
433 system header files are found in different places.
434 @end table
435
436 @node Include Operation, Once-Only, Include Syntax, Header Files
437 @subsection How @samp{#include} Works
438
439 The @samp{#include} directive works by directing the C preprocessor to
440 scan the specified file as input before continuing with the rest of the
441 current file.  The output from the preprocessor contains the output
442 already generated, followed by the output resulting from the included
443 file, followed by the output that comes from the text after the
444 @samp{#include} directive.  For example, given a header file
445 @file{header.h} as follows,
446
447 @example
448 char *test ();
449 @end example
450
451 @noindent
452 and a main program called @file{program.c} that uses the header file,
453 like this,
454
455 @example
456 int x;
457 #include "header.h"
458
459 main ()
460 @{
461   printf (test ());
462 @}
463 @end example
464
465 @noindent
466 the output generated by the C preprocessor for @file{program.c} as input
467 would be
468
469 @example
470 int x;
471 char *test ();
472
473 main ()
474 @{
475   printf (test ());
476 @}
477 @end example
478
479 Included files are not limited to declarations and macro definitions;
480 those are merely the typical uses.  Any fragment of a C program can be
481 included from another file.  The include file could even contain the
482 beginning of a statement that is concluded in the containing file, or
483 the end of a statement that was started in the including file.  However,
484 a comment or a string or character constant may not start in the
485 included file and finish in the including file.  An unterminated
486 comment, string constant or character constant in an included file is
487 considered to end (with an error message) at the end of the file.
488
489 It is possible for a header file to begin or end a syntactic unit such
490 as a function definition, but that would be very confusing, so don't do
491 it.
492
493 The line following the @samp{#include} directive is always treated as a
494 separate line by the C preprocessor, even if the included file lacks a
495 final newline.
496
497 @node Once-Only, Inheritance, Include Operation, Header Files
498 @subsection Once-Only Include Files
499 @cindex repeated inclusion
500 @cindex including just once
501
502 Very often, one header file includes another.  It can easily result that
503 a certain header file is included more than once.  This may lead to
504 errors, if the header file defines structure types or typedefs, and is
505 certainly wasteful.  Therefore, we often wish to prevent multiple
506 inclusion of a header file.
507
508 The standard way to do this is to enclose the entire real contents of the
509 file in a conditional, like this:
510
511 @example
512 #ifndef FILE_FOO_SEEN
513 #define FILE_FOO_SEEN
514
515 @var{the entire file}
516
517 #endif /* FILE_FOO_SEEN */
518 @end example
519
520 The macro @code{FILE_FOO_SEEN} indicates that the file has been included
521 once already.  In a user header file, the macro name should not begin
522 with @samp{_}.  In a system header file, this name should begin with
523 @samp{__} to avoid conflicts with user programs.  In any kind of header
524 file, the macro name should contain the name of the file and some
525 additional text, to avoid conflicts with other header files.
526
527 The GNU C preprocessor is programmed to notice when a header file uses
528 this particular construct and handle it efficiently.  If a header file
529 is contained entirely in a @samp{#ifndef} conditional, modulo whitespace
530 and comments, then it remembers that fact.  If a subsequent
531 @samp{#include} specifies the same file, and the macro in the
532 @samp{#ifndef} is already defined, then the directive is skipped without
533 processing the specified file at all.
534
535 @findex #import
536 In the Objective C language, there is a variant of @samp{#include}
537 called @samp{#import} which includes a file, but does so at most once.
538 If you use @samp{#import} @emph{instead of} @samp{#include}, then you
539 don't need the conditionals inside the header file to prevent multiple
540 execution of the contents.
541
542 @samp{#import} is obsolete because it is not a well designed feature.
543 It requires the users of a header file --- the applications programmers
544 --- to know that a certain header file should only be included once.  It
545 is much better for the header file's implementor to write the file so
546 that users don't need to know this.  Using @samp{#ifndef} accomplishes
547 this goal.
548
549 @node Inheritance, System Headers, Once-Only, Header Files
550 @subsection Inheritance and Header Files
551 @cindex inheritance
552 @cindex overriding a header file
553
554 @dfn{Inheritance} is what happens when one object or file derives some
555 of its contents by virtual copying from another object or file.  In
556 the case of C header files, inheritance means that one header file 
557 includes another header file and then replaces or adds something.
558
559 If the inheriting header file and the base header file have different
560 names, then inheritance is straightforward: simply write @samp{#include
561 "@var{base}"} in the inheriting file.
562
563 Sometimes it is necessary to give the inheriting file the same name as
564 the base file.  This is less straightforward.
565
566 For example, suppose an application program uses the system header
567 @file{sys/signal.h}, but the version of @file{/usr/include/sys/signal.h}
568 on a particular system doesn't do what the application program expects.
569 It might be convenient to define a ``local'' version, perhaps under the
570 name @file{/usr/local/include/sys/signal.h}, to override or add to the
571 one supplied by the system.
572
573 You can do this by compiling with the option @samp{-I.}, and writing a
574 file @file{sys/signal.h} that does what the application program expects.
575 Making this file include the standard @file{sys/signal.h} is not so easy
576 --- writing @samp{#include <sys/signal.h>} in that file doesn't work,
577 because it includes your own version of the file, not the standard
578 system version.  Used in that file itself, this leads to an infinite
579 recursion and a fatal error in compilation.
580
581 @samp{#include </usr/include/sys/signal.h>} would find the proper file,
582 but that is not clean, since it makes an assumption about where the
583 system header file is found.  This is bad for maintenance, since it
584 means that any change in where the system's header files are kept
585 requires a change somewhere else.
586
587 @findex #include_next
588 The clean way to solve this problem is to use 
589 @samp{#include_next}, which means, ``Include the @emph{next} file with
590 this name.''  This directive works like @samp{#include} except in
591 searching for the specified file: it starts searching the list of header
592 file directories @emph{after} the directory in which the current file
593 was found.
594
595 Suppose you specify @samp{-I /usr/local/include}, and the list of
596 directories to search also includes @file{/usr/include}; and suppose
597 both directories contain @file{sys/signal.h}.  Ordinary @samp{#include
598 <sys/signal.h>} finds the file under @file{/usr/local/include}.  If that
599 file contains @samp{#include_next <sys/signal.h>}, it starts searching
600 after that directory, and finds the file in @file{/usr/include}.
601
602 @samp{#include_next} is a GCC extension and should not be used in
603 programs intended to be portable to other compilers.
604
605 @node System Headers,, Inheritance, Header Files
606 @subsection System Headers
607 @cindex system header files
608
609 The header files declaring interfaces to the operating system and
610 runtime libraries often cannot be written in strictly conforming C.
611 Therefore, GNU C gives code found in @dfn{system headers} special
612 treatment.  Certain categories of warnings are suppressed, notably those
613 enabled by @samp{-pedantic}.
614
615 Normally, only the headers found in specific directories are considered
616 system headers.  The set of these directories is determined when GCC is
617 compiled.  There are, however, two ways to add to the set.
618
619 @findex -isystem
620 The @samp{-isystem} command line option adds its argument to the list of
621 directories to search for headers, just like @samp{-I}.  In addition,
622 any headers found in that directory will be considered system headers.
623 Note that unlike @samp{-I}, you must put a space between @samp{-isystem}
624 and its argument.
625
626 All directories named by @samp{-isystem} are searched @strong{after} all
627 directories named by @samp{-I}, no matter what their order was on the
628 command line.  If the same directory is named by both @samp{-I} and
629 @samp{-isystem}, @samp{-I} wins; it is as if the @samp{-isystem} option
630 had never been specified at all.
631
632 @findex #pragma GCC system_header
633 There is also a directive, @samp{#pragma GCC system_header}, which tells
634 GCC to consider the rest of the current include file a system header, no
635 matter where it was found.  Code that comes before the @samp{#pragma} in
636 the file will not be affected.
637
638 @samp{#pragma GCC system_header} has no effect in the primary source file.
639
640 @node Macros, Conditionals, Header Files, Top
641 @section Macros
642
643 A macro is a sort of abbreviation which you can define once and then
644 use later.  There are many complicated features associated with macros
645 in the C preprocessor.
646
647 @menu
648 * Object-like Macros::   Macros that always expand the same way.
649 * Function-like Macros:: Macros that accept arguments that are substituted
650                          into the macro expansion.
651 * Macro Varargs::        Macros with variable number of arguments.
652 * Predefined::           Predefined macros that are always available.
653 * Stringification::      Macro arguments converted into string constants.
654 * Concatenation::        Building tokens from parts taken from macro arguments.
655 * Undefining::           Cancelling a macro's definition.
656 * Redefining::           Changing a macro's definition.
657 * Poisoning::            Ensuring a macro is never defined or used.
658 * Macro Pitfalls::       Macros can confuse the unwary.  Here we explain
659                            several common problems and strange features.
660 @end menu
661
662 @node Object-like Macros, Function-like Macros, Macros, Macros
663 @subsection Object-like Macros
664 @cindex object-like macro
665 @cindex manifest constant
666
667 An @dfn{object-like macro} is a kind of abbreviation.  It is a name
668 which stands for a fragment of code.  Some people refer to these as
669 @dfn{manifest constants}.
670
671 Before you can use a macro, you must @dfn{define} it explicitly with the
672 @samp{#define} directive.  @samp{#define} is followed by the name of the
673 macro and then the token sequence it should be an abbreviation for,
674 which is variously referred to as the macro's @dfn{body},
675 @dfn{expansion} or @dfn{replacement list}.  For example,
676
677 @example
678 #define BUFFER_SIZE 1020
679 @end example
680
681 @noindent
682 defines a macro named @samp{BUFFER_SIZE} as an abbreviation for the
683 token @samp{1020}.  If somewhere after this @samp{#define} directive
684 there comes a C statement of the form
685
686 @example
687 foo = (char *) xmalloc (BUFFER_SIZE);
688 @end example
689
690 @noindent
691 then the C preprocessor will recognize and @dfn{expand} the macro
692 @samp{BUFFER_SIZE}, resulting in
693
694 @example
695 foo = (char *) xmalloc (1020);
696 @end example
697
698 The use of all upper case for macro names is a standard convention.
699 Programs are easier to read when it is possible to tell at a glance
700 which names are macros.
701
702 Normally, a macro definition can only span a single logical line, like
703 all C preprocessing directives.  Comments within a macro definition may
704 contain newlines, which make no difference since each comment is
705 replaced by a space regardless of its contents.
706
707 Apart from this, there is no restriction on what can go in a macro body
708 provided it decomposes into valid preprocessing tokens.  In particular,
709 parentheses need not balance, and the body need not resemble valid C
710 code.  (If it does not, you may get error messages from the C
711 compiler when you use the macro.)
712
713 The C preprocessor scans your program sequentially, so macro definitions
714 take effect at the place you write them.  Therefore, the following input
715 to the C preprocessor
716
717 @example
718 foo = X;
719 #define X 4
720 bar = X;
721 @end example
722
723 @noindent
724 produces as output
725
726 @example
727 foo = X;
728
729 bar = 4;
730 @end example
731
732 When the preprocessor expands a macro name, the macro's expansion
733 replaces the macro invocation, and the result is re-scanned for more
734 macros to expand.  For example, after
735
736 @example
737 #define BUFSIZE 1020
738 #define TABLESIZE BUFSIZE
739 @end example
740
741 @noindent
742 the name @samp{TABLESIZE} when used in the program would go through two
743 stages of expansion, resulting ultimately in @samp{1020}.
744
745 This is not the same as defining @samp{TABLESIZE} to be @samp{1020}.
746 The @samp{#define} for @samp{TABLESIZE} uses exactly the expansion you
747 specify --- in this case, @samp{BUFSIZE} --- and does not check to see
748 whether it too contains macro names.  Only when you @emph{use}
749 @samp{TABLESIZE} is the result of its expansion scanned for more macro
750 names.  @xref{Cascaded Macros}.
751
752 @node Function-like Macros, Macro Varargs, Object-like Macros, Macros
753 @subsection Macros with Arguments
754 @cindex macros with argument
755 @cindex arguments in macro definitions
756 @cindex function-like macro
757
758 An object-like macro is always replaced by exactly the same tokens each
759 time it is used.  Macros can be made more flexible by taking
760 @dfn{arguments}.  Arguments are fragments of code that you supply each
761 time the macro is used.  These fragments are included in the expansion
762 of the macro according to the directions in the macro definition.  A
763 macro that accepts arguments is called a @dfn{function-like macro}
764 because the syntax for using it looks like a function call.
765
766 @findex #define
767 To define a macro that uses arguments, you write a @samp{#define}
768 directive with a list of @dfn{parameters} in parentheses after the name
769 of the macro.  The parameters must be valid C identifiers, separated by
770 commas and optionally whitespace.  The @samp{(} must follow the macro
771 name immediately, with no space in between.  If you leave a space, you
772 instead define an object-like macro whose expansion begins with a
773 @samp{(}, and often leads to confusing errors at compile time.
774
775 As an example, here is a macro that computes the minimum of two numeric
776 values, as it is defined in many C programs:
777
778 @example
779 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
780 @end example
781
782 @noindent
783 (This is not the best way to define a ``minimum'' macro in GNU C@.
784 @xref{Side Effects}, for more information.)
785
786 To invoke a function-like macro, you write the name of the macro
787 followed by a list of @dfn{arguments} in parentheses, separated by
788 commas.  The invocation of the macro need not be restricted to a single
789 logical line - it can cross as many lines in the source file as you
790 wish.  The number of arguments you give must match the number of
791 parameters in the macro definition; empty arguments are fine.  Examples
792 of use of the macro @samp{min} include @samp{min (1, 2)} and @samp{min
793 (x + 28, *p)}.
794
795 The expansion text of the macro depends on the arguments you use.  Each
796 macro parameter is replaced throughout the macro expansion with the
797 tokens of the corresponding argument.  Leading and trailing argument
798 whitespace is dropped, and all whitespace between the tokens of an
799 argument is reduced to a single space.  Using the same macro @samp{min}
800 defined above, @samp{min (1, 2)} expands into
801
802 @example
803 ((1) < (2) ? (1) : (2))
804 @end example
805
806 @noindent
807 where @samp{1} has been substituted for @samp{X} and @samp{2} for @samp{Y}.
808
809 Likewise, @samp{min (x + 28, *p)} expands into
810
811 @example
812 ((x + 28) < (*p) ? (x + 28) : (*p))
813 @end example
814
815 Parentheses within each argument must balance; a comma within such
816 parentheses does not end the argument.  However, there is no requirement
817 for square brackets or braces to balance, and they do not prevent a
818 comma from separating arguments.  Thus,
819
820 @example
821 macro (array[x = y, x + 1])
822 @end example
823
824 @noindent
825 passes two arguments to @code{macro}: @samp{array[x = y} and @samp{x +
826 1]}.  If you want to supply @samp{array[x = y, x + 1]} as an argument,
827 you must write it as @samp{array[(x = y, x + 1)]}, which is equivalent C
828 code.
829
830 After the arguments have been substituted into the macro body, the
831 resulting expansion replaces the macro invocation, and re-scanned for
832 more macro calls.  Therefore even arguments can contain calls to other
833 macros, either with or without arguments, and even to the same macro.
834 For example, @samp{min (min (a, b), c)} expands into this text:
835
836 @example
837 ((((a) < (b) ? (a) : (b))) < (c)
838  ? (((a) < (b) ? (a) : (b)))
839  : (c))
840 @end example
841
842 @noindent
843 (Line breaks shown here for clarity would not actually be generated.)
844
845 @cindex empty macro arguments
846 If a macro @code{foo} takes one argument, and you want to supply an
847 empty argument, simply supply no preprocessing tokens.  Since whitespace
848 does not form a preprocessing token, it is optional.  For example,
849 @samp{foo ()}, @samp{foo ( )} and @samp{bar (, arg2)}.
850
851 Previous GNU preprocessor implementations and documentation were
852 incorrect on this point, insisting that a function-like macro that takes
853 a single argument be passed a space if an empty argument was required.
854
855 If you use a macro name followed by something other than a @samp{(}
856 (after ignoring any whitespace that might follow), it does not form an
857 invocation of the macro, and the preprocessor does not change what you
858 have written.  Therefore, it is possible for the same identifier to be a
859 variable or function in your program as well as a macro, and you can
860 choose in each instance whether to refer to the macro (if an actual
861 argument list follows) or the variable or function (if an argument list
862 does not follow).  For example,
863
864 @example
865 #define foo(X) X
866 foo bar foo(baz)
867 @end example
868
869 expands to @samp{foo bar baz}.  Such dual use of one name could be
870 confusing and should be avoided except when the two meanings are
871 effectively synonymous: that is, when the name is both a macro and a
872 function and the two have similar effects.  You can think of the name
873 simply as a function; use of the name for purposes other than calling it
874 (such as, to take the address) will refer to the function, while calls
875 will expand the macro and generate better but equivalent code.
876
877 For example, you can use a function named @samp{min} in the same source
878 file that defines the macro.  If you write @samp{&min} with no argument
879 list, you refer to the function.  If you write @samp{min (x, bb)}, with
880 an argument list, the macro is expanded.  If you write @samp{(min) (a,
881 bb)}, where the name @samp{min} is not followed by an open-parenthesis,
882 the macro is not expanded, so you wind up with a call to the function
883 @samp{min}.
884
885 In the definition of a macro with arguments, the list of argument names
886 must follow the macro name immediately with no space in between.  If
887 there is a space after the macro name, the macro is defined as taking no
888 arguments, and all the rest of the line is taken to be the expansion.
889 The reason for this is that it is often useful to define a macro that
890 takes no arguments and whose definition begins with an identifier in
891 parentheses.  This rule makes it possible for you to do either this:
892
893 @example
894 #define FOO(x) - 1 / (x)
895 @end example
896
897 @noindent
898 (which defines @samp{FOO} to take an argument and expand into minus the
899 reciprocal of that argument) or this:
900
901 @example
902 #define BAR (x) - 1 / (x)
903 @end example
904
905 @noindent
906 (which defines @samp{BAR} to take no argument and always expand into
907 @samp{(x) - 1 / (x)}).
908
909 Note that the @emph{uses} of a macro with arguments can have spaces
910 before the left parenthesis; it's the @emph{definition} where it matters
911 whether there is a space.
912
913 @node Macro Varargs, Predefined, Function-like Macros, Macros
914 @subsection Macros with Variable Numbers of Arguments
915 @cindex variable number of arguments
916 @cindex macro with variable arguments
917 @cindex rest argument (in macro)
918
919 In the ISO C standard of 1999, a macro can be declared to accept a
920 variable number of arguments much as a function can.  The syntax for
921 defining the macro is similar to that of a function.  Here is an
922 example:
923
924 @example
925 #define eprintf(...) fprintf (stderr, __VA_ARGS__)
926 @end example
927
928 Here @samp{@dots{}} is a @dfn{variable argument}.  In the invocation of
929 such a macro, it represents the zero or more tokens until the closing
930 parenthesis that ends the invocation, including any commas.  This set of
931 tokens replaces the identifier @code{__VA_ARGS__} in the macro body
932 wherever it appears.  Thus, we have this expansion:
933
934 @example
935 eprintf ("%s:%d: ", input_file_name, line_number)
936 @expansion{}
937 fprintf (stderr, "%s:%d: " , input_file_name, line_number)
938 @end example
939
940 Within a @samp{#define} directive, ISO C mandates that the only place
941 the identifier @code{__VA_ARGS__} can appear is in the replacement list
942 of a variable-argument macro.  It may not be used as a macro name, macro
943 argument name, or within a different type of macro.  It may also be
944 forbidden in open text; the standard is ambiguous.  We recommend you
945 avoid using it except for its defined purpose.
946
947 If your macro is complicated, you may want a more descriptive name for
948 the variable argument than @code{__VA_ARGS__}.  GNU cpp permits this, as
949 an extension.  You may write an argument name immediately before the
950 @samp{@dots{}}; that name is used for the variable argument.  The
951 @code{eprintf} macro above could be written
952
953 @example
954 #define eprintf(args...) fprintf (stderr, args)
955 @end example
956
957 @noindent
958 using this extension.  You cannot use @code{__VA_ARGS__} and this
959 extension in the same macro.
960
961 We might instead have defined eprintf as follows:
962
963 @example
964 #define eprintf(format, ...) fprintf (stderr, format, __VA_ARGS__)
965 @end example
966
967 This formulation looks more descriptive, but cannot be used as flexibly.
968 There is no way to produce expanded output of
969
970 @example
971 fprintf (stderr, "success!\n")
972 @end example
973
974 @noindent
975 because, in standard C, you are not allowed to leave the variable
976 argument out entirely, and passing an empty argument for the variable
977 arguments will not do what you want.  Writing
978
979 @example
980 eprintf ("success!\n", )
981 @end example
982
983 @noindent
984 produces
985
986 @example
987 fprintf (stderr, "success!\n",)
988 @end example
989
990 @noindent
991 where the extra comma originates from the replacement list and not from
992 the arguments to eprintf.
993
994 There is another extension in the GNU C preprocessor which deals with
995 this difficulty.  First, you are allowed to leave the variable argument
996 out entirely:
997
998 @example
999 eprintf ("success!\n")
1000 @end example
1001
1002 Second, the @samp{##} token paste operator has a special meaning when
1003 placed between a comma and a variable argument.  If you write
1004
1005 @example
1006 #define eprintf(format, ...) fprintf (stderr, format, ##__VA_ARGS__)
1007 @end example
1008
1009 and the variable argument is left out when the @samp{eprintf} macro is
1010 used, then the comma before the @samp{##} will be deleted.  This does
1011 @emph{not} happen if you pass an empty argument, nor does it happen if
1012 the token preceding @samp{##} is anything other than a comma.
1013
1014 Previous versions of the preprocessor implemented this extension much
1015 more generally.  We have restricted it in order to minimize the
1016 difference from the C standard.  @xref{Unreliable Features}.
1017
1018 @node Predefined, Stringification, Macro Varargs, Macros
1019 @subsection Predefined Macros
1020
1021 @cindex predefined macros
1022 Several object-like macros are predefined; you use them without
1023 supplying their definitions.  They fall into two classes: standard
1024 macros and system-specific macros.
1025
1026 @menu
1027 * Standard Predefined::     Standard predefined macros.
1028 * Nonstandard Predefined::  Nonstandard predefined macros.
1029 @end menu
1030
1031 @node Standard Predefined, Nonstandard Predefined, Predefined, Predefined
1032 @subsubsection Standard Predefined Macros
1033 @cindex standard predefined macros
1034
1035 The standard predefined macros are available with the same meanings
1036 regardless of the machine or operating system on which you are using GNU
1037 C@.  Their names all start and end with double underscores.  Those
1038 preceding @code{__GNUC__} in this table are standardized by ISO C; the
1039 rest are GNU C extensions.
1040
1041 @table @code
1042 @item __FILE__
1043 @findex __FILE__
1044 This macro expands to the name of the current input file, in the form of
1045 a C string constant.  The precise name returned is the one that was
1046 specified in @samp{#include} or as the input file name argument.  For
1047 example, @samp{"/usr/local/include/myheader.h"} is a possible expansion
1048 of this macro.
1049
1050 @item __LINE__
1051 @findex __LINE__
1052 This macro expands to the current input line number, in the form of a
1053 decimal integer constant.  While we call it a predefined macro, it's
1054 a pretty strange macro, since its ``definition'' changes with each
1055 new line of source code.
1056
1057 This and @samp{__FILE__} are useful in generating an error message to
1058 report an inconsistency detected by the program; the message can state
1059 the source line at which the inconsistency was detected.  For example,
1060
1061 @smallexample
1062 fprintf (stderr, "Internal error: "
1063                  "negative string length "
1064                  "%d at %s, line %d.",
1065          length, __FILE__, __LINE__);
1066 @end smallexample
1067
1068 A @samp{#include} directive changes the expansions of @samp{__FILE__}
1069 and @samp{__LINE__} to correspond to the included file.  At the end of
1070 that file, when processing resumes on the input file that contained
1071 the @samp{#include} directive, the expansions of @samp{__FILE__} and
1072 @samp{__LINE__} revert to the values they had before the
1073 @samp{#include} (but @samp{__LINE__} is then incremented by one as
1074 processing moves to the line after the @samp{#include}).
1075
1076 The expansions of both @samp{__FILE__} and @samp{__LINE__} are altered
1077 if a @samp{#line} directive is used.  @xref{Line Control}.
1078
1079 @item __DATE__
1080 @findex __DATE__
1081 This macro expands to a string constant that describes the date on
1082 which the preprocessor is being run.  The string constant contains
1083 eleven characters and looks like @w{@samp{"Feb  1 1996"}}.
1084 @c After reformatting the above, check that the date remains `Feb  1 1996',
1085 @c all on one line, with two spaces between the `Feb' and the `1'.
1086
1087 @item __TIME__
1088 @findex __TIME__
1089 This macro expands to a string constant that describes the time at
1090 which the preprocessor is being run.  The string constant contains
1091 eight characters and looks like @samp{"23:59:01"}.
1092
1093 @item __STDC__
1094 @findex __STDC__
1095 This macro expands to the constant 1, to signify that this is ISO
1096 Standard C@.  (Whether that is actually true depends on what C compiler
1097 will operate on the output from the preprocessor.)
1098
1099 On some hosts, system include files use a different convention, where
1100 @samp{__STDC__} is normally 0, but is 1 if the user specifies strict
1101 conformance to the C Standard.  The preprocessor follows the host
1102 convention when processing system include files, but when processing
1103 user files it follows the usual GNU C convention.
1104
1105 This macro is not defined if the @samp{-traditional} option is used.
1106
1107 @item __STDC_VERSION__
1108 @findex __STDC_VERSION__
1109 This macro expands to the C Standard's version number, a long integer
1110 constant of the form @samp{@var{yyyy}@var{mm}L} where @var{yyyy} and
1111 @var{mm} are the year and month of the Standard version.  This signifies
1112 which version of the C Standard the preprocessor conforms to.  Like
1113 @samp{__STDC__}, whether this version number is accurate for the entire
1114 implementation depends on what C compiler will operate on the output
1115 from the preprocessor.
1116
1117 This macro is not defined if the @samp{-traditional} option is used.
1118
1119 @item __GNUC__
1120 @findex __GNUC__
1121 This macro is defined if and only if this is GNU C@.  This macro is
1122 defined only when the entire GNU C compiler is in use; if you invoke the
1123 preprocessor directly, @samp{__GNUC__} is undefined.  The value
1124 identifies the major version number of GNU CC (@samp{1} for GNU CC
1125 version 1, which is now obsolete, and @samp{2} for version 2).
1126
1127 @item __GNUC_MINOR__
1128 @findex __GNUC_MINOR__
1129 The macro contains the minor version number of the compiler.  This can
1130 be used to work around differences between different releases of the
1131 compiler (for example, if GCC 2.6.x is known to support a feature, you
1132 can test for @code{__GNUC__ > 2 || (__GNUC__ == 2 && __GNUC_MINOR__ >= 6)}).
1133
1134 @item __GNUC_PATCHLEVEL__
1135 @findex __GNUC_PATCHLEVEL__
1136 This macro contains the patch level of the compiler.  This can be
1137 used to work around differences between different patch level releases
1138 of the compiler (for example, if GCC 2.6.2 is known to contain a bug,
1139 whereas GCC 2.6.3 contains a fix, and you have code which can workaround
1140 the problem depending on whether the bug is fixed or not, you can test for
1141 @code{__GNUC__ > 2 || (__GNUC__ == 2 && __GNUC_MINOR__ > 6) || 
1142 (__GNUC__ == 2 && __GNUC_MINOR__ == 6 && __GNUC_PATCHLEVEL__ >= 3)}).
1143
1144 @item __GNUG__
1145 @findex __GNUG__
1146 The GNU C compiler defines this when the compilation language is
1147 C++; use @samp{__GNUG__} to distinguish between GNU C and GNU
1148 C++.
1149
1150 @item __cplusplus 
1151 @findex __cplusplus 
1152 The ISO standard for C++ requires predefining this variable.  You can
1153 use @samp{__cplusplus} to test whether a header is compiled by a C
1154 compiler or a C++ compiler. The compiler currently uses a value of
1155 @samp{1}, instead of the value @samp{199711L}, which would indicate full
1156 conformance with the standard.
1157
1158 @item __STRICT_ANSI__
1159 @findex __STRICT_ANSI__
1160 GNU C defines this macro if and only if the @option{-ansi} switch, or a
1161 @option{-std} switch specifying strict conformance to some version of ISO C,
1162 was specified when GNU C was invoked.  Its definition is the null string.
1163 This macro exists primarily to direct certain GNU header files not to
1164 define certain traditional Unix constructs which are incompatible with
1165 ISO C@.
1166
1167 @item __BASE_FILE__
1168 @findex __BASE_FILE__
1169 This macro expands to the name of the main input file, in the form
1170 of a C string constant.  This is the source file that was specified
1171 on the command line of the preprocessor or C compiler.
1172
1173 @item __INCLUDE_LEVEL__
1174 @findex __INCLUDE_LEVEL_
1175 This macro expands to a decimal integer constant that represents the
1176 depth of nesting in include files.  The value of this macro is
1177 incremented on every @samp{#include} directive and decremented at the
1178 end of every included file.  It starts out at 0, it's value within the
1179 base file specified on the command line.
1180
1181 @item __VERSION__
1182 @findex __VERSION__
1183 This macro expands to a string constant which describes the version
1184 number of GNU C@.  The string is normally a sequence of decimal numbers
1185 separated by periods, such as @samp{"2.6.0"}.
1186
1187 @item __OPTIMIZE__
1188 @findex __OPTIMIZE__
1189 GNU CC defines this macro in optimizing compilations.  It causes certain
1190 GNU header files to define alternative macro definitions for some system
1191 library functions.  You should not refer to or test the definition of
1192 this macro unless you make very sure that programs will execute with the
1193 same effect regardless.
1194
1195 @item __OPTIMIZE_SIZE__
1196 @findex __OPTIMIZE_SIZE__
1197 GNU CC defines this macro when optimizing for size with @samp{-Os}.  It
1198 causes certain GNU header files to define alternative macro definitions
1199 for some system library functions.  You should not refer to or test the
1200 definition of this macro unless you make very sure that programs will
1201 execute with the same effect regardless.
1202
1203 @item __CHAR_UNSIGNED__
1204 @findex __CHAR_UNSIGNED__
1205 GNU C defines this macro if and only if the data type @code{char} is
1206 unsigned on the target machine.  It exists to cause the standard header
1207 file @file{limits.h} to work correctly.  You should not refer to this
1208 macro yourself; instead, refer to the standard macros defined in
1209 @file{limits.h}.  The preprocessor uses this macro to determine whether
1210 or not to sign-extend large character constants written in octal; see
1211 @ref{#if Directive,,The @samp{#if} Directive}.
1212
1213 @item __REGISTER_PREFIX__
1214 @findex __REGISTER_PREFIX__
1215 This macro expands to a string (not a string constant) describing the
1216 prefix applied to CPU registers in assembler code.  You can use it to
1217 write assembler code that is usable in multiple environments.  For
1218 example, in the @samp{m68k-aout} environment it expands to the null
1219 string, but in the @samp{m68k-coff} environment it expands to the string
1220 @samp{%}.
1221
1222 @item __USER_LABEL_PREFIX__
1223 @findex __USER_LABEL_PREFIX__
1224 Similar to @code{__REGISTER_PREFIX__}, but describes the prefix applied
1225 to user generated labels in assembler code.  For example, in the
1226 @samp{m68k-aout} environment it expands to the string @samp{_}, but in
1227 the @samp{m68k-coff} environment it expands to the null string.  This
1228 does not work with the @samp{-mno-underscores} option that the i386
1229 OSF/rose and m88k targets provide nor with the @samp{-mcall*} options of
1230 the rs6000 System V Release 4 target.
1231 @end table
1232
1233 @node Nonstandard Predefined,, Standard Predefined, Predefined
1234 @subsubsection Nonstandard Predefined Macros
1235
1236 The C preprocessor normally has several predefined macros that vary
1237 between machines because their purpose is to indicate what type of
1238 system and machine is in use.  This manual, being for all systems and
1239 machines, cannot tell you exactly what their names are; instead, we
1240 offer a list of some typical ones.  You can use @samp{cpp -dM} to see
1241 the values of predefined macros; see @ref{Invocation}.
1242
1243 Some nonstandard predefined macros describe the operating system in use,
1244 with more or less specificity.  For example,
1245
1246 @table @code
1247 @item unix
1248 @findex unix
1249 @samp{unix} is normally predefined on all Unix systems.
1250
1251 @item BSD
1252 @findex BSD
1253 @samp{BSD} is predefined on recent versions of Berkeley Unix
1254 (perhaps only in version 4.3).
1255 @end table
1256
1257 Other nonstandard predefined macros describe the kind of CPU, with more or
1258 less specificity.  For example,
1259
1260 @table @code
1261 @item vax
1262 @findex vax
1263 @samp{vax} is predefined on Vax computers.
1264
1265 @item mc68000
1266 @findex mc68000
1267 @samp{mc68000} is predefined on most computers whose CPU is a Motorola
1268 68000, 68010 or 68020.
1269
1270 @item m68k
1271 @findex m68k
1272 @samp{m68k} is also predefined on most computers whose CPU is a 68000,
1273 68010 or 68020; however, some makers use @samp{mc68000} and some use
1274 @samp{m68k}.  Some predefine both names.  What happens in GNU C
1275 depends on the system you are using it on.
1276
1277 @item M68020
1278 @findex M68020
1279 @samp{M68020} has been observed to be predefined on some systems that
1280 use 68020 CPUs --- in addition to @samp{mc68000} and @samp{m68k}, which
1281 are less specific.
1282
1283 @item _AM29K
1284 @findex _AM29K
1285 @itemx _AM29000
1286 @findex _AM29000
1287 Both @samp{_AM29K} and @samp{_AM29000} are predefined for the AMD 29000
1288 CPU family.
1289
1290 @item ns32000
1291 @findex ns32000
1292 @samp{ns32000} is predefined on computers which use the National
1293 Semiconductor 32000 series CPU.
1294 @end table
1295
1296 Yet other nonstandard predefined macros describe the manufacturer of
1297 the system.  For example,
1298
1299 @table @code
1300 @item sun
1301 @findex sun
1302 @samp{sun} is predefined on all models of Sun computers.
1303
1304 @item pyr
1305 @findex pyr
1306 @samp{pyr} is predefined on all models of Pyramid computers.
1307
1308 @item sequent
1309 @findex sequent
1310 @samp{sequent} is predefined on all models of Sequent computers.
1311 @end table
1312
1313 These predefined symbols are not only nonstandard, they are contrary to the
1314 ISO standard because their names do not start with underscores.
1315 Therefore, the option @samp{-ansi} inhibits the definition of these
1316 symbols.
1317
1318 This tends to make @samp{-ansi} useless, since many programs depend on
1319 the customary nonstandard predefined symbols.  Even system header files
1320 check them and will generate incorrect declarations if they do not find
1321 the names that are expected.  You might think that the header files
1322 supplied for the Uglix computer would not need to test what machine they
1323 are running on, because they can simply assume it is the Uglix; but
1324 often they do, and they do so using the customary names.  As a result,
1325 very few C programs will compile with @samp{-ansi}.  We intend to avoid
1326 such problems on the GNU system.
1327
1328 What, then, should you do in an ISO C program to test the type of machine
1329 it will run on?
1330
1331 GNU C offers a parallel series of symbols for this purpose, whose names
1332 are made from the customary ones by adding @samp{__} at the beginning
1333 and end.  Thus, the symbol @code{__vax__} would be available on a Vax,
1334 and so on.
1335
1336 The set of nonstandard predefined names in the GNU C preprocessor is
1337 controlled (when @code{cpp} is itself compiled) by the macro
1338 @samp{CPP_PREDEFINES}, which should be a string containing @samp{-D}
1339 options, separated by spaces.  For example, on the Sun 3, we use the
1340 following definition:
1341
1342 @example
1343 #define CPP_PREDEFINES "-Dmc68000 -Dsun -Dunix -Dm68k"
1344 @end example
1345
1346 @noindent 
1347 This macro is usually specified in @file{tm.h}.
1348
1349 @node Stringification, Concatenation, Predefined, Macros
1350 @subsection Stringification
1351
1352 @cindex stringification
1353 @dfn{Stringification} means turning a sequence of preprocessing tokens
1354 into a string literal.  For example, stringifying @samp{foo (z)} results
1355 in @samp{"foo (z)"}.
1356
1357 In the C preprocessor, stringification is possible when macro arguments
1358 are substituted during macro expansion.  When a parameter appears
1359 preceded by a @samp{#} token in the replacement list of a function-like
1360 macro, it indicates that both tokens should be replaced with the
1361 stringification of the corresponding argument during expansion.  The
1362 same argument may be substituted in other places in the definition
1363 without stringification if the argument name appears in those places
1364 with no preceding @samp{#}.
1365
1366 Here is an example of a macro definition that uses stringification:
1367
1368 @smallexample
1369 @group
1370 #define WARN_IF(EXP) \
1371 do @{ if (EXP) \
1372         fprintf (stderr, "Warning: " #EXP "\n"); @} \
1373 while (0)
1374 @end group
1375 @end smallexample
1376
1377 @noindent
1378 Here the argument for @samp{EXP} is substituted once, as-is, into the
1379 @samp{if} statement, and once, stringified, into the argument to
1380 @samp{fprintf}.  The @samp{do} and @samp{while (0)} are a kludge to make
1381 it possible to write @samp{WARN_IF (@var{arg});}, which the resemblance
1382 of @samp{WARN_IF} to a function would make C programmers want to do; see
1383 @ref{Swallow Semicolon}.
1384
1385 The stringification feature is limited to transforming the tokens of a
1386 macro argument into a string constant: there is no way to combine the
1387 argument with surrounding text and stringify it all together.  The
1388 example above shows how an equivalent result can be obtained in ISO
1389 Standard C, using the fact that adjacent string constants are
1390 concatenated by the C compiler to form a single string constant.  The
1391 preprocessor stringifies the actual value of @samp{EXP} into a separate
1392 string constant, resulting in text like
1393
1394 @smallexample
1395 @group
1396 do @{ if (x == 0) \
1397         fprintf (stderr, "Warning: " "x == 0" "\n"); @} \
1398 while (0)
1399 @end group
1400 @end smallexample
1401
1402 @noindent
1403 but the compiler then sees three consecutive string constants and
1404 concatenates them into one, producing effectively
1405
1406 @smallexample
1407 do @{ if (x == 0) \
1408         fprintf (stderr, "Warning: x == 0\n"); @} \
1409 while (0)
1410 @end smallexample
1411
1412 Stringification in C involves more than putting double-quote characters
1413 around the fragment.  The preprocessor backslash-escapes the surrounding
1414 quotes of string literals, and all backslashes within string and
1415 character constants, in order to get a valid C string constant with the
1416 proper contents.  Thus, stringifying @samp{p = "foo\n";} results in
1417 @samp{"p = \"foo\\n\";"}.  However, backslashes that are not inside
1418 string or character constants are not duplicated: @samp{\n} by itself
1419 stringifies to @samp{"\n"}.
1420
1421 Whitespace (including comments) in the text being stringified is handled
1422 according to precise rules.  All leading and trailing whitespace is
1423 ignored.  Any sequence of whitespace in the middle of the text is
1424 converted to a single space in the stringified result.
1425
1426 @node Concatenation, Undefining, Stringification, Macros
1427 @subsection Concatenation
1428 @cindex concatenation
1429 @cindex @samp{##}
1430 @dfn{Concatenation} means joining two strings into one.  In the context
1431 of macro expansion, concatenation refers to joining two preprocessing
1432 tokens to form one.  In particular, a token of a macro argument can be
1433 concatenated with another argument's token or with fixed text to produce
1434 a longer name.  The longer name might be the name of a function,
1435 variable, type, or a C keyword; it might even be the name of another
1436 macro, in which case it will be expanded.
1437
1438 When you define a function-like or object-like macro, you request
1439 concatenation with the special operator @samp{##} in the macro's
1440 replacement list.  When the macro is called, any arguments are
1441 substituted without performing macro expansion, every @samp{##} operator
1442 is deleted, and the two tokens on either side of it are concatenated to
1443 form a single token.
1444
1445 Consider a C program that interprets named commands.  There probably needs
1446 to be a table of commands, perhaps an array of structures declared as
1447 follows:
1448
1449 @example
1450 struct command
1451 @{
1452   char *name;
1453   void (*function) ();
1454 @};
1455
1456 struct command commands[] =
1457 @{
1458   @{ "quit", quit_command@},
1459   @{ "help", help_command@},
1460   @dots{}
1461 @};
1462 @end example
1463
1464 It would be cleaner not to have to give each command name twice, once in
1465 the string constant and once in the function name.  A macro which takes the
1466 name of a command as an argument can make this unnecessary.  The string
1467 constant can be created with stringification, and the function name by
1468 concatenating the argument with @samp{_command}.  Here is how it is done:
1469
1470 @example
1471 #define COMMAND(NAME)  @{ #NAME, NAME ## _command @}
1472
1473 struct command commands[] =
1474 @{
1475   COMMAND (quit),
1476   COMMAND (help),
1477   @dots{}
1478 @};
1479 @end example
1480
1481 The usual case of concatenation is concatenating two names (or a name
1482 and a number) into a longer name.  This isn't the only valid case.
1483 It is also possible to concatenate two numbers (or a number and a name,
1484 such as @samp{1.5} and @samp{e3}) into a number.  Also, multi-character
1485 operators such as @samp{+=} can be formed by concatenation.  However,
1486 two tokens that don't together form a valid token cannot be
1487 concatenated.  For example, concatenation of @samp{x} on one side and
1488 @samp{+} on the other is not meaningful because those two tokens do not
1489 form a valid preprocessing token when concatenated.  UNDEFINED
1490
1491 Keep in mind that the C preprocessor converts comments to whitespace
1492 before macros are even considered.  Therefore, you cannot create a
1493 comment by concatenating @samp{/} and @samp{*}: the @samp{/*} sequence
1494 that starts a comment is not a token, but rather the beginning of a
1495 comment.  You can freely use comments next to @samp{##} in a macro
1496 definition, or in arguments that will be concatenated, because the
1497 comments will be converted to spaces at first sight, and concatenation
1498 operates on tokens and so ignores whitespace.
1499
1500 @node Undefining, Redefining, Concatenation, Macros
1501 @subsection Undefining Macros
1502
1503 @cindex undefining macros
1504 To @dfn{undefine} a macro means to cancel its definition.  This is done
1505 with the @samp{#undef} directive.  @samp{#undef} is followed by the macro
1506 name to be undefined.
1507
1508 Like definition, undefinition occurs at a specific point in the source
1509 file, and it applies starting from that point.  The name ceases to be a
1510 macro name, and from that point on it is treated by the preprocessor as
1511 if it had never been a macro name.
1512
1513 For example,
1514
1515 @example
1516 #define FOO 4
1517 x = FOO;
1518 #undef FOO
1519 x = FOO;
1520 @end example
1521
1522 @noindent
1523 expands into
1524
1525 @example
1526 x = 4;
1527
1528 x = FOO;
1529 @end example
1530
1531 @noindent
1532 In this example, @samp{FOO} had better be a variable or function as well
1533 as (temporarily) a macro, in order for the result of the expansion to be
1534 valid C code.
1535
1536 The same form of @samp{#undef} directive will cancel definitions with
1537 arguments or definitions that don't expect arguments.  The @samp{#undef}
1538 directive has no effect when used on a name not currently defined as a
1539 macro.
1540
1541 @node Redefining, Poisoning, Undefining, Macros
1542 @subsection Redefining Macros
1543
1544 @cindex redefining macros
1545 @dfn{Redefining} a macro means defining (with @samp{#define}) a name that
1546 is already defined as a macro.
1547
1548 A redefinition is trivial if the new definition is transparently
1549 identical to the old one.  You probably wouldn't deliberately write a
1550 trivial redefinition, but they can happen automatically when a header
1551 file is included more than once (@pxref{Header Files}), so they are
1552 accepted silently and without effect.
1553
1554 Nontrivial redefinition is considered likely to be an error, so it
1555 provokes a warning message from the preprocessor.  However, sometimes it
1556 is useful to change the definition of a macro in mid-compilation.  You
1557 can inhibit the warning by undefining the macro with @samp{#undef}
1558 before the second definition.
1559
1560 In order for a redefinition to be trivial, the parameter names must
1561 match and be in the same order, and the new replacement list must
1562 exactly match the one already in effect, with two possible exceptions:
1563
1564 @itemize @bullet
1565 @item
1566 Whitespace may be added or deleted at the beginning or the end of the
1567 replacement list.  In a sense this is vacuous, since strictly such
1568 whitespace doesn't form part of the macro's expansion.
1569
1570 @item
1571 Between tokens in the expansion, any two forms of whitespace are
1572 considered equivalent.  In particular, whitespace may not be eliminated
1573 entirely, nor may it be added where there previously wasn't any.
1574 @end itemize
1575
1576 Recall that a comment counts as whitespace.
1577
1578 As a particular case of the above, you may not redefine an object-like
1579 macro as a function-like macro, and vice-versa.
1580
1581 @node Poisoning, Macro Pitfalls, Redefining, Macros
1582 @subsection Poisoning Macros
1583 @cindex poisoning macros
1584 @findex #pragma GCC poison
1585
1586 Sometimes, there is an identifier that you want to remove completely
1587 from your program, and make sure that it never creeps back in.  To
1588 enforce this, the @samp{#pragma GCC poison} directive can be used.
1589 @samp{#pragma GCC poison} is followed by a list of identifiers to
1590 poison, and takes effect for the rest of the source.  You cannot
1591 @samp{#undef} a poisoned identifier or test to see if it's defined with
1592 @samp{#ifdef}.
1593
1594 For example,
1595
1596 @example
1597 #pragma GCC poison printf sprintf fprintf
1598 sprintf(some_string, "hello");
1599 @end example
1600
1601 @noindent
1602 will produce an error.
1603
1604 Note, if the poisoned identifier appears through the result of macro
1605 expansion it @emph{won't} cause an error.  So if you poison an
1606 identifier you need not worry about system headers defining macros that
1607 use it.
1608
1609 For example,
1610
1611 @example
1612 #define strrchr rindex
1613 #pragma GCC poison rindex
1614 strrchr(some_string, 'h');
1615 @end example
1616
1617 @noindent
1618 will not produce an error.
1619
1620 @node Macro Pitfalls,, Poisoning, Macros
1621 @subsection Pitfalls and Subtleties of Macros
1622 @cindex problems with macros
1623 @cindex pitfalls of macros
1624
1625 In this section we describe some special rules that apply to macros and
1626 macro expansion, and point out certain cases in which the rules have
1627 counterintuitive consequences that you must watch out for.
1628
1629 @menu
1630 * Misnesting::        Macros can contain unmatched parentheses.
1631 * Macro Parentheses:: Why apparently superfluous parentheses
1632                          may be necessary to avoid incorrect grouping.
1633 * Swallow Semicolon:: Macros that look like functions
1634                          but expand into compound statements.
1635 * Side Effects::      Unsafe macros that cause trouble when
1636                          arguments contain side effects.
1637 * Self-Reference::    Macros whose definitions use the macros' own names.
1638 * Argument Prescan::  Arguments are checked for macro calls before they
1639                          are substituted.
1640 * Cascaded Macros::   Macros whose definitions use other macros.
1641 * Newlines in Args::  Sometimes line numbers get confused.
1642 @end menu
1643
1644 @node Misnesting, Macro Parentheses, Macro Pitfalls, Macro Pitfalls
1645 @subsubsection Improperly Nested Constructs
1646
1647 Recall that when a macro is called with arguments, the arguments are
1648 substituted into the macro body and the result is checked, together with
1649 the rest of the input file, for more macro calls.
1650
1651 It is possible to piece together a macro call coming partially from the
1652 macro body and partially from the arguments.  For example,
1653
1654 @example
1655 #define double(x) (2*(x))
1656 #define call_with_1(x) x(1)
1657 @end example
1658
1659 @noindent
1660 would expand @samp{call_with_1 (double)} into @samp{(2*(1))}.
1661
1662 Macro definitions do not have to have balanced parentheses.  By writing
1663 an unbalanced open parenthesis in a macro body, it is possible to create
1664 a macro call that begins inside the macro body but ends outside of it.
1665 For example,
1666
1667 @example
1668 #define strange(file) fprintf (file, "%s %d",
1669 @dots{}
1670 strange(stderr) p, 35)
1671 @end example
1672
1673 @noindent
1674 This bizarre example expands to @samp{fprintf (stderr, "%s %d", p, 35)}!
1675
1676 @node Macro Parentheses, Swallow Semicolon, Misnesting, Macro Pitfalls
1677 @subsubsection Unintended Grouping of Arithmetic
1678 @cindex parentheses in macro bodies
1679
1680 You may have noticed that in most of the macro definition examples shown
1681 above, each occurrence of a macro argument name had parentheses around
1682 it.  In addition, another pair of parentheses usually surround the
1683 entire macro definition.  Here is why it is best to write macros that
1684 way.
1685
1686 Suppose you define a macro as follows,
1687
1688 @example
1689 #define ceil_div(x, y) (x + y - 1) / y
1690 @end example
1691
1692 @noindent
1693 whose purpose is to divide, rounding up.  (One use for this operation is
1694 to compute how many @samp{int} objects are needed to hold a certain
1695 number of @samp{char} objects.)  Then suppose it is used as follows:
1696
1697 @example
1698 a = ceil_div (b & c, sizeof (int));
1699 @end example
1700
1701 @noindent
1702 This expands into
1703
1704 @example
1705 a = (b & c + sizeof (int) - 1) / sizeof (int);
1706 @end example
1707
1708 @noindent
1709 which does not do what is intended.  The operator-precedence rules of
1710 C make it equivalent to this:
1711
1712 @example
1713 a = (b & (c + sizeof (int) - 1)) / sizeof (int);
1714 @end example
1715
1716 @noindent
1717 What we want is this:
1718
1719 @example
1720 a = ((b & c) + sizeof (int) - 1)) / sizeof (int);
1721 @end example
1722
1723 @noindent
1724 Defining the macro as
1725
1726 @example
1727 #define ceil_div(x, y) ((x) + (y) - 1) / (y)
1728 @end example
1729
1730 @noindent
1731 provides the desired result.
1732
1733 Unintended grouping can result in another way.  Consider @samp{sizeof
1734 ceil_div(1, 2)}.  That has the appearance of a C expression that would
1735 compute the size of the type of @samp{ceil_div (1, 2)}, but in fact it
1736 means something very different.  Here is what it expands to:
1737
1738 @example
1739 sizeof ((1) + (2) - 1) / (2)
1740 @end example
1741
1742 @noindent
1743 This would take the size of an integer and divide it by two.  The
1744 precedence rules have put the division outside the @samp{sizeof} when it
1745 was intended to be inside.
1746
1747 Parentheses around the entire macro definition can prevent such
1748 problems.  Here, then, is the recommended way to define @samp{ceil_div}:
1749
1750 @example
1751 #define ceil_div(x, y) (((x) + (y) - 1) / (y))
1752 @end example
1753
1754 @node Swallow Semicolon, Side Effects, Macro Parentheses, Macro Pitfalls
1755 @subsubsection Swallowing the Semicolon
1756
1757 @cindex semicolons (after macro calls)
1758 Often it is desirable to define a macro that expands into a compound
1759 statement.  Consider, for example, the following macro, that advances a
1760 pointer (the argument @samp{p} says where to find it) across whitespace
1761 characters:
1762
1763 @example
1764 #define SKIP_SPACES(p, limit)  \
1765 @{ register char *lim = (limit); \
1766   while (p != lim) @{            \
1767     if (*p++ != ' ') @{          \
1768       p--; break; @}@}@}
1769 @end example
1770
1771 @noindent
1772 Here backslash-newline is used to split the macro definition, which must
1773 be a single logical line, so that it resembles the way such C code would
1774 be laid out if not part of a macro definition.
1775
1776 A call to this macro might be @samp{SKIP_SPACES (p, lim)}.  Strictly
1777 speaking, the call expands to a compound statement, which is a complete
1778 statement with no need for a semicolon to end it.  However, since it
1779 looks like a function call, it minimizes confusion if you can use it
1780 like a function call, writing a semicolon afterward, as in
1781 @samp{SKIP_SPACES (p, lim);}
1782
1783 This can cause trouble before @samp{else} statements, because the
1784 semicolon is actually a null statement.  Suppose you write
1785
1786 @example
1787 if (*p != 0)
1788   SKIP_SPACES (p, lim);
1789 else @dots{}
1790 @end example
1791
1792 @noindent
1793 The presence of two statements --- the compound statement and a null
1794 statement --- in between the @samp{if} condition and the @samp{else}
1795 makes invalid C code.
1796
1797 The definition of the macro @samp{SKIP_SPACES} can be altered to solve
1798 this problem, using a @samp{do @dots{} while} statement.  Here is how:
1799
1800 @example
1801 #define SKIP_SPACES(p, limit)     \
1802 do @{ register char *lim = (limit); \
1803      while (p != lim) @{            \
1804        if (*p++ != ' ') @{          \
1805          p--; break; @}@}@}           \
1806 while (0)
1807 @end example
1808
1809 Now @samp{SKIP_SPACES (p, lim);} expands into
1810
1811 @example
1812 do @{@dots{}@} while (0);
1813 @end example
1814
1815 @noindent
1816 which is one statement.
1817
1818 @node Side Effects, Self-Reference, Swallow Semicolon, Macro Pitfalls
1819 @subsubsection Duplication of Side Effects
1820
1821 @cindex side effects (in macro arguments)
1822 @cindex unsafe macros
1823 Many C programs define a macro @samp{min}, for ``minimum'', like this:
1824
1825 @example
1826 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
1827 @end example
1828
1829 When you use this macro with an argument containing a side effect,
1830 as shown here,
1831
1832 @example
1833 next = min (x + y, foo (z));
1834 @end example
1835
1836 @noindent
1837 it expands as follows:
1838
1839 @example
1840 next = ((x + y) < (foo (z)) ? (x + y) : (foo (z)));
1841 @end example
1842
1843 @noindent
1844 where @samp{x + y} has been substituted for @samp{X} and @samp{foo (z)}
1845 for @samp{Y}.
1846
1847 The function @samp{foo} is used only once in the statement as it appears
1848 in the program, but the expression @samp{foo (z)} has been substituted
1849 twice into the macro expansion.  As a result, @samp{foo} might be called
1850 two times when the statement is executed.  If it has side effects or if
1851 it takes a long time to compute, the results might not be what you
1852 intended.  We say that @samp{min} is an @dfn{unsafe} macro.
1853
1854 The best solution to this problem is to define @samp{min} in a way that
1855 computes the value of @samp{foo (z)} only once.  The C language offers
1856 no standard way to do this, but it can be done with GNU C extensions as
1857 follows:
1858
1859 @example
1860 #define min(X, Y)                     \
1861 (@{ typeof (X) __x = (X), __y = (Y);   \
1862    (__x < __y) ? __x : __y; @})
1863 @end example
1864
1865 If you do not wish to use GNU C extensions, the only solution is to be
1866 careful when @emph{using} the macro @samp{min}.  For example, you can
1867 calculate the value of @samp{foo (z)}, save it in a variable, and use
1868 that variable in @samp{min}:
1869
1870 @example
1871 #define min(X, Y)  ((X) < (Y) ? (X) : (Y))
1872 @dots{}
1873 @{
1874   int tem = foo (z);
1875   next = min (x + y, tem);
1876 @}
1877 @end example
1878
1879 @noindent
1880 (where we assume that @samp{foo} returns type @samp{int}).
1881
1882 @node Self-Reference, Argument Prescan, Side Effects, Macro Pitfalls
1883 @subsubsection Self-Referential Macros
1884
1885 @cindex self-reference
1886 A @dfn{self-referential} macro is one whose name appears in its
1887 definition.  A special feature of ISO Standard C is that the
1888 self-reference is not considered a macro call.  It is passed into the
1889 preprocessor output unchanged.
1890
1891 Let's consider an example:
1892
1893 @example
1894 #define foo (4 + foo)
1895 @end example
1896
1897 @noindent
1898 where @samp{foo} is also a variable in your program.
1899
1900 Following the ordinary rules, each reference to @samp{foo} will expand
1901 into @samp{(4 + foo)}; then this will be rescanned and will expand into
1902 @samp{(4 + (4 + foo))}; and so on until it causes a fatal error (memory
1903 full) in the preprocessor.
1904
1905 However, the special rule about self-reference cuts this process short
1906 after one step, at @samp{(4 + foo)}.  Therefore, this macro definition
1907 has the possibly useful effect of causing the program to add 4 to the
1908 value of @samp{foo} wherever @samp{foo} is referred to.
1909
1910 In most cases, it is a bad idea to take advantage of this feature.  A
1911 person reading the program who sees that @samp{foo} is a variable will
1912 not expect that it is a macro as well.  The reader will come across the
1913 identifier @samp{foo} in the program and think its value should be that
1914 of the variable @samp{foo}, whereas in fact the value is four greater.
1915
1916 The special rule for self-reference applies also to @dfn{indirect}
1917 self-reference.  This is the case where a macro @var{x} expands to use a
1918 macro @samp{y}, and the expansion of @samp{y} refers to the macro
1919 @samp{x}.  The resulting reference to @samp{x} comes indirectly from the
1920 expansion of @samp{x}, so it is a self-reference and is not further
1921 expanded.  Thus, after
1922
1923 @example
1924 #define x (4 + y)
1925 #define y (2 * x)
1926 @end example
1927
1928 @noindent
1929 @samp{x} would expand into @samp{(4 + (2 * x))}.  Clear?
1930
1931 Suppose @samp{y} is used elsewhere, not from the definition of @samp{x}.
1932 Then the use of @samp{x} in the expansion of @samp{y} is not a
1933 self-reference because @samp{x} is not ``in progress''.  So it does
1934 expand.  However, the expansion of @samp{x} contains a reference to
1935 @samp{y}, and that is an indirect self-reference now because @samp{y} is
1936 ``in progress''.  The result is that @samp{y} expands to @samp{(2 * (4 +
1937 y))}.
1938
1939 This behavior is specified by the ISO C standard, so you may need to
1940 understand it.
1941
1942 @node Argument Prescan, Cascaded Macros, Self-Reference, Macro Pitfalls
1943 @subsubsection Separate Expansion of Macro Arguments
1944 @cindex expansion of arguments
1945 @cindex macro argument expansion
1946 @cindex prescan of macro arguments
1947
1948 We have explained that the expansion of a macro, including the substituted
1949 arguments, is re-scanned for macro calls to be expanded.
1950
1951 What really happens is more subtle: first each argument is scanned
1952 separately for macro calls.  Then the resulting tokens are substituted
1953 into the macro body to produce the macro expansion, and the macro
1954 expansion is scanned again for macros to expand.
1955
1956 The result is that the arguments are scanned @emph{twice} to expand
1957 macro calls in them.
1958
1959 Most of the time, this has no effect.  If the argument contained any
1960 macro calls, they are expanded during the first scan.  The result
1961 therefore contains no macro calls, so the second scan does not change
1962 it.  If the argument were substituted as given, with no prescan, the
1963 single remaining scan would find the same macro calls and produce the
1964 same results.
1965
1966 You might expect the double scan to change the results when a
1967 self-referential macro is used in an argument of another macro
1968 (@pxref{Self-Reference}): the self-referential macro would be expanded
1969 once in the first scan, and a second time in the second scan.  However,
1970 this is not what happens.  The self-references that do not expand in the
1971 first scan are marked so that they will not expand in the second scan
1972 either.
1973
1974 The prescan is not done when an argument is stringified or concatenated.
1975 Thus,
1976
1977 @example
1978 #define str(s) #s
1979 #define foo 4
1980 str (foo)
1981 @end example
1982
1983 @noindent
1984 expands to @samp{"foo"}.  Once more, prescan has been prevented from
1985 having any noticeable effect.
1986
1987 More precisely, stringification and concatenation use the argument
1988 tokens as given without initially scanning for macros.  The same
1989 argument would be used in expanded form if it is substituted elsewhere
1990 without stringification or concatenation.
1991
1992 @example
1993 #define str(s) #s lose(s)
1994 #define foo 4
1995 str (foo)
1996 @end example
1997
1998 expands to @samp{"foo" lose(4)}.
1999
2000 You might now ask, ``Why mention the prescan, if it makes no difference?
2001 And why not skip it and make the preprocessor faster?''  The answer is
2002 that the prescan does make a difference in three special cases:
2003
2004 @itemize @bullet
2005 @item
2006 Nested calls to a macro.
2007
2008 @item
2009 Macros that call other macros that stringify or concatenate.
2010
2011 @item
2012 Macros whose expansions contain unshielded commas.
2013 @end itemize
2014
2015 We say that @dfn{nested} calls to a macro occur when a macro's argument
2016 contains a call to that very macro.  For example, if @samp{f} is a macro
2017 that expects one argument, @samp{f (f (1))} is a nested pair of calls to
2018 @samp{f}.  The desired expansion is made by expanding @samp{f (1)} and
2019 substituting that into the definition of @samp{f}.  The prescan causes
2020 the expected result to happen.  Without the prescan, @samp{f (1)} itself
2021 would be substituted as an argument, and the inner use of @samp{f} would
2022 appear during the main scan as an indirect self-reference and would not
2023 be expanded.  Here, the prescan cancels an undesirable side effect (in
2024 the medical, not computational, sense of the term) of the special rule
2025 for self-referential macros.
2026
2027 Prescan causes trouble in certain other cases of nested macro calls.
2028 Here is an example:
2029
2030 @example
2031 #define foo  a,b
2032 #define bar(x) lose(x)
2033 #define lose(x) (1 + (x))
2034
2035 bar(foo)
2036 @end example
2037
2038 @noindent
2039 We would like @samp{bar(foo)} to turn into @samp{(1 + (foo))}, which
2040 would then turn into @samp{(1 + (a,b))}.  Instead, @samp{bar(foo)}
2041 expands into @samp{lose(a,b)}, and you get an error because @code{lose}
2042 requires a single argument.  In this case, the problem is easily solved
2043 by the same parentheses that ought to be used to prevent misnesting of
2044 arithmetic operations:
2045
2046 @example
2047 #define foo (a,b)
2048 #define bar(x) lose((x))
2049 @end example
2050
2051 The problem is more serious when the operands of the macro are not
2052 expressions; for example, when they are statements.  Then parentheses
2053 are unacceptable because they would make for invalid C code:
2054
2055 @example
2056 #define foo @{ int a, b; @dots{} @}
2057 @end example
2058
2059 @noindent
2060 In GNU C you can shield the commas using the @samp{(@{@dots{}@})}
2061 construct which turns a compound statement into an expression:
2062
2063 @example
2064 #define foo (@{ int a, b; @dots{} @})
2065 @end example
2066
2067 Or you can rewrite the macro definition to avoid such commas:
2068
2069 @example
2070 #define foo @{ int a; int b; @dots{} @}
2071 @end example
2072
2073 There is also one case where prescan is useful.  It is possible to use
2074 prescan to expand an argument and then stringify it --- if you use two
2075 levels of macros.  Let's add a new macro @samp{xstr} to the example
2076 shown above:
2077
2078 @example
2079 #define xstr(s) str(s)
2080 #define str(s) #s
2081 #define foo 4
2082 xstr (foo)
2083 @end example
2084
2085 This expands into @samp{"4"}, not @samp{"foo"}.  The reason for the
2086 difference is that the argument of @samp{xstr} is expanded at prescan
2087 (because @samp{xstr} does not specify stringification or concatenation
2088 of the argument).  The result of prescan then forms the argument for
2089 @samp{str}.  @samp{str} uses its argument without prescan because it
2090 performs stringification; but it cannot prevent or undo the prescanning
2091 already done by @samp{xstr}.
2092
2093 @node Cascaded Macros, Newlines in Args, Argument Prescan, Macro Pitfalls
2094 @subsubsection Cascaded Use of Macros
2095
2096 @cindex cascaded macros
2097 @cindex macro body uses macro
2098 A @dfn{cascade} of macros is when one macro's body contains a reference
2099 to another macro.  This is very common practice.  For example,
2100
2101 @example
2102 #define BUFSIZE 1020
2103 #define TABLESIZE BUFSIZE
2104 @end example
2105
2106 This is not at all the same as defining @samp{TABLESIZE} to be
2107 @samp{1020}.  The @samp{#define} for @samp{TABLESIZE} uses exactly the
2108 body you specify --- in this case, @samp{BUFSIZE} --- and does not check
2109 to see whether it too is the name of a macro.
2110
2111 It's only when you @emph{use} @samp{TABLESIZE} that the result of its
2112 expansion is checked for more macro names.
2113
2114 This makes a difference if you change the definition of @samp{BUFSIZE}
2115 at some point in the source file.  @samp{TABLESIZE}, defined as shown,
2116 will always expand using the definition of @samp{BUFSIZE} that is
2117 currently in effect:
2118
2119 @example
2120 #define BUFSIZE 1020
2121 #define TABLESIZE BUFSIZE
2122 #undef BUFSIZE
2123 #define BUFSIZE 37
2124 @end example
2125
2126 @noindent
2127 Now @samp{TABLESIZE} expands (in two stages) to @samp{37}.  (The
2128 @samp{#undef} is to prevent any warning about the nontrivial
2129 redefinition of @code{BUFSIZE}.)
2130
2131 @node Newlines in Args,, Cascaded Macros, Macro Pitfalls
2132 @subsection Newlines in Macro Arguments
2133 @cindex newlines in macro arguments
2134
2135 The invocation of a function-like macro can extend over many logical
2136 lines.  The ISO C standard requires that newlines within a macro
2137 invocation be treated as ordinary whitespace.  This means that when the
2138 expansion of a function-like macro replaces its invocation, it appears
2139 on the same line as the macro name did.  Thus line numbers emitted by
2140 the compiler or debugger refer to the line the invocation started on,
2141 which might be different to the line containing the argument causing the
2142 problem.
2143
2144 Here is an example illustrating this:
2145
2146 @example
2147 #define ignore_second_arg(a,b,c) a; c
2148
2149 ignore_second_arg (foo (),
2150                    ignored (),
2151                    syntax error);
2152 @end example
2153
2154 @noindent
2155 The syntax error triggered by the tokens @samp{syntax error} results in
2156 an error message citing line three --- the line of ignore_second_arg ---
2157 even though the problematic code comes from line five.
2158
2159 @node Conditionals, Assertions, Macros, Top
2160 @section Conditionals
2161
2162 @cindex conditionals
2163 In a macro processor, a @dfn{conditional} is a directive that allows a
2164 part of the program to be ignored during compilation, on some
2165 conditions.  In the C preprocessor, a conditional can test either an
2166 arithmetic expression or whether a name is defined as a macro.
2167
2168 A conditional in the C preprocessor resembles in some ways an @samp{if}
2169 statement in C, but it is important to understand the difference between
2170 them.  The condition in an @samp{if} statement is tested during the
2171 execution of your program.  Its purpose is to allow your program to
2172 behave differently from run to run, depending on the data it is
2173 operating on.  The condition in a preprocessing conditional directive is
2174 tested when your program is compiled.  Its purpose is to allow different
2175 code to be included in the program depending on the situation at the
2176 time of compilation.
2177
2178 @menu
2179 * Uses: Conditional Uses.       What conditionals are for.
2180 * Syntax: Conditional Syntax.   How conditionals are written.
2181 * Deletion: Deleted Code.       Making code into a comment.
2182 * Macros: Conditionals-Macros.  Why conditionals are used with macros.
2183 * Errors: #error Directive.     Detecting inconsistent compilation parameters.
2184 @end menu
2185
2186 @node Conditional Uses
2187 @subsection Why Conditionals are Used
2188
2189 Generally there are three kinds of reason to use a conditional.
2190
2191 @itemize @bullet
2192 @item
2193 A program may need to use different code depending on the machine or
2194 operating system it is to run on.  In some cases the code for one
2195 operating system may be erroneous on another operating system; for
2196 example, it might refer to library routines that do not exist on the
2197 other system.  When this happens, it is not enough to avoid executing
2198 the invalid code: merely having it in the program makes it impossible to
2199 link the program and run it.  With a preprocessing conditional, the
2200 offending code can be effectively excised from the program when it is
2201 not valid.
2202
2203 @item
2204 You may want to be able to compile the same source file into two
2205 different programs.  Sometimes the difference between the programs is
2206 that one makes frequent time-consuming consistency checks on its
2207 intermediate data, or prints the values of those data for debugging,
2208 while the other does not.
2209
2210 @item
2211 A conditional whose condition is always false is a good way to exclude
2212 code from the program but keep it as a sort of comment for future
2213 reference.
2214 @end itemize
2215
2216 Most simple programs that are intended to run on only one machine will
2217 not need to use preprocessing conditionals.
2218
2219 @node Conditional Syntax
2220 @subsection Syntax of Conditionals
2221
2222 @findex #if
2223 A conditional in the C preprocessor begins with a @dfn{conditional
2224 directive}: @samp{#if}, @samp{#ifdef} or @samp{#ifndef}.
2225 @xref{Conditionals-Macros}, for information on @samp{#ifdef} and
2226 @samp{#ifndef}; only @samp{#if} is explained here.
2227
2228 @menu
2229 * If: #if Directive.     Basic conditionals using @samp{#if} and @samp{#endif}.
2230 * Else: #else Directive. Including some text if the condition fails.
2231 * Elif: #elif Directive. Testing several alternative possibilities.
2232 @end menu
2233
2234 @node #if Directive
2235 @subsubsection The @samp{#if} Directive
2236
2237 The @samp{#if} directive in its simplest form consists of
2238
2239 @example
2240 #if @var{expression}
2241 @var{controlled text}
2242 #endif /* @var{expression} */
2243 @end example
2244
2245 The comment following the @samp{#endif} is not required, but it is a
2246 good practice because it helps people match the @samp{#endif} to the
2247 corresponding @samp{#if}.  Such comments should always be used, except
2248 in short conditionals that are not nested.  In fact, you can put
2249 anything at all after the @samp{#endif} and it will be ignored by the
2250 GNU C preprocessor, but only comments are acceptable in ISO Standard C@.
2251
2252 @var{expression} is a C expression of integer type, subject to stringent
2253 restrictions.  It may contain
2254
2255 @itemize @bullet
2256 @item
2257 Integer constants, which are all regarded as @code{long} or
2258 @code{unsigned long}.
2259
2260 @item
2261 Character constants, which are interpreted according to the character
2262 set and conventions of the machine and operating system on which the
2263 preprocessor is running.  The GNU C preprocessor uses the C data type
2264 @samp{char} for these character constants; therefore, whether some
2265 character codes are negative is determined by the C compiler used to
2266 compile the preprocessor.  If it treats @samp{char} as signed, then
2267 character codes large enough to set the sign bit will be considered
2268 negative; otherwise, no character code is considered negative.
2269
2270 @item
2271 Arithmetic operators for addition, subtraction, multiplication,
2272 division, bitwise operations, shifts, comparisons, and logical
2273 operations (@samp{&&} and @samp{||}).  The latter two obey the usual
2274 short-circuiting rules of standard C.
2275
2276 @item
2277 Identifiers that are not macros, which are all treated as zero(!).
2278
2279 @item
2280 Macro calls.  All macro calls in the expression are expanded before
2281 actual computation of the expression's value begins.
2282 @end itemize
2283
2284 Note that @samp{sizeof} operators and @code{enum}-type values are not
2285 allowed.  @code{enum}-type values, like all other identifiers that are
2286 not taken as macro calls and expanded, are treated as zero.
2287
2288 The @var{controlled text} inside of a conditional can include
2289 preprocessing directives.  Then the directives inside the conditional
2290 are obeyed only if that branch of the conditional succeeds.  The text
2291 can also contain other conditional groups.  However, the @samp{#if} and
2292 @samp{#endif} directives must balance.
2293
2294 @node #else Directive
2295 @subsubsection The @samp{#else} Directive
2296
2297 @findex #else
2298 The @samp{#else} directive can be added to a conditional to provide
2299 alternative text to be used if the condition is false.  This is what
2300 it looks like:
2301
2302 @example
2303 #if @var{expression}
2304 @var{text-if-true}
2305 #else /* Not @var{expression} */
2306 @var{text-if-false}
2307 #endif /* Not @var{expression} */
2308 @end example
2309
2310 If @var{expression} is nonzero, and thus the @var{text-if-true} is 
2311 active, then @samp{#else} acts like a failing conditional and the
2312 @var{text-if-false} is ignored.  Conversely, if the @samp{#if}
2313 conditional fails, the @var{text-if-false} is considered included.
2314
2315 @node #elif Directive
2316 @subsubsection The @samp{#elif} Directive
2317
2318 @findex #elif
2319 One common case of nested conditionals is used to check for more than two
2320 possible alternatives.  For example, you might have
2321
2322 @example
2323 #if X == 1
2324 @dots{}
2325 #else /* X != 1 */
2326 #if X == 2
2327 @dots{}
2328 #else /* X != 2 */
2329 @dots{}
2330 #endif /* X != 2 */
2331 #endif /* X != 1 */
2332 @end example
2333
2334 Another conditional directive, @samp{#elif}, allows this to be
2335 abbreviated as follows:
2336
2337 @example
2338 #if X == 1
2339 @dots{}
2340 #elif X == 2
2341 @dots{}
2342 #else /* X != 2 and X != 1*/
2343 @dots{}
2344 #endif /* X != 2 and X != 1*/
2345 @end example
2346
2347 @samp{#elif} stands for ``else if''.  Like @samp{#else}, it goes in the
2348 middle of a @samp{#if}-@samp{#endif} pair and subdivides it; it does not
2349 require a matching @samp{#endif} of its own.  Like @samp{#if}, the
2350 @samp{#elif} directive includes an expression to be tested.
2351
2352 The text following the @samp{#elif} is processed only if the original
2353 @samp{#if}-condition failed and the @samp{#elif} condition succeeds.
2354 More than one @samp{#elif} can go in the same @samp{#if}-@samp{#endif}
2355 group.  Then the text after each @samp{#elif} is processed only if the
2356 @samp{#elif} condition succeeds after the original @samp{#if} and any
2357 previous @samp{#elif} directives within it have failed.  @samp{#else} is
2358 equivalent to @samp{#elif 1}, and @samp{#else} is allowed after any
2359 number of @samp{#elif} directives, but @samp{#elif} may not follow
2360 @samp{#else}.
2361
2362 @node Deleted Code
2363 @subsection Keeping Deleted Code for Future Reference
2364 @cindex commenting out code
2365
2366 If you replace or delete a part of the program but want to keep the old
2367 code around as a comment for future reference, the easy way to do this
2368 is to put @samp{#if 0} before it and @samp{#endif} after it.  This is
2369 better than using comment delimiters @samp{/*} and @samp{*/} since those
2370 won't work if the code already contains comments (C comments do not
2371 nest).
2372
2373 This works even if the code being turned off contains conditionals, but
2374 they must be entire conditionals (balanced @samp{#if} and @samp{#endif}).
2375
2376 Conversely, do not use @samp{#if 0} for comments which are not C code.
2377 Use the comment delimiters @samp{/*} and @samp{*/} instead.  The
2378 interior of @samp{#if 0} must consist of complete tokens; in particular,
2379 single-quote characters must balance.  Comments often contain unbalanced
2380 single-quote characters (known in English as apostrophes).  These
2381 confuse @samp{#if 0}.  They do not confuse @samp{/*}.
2382
2383 @node Conditionals-Macros
2384 @subsection Conditionals and Macros
2385
2386 Conditionals are useful in connection with macros or assertions, because
2387 those are the only ways that an expression's value can vary from one
2388 compilation to another.  A @samp{#if} directive whose expression uses no
2389 macros or assertions is equivalent to @samp{#if 1} or @samp{#if 0}; you
2390 might as well determine which one, by computing the value of the
2391 expression yourself, and then simplify the program.
2392
2393 For example, here is a conditional that tests the expression
2394 @samp{BUFSIZE == 1020}, where @samp{BUFSIZE} must be a macro.
2395
2396 @example
2397 #if BUFSIZE == 1020
2398   printf ("Large buffers!\n");
2399 #endif /* BUFSIZE is large */
2400 @end example
2401
2402 (Programmers often wish they could test the size of a variable or data
2403 type in @samp{#if}, but this does not work.  The preprocessor does not
2404 understand @code{sizeof}, or typedef names, or even the type keywords
2405 such as @code{int}.)
2406
2407 @findex defined
2408 The special operator @samp{defined} is used in @samp{#if} and
2409 @samp{#elif} expressions to test whether a certain name is defined as a
2410 macro.  Either @samp{defined @var{name}} or @samp{defined (@var{name})}
2411 is an expression whose value is 1 if @var{name} is defined as macro at
2412 the current point in the program, and 0 otherwise.  To the
2413 @samp{defined} operator it makes no difference what the definition of
2414 the macro is; all that matters is whether there is a definition.  Thus,
2415 for example,@refill
2416
2417 @example
2418 #if defined (vax) || defined (ns16000)
2419 @end example
2420
2421 @noindent
2422 would succeed if either of the names @samp{vax} and @samp{ns16000} is
2423 defined as a macro.  You can test the same condition using assertions
2424 (@pxref{Assertions}), like this:
2425
2426 @example
2427 #if #cpu (vax) || #cpu (ns16000)
2428 @end example
2429
2430 If a macro is defined and later undefined with @samp{#undef}, subsequent
2431 use of the @samp{defined} operator returns 0, because the name is no
2432 longer defined.  If the macro is defined again with another
2433 @samp{#define}, @samp{defined} will recommence returning 1.
2434
2435 If the @samp{defined} operator appears as a result of a macro expansion,
2436 the C standard says the behavior is undefined.  GNU cpp treats it as a
2437 genuine @samp{defined} operator and evaluates it normally.  It will warn
2438 wherever your code uses this feature if you use the command-line option
2439 @samp{-pedantic}, since other compilers may handle it differently.
2440
2441 @findex #ifdef
2442 @findex #ifndef
2443 Conditionals that test whether a single macro is defined are very common,
2444 so there are two special short conditional directives for this case.
2445
2446 @table @code
2447 @item #ifdef @var{name}
2448 is equivalent to @samp{#if defined (@var{name})}.
2449
2450 @item #ifndef @var{name}
2451 is equivalent to @samp{#if ! defined (@var{name})}.
2452 @end table
2453
2454 Macro definitions can vary between compilations for several reasons.
2455
2456 @itemize @bullet
2457 @item
2458 Some macros are predefined on each kind of machine.  For example, on a
2459 Vax, the name @samp{vax} is a predefined macro.  On other machines, it
2460 would not be defined.
2461
2462 @item
2463 Many more macros are defined by system header files.  Different systems
2464 and machines define different macros, or give them different values.  It
2465 is useful to test these macros with conditionals to avoid using a system
2466 feature on a machine where it is not implemented.
2467
2468 @item
2469 Macros are a common way of allowing users to customize a program for
2470 different machines or applications.  For example, the macro
2471 @samp{BUFSIZE} might be defined in a configuration file for your program
2472 that is included as a header file in each source file.  You would use
2473 @samp{BUFSIZE} in a preprocessing conditional in order to generate
2474 different code depending on the chosen configuration.
2475
2476 @item
2477 Macros can be defined or undefined with @samp{-D} and @samp{-U} command
2478 options when you compile the program.  You can arrange to compile the
2479 same source file into two different programs by choosing a macro name to
2480 specify which program you want, writing conditionals to test whether or
2481 how this macro is defined, and then controlling the state of the macro
2482 with compiler command options.  @xref{Invocation}.
2483 @end itemize
2484
2485 @ifinfo
2486 Assertions are usually predefined, but can be defined with preprocessor
2487 directives or command-line options.
2488 @end ifinfo
2489
2490 @node #error Directive
2491 @subsection The @samp{#error} and @samp{#warning} Directives
2492
2493 @findex #error
2494 The directive @samp{#error} causes the preprocessor to report a fatal
2495 error.  The tokens forming the rest of the line following @samp{#error}
2496 are used as the error message, and not macro-expanded.  Internal
2497 whitespace sequences are each replaced with a single space.  The line
2498 must consist of complete tokens.
2499
2500 You would use @samp{#error} inside of a conditional that detects a
2501 combination of parameters which you know the program does not properly
2502 support.  For example, if you know that the program will not run
2503 properly on a Vax, you might write
2504
2505 @smallexample
2506 @group
2507 #ifdef __vax__
2508 #error "Won't work on Vaxen.  See comments at get_last_object."
2509 #endif
2510 @end group
2511 @end smallexample
2512
2513 @noindent
2514 @xref{Nonstandard Predefined}, for why this works.
2515
2516 If you have several configuration parameters that must be set up by
2517 the installation in a consistent way, you can use conditionals to detect
2518 an inconsistency and report it with @samp{#error}.  For example,
2519
2520 @smallexample
2521 #if HASH_TABLE_SIZE % 2 == 0 || HASH_TABLE_SIZE % 3 == 0 \
2522     || HASH_TABLE_SIZE % 5 == 0
2523 #error HASH_TABLE_SIZE should not be divisible by a small prime
2524 #endif
2525 @end smallexample
2526
2527 @findex #warning
2528 The directive @samp{#warning} is like the directive @samp{#error}, but
2529 causes the preprocessor to issue a warning and continue preprocessing.
2530 The tokens following @samp{#warning} are used as the warning message,
2531 and not macro-expanded.
2532
2533 You might use @samp{#warning} in obsolete header files, with a message
2534 directing the user to the header file which should be used instead.
2535
2536 @node Assertions, Line Control, Conditionals, Top
2537 @section Assertions
2538 @cindex assertions
2539 @dfn{Assertions} are a more systematic alternative to macros in writing
2540 conditionals to test what sort of computer or system the compiled
2541 program will run on.  Assertions are usually predefined, but you can
2542 define them with preprocessing directives or command-line options.
2543
2544 @cindex predicates
2545 The macros traditionally used to describe the type of target are not
2546 classified in any way according to which question they answer; they may
2547 indicate a hardware architecture, a particular hardware model, an
2548 operating system, a particular version of an operating system, or
2549 specific configuration options.  These are jumbled together in a single
2550 namespace.  In contrast, each assertion consists of a named question and
2551 an answer.  The question is usually called the @dfn{predicate}.  An
2552 assertion looks like this:
2553
2554 @example
2555 #@var{predicate} (@var{answer})
2556 @end example
2557
2558 @noindent
2559 You must use a properly formed identifier for @var{predicate}.  The
2560 value of @var{answer} can be any sequence of words; all characters are
2561 significant except for leading and trailing whitespace, and differences
2562 in internal whitespace sequences are ignored.  (This is similar to the
2563 rules governing macro redefinition.)  Thus, @samp{x + y} is different
2564 from @samp{x+y} but equivalent to @samp{ x + y }.  @samp{)} is not
2565 allowed in an answer.
2566
2567 @cindex testing predicates
2568 Here is a conditional to test whether the answer @var{answer} is asserted
2569 for the predicate @var{predicate}:
2570
2571 @example
2572 #if #@var{predicate} (@var{answer})
2573 @end example
2574
2575 @noindent
2576 There may be more than one answer asserted for a given predicate.  If
2577 you omit the answer, you can test whether @emph{any} answer is asserted
2578 for @var{predicate}:
2579
2580 @example
2581 #if #@var{predicate}
2582 @end example
2583
2584 @findex #system
2585 @findex #machine
2586 @findex #cpu
2587 Most of the time, the assertions you test will be predefined assertions.
2588 GNU C provides three predefined predicates: @code{system}, @code{cpu},
2589 and @code{machine}.  @code{system} is for assertions about the type of
2590 software, @code{cpu} describes the type of computer architecture, and
2591 @code{machine} gives more information about the computer.  For example,
2592 on a GNU system, the following assertions would be true:
2593
2594 @example
2595 #system (gnu)
2596 #system (mach)
2597 #system (mach 3)
2598 #system (mach 3.@var{subversion})
2599 #system (hurd)
2600 #system (hurd @var{version})
2601 @end example
2602
2603 @noindent
2604 and perhaps others.  The alternatives with
2605 more or less version information let you ask more or less detailed
2606 questions about the type of system software.
2607
2608 On a Unix system, you would find @code{#system (unix)} and perhaps one of:
2609 @code{#system (aix)}, @code{#system (bsd)}, @code{#system (hpux)},
2610 @code{#system (lynx)}, @code{#system (mach)}, @code{#system (posix)},
2611 @code{#system (svr3)}, @code{#system (svr4)}, or @code{#system (xpg4)}
2612 with possible version numbers following.
2613
2614 Other values for @code{system} are @code{#system (mvs)}
2615 and @code{#system (vms)}.
2616
2617 @strong{Portability note:} Many Unix C compilers provide only one answer
2618 for the @code{system} assertion: @code{#system (unix)}, if they support
2619 assertions at all.  This is less than useful.
2620
2621 An assertion with a multi-word answer is completely different from several
2622 assertions with individual single-word answers.  For example, the presence
2623 of @code{system (mach 3.0)} does not mean that @code{system (3.0)} is true.
2624 It also does not directly imply @code{system (mach)}, but in GNU C, that
2625 last will normally be asserted as well.
2626
2627 The current list of possible assertion values for @code{cpu} is:
2628 @code{#cpu (a29k)}, @code{#cpu (alpha)}, @code{#cpu (arm)}, @code{#cpu
2629 (clipper)}, @code{#cpu (convex)}, @code{#cpu (elxsi)}, @code{#cpu
2630 (tron)}, @code{#cpu (h8300)}, @code{#cpu (i370)}, @code{#cpu (i386)},
2631 @code{#cpu (i860)}, @code{#cpu (i960)}, @code{#cpu (m68k)}, @code{#cpu
2632 (m88k)}, @code{#cpu (mips)}, @code{#cpu (ns32k)}, @code{#cpu (hppa)},
2633 @code{#cpu (pyr)}, @code{#cpu (ibm032)}, @code{#cpu (rs6000)},
2634 @code{#cpu (sh)}, @code{#cpu (sparc)}, @code{#cpu (spur)}, @code{#cpu
2635 (tahoe)}, @code{#cpu (vax)}, @code{#cpu (we32000)}.
2636
2637 @findex #assert
2638 You can create assertions within a C program using @samp{#assert}, like
2639 this:
2640
2641 @example
2642 #assert @var{predicate} (@var{answer})
2643 @end example
2644
2645 @noindent
2646 (Note the absence of a @samp{#} before @var{predicate}.)
2647
2648 @cindex unassert
2649 @cindex assertions, undoing
2650 @cindex retracting assertions
2651 @findex #unassert
2652 Each time you do this, you assert a new true answer for @var{predicate}.
2653 Asserting one answer does not invalidate previously asserted answers;
2654 they all remain true.  The only way to remove an answer is with
2655 @samp{#unassert}.  @samp{#unassert} has the same syntax as
2656 @samp{#assert}.  You can also remove all answers to a @var{predicate}
2657 like this:
2658
2659 @example
2660 #unassert @var{predicate}
2661 @end example
2662
2663 You can also add or cancel assertions using command options
2664 when you run @code{gcc} or @code{cpp}.  @xref{Invocation}.
2665
2666 @node Line Control, Other Directives, Assertions, Top
2667 @section Combining Source Files
2668
2669 @cindex line control
2670 One of the jobs of the C preprocessor is to inform the C compiler of where
2671 each line of C code came from: which source file and which line number.
2672
2673 C code can come from multiple source files if you use @samp{#include};
2674 both @samp{#include} and the use of conditionals and macros can cause
2675 the line number of a line in the preprocessor output to be different
2676 from the line's number in the original source file.  You will appreciate
2677 the value of making both the C compiler (in error messages) and symbolic
2678 debuggers such as GDB use the line numbers in your source file.
2679
2680 The C preprocessor builds on this feature by offering a directive by
2681 which you can control the feature explicitly.  This is useful when a
2682 file for input to the C preprocessor is the output from another program
2683 such as the @code{bison} parser generator, which operates on another
2684 file that is the true source file.  Parts of the output from
2685 @code{bison} are generated from scratch, other parts come from a
2686 standard parser file.  The rest are copied nearly verbatim from the
2687 source file, but their line numbers in the @code{bison} output are not
2688 the same as their original line numbers.  Naturally you would like
2689 compiler error messages and symbolic debuggers to know the original
2690 source file and line number of each line in the @code{bison} input.
2691
2692 @findex #line
2693 @code{bison} arranges this by writing @samp{#line} directives into the output
2694 file.  @samp{#line} is a directive that specifies the original line number
2695 and source file name for subsequent input in the current preprocessor input
2696 file.  @samp{#line} has three variants:
2697
2698 @table @code
2699 @item #line @var{linenum}
2700 Here @var{linenum} is a decimal integer constant.  This specifies that
2701 the line number of the following line of input, in its original source file,
2702 was @var{linenum}.
2703
2704 @item #line @var{linenum} @var{filename}
2705 Here @var{linenum} is a decimal integer constant and @var{filename} is a
2706 string constant.  This specifies that the following line of input came
2707 originally from source file @var{filename} and its line number there was
2708 @var{linenum}.  Keep in mind that @var{filename} is not just a file
2709 name; it is surrounded by double-quote characters so that it looks like
2710 a string constant.
2711
2712 @item #line @var{anything else}
2713 @var{anything else} is checked for macro calls, which are expanded.
2714 The result should be a decimal integer constant followed optionally
2715 by a string constant, as described above.
2716 @end table
2717
2718 @samp{#line} directives alter the results of the @samp{__FILE__} and
2719 @samp{__LINE__} predefined macros from that point on.  @xref{Standard
2720 Predefined}.
2721
2722 The output of the preprocessor (which is the input for the rest of the
2723 compiler) contains directives that look much like @samp{#line}
2724 directives.  They start with just @samp{#} instead of @samp{#line}, but
2725 this is followed by a line number and file name as in @samp{#line}.
2726 @xref{Output}.
2727
2728 @node Other Directives, Output, Line Control, Top
2729 @section Miscellaneous Preprocessing Directives
2730
2731 This section describes some additional, rarely used, preprocessing
2732 directives.
2733
2734 @findex #pragma
2735 @findex #pragma GCC
2736
2737 The ISO standard specifies that the effect of the @samp{#pragma}
2738 directive is implementation-defined.  The GNU C preprocessor recognizes
2739 some pragmas, and passes unrecognized ones through to the preprocessor
2740 output, so they are available to the compilation pass.
2741
2742 In line with the C99 standard, which introduces a STDC namespace for C99
2743 pragmas, the preprocessor introduces a GCC namespace for GCC pragmas.
2744 Supported GCC preprocessor pragmas are of the form @samp{#pragma GCC
2745 ...}.  For backwards compatibility previously supported pragmas are also
2746 recognized without the @samp{GCC} prefix, however that use is
2747 deprecated.  Pragmas that are already deprecated are not recognized with
2748 a @samp{GCC} prefix.
2749
2750 @findex #pragma GCC dependency
2751 The @samp{#pragma GCC dependency} allows you to check the relative dates
2752 of the current file and another file. If the other file is more recent
2753 than the current file, a warning is issued. This is useful if the
2754 include file is derived from the other file, and should be regenerated.
2755 The other file is searched for using the normal include search path.
2756 Optional trailing text can be used to give more information in the
2757 warning message.
2758
2759 @smallexample
2760 #pragma GCC dependency "parse.y"
2761 #pragma GCC dependency "/usr/include/time.h" rerun /path/to/fixincludes
2762 @end smallexample
2763
2764 @findex _Pragma
2765 The C99 standard also introduces the @samp{_Pragma} operator.  The
2766 syntax is @code{_Pragma (string-literal)}, where @samp{string-literal}
2767 can be either a normal or wide-character string literal.  It is
2768 destringized, by replacing all @samp{\\} with a single @samp{\} and all
2769 @samp{\"} with a @samp{"}.  The result is then processed as if it had
2770 appeared as the right hand side of a @samp{#pragma} directive.  For
2771 example,
2772
2773 @smallexample
2774 _Pragma ("GCC dependency \"parse.y\"")
2775 @end smallexample
2776
2777 @noindent has the same effect as @samp{#pragma GCC dependency
2778 "parse.y"}.  The same effect could be achieved using macros, for example
2779
2780 @smallexample
2781 #define DO_PRAGMA(x) _Pragma (#x)
2782 DO_PRAGMA (GCC dependency "parse.y")
2783 @end smallexample
2784
2785 The standard is unclear on where a @samp{_Pragma} operator can appear.
2786 The preprocessor accepts it even within a preprocessing conditional
2787 directive like @samp{#if}.  To be safe, you are probably best keeping it
2788 out of directives other than @samp{#define}, and putting it on a line of
2789 its own.
2790
2791 @findex #ident
2792 The @samp{#ident} directive is supported for compatibility with certain
2793 other systems.  It is followed by a line of text.  On some systems, the
2794 text is copied into a special place in the object file; on most systems,
2795 the text is ignored and this directive has no effect.  Typically
2796 @samp{#ident} is only used in header files supplied with those systems
2797 where it is meaningful.
2798
2799 @cindex null directive
2800 The @dfn{null directive} consists of a @samp{#} followed by a newline,
2801 with only whitespace (including comments) in between.  A null directive
2802 is understood as a preprocessing directive but has no effect on the
2803 preprocessor output.  The primary significance of the existence of the
2804 null directive is that an input line consisting of just a @samp{#} will
2805 produce no output, rather than a line of output containing just a
2806 @samp{#}.  Supposedly some old C programs contain such lines.
2807
2808 @node Output, Implementation, Other Directives, Top
2809 @section C Preprocessor Output
2810
2811 @cindex output format
2812 The output from the C preprocessor looks much like the input, except
2813 that all preprocessing directive lines have been replaced with blank
2814 lines and all comments with spaces.
2815
2816 The ISO standard specifies that it is implementation defined whether a
2817 preprocessor preserves whitespace between tokens, or replaces it with
2818 e.g. a single space.  In the GNU C preprocessor, whitespace between
2819 tokens is collapsed to become a single space, with the exception that
2820 the first token on a non-directive line is preceded with sufficient
2821 spaces that it appears in the same column in the preprocessed output
2822 that it appeared in in the original source file.  This is so the output
2823 is easy to read.  @xref{Unreliable Features}.
2824
2825 Source file name and line number information is conveyed by lines
2826 of the form
2827
2828 @example
2829 # @var{linenum} @var{filename} @var{flags}
2830 @end example
2831
2832 @noindent
2833 which are inserted as needed into the output (but never within a string
2834 or character constant), and in place of long sequences of empty lines.
2835 Such a line means that the following line originated in file
2836 @var{filename} at line @var{linenum}.
2837
2838 After the file name comes zero or more flags, which are @samp{1},
2839 @samp{2}, @samp{3}, or @samp{4}.  If there are multiple flags, spaces
2840 separate them.  Here is what the flags mean:
2841
2842 @table @samp
2843 @item 1
2844 This indicates the start of a new file.
2845 @item 2
2846 This indicates returning to a file (after having included another file).
2847 @item 3
2848 This indicates that the following text comes from a system header file,
2849 so certain warnings should be suppressed.
2850 @item 4
2851 This indicates that the following text should be treated as C@.
2852 @c maybe cross reference NO_IMPLICIT_EXTERN_C
2853 @end table
2854
2855 @node Implementation, Unreliable Features, Output, Top
2856 @section Implementation-defined Behavior and Implementation Limits
2857 @cindex implementation limits
2858 @cindex implementation-defined behavior
2859
2860 The ISO C standard mandates that implementations document various
2861 aspects of preprocessor behavior.  You should try to avoid undue
2862 reliance on behaviour described here, as it is possible that it will
2863 change subtly in future implementations.
2864
2865 @itemize @bullet
2866
2867 @item The mapping of physical source file multi-byte characters to the
2868 execution character set.
2869
2870 Currently, GNU cpp only supports character sets that are strict supersets
2871 of ASCII, and performs no translation of characters.
2872
2873 @item Non-empty sequences of whitespace characters.
2874
2875 Each whitespace sequence is not preserved, but collapsed to a single
2876 space.  For aesthetic reasons, the first token on each non-directive
2877 line of output is preceded with sufficient spaces that it appears in the
2878 same column as it did in the original source file.
2879
2880 @item The numeric value of character constants in preprocessor expressions.
2881
2882 The preprocessor interprets character constants in preprocessing
2883 directives on the host machine.  Expressions outside preprocessing
2884 directives are compiled to be interpreted on the target machine.  In the
2885 normal case of a native compiler, these two environments are the same
2886 and so character constants will be evaluated identically in both cases.
2887 However, in the case of a cross compiler, the values may be different.
2888
2889 Multi-character character constants are interpreted a character at a
2890 time, shifting the previous result left by the number of bits per
2891 character on the host, and adding the new character.  For example, 'ab'
2892 on an 8-bit host would be interpreted as 'a' * 256 + 'b'.  If there are
2893 more characters in the constant than can fit in the widest native
2894 integer type on the host, usually a @samp{long}, the behavior is
2895 undefined.
2896
2897 Evaluation of wide character constants is not properly implemented yet.
2898
2899 @item Source file inclusion.
2900
2901 For a discussion on how the preprocessor locates header files,
2902 @pxref{Include Operation}.
2903
2904 @item Interpretation of the filename resulting from a macro-expanded
2905 @samp{#include} directive.
2906
2907 If the macro expands to a string literal, the @samp{#include} directive
2908 is processed as if the string had been specified directly.  Otherwise,
2909 the macro must expand to a token stream beginning with a @samp{<} token
2910 and including a @samp{>} token.  In this case, the tokens between the
2911 @samp{<} and the first @samp{>} are combined to form the filename to be
2912 included.  Any whitespace between tokens is reduced to a single space;
2913 then any space after the initial @samp{<} is retained, but a trailing
2914 space before the closing @samp{>} is ignored.
2915
2916 In either case, if any excess tokens remain, an error occurs and the
2917 directive is not processed.
2918
2919 @item Treatment of a @samp{#pragma} directive that after macro-expansion
2920 results in a standard pragma.
2921
2922 The pragma is processed as if it were a normal standard pragma.
2923
2924 @end itemize
2925
2926 The following documents internal limits of GNU cpp.
2927
2928 @itemize @bullet
2929
2930 @item Nesting levels of @samp{#include} files.
2931
2932 We impose an arbitrary limit of 200 levels, to avoid runaway recursion.
2933 The standard requires at least 15 levels.
2934
2935 @item Nesting levels of conditional inclusion.
2936
2937 The C standard mandates this be at least 63.  The GNU C preprocessor
2938 is limited only by available memory.
2939
2940 @item Levels of parenthesised expressions within a full expression.
2941
2942 The C standard requires this to be at least 63.  In preprocessor
2943 conditional expressions it is limited only by available memory.
2944
2945 @item Significant initial characters in an identifier or macro name.
2946
2947 The preprocessor treats all characters as significant.  The C standard
2948 requires only that the first 63 be significant.
2949
2950 @item Number of macros simultaneously defined in a single translation unit.
2951
2952 The standard requires at least 4095 be possible; GNU cpp is limited only
2953 by available memory.
2954
2955 @item Number of parameters in a macro definition and arguments in a macro call.
2956
2957 We allow USHRT_MAX, which is normally 65,535, and above the minimum of
2958 127 required by the standard.
2959
2960 @item Number of characters on a logical source line.
2961
2962 The C standard requires a minimum of 4096 be permitted.  GNU cpp places
2963 no limits on this, but you may get incorrect column numbers reported in
2964 diagnostics for lines longer than 65,535 characters.
2965
2966 @end itemize
2967
2968 @node Unreliable Features, Invocation, Implementation, Top
2969 @section Undefined Behavior and Deprecated Features
2970 @cindex undefined behavior
2971 @cindex deprecated features
2972
2973 This section details GNU C preprocessor behavior that is subject to
2974 change or deprecated.  You are @emph{strongly advised} to write your
2975 software so it does not rely on anything described here; future versions
2976 of the preprocessor may subtly change such behavior or even remove the
2977 feature altogether.
2978
2979 Preservation of the form of whitespace between tokens is unlikely to
2980 change from current behavior (@ref{Output}), but you are advised not
2981 to rely on it.
2982
2983 The following are undocumented and subject to change:-
2984
2985 @itemize @bullet
2986
2987 @item Precedence of ## operators with respect to each other
2988
2989 Whether a sequence of ## operators is evaluated left-to-right,
2990 right-to-left or indeed in a consistent direction at all is not
2991 specified.  An example of where this might matter is pasting the
2992 arguments @samp{1}, @samp{e} and @samp{-2}.  This would be fine for
2993 left-to-right pasting, but right-to-left pasting would produce an
2994 invalid token @samp{e-2}.  It is possible to guarantee precedence by
2995 suitable use of nested macros.
2996
2997 @item Precedence of # operator with respect to the ## operator
2998
2999 Which of these two operators is evaluated first is not specified.
3000
3001 @end itemize
3002
3003 The following features are in flux and should not be used in portable
3004 code:
3005
3006 @itemize @bullet
3007
3008 @item Optional argument when invoking rest argument macros
3009
3010 As an extension, GCC permits you to omit the variable arguments entirely
3011 when you use a variable argument macro.  This works whether or not you
3012 give the variable argument a name.  For example, the two macro
3013 invocations in the example below expand to the same thing:
3014
3015 @smallexample
3016 #define debug(format, ...) printf (format, __VA_ARGS__)
3017 debug("string");       /* Not permitted by C standard.  */
3018 debug("string",);      /* OK.  */
3019 @end smallexample
3020
3021 This extension will be preserved, but the special behavior of @samp{##}
3022 in this context has changed in the past and may change again in the
3023 future.
3024
3025 @item ## swallowing preceding text in rest argument macros
3026
3027 Formerly, in a macro expansion, if @samp{##} appeared before a variable
3028 arguments parameter, and the set of tokens specified for that argument in
3029 the macro invocation was empty, previous versions of the GNU C
3030 preprocessor would back up and remove the preceding sequence of
3031 non-whitespace characters (@strong{not} the preceding token).  This
3032 extension is in direct conflict with the 1999 C standard and has been
3033 drastically pared back.
3034
3035 In the current version of the preprocessor, if @samp{##} appears between
3036 a comma and a variable arguments parameter, and the variable argument is
3037 omitted entirely, the comma will be removed from the expansion.  If the
3038 variable argument is empty, or the token before @samp{##} is not a
3039 comma, then @samp{##} behaves as a normal token paste.  
3040
3041 Portable code should avoid this extension at all costs.
3042
3043 @end itemize
3044
3045 The following features are deprecated and will likely be removed at some
3046 point in the future:-
3047
3048 @itemize @bullet
3049
3050 @item Attempting to paste two tokens which together do not form a valid
3051 preprocessing token
3052
3053 The preprocessor currently warns about this and outputs the two tokens
3054 adjacently, which is probably the behavior the programmer intends.  It
3055 may not work in future, though.
3056
3057 Most of the time, when you get this warning, you will find that @samp{##}
3058 is being used superstitiously, to guard against whitespace appearing
3059 between two tokens.  It is almost always safe to delete the @samp{##}.
3060
3061 @findex #pragma once
3062 @item #pragma once
3063
3064 This pragma was once used to tell the preprocessor that it need not
3065 include a file more than once.  It is now obsolete and should not be
3066 used at all.
3067
3068 @item #pragma poison
3069
3070 This pragma has been superseded by @samp{#pragma GCC poison}.
3071 @xref{Poisoning}.
3072
3073 @item Multi-line string literals
3074
3075 The preprocessor currently allows raw newlines in string literals.  This
3076 extension is deprecated and will be removed in a future version of GCC.
3077 The preprocessor already forbids such string literals in all directives
3078 apart from #define.
3079
3080 Instead, make use of ISO C concatenation of adjacent string literals, or
3081 use @samp{\n} followed by an escaped newline.
3082
3083 @item Preprocessing things which are not C
3084
3085 The C preprocessor is intended to be used only with C, C++, and
3086 Objective C source code.  In the past, it has been abused as a general
3087 text processor.  It will choke on input which is not lexically valid C;
3088 for example, apostrophes will be interpreted as the beginning of
3089 character constants, and cause errors.  Also, you cannot rely on it
3090 preserving characteristics of the input which are not significant to
3091 C-family languages.  For instance, if a Makefile is preprocessed, all
3092 the hard tabs will be lost, and the Makefile will not work.
3093
3094 Having said that, you can often get away with using cpp on things which
3095 are not C.  Other Algol-ish programming languages are often safe
3096 (Pascal, Ada, ...)  and so is assembly, with caution. @samp{-traditional}
3097 mode is much more permissive, and can safely be used with e.g. Fortran.
3098 Many of the problems go away if you write C or C++ style comments
3099 instead of native language comments, and if you avoid elaborate macros.
3100
3101 Wherever possible, you should use a preprocessor geared to the language
3102 you are writing in.  Modern versions of the GNU assembler have macro
3103 facilities.  Most high level programming languages have their own
3104 conditional compilation and inclusion mechanism.  If all else fails,
3105 try a true general text processor, such as @xref{Top, M4, , m4, GNU `m4'}.
3106
3107 @end itemize
3108
3109 @node Invocation, Concept Index, Unreliable Features, Top
3110 @section Invoking the C Preprocessor
3111 @cindex invocation of the preprocessor
3112
3113 Most often when you use the C preprocessor you will not have to invoke it
3114 explicitly: the C compiler will do so automatically.  However, the
3115 preprocessor is sometimes useful on its own.
3116
3117 @ignore
3118 @c man begin SYNOPSIS
3119 cpp [@samp{-P}] [@samp{-C}] [@samp{-gcc}] [@samp{-traditional}]
3120     [@samp{-undef}] [@samp{-trigraphs}] [@samp{-pedantic}]
3121     [@samp{-W}@var{warn}...] [@samp{-I}@var{dir}...]
3122     [@samp{-D}@var{macro}[=@var{defn}]...] [@samp{-U}@var{macro}]
3123     [@samp{-A}@var{predicate}(@var{answer})]
3124     [@samp{-M}|@samp{-MM}][@samp{-MG}][@samp{-MF}@var{filename}]
3125     [@samp{-MP}][@samp{-MQ}@var{target}...][@samp{-MT}@var{target}...]
3126     [@samp{-x} @var{language}] [@samp{-std=}@var{standard}]
3127     @var{infile} @var{outfile}
3128
3129 Only the most useful options are listed here; see below for the remainder.
3130 @c man end
3131 @c man begin SEEALSO
3132 gcc(1), as(1), ld(1), and the Info entries for @file{cpp}, @file{gcc}, and
3133 @file{binutils}.
3134 @c man end
3135 @end ignore
3136
3137 @c man begin OPTIONS
3138 The C preprocessor expects two file names as arguments, @var{infile} and
3139 @var{outfile}.  The preprocessor reads @var{infile} together with any
3140 other files it specifies with @samp{#include}.  All the output generated
3141 by the combined input files is written in @var{outfile}.
3142
3143 Either @var{infile} or @var{outfile} may be @samp{-}, which as
3144 @var{infile} means to read from standard input and as @var{outfile}
3145 means to write to standard output.  Also, if either file is omitted, it
3146 means the same as if @samp{-} had been specified for that file.
3147
3148 @cindex options
3149 Here is a table of command options accepted by the C preprocessor.
3150 These options can also be given when compiling a C program; they are
3151 passed along automatically to the preprocessor when it is invoked by the
3152 compiler.
3153
3154 @table @samp
3155 @item -P
3156 @findex -P
3157 Inhibit generation of @samp{#}-lines with line-number information in the
3158 output from the preprocessor.  This might be useful when running the
3159 preprocessor on something that is not C code and will be sent to a
3160 program which might be confused by the @samp{#}-lines.  @xref{Output}.
3161
3162 @item -C
3163 @findex -C
3164 Do not discard comments.  All comments are passed through to the output
3165 file, except for comments in processed directives, which are deleted
3166 along with the directive.  Comments appearing in the expansion list of a
3167 macro will be preserved, and appear in place wherever the macro is
3168 invoked.
3169
3170 You should be prepared for side effects when using @samp{-C}; it causes
3171 the preprocessor to treat comments as tokens in their own right.  For
3172 example, macro redefinitions that were trivial when comments were
3173 replaced by a single space might become significant when comments are
3174 retained.  Also, comments appearing at the start of what would be a
3175 directive line have the effect of turning that line into an ordinary
3176 source line, since the first token on the line is no longer a @samp{#}.
3177
3178 @item -traditional
3179 @findex -traditional
3180 Try to imitate the behavior of old-fashioned C, as opposed to ISO C@.
3181
3182 @itemize @bullet
3183 @item
3184 Traditional macro expansion pays no attention to single-quote or
3185 double-quote characters; macro argument symbols are replaced by the
3186 argument values even when they appear within apparent string or
3187 character constants.
3188
3189 @item
3190 Traditionally, it is permissible for a macro expansion to end in the
3191 middle of a string or character constant.  The constant continues into
3192 the text surrounding the macro call.
3193
3194 @item
3195 However, traditionally the end of the line terminates a string or
3196 character constant, with no error.
3197
3198 @item
3199 In traditional C, a comment is equivalent to no text at all.  (In ISO
3200 C, a comment counts as whitespace.)
3201
3202 @item
3203 Traditional C does not have the concept of a ``preprocessing number''.
3204 It considers @samp{1.0e+4} to be three tokens: @samp{1.0e}, @samp{+},
3205 and @samp{4}.
3206
3207 @item
3208 A macro is not suppressed within its own definition, in traditional C@.
3209 Thus, any macro that is used recursively inevitably causes an error.
3210
3211 @item
3212 The character @samp{#} has no special meaning within a macro definition
3213 in traditional C@.
3214
3215 @item
3216 In traditional C, the text at the end of a macro expansion can run
3217 together with the text after the macro call, to produce a single token.
3218 (This is impossible in ISO C@.)
3219
3220 @item
3221 None of the GNU extensions to the preprocessor are available in
3222 @samp{-traditional} mode.
3223
3224 @end itemize
3225
3226 @cindex Fortran
3227 @cindex unterminated
3228 Use the @samp{-traditional} option when preprocessing Fortran code, so
3229 that single-quotes and double-quotes within Fortran comment lines (which
3230 are generally not recognized as such by the preprocessor) do not cause
3231 diagnostics about unterminated character or string constants.
3232
3233 However, this option does not prevent diagnostics about unterminated
3234 comments when a C-style comment appears to start, but not end, within
3235 Fortran-style commentary.
3236
3237 So, the following Fortran comment lines are accepted with
3238 @samp{-traditional}:
3239
3240 @smallexample
3241 C This isn't an unterminated character constant
3242 C Neither is "20000000000, an octal constant
3243 C in some dialects of Fortran
3244 @end smallexample
3245
3246 However, this type of comment line will likely produce a diagnostic, or
3247 at least unexpected output from the preprocessor, due to the
3248 unterminated comment:
3249
3250 @smallexample
3251 C Some Fortran compilers accept /* as starting
3252 C an inline comment.
3253 @end smallexample
3254
3255 @cindex g77
3256 Note that @code{g77} automatically supplies the @samp{-traditional}
3257 option when it invokes the preprocessor.  However, a future version of
3258 @code{g77} might use a different, more-Fortran-aware preprocessor in
3259 place of @code{cpp}.
3260
3261 @item -trigraphs
3262 @findex -trigraphs
3263 Process ISO standard trigraph sequences.  These are three-character
3264 sequences, all starting with @samp{??}, that are defined by ISO C to
3265 stand for single characters.  For example, @samp{??/} stands for
3266 @samp{\}, so @samp{'??/n'} is a character constant for a newline.  By
3267 default, GCC ignores trigraphs, but in standard-conforming modes it
3268 converts them.  See the @samp{-std} option.
3269
3270 The nine trigraph sequences are
3271 @table @samp
3272 @item ??(
3273 -> @samp{[}
3274
3275 @item ??)
3276 -> @samp{]}
3277
3278 @item ??<
3279 -> @samp{@{}
3280
3281 @item ??>
3282 -> @samp{@}}
3283
3284 @item ??=
3285 -> @samp{#}
3286
3287 @item ??/
3288 -> @samp{\}
3289
3290 @item ??'
3291 -> @samp{^}
3292
3293 @item ??!
3294 -> @samp{|}
3295
3296 @item ??-
3297 -> @samp{~}
3298
3299 @end table
3300
3301 Trigraph support is not popular, so many compilers do not implement it
3302 properly.  Portable code should not rely on trigraphs being either
3303 converted or ignored.
3304
3305 @item -pedantic
3306 @findex -pedantic
3307 Issue warnings required by the ISO C standard in certain cases such
3308 as when text other than a comment follows @samp{#else} or @samp{#endif}.
3309
3310 @item -pedantic-errors
3311 @findex -pedantic-errors
3312 Like @samp{-pedantic}, except that errors are produced rather than
3313 warnings.
3314
3315 @item -Wcomment
3316 @findex -Wcomment
3317 @itemx -Wcomments
3318 (Both forms have the same effect).
3319 Warn whenever a comment-start sequence @samp{/*} appears in a @samp{/*}
3320 comment, or whenever a backslash-newline appears in a @samp{//} comment.
3321
3322 @item -Wtrigraphs
3323 @findex -Wtrigraphs
3324 Warn if any trigraphs are encountered.  This option used to take effect
3325 only if @samp{-trigraphs} was also specified, but now works
3326 independently.  Warnings are not given for trigraphs within comments, as
3327 we feel this is obnoxious.
3328
3329 @item -Wwhite-space
3330 @findex -Wwhite-space
3331 Warn about possible white space confusion, e.g. white space between a
3332 backslash and a newline.
3333
3334 @item -Wall
3335 @findex -Wall
3336 Requests @samp{-Wcomment}, @samp{-Wtrigraphs}, and @samp{-Wwhite-space}
3337 (but not @samp{-Wtraditional} or @samp{-Wundef}).
3338
3339 @item -Wtraditional
3340 @findex -Wtraditional
3341 Warn about certain constructs that behave differently in traditional and
3342 ISO C@.
3343
3344 @itemize @bullet
3345 @item
3346 Macro parameters that appear within string literals in the macro body.
3347 In traditional C macro replacement takes place within string literals,
3348 but does not in ISO C.
3349
3350 @item
3351 In traditional C, some preprocessor directives did not exist.
3352 Traditional preprocessors would only consider a line to be a directive
3353 if the @samp{#} appeared in column 1 on the line.  Therefore
3354 @samp{-Wtraditional} warns about directives that traditional C
3355 understands but would ignore because the @samp{#} does not appear as the
3356 first character on the line.  It also suggests you hide directives like
3357 @samp{#pragma} not understood by traditional C by indenting them.  Some
3358 traditional implementations would not recognise @samp{#elif}, so it
3359 suggests avoiding it altogether.
3360
3361 @item
3362 A function-like macro that appears without arguments.
3363
3364 @item
3365 The unary plus operator.
3366
3367 @item
3368 The `U' integer constant suffix.  (Traditonal C does support the `L'
3369 suffix on integer constants.)  Note, these suffixes appear in macros
3370 defined in the system headers of most modern systems, e.g. the _MIN/_MAX
3371 macros in limits.h.  Use of these macros can lead to spurious warnings
3372 as they do not necessarily reflect whether the code in question is any
3373 less portable to traditional C given that suitable backup definitions
3374 are provided.
3375 @end itemize
3376
3377 @item -Wundef
3378 @findex -Wundef
3379 Warn if an undefined identifier is evaluated in an @samp{#if} directive.
3380
3381 @item -I @var{directory}
3382 @findex -I
3383 Add the directory @var{directory} to the head of the list of
3384 directories to be searched for header files (@pxref{Include Syntax}).
3385 This can be used to override a system header file, substituting your
3386 own version, since these directories are searched before the system
3387 header file directories.  If you use more than one @samp{-I} option,
3388 the directories are scanned in left-to-right order; the standard
3389 system directories come after.
3390
3391 @item -I-
3392 Any directories specified with @samp{-I} options before the @samp{-I-}
3393 option are searched only for the case of @samp{#include "@var{file}"};
3394 they are not searched for @samp{#include <@var{file}>}.
3395
3396 If additional directories are specified with @samp{-I} options after
3397 the @samp{-I-}, these directories are searched for all @samp{#include}
3398 directives.
3399
3400 In addition, the @samp{-I-} option inhibits the use of the current
3401 directory as the first search directory for @samp{#include "@var{file}"}.
3402 Therefore, the current directory is searched only if it is requested
3403 explicitly with @samp{-I.}.  Specifying both @samp{-I-} and @samp{-I.}
3404 allows you to control precisely which directories are searched before
3405 the current one and which are searched after.
3406
3407 @item -nostdinc
3408 @findex -nostdinc
3409 Do not search the standard system directories for header files.
3410 Only the directories you have specified with @samp{-I} options
3411 (and the current directory, if appropriate) are searched.
3412
3413 By using both @samp{-nostdinc} and @samp{-I-}, you can limit the include-file
3414 search path to only those directories you specify explicitly.
3415
3416 @item -nostdinc++
3417 @findex -nostdinc++
3418 Do not search for header files in the C++-specific standard directories,
3419 but do still search the other standard directories.  (This option is
3420 used when building the C++ library.)
3421
3422 @item -remap
3423 @findex -remap
3424 When searching for a header file in a directory, remap file names if a
3425 file named @file{header.gcc} exists in that directory.  This can be used
3426 to work around limitations of file systems with file name restrictions.
3427 The @file{header.gcc} file should contain a series of lines with two
3428 tokens on each line: the first token is the name to map, and the second
3429 token is the actual name to use.
3430
3431 @item -D @var{name}
3432 @findex -D
3433 Predefine @var{name} as a macro, with definition @samp{1}.
3434
3435 @item -D @var{name}=@var{definition}
3436 Predefine @var{name} as a macro, with definition @var{definition}.
3437 There are no restrictions on the contents of @var{definition}, but if
3438 you are invoking the preprocessor from a shell or shell-like program you
3439 may need to use the shell's quoting syntax to protect characters such as
3440 spaces that have a meaning in the shell syntax.  If you use more than
3441 one @samp{-D} for the same @var{name}, the rightmost definition takes
3442 effect.
3443
3444 Any @samp{-D} and @samp{-U} options on the command line are processed in
3445 order, and always before @samp{-imacros @var{file}}, regardless of the
3446 order in which they are written.
3447
3448 @item -U @var{name}
3449 @findex -U
3450 Do not predefine @var{name}.
3451
3452 Any @samp{-D} and @samp{-U} options on the command line are processed in
3453 order, and always before @samp{-imacros @var{file}}, regardless of the
3454 order in which they are written.
3455
3456 @item -undef
3457 @findex -undef
3458 Do not predefine any nonstandard macros.
3459
3460 @item -gcc
3461 @findex -gcc
3462 Define the macros @var{__GNUC__}, @var{__GNUC_MINOR__} and
3463 @var{__GNUC_PATCHLEVEL__}. These are defined automatically when you use
3464 @samp{gcc -E}; you can turn them off in that case with @samp{-no-gcc}.
3465
3466 @item -A @var{predicate}=@var{answer}
3467 @findex -A
3468 Make an assertion with the predicate @var{predicate} and answer
3469 @var{answer}.  This form is preferred to the older form @samp{-A
3470 @var{predicate}(@var{answer})}, which is still supported, because
3471 it does not use shell special characters.  @xref{Assertions}.
3472
3473 @item -A -@var{predicate}=@var{answer}
3474 Disable an assertion with the predicate @var{predicate} and answer
3475 @var{answer}.  Specifying no predicate, by @samp{-A-} or @samp{-A -},
3476 disables all predefined assertions and all assertions preceding it on
3477 the command line; and also undefines all predefined macros and all
3478 macros preceding it on the command line.
3479
3480 @item -dM
3481 @findex -dM
3482 Instead of outputting the result of preprocessing, output a list of
3483 @samp{#define} directives for all the macros defined during the
3484 execution of the preprocessor, including predefined macros.  This gives
3485 you a way of finding out what is predefined in your version of the
3486 preprocessor; assuming you have no file @samp{foo.h}, the command
3487
3488 @example
3489 touch foo.h; cpp -dM foo.h
3490 @end example
3491
3492 @noindent 
3493 will show the values of any predefined macros.
3494
3495 @item -dD
3496 @findex -dD
3497 Like @samp{-dM} except in two respects: it does @emph{not} include the
3498 predefined macros, and it outputs @emph{both} the @samp{#define}
3499 directives and the result of preprocessing.  Both kinds of output go to
3500 the standard output file.
3501
3502 @item -dN
3503 @findex -dN
3504 Like @samp{-dD}, but emit only the macro names, not their expansions.
3505
3506 @item -dI
3507 @findex -dI
3508 Output @samp{#include} directives in addition to the result of
3509 preprocessing.
3510
3511 @item -M
3512 @findex -M
3513 Instead of outputting the result of preprocessing, output a rule
3514 suitable for @code{make} describing the dependencies of the main source
3515 file.  The preprocessor outputs one @code{make} rule containing the
3516 object file name for that source file, a colon, and the names of all the
3517 included files, including those coming from @samp{-include} or
3518 @samp{-imacros} command line options.  Unless specified explicitly (with
3519 @samp{-MT} or @samp{-MQ}), the object file name consists of the basename
3520 of the source file with any suffix replaced with object file suffix.
3521 If there are many included files
3522 then the rule is split into several lines using @samp{\}-newline.
3523
3524 @item -MM
3525 @findex -MM
3526 Like @samp{-M}, but mention only the files included with @samp{#include
3527 "@var{file}"} or with @samp{-include} or @samp{-imacros} command line
3528 options.  System header files included with @samp{#include <@var{file}>}
3529 are omitted.
3530
3531 @item -MF @var{file}
3532 @findex -MF
3533 When used with @samp{-M} or @samp{-MM}, specifies a file to write the
3534 dependencies to.  This allows the preprocessor to write the preprocessed
3535 file to stdout normally.  If no @samp{-MF} switch is given, CPP sends
3536 the rules to stdout and suppresses normal preprocessed output.
3537
3538 @item -MG
3539 @findex -MG
3540 When used with @samp{-M} or @samp{-MM}, @samp{-MG} says to treat missing
3541 header files as generated files and assume they live in the same
3542 directory as the source file.  It suppresses preprocessed output, as a
3543 missing header file is ordinarily an error.
3544
3545 This feature is used in automatic updating of makefiles.
3546
3547 @item -MP
3548 @findex -MP
3549 This option instructs CPP to add a phony target for each dependency
3550 other than the main file, causing each to depend on nothing.  These
3551 dummy rules work around errors @code{make} gives if you remove header
3552 files without updating the @code{Makefile} to match.
3553
3554 This is typical output:-
3555
3556 @smallexample
3557 /tmp/test.o: /tmp/test.c /tmp/test.h
3558
3559 /tmp/test.h:
3560 @end smallexample
3561
3562 @item -MQ @var{target}
3563 @item -MT @var{target}
3564 @findex -MQ
3565 @findex -MT
3566 By default CPP uses the main file name, including any path, and appends
3567 the object suffix, normally ``.o'', to it to obtain the name of the
3568 target for dependency generation.  With @samp{-MT} you can specify a
3569 target yourself, overriding the default one.
3570
3571 If you want multiple targets, you can specify them as a single argument
3572 to @samp{-MT}, or use multiple @samp{-MT} options.
3573
3574 The targets you specify are output in the order they appear on the
3575 command line.  @samp{-MQ} is identical to @samp{-MT}, except that the
3576 target name is quoted for Make, but with @samp{-MT} it isn't.  For
3577 example, -MT '$(objpfx)foo.o' gives
3578
3579 @smallexample
3580 $(objpfx)foo.o: /tmp/foo.c
3581 @end smallexample
3582
3583 but -MQ '$(objpfx)foo.o' gives
3584
3585 @smallexample
3586 $$(objpfx)foo.o: /tmp/foo.c
3587 @end smallexample
3588
3589 The default target is automatically quoted, as if it were given with
3590 @samp{-MQ}.
3591
3592 @item -H
3593 @findex -H
3594 Print the name of each header file used, in addition to other normal
3595 activities.
3596
3597 @item -imacros @var{file}
3598 @findex -imacros
3599 Process @var{file} as input and discard the resulting output.
3600
3601 This has all the effects of @code{#include "file"} appearing on the
3602 first line of the main source file, such as generating dependencies and
3603 being listed with the @samp{-H} option, except that no output is
3604 generated, and that the first directory searched for @var{file} is the
3605 preprocessor's working directory @emph{instead of} the directory
3606 containing the main source file.  If not found there, it is searched for
3607 in the remainder of the @code{#include "..."} search chain as normal.
3608
3609 Because the output is discarded, the main effect of @samp{-imacros
3610 @var{file}} is to make the macros defined in @var{file} available for
3611 use in the main input.
3612
3613 @item -include @var{file}
3614 @findex -include
3615 Process @var{file} as input, and include all the resulting output.
3616
3617 This has all the effects of @code{#include "file"} appearing on the
3618 first line of the main source file, such as generating dependencies and
3619 being listed with the @samp{-H} option, except that the first directory
3620 searched for @var{file} is the preprocessor's working directory
3621 @emph{instead of} the directory containing the main source file.  If not
3622 found there, it is searched for in the remainder of the @code{#include
3623 "..."}  search chain as normal.
3624
3625 @item -idirafter @var{dir}
3626 @findex -idirafter
3627 @cindex second include path
3628 Add the directory @var{dir} to the second include path, marking it as a
3629 system directory.  The directories on the second include path are searched
3630 when a header file is not found in any of the directories in the main
3631 include path (the one that @samp{-I} adds to).
3632
3633 @item -iprefix @var{prefix}
3634 @findex -iprefix
3635 Specify @var{prefix} as the prefix for subsequent @samp{-iwithprefix}
3636 options.  If the prefix represents a directory, you should include the
3637 final @samp{/}.
3638
3639 @item -iwithprefix @var{dir}
3640 @findex -iwithprefix
3641 Add a directory to the second include path, marking it as a system
3642 directory.  The directory's name is made by concatenating @var{prefix}
3643 and @var{dir}, where @var{prefix} was specified previously with
3644 @samp{-iprefix}.
3645
3646 @item -isystem @var{dir}
3647 @findex -isystem
3648 Add a directory to the beginning of the second include path, marking it
3649 as a system directory, so that it gets the same special treatment as
3650 is applied to the standard system directories.  @xref{System Headers}.
3651
3652 @item -x c
3653 @itemx -x c++
3654 @itemx -x objective-c
3655 @itemx -x assembler-with-cpp
3656 @findex -x c
3657 @findex -x objective-c
3658 @findex -x assembler-with-cpp
3659 Specify the source language: C, C++, Objective-C, or assembly.  This has
3660 nothing to do with standards conformance or extensions; it merely
3661 selects which base syntax to expect.  If you give none of these options,
3662 cpp will deduce the language from the extension of the source file:
3663 @samp{.c}, @samp{.cc}, @samp{.m}, or @samp{.S}.  Some other common
3664 extensions for C++ and assembly are also recognized.  If cpp does not
3665 recognize the extension, it will treat the file as C; this is the most
3666 generic mode.
3667
3668 @strong{Note:} Previous versions of cpp accepted a @samp{-lang} option
3669 which selected both the language and the standards conformance level.
3670 This option has been removed, because it conflicts with the @samp{-l}
3671 option.
3672
3673 @item -std=@var{standard}
3674 @itemx -ansi
3675 @findex -std
3676 @findex -ansi
3677 Specify the standard to which the code should conform.  Currently cpp
3678 only knows about the standards for C; other language standards will be
3679 added in the future.
3680
3681 @var{standard}
3682 may be one of:
3683 @table @code
3684 @item iso9899:1990
3685 @itemx c89
3686 The ISO C standard from 1990.  @samp{c89} is the customary shorthand for
3687 this version of the standard.
3688
3689 The @samp{-ansi} option is equivalent to @samp{-std=c89}.
3690
3691 @item iso9899:199409
3692 The 1990 C standard, as amended in 1994.
3693
3694 @item iso9899:1999
3695 @itemx c99
3696 @itemx iso9899:199x
3697 @itemx c9x
3698 The revised ISO C standard, published in December 1999.  Before
3699 publication, this was known as C9X.
3700
3701 @item gnu89
3702 The 1990 C standard plus GNU extensions.  This is the default.
3703
3704 @item gnu99
3705 @itemx gnu9x
3706 The 1999 C standard plus GNU extensions.
3707 @end table
3708
3709 @item -ftabstop=NUMBER
3710 @findex -ftabstop
3711 Set the distance between tab stops.  This helps the preprocessor
3712 report correct column numbers in warnings or errors, even if tabs appear
3713 on the line.  Values less than 1 or greater than 100 are ignored.  The
3714 default is 8.
3715
3716 @item -$
3717 @findex -$
3718 Forbid the use of @samp{$} in identifiers.  The C standard allows
3719 implementations to define extra characters that can appear in
3720 identifiers.  By default the GNU C preprocessor permits @samp{$}, a
3721 common extension.
3722 @end table
3723 @c man end
3724
3725 @node Concept Index, Index, Invocation, Top
3726 @unnumbered Concept Index
3727 @printindex cp
3728
3729 @node Index,, Concept Index, Top
3730 @unnumbered Index of Directives, Macros and Options
3731 @printindex fn
3732
3733 @contents
3734 @bye