OSDN Git Service

* charset.c (cpp_init_iconv): Initialize utf8_cset_desc.
[pf3gnuchains/gcc-fork.git] / libcpp / internal.h
1 /* Part of CPP library.
2    Copyright (C) 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2007,
3    2008, 2009 Free Software Foundation, Inc.
4
5 This program is free software; you can redistribute it and/or modify it
6 under the terms of the GNU General Public License as published by the
7 Free Software Foundation; either version 3, or (at your option) any
8 later version.
9
10 This program is distributed in the hope that it will be useful,
11 but WITHOUT ANY WARRANTY; without even the implied warranty of
12 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 GNU General Public License for more details.
14
15 You should have received a copy of the GNU General Public License
16 along with this program; see the file COPYING3.  If not see
17 <http://www.gnu.org/licenses/>.  */
18
19 /* This header defines all the internal data structures and functions
20    that need to be visible across files.  It should not be used outside
21    cpplib.  */
22
23 #ifndef LIBCPP_INTERNAL_H
24 #define LIBCPP_INTERNAL_H
25
26 #include "symtab.h"
27 #include "cpp-id-data.h"
28
29 #if HAVE_ICONV
30 #include <iconv.h>
31 #else
32 #define HAVE_ICONV 0
33 typedef int iconv_t;  /* dummy */
34 #endif
35
36 #ifdef __cplusplus
37 extern "C" {
38 #endif
39
40 struct directive;               /* Deliberately incomplete.  */
41 struct pending_option;
42 struct op;
43 struct _cpp_strbuf;
44
45 typedef bool (*convert_f) (iconv_t, const unsigned char *, size_t,
46                            struct _cpp_strbuf *);
47 struct cset_converter
48 {
49   convert_f func;
50   iconv_t cd;
51   int width;
52 };
53
54 #define BITS_PER_CPPCHAR_T (CHAR_BIT * sizeof (cppchar_t))
55
56 /* Test if a sign is valid within a preprocessing number.  */
57 #define VALID_SIGN(c, prevc) \
58   (((c) == '+' || (c) == '-') && \
59    ((prevc) == 'e' || (prevc) == 'E' \
60     || (((prevc) == 'p' || (prevc) == 'P') \
61         && CPP_OPTION (pfile, extended_numbers))))
62
63 #define CPP_OPTION(PFILE, OPTION) ((PFILE)->opts.OPTION)
64 #define CPP_BUFFER(PFILE) ((PFILE)->buffer)
65 #define CPP_BUF_COLUMN(BUF, CUR) ((CUR) - (BUF)->line_base)
66 #define CPP_BUF_COL(BUF) CPP_BUF_COLUMN(BUF, (BUF)->cur)
67
68 #define CPP_INCREMENT_LINE(PFILE, COLS_HINT) do { \
69     const struct line_maps *line_table = PFILE->line_table; \
70     const struct line_map *map = &line_table->maps[line_table->used-1]; \
71     linenum_type line = SOURCE_LINE (map, line_table->highest_line); \
72     linemap_line_start (PFILE->line_table, line + 1, COLS_HINT); \
73   } while (0)
74
75 /* Maximum nesting of cpp_buffers.  We use a static limit, partly for
76    efficiency, and partly to limit runaway recursion.  */
77 #define CPP_STACK_MAX 200
78
79 /* Host alignment handling.  */
80 struct dummy
81 {
82   char c;
83   union
84   {
85     double d;
86     int *p;
87   } u;
88 };
89
90 #define DEFAULT_ALIGNMENT offsetof (struct dummy, u)
91 #define CPP_ALIGN2(size, align) (((size) + ((align) - 1)) & ~((align) - 1))
92 #define CPP_ALIGN(size) CPP_ALIGN2 (size, DEFAULT_ALIGNMENT)
93
94 #define _cpp_mark_macro_used(NODE) do {                                 \
95   if ((NODE)->type == NT_MACRO && !((NODE)->flags & NODE_BUILTIN))      \
96     (NODE)->value.macro->used = 1; } while (0)
97
98 /* A generic memory buffer, and operations on it.  */
99 typedef struct _cpp_buff _cpp_buff;
100 struct _cpp_buff
101 {
102   struct _cpp_buff *next;
103   unsigned char *base, *cur, *limit;
104 };
105
106 extern _cpp_buff *_cpp_get_buff (cpp_reader *, size_t);
107 extern void _cpp_release_buff (cpp_reader *, _cpp_buff *);
108 extern void _cpp_extend_buff (cpp_reader *, _cpp_buff **, size_t);
109 extern _cpp_buff *_cpp_append_extend_buff (cpp_reader *, _cpp_buff *, size_t);
110 extern void _cpp_free_buff (_cpp_buff *);
111 extern unsigned char *_cpp_aligned_alloc (cpp_reader *, size_t);
112 extern unsigned char *_cpp_unaligned_alloc (cpp_reader *, size_t);
113
114 #define BUFF_ROOM(BUFF) (size_t) ((BUFF)->limit - (BUFF)->cur)
115 #define BUFF_FRONT(BUFF) ((BUFF)->cur)
116 #define BUFF_LIMIT(BUFF) ((BUFF)->limit)
117
118 /* #include types.  */
119 enum include_type {IT_INCLUDE, IT_INCLUDE_NEXT, IT_IMPORT, IT_CMDLINE};
120
121 union utoken
122 {
123   const cpp_token *token;
124   const cpp_token **ptoken;
125 };
126
127 /* A "run" of tokens; part of a chain of runs.  */
128 typedef struct tokenrun tokenrun;
129 struct tokenrun
130 {
131   tokenrun *next, *prev;
132   cpp_token *base, *limit;
133 };
134
135 /* Accessor macros for struct cpp_context.  */
136 #define FIRST(c) ((c)->u.iso.first)
137 #define LAST(c) ((c)->u.iso.last)
138 #define CUR(c) ((c)->u.trad.cur)
139 #define RLIMIT(c) ((c)->u.trad.rlimit)
140
141 typedef struct cpp_context cpp_context;
142 struct cpp_context
143 {
144   /* Doubly-linked list.  */
145   cpp_context *next, *prev;
146
147   union
148   {
149     /* For ISO macro expansion.  Contexts other than the base context
150        are contiguous tokens.  e.g. macro expansions, expanded
151        argument tokens.  */
152     struct
153     {
154       union utoken first;
155       union utoken last;
156     } iso;
157
158     /* For traditional macro expansion.  */
159     struct
160     {
161       const unsigned char *cur;
162       const unsigned char *rlimit;
163     } trad;
164   } u;
165
166   /* If non-NULL, a buffer used for storage related to this context.
167      When the context is popped, the buffer is released.  */
168   _cpp_buff *buff;
169
170   /* For a macro context, the macro node, otherwise NULL.  */
171   cpp_hashnode *macro;
172
173   /* True if utoken element is token, else ptoken.  */
174   bool direct_p;
175 };
176
177 struct lexer_state
178 {
179   /* Nonzero if first token on line is CPP_HASH.  */
180   unsigned char in_directive;
181
182   /* Nonzero if in a directive that will handle padding tokens itself.
183      #include needs this to avoid problems with computed include and
184      spacing between tokens.  */
185   unsigned char directive_wants_padding;
186
187   /* True if we are skipping a failed conditional group.  */
188   unsigned char skipping;
189
190   /* Nonzero if in a directive that takes angle-bracketed headers.  */
191   unsigned char angled_headers;
192
193   /* Nonzero if in a #if or #elif directive.  */
194   unsigned char in_expression;
195
196   /* Nonzero to save comments.  Turned off if discard_comments, and in
197      all directives apart from #define.  */
198   unsigned char save_comments;
199
200   /* Nonzero if lexing __VA_ARGS__ is valid.  */
201   unsigned char va_args_ok;
202
203   /* Nonzero if lexing poisoned identifiers is valid.  */
204   unsigned char poisoned_ok;
205
206   /* Nonzero to prevent macro expansion.  */
207   unsigned char prevent_expansion;
208
209   /* Nonzero when parsing arguments to a function-like macro.  */
210   unsigned char parsing_args;
211
212   /* Nonzero if prevent_expansion is true only because output is
213      being discarded.  */
214   unsigned char discarding_output;
215
216   /* Nonzero to skip evaluating part of an expression.  */
217   unsigned int skip_eval;
218
219   /* Nonzero when handling a deferred pragma.  */
220   unsigned char in_deferred_pragma;
221
222   /* Nonzero if the deferred pragma being handled allows macro expansion.  */
223   unsigned char pragma_allow_expansion;
224 };
225
226 /* Special nodes - identifiers with predefined significance.  */
227 struct spec_nodes
228 {
229   cpp_hashnode *n_defined;              /* defined operator */
230   cpp_hashnode *n_true;                 /* C++ keyword true */
231   cpp_hashnode *n_false;                /* C++ keyword false */
232   cpp_hashnode *n__VA_ARGS__;           /* C99 vararg macros */
233 };
234
235 typedef struct _cpp_line_note _cpp_line_note;
236 struct _cpp_line_note
237 {
238   /* Location in the clean line the note refers to.  */
239   const unsigned char *pos;
240
241   /* Type of note.  The 9 'from' trigraph characters represent those
242      trigraphs, '\\' an escaped newline, ' ' an escaped newline with
243      intervening space, and anything else is invalid.  */
244   unsigned int type;
245 };
246
247 /* Represents the contents of a file cpplib has read in.  */
248 struct cpp_buffer
249 {
250   const unsigned char *cur;        /* Current location.  */
251   const unsigned char *line_base;  /* Start of current physical line.  */
252   const unsigned char *next_line;  /* Start of to-be-cleaned logical line.  */
253
254   const unsigned char *buf;        /* Entire character buffer.  */
255   const unsigned char *rlimit;     /* Writable byte at end of file.  */
256
257   _cpp_line_note *notes;           /* Array of notes.  */
258   unsigned int cur_note;           /* Next note to process.  */
259   unsigned int notes_used;         /* Number of notes.  */
260   unsigned int notes_cap;          /* Size of allocated array.  */
261
262   struct cpp_buffer *prev;
263
264   /* Pointer into the file table; non-NULL if this is a file buffer.
265      Used for include_next and to record control macros.  */
266   struct _cpp_file *file;
267
268   /* Saved value of __TIMESTAMP__ macro - date and time of last modification
269      of the assotiated file.  */
270   const unsigned char *timestamp;
271
272   /* Value of if_stack at start of this file.
273      Used to prohibit unmatched #endif (etc) in an include file.  */
274   struct if_stack *if_stack;
275
276   /* True if we need to get the next clean line.  */
277   bool need_line;
278
279   /* True if we have already warned about C++ comments in this file.
280      The warning happens only for C89 extended mode with -pedantic on,
281      or for -Wtraditional, and only once per file (otherwise it would
282      be far too noisy).  */
283   unsigned int warned_cplusplus_comments : 1;
284
285   /* True if we don't process trigraphs and escaped newlines.  True
286      for preprocessed input, command line directives, and _Pragma
287      buffers.  */
288   unsigned int from_stage3 : 1;
289
290   /* At EOF, a buffer is automatically popped.  If RETURN_AT_EOF is
291      true, a CPP_EOF token is then returned.  Otherwise, the next
292      token from the enclosing buffer is returned.  */
293   unsigned int return_at_eof : 1;
294
295   /* One for a system header, two for a C system header file that therefore
296      needs to be extern "C" protected in C++, and zero otherwise.  */
297   unsigned char sysp;
298
299   /* The directory of the this buffer's file.  Its NAME member is not
300      allocated, so we don't need to worry about freeing it.  */
301   struct cpp_dir dir;
302
303   /* Descriptor for converting from the input character set to the
304      source character set.  */
305   struct cset_converter input_cset_desc;
306 };
307
308 /* A cpp_reader encapsulates the "state" of a pre-processor run.
309    Applying cpp_get_token repeatedly yields a stream of pre-processor
310    tokens.  Usually, there is only one cpp_reader object active.  */
311 struct cpp_reader
312 {
313   /* Top of buffer stack.  */
314   cpp_buffer *buffer;
315
316   /* Overlaid buffer (can be different after processing #include).  */
317   cpp_buffer *overlaid_buffer;
318
319   /* Lexer state.  */
320   struct lexer_state state;
321
322   /* Source line tracking.  */
323   struct line_maps *line_table;
324
325   /* The line of the '#' of the current directive.  */
326   source_location directive_line;
327
328   /* Memory buffers.  */
329   _cpp_buff *a_buff;            /* Aligned permanent storage.  */
330   _cpp_buff *u_buff;            /* Unaligned permanent storage.  */
331   _cpp_buff *free_buffs;        /* Free buffer chain.  */
332
333   /* Context stack.  */
334   struct cpp_context base_context;
335   struct cpp_context *context;
336
337   /* If in_directive, the directive if known.  */
338   const struct directive *directive;
339
340   /* Token generated while handling a directive, if any. */
341   cpp_token directive_result;
342
343   /* When expanding a macro at top-level, this is the location of the
344      macro invocation.  */
345   source_location invocation_location;
346
347   /* True if this call to cpp_get_token should consider setting
348      invocation_location.  */
349   bool set_invocation_location;
350
351   /* Search paths for include files.  */
352   struct cpp_dir *quote_include;        /* "" */
353   struct cpp_dir *bracket_include;      /* <> */
354   struct cpp_dir no_search_path;        /* No path.  */
355
356   /* Chain of all hashed _cpp_file instances.  */
357   struct _cpp_file *all_files;
358
359   struct _cpp_file *main_file;
360
361   /* File and directory hash table.  */
362   struct htab *file_hash;
363   struct htab *dir_hash;
364   struct file_hash_entry_pool *file_hash_entries;
365
366   /* Negative path lookup hash table.  */
367   struct htab *nonexistent_file_hash;
368   struct obstack nonexistent_file_ob;
369
370   /* Nonzero means don't look for #include "foo" the source-file
371      directory.  */
372   bool quote_ignores_source_dir;
373
374   /* Nonzero if any file has contained #pragma once or #import has
375      been used.  */
376   bool seen_once_only;
377
378   /* Multiple include optimization.  */
379   const cpp_hashnode *mi_cmacro;
380   const cpp_hashnode *mi_ind_cmacro;
381   bool mi_valid;
382
383   /* Lexing.  */
384   cpp_token *cur_token;
385   tokenrun base_run, *cur_run;
386   unsigned int lookaheads;
387
388   /* Nonzero prevents the lexer from re-using the token runs.  */
389   unsigned int keep_tokens;
390
391   /* Buffer to hold macro definition string.  */
392   unsigned char *macro_buffer;
393   unsigned int macro_buffer_len;
394
395   /* Descriptor for converting from the source character set to the
396      execution character set.  */
397   struct cset_converter narrow_cset_desc;
398
399   /* Descriptor for converting from the source character set to the
400      UTF-8 execution character set.  */
401   struct cset_converter utf8_cset_desc;
402
403   /* Descriptor for converting from the source character set to the
404      UTF-16 execution character set.  */
405   struct cset_converter char16_cset_desc;
406
407   /* Descriptor for converting from the source character set to the
408      UTF-32 execution character set.  */
409   struct cset_converter char32_cset_desc;
410
411   /* Descriptor for converting from the source character set to the
412      wide execution character set.  */
413   struct cset_converter wide_cset_desc;
414
415   /* Date and time text.  Calculated together if either is requested.  */
416   const unsigned char *date;
417   const unsigned char *time;
418
419   /* EOF token, and a token forcing paste avoidance.  */
420   cpp_token avoid_paste;
421   cpp_token eof;
422
423   /* Opaque handle to the dependencies of mkdeps.c.  */
424   struct deps *deps;
425
426   /* Obstack holding all macro hash nodes.  This never shrinks.
427      See identifiers.c */
428   struct obstack hash_ob;
429
430   /* Obstack holding buffer and conditional structures.  This is a
431      real stack.  See directives.c.  */
432   struct obstack buffer_ob;
433
434   /* Pragma table - dynamic, because a library user can add to the
435      list of recognized pragmas.  */
436   struct pragma_entry *pragmas;
437
438   /* Call backs to cpplib client.  */
439   struct cpp_callbacks cb;
440
441   /* Identifier hash table.  */
442   struct ht *hash_table;
443
444   /* Expression parser stack.  */
445   struct op *op_stack, *op_limit;
446
447   /* User visible options.  */
448   struct cpp_options opts;
449
450   /* Special nodes - identifiers with predefined significance to the
451      preprocessor.  */
452   struct spec_nodes spec_nodes;
453
454   /* Whether cpplib owns the hashtable.  */
455   bool our_hashtable;
456
457   /* Traditional preprocessing output buffer (a logical line).  */
458   struct
459   {
460     unsigned char *base;
461     unsigned char *limit;
462     unsigned char *cur;
463     source_location first_line;
464   } out;
465
466   /* Used for buffer overlays by traditional.c.  */
467   const unsigned char *saved_cur, *saved_rlimit, *saved_line_base;
468
469   /* A saved list of the defined macros, for dependency checking
470      of precompiled headers.  */
471   struct cpp_savedstate *savedstate;
472
473   /* Next value of __COUNTER__ macro. */
474   unsigned int counter;
475
476   /* Table of comments, when state.save_comments is true.  */
477   cpp_comment_table comments;
478 };
479
480 /* Character classes.  Based on the more primitive macros in safe-ctype.h.
481    If the definition of `numchar' looks odd to you, please look up the
482    definition of a pp-number in the C standard [section 6.4.8 of C99].
483
484    In the unlikely event that characters other than \r and \n enter
485    the set is_vspace, the macro handle_newline() in lex.c must be
486    updated.  */
487 #define _dollar_ok(x)   ((x) == '$' && CPP_OPTION (pfile, dollars_in_ident))
488
489 #define is_idchar(x)    (ISIDNUM(x) || _dollar_ok(x))
490 #define is_numchar(x)   ISIDNUM(x)
491 #define is_idstart(x)   (ISIDST(x) || _dollar_ok(x))
492 #define is_numstart(x)  ISDIGIT(x)
493 #define is_hspace(x)    ISBLANK(x)
494 #define is_vspace(x)    IS_VSPACE(x)
495 #define is_nvspace(x)   IS_NVSPACE(x)
496 #define is_space(x)     IS_SPACE_OR_NUL(x)
497
498 /* This table is constant if it can be initialized at compile time,
499    which is the case if cpp was compiled with GCC >=2.7, or another
500    compiler that supports C99.  */
501 #if HAVE_DESIGNATED_INITIALIZERS
502 extern const unsigned char _cpp_trigraph_map[UCHAR_MAX + 1];
503 #else
504 extern unsigned char _cpp_trigraph_map[UCHAR_MAX + 1];
505 #endif
506
507 /* Macros.  */
508
509 static inline int cpp_in_system_header (cpp_reader *);
510 static inline int
511 cpp_in_system_header (cpp_reader *pfile)
512 {
513   return pfile->buffer ? pfile->buffer->sysp : 0;
514 }
515 #define CPP_PEDANTIC(PF) CPP_OPTION (PF, pedantic)
516 #define CPP_WTRADITIONAL(PF) CPP_OPTION (PF, warn_traditional)
517
518 static inline int cpp_in_primary_file (cpp_reader *);
519 static inline int
520 cpp_in_primary_file (cpp_reader *pfile)
521 {
522   return pfile->line_table->depth == 1;
523 }
524
525 /* In macro.c */
526 extern void _cpp_free_definition (cpp_hashnode *);
527 extern bool _cpp_create_definition (cpp_reader *, cpp_hashnode *);
528 extern void _cpp_pop_context (cpp_reader *);
529 extern void _cpp_push_text_context (cpp_reader *, cpp_hashnode *,
530                                     const unsigned char *, size_t);
531 extern bool _cpp_save_parameter (cpp_reader *, cpp_macro *, cpp_hashnode *);
532 extern bool _cpp_arguments_ok (cpp_reader *, cpp_macro *, const cpp_hashnode *,
533                                unsigned int);
534 extern const unsigned char *_cpp_builtin_macro_text (cpp_reader *,
535                                                      cpp_hashnode *);
536 extern int _cpp_warn_if_unused_macro (cpp_reader *, cpp_hashnode *, void *);
537 extern void _cpp_push_token_context (cpp_reader *, cpp_hashnode *,
538                                      const cpp_token *, unsigned int);
539 extern void _cpp_backup_tokens_direct (cpp_reader *, unsigned int);
540
541 /* In identifiers.c */
542 extern void _cpp_init_hashtable (cpp_reader *, hash_table *);
543 extern void _cpp_destroy_hashtable (cpp_reader *);
544
545 /* In files.c */
546 typedef struct _cpp_file _cpp_file;
547 extern _cpp_file *_cpp_find_file (cpp_reader *, const char *, cpp_dir *,
548                                   bool, int);
549 extern bool _cpp_find_failed (_cpp_file *);
550 extern void _cpp_mark_file_once_only (cpp_reader *, struct _cpp_file *);
551 extern void _cpp_fake_include (cpp_reader *, const char *);
552 extern bool _cpp_stack_file (cpp_reader *, _cpp_file*, bool);
553 extern bool _cpp_stack_include (cpp_reader *, const char *, int,
554                                 enum include_type);
555 extern int _cpp_compare_file_date (cpp_reader *, const char *, int);
556 extern void _cpp_report_missing_guards (cpp_reader *);
557 extern void _cpp_init_files (cpp_reader *);
558 extern void _cpp_cleanup_files (cpp_reader *);
559 extern void _cpp_pop_file_buffer (cpp_reader *, struct _cpp_file *);
560 extern bool _cpp_save_file_entries (cpp_reader *pfile, FILE *f);
561 extern bool _cpp_read_file_entries (cpp_reader *, FILE *);
562 extern struct stat *_cpp_get_file_stat (_cpp_file *);
563
564 /* In expr.c */
565 extern bool _cpp_parse_expr (cpp_reader *, bool);
566 extern struct op *_cpp_expand_op_stack (cpp_reader *);
567
568 /* In lex.c */
569 extern void _cpp_process_line_notes (cpp_reader *, int);
570 extern void _cpp_clean_line (cpp_reader *);
571 extern bool _cpp_get_fresh_line (cpp_reader *);
572 extern bool _cpp_skip_block_comment (cpp_reader *);
573 extern cpp_token *_cpp_temp_token (cpp_reader *);
574 extern const cpp_token *_cpp_lex_token (cpp_reader *);
575 extern cpp_token *_cpp_lex_direct (cpp_reader *);
576 extern int _cpp_equiv_tokens (const cpp_token *, const cpp_token *);
577 extern void _cpp_init_tokenrun (tokenrun *, unsigned int);
578
579 /* In init.c.  */
580 extern void _cpp_maybe_push_include_file (cpp_reader *);
581 extern const char *cpp_named_operator2name (enum cpp_ttype type);
582
583 /* In directives.c */
584 extern int _cpp_test_assertion (cpp_reader *, unsigned int *);
585 extern int _cpp_handle_directive (cpp_reader *, int);
586 extern void _cpp_define_builtin (cpp_reader *, const char *);
587 extern char ** _cpp_save_pragma_names (cpp_reader *);
588 extern void _cpp_restore_pragma_names (cpp_reader *, char **);
589 extern int _cpp_do__Pragma (cpp_reader *);
590 extern void _cpp_init_directives (cpp_reader *);
591 extern void _cpp_init_internal_pragmas (cpp_reader *);
592 extern void _cpp_do_file_change (cpp_reader *, enum lc_reason, const char *,
593                                  linenum_type, unsigned int);
594 extern void _cpp_pop_buffer (cpp_reader *);
595
596 /* In directives.c */
597 struct _cpp_dir_only_callbacks
598 {
599   /* Called to print a block of lines. */
600   void (*print_lines) (int, const void *, size_t);
601   void (*maybe_print_line) (source_location);
602 };
603
604 extern void _cpp_preprocess_dir_only (cpp_reader *,
605                                       const struct _cpp_dir_only_callbacks *);
606
607 /* In traditional.c.  */
608 extern bool _cpp_scan_out_logical_line (cpp_reader *, cpp_macro *);
609 extern bool _cpp_read_logical_line_trad (cpp_reader *);
610 extern void _cpp_overlay_buffer (cpp_reader *pfile, const unsigned char *,
611                                  size_t);
612 extern void _cpp_remove_overlay (cpp_reader *);
613 extern bool _cpp_create_trad_definition (cpp_reader *, cpp_macro *);
614 extern bool _cpp_expansions_different_trad (const cpp_macro *,
615                                             const cpp_macro *);
616 extern unsigned char *_cpp_copy_replacement_text (const cpp_macro *,
617                                                   unsigned char *);
618 extern size_t _cpp_replacement_text_len (const cpp_macro *);
619
620 /* In charset.c.  */
621
622 /* The normalization state at this point in the sequence.
623    It starts initialized to all zeros, and at the end
624    'level' is the normalization level of the sequence.  */
625
626 struct normalize_state 
627 {
628   /* The previous character.  */
629   cppchar_t previous;
630   /* The combining class of the previous character.  */
631   unsigned char prev_class;
632   /* The lowest normalization level so far.  */
633   enum cpp_normalize_level level;
634 };
635 #define INITIAL_NORMALIZE_STATE { 0, 0, normalized_KC }
636 #define NORMALIZE_STATE_RESULT(st) ((st)->level)
637
638 /* We saw a character that matches ISIDNUM(), update a
639    normalize_state appropriately.  */
640 #define NORMALIZE_STATE_UPDATE_IDNUM(st) \
641   ((st)->previous = 0, (st)->prev_class = 0)
642
643 extern cppchar_t _cpp_valid_ucn (cpp_reader *, const unsigned char **,
644                                  const unsigned char *, int,
645                                  struct normalize_state *state);
646 extern void _cpp_destroy_iconv (cpp_reader *);
647 extern unsigned char *_cpp_convert_input (cpp_reader *, const char *,
648                                           unsigned char *, size_t, size_t,
649                                           const unsigned char **, off_t *);
650 extern const char *_cpp_default_encoding (void);
651 extern cpp_hashnode * _cpp_interpret_identifier (cpp_reader *pfile,
652                                                  const unsigned char *id,
653                                                  size_t len);
654
655 /* Utility routines and macros.  */
656 #define DSC(str) (const unsigned char *)str, sizeof str - 1
657
658 /* These are inline functions instead of macros so we can get type
659    checking.  */
660 static inline int ustrcmp (const unsigned char *, const unsigned char *);
661 static inline int ustrncmp (const unsigned char *, const unsigned char *,
662                             size_t);
663 static inline size_t ustrlen (const unsigned char *);
664 static inline unsigned char *uxstrdup (const unsigned char *);
665 static inline unsigned char *ustrchr (const unsigned char *, int);
666 static inline int ufputs (const unsigned char *, FILE *);
667
668 /* Use a const char for the second parameter since it is usually a literal.  */
669 static inline int ustrcspn (const unsigned char *, const char *);
670
671 static inline int
672 ustrcmp (const unsigned char *s1, const unsigned char *s2)
673 {
674   return strcmp ((const char *)s1, (const char *)s2);
675 }
676
677 static inline int
678 ustrncmp (const unsigned char *s1, const unsigned char *s2, size_t n)
679 {
680   return strncmp ((const char *)s1, (const char *)s2, n);
681 }
682
683 static inline int
684 ustrcspn (const unsigned char *s1, const char *s2)
685 {
686   return strcspn ((const char *)s1, s2);
687 }
688
689 static inline size_t
690 ustrlen (const unsigned char *s1)
691 {
692   return strlen ((const char *)s1);
693 }
694
695 static inline unsigned char *
696 uxstrdup (const unsigned char *s1)
697 {
698   return (unsigned char *) xstrdup ((const char *)s1);
699 }
700
701 static inline unsigned char *
702 ustrchr (const unsigned char *s1, int c)
703 {
704   return (unsigned char *) strchr ((const char *)s1, c);
705 }
706
707 static inline int
708 ufputs (const unsigned char *s, FILE *f)
709 {
710   return fputs ((const char *)s, f);
711 }
712
713 #ifdef __cplusplus
714 }
715 #endif
716
717 #endif /* ! LIBCPP_INTERNAL_H */