OSDN Git Service

(safe_read, safe_write): Handle EINTR.
[pf3gnuchains/gcc-fork.git] / gcc / protoize.c
1 /* Protoize program - Original version by Ron Guilmette at MCC.
2
3    Copyright (C) 1989, 1992 Free Software Foundation, Inc.
4
5 This file is part of GNU CC.
6
7 GNU CC is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 2, or (at your option)
10 any later version.
11
12 GNU CC is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GNU CC; see the file COPYING.  If not, write to
19 the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
20
21 /* Any reasonable C++ compiler should have all of the same features
22    as __STDC__ plus more, so make sure that __STDC__ is defined if
23    __cplusplus is defined. */
24
25 #if defined(__cplusplus) && !defined(__STDC__)
26 #define __STDC__ 1
27 #endif /* defined(__cplusplus) && !defined(__STDC__) */
28
29 #if defined(__GNUC__) || defined (__GNUG__)
30 #define VOLATILE volatile
31 #else
32 #define VOLATILE
33 #endif
34
35 #ifndef __STDC__
36 #define const
37 #define volatile
38 #endif
39
40 #include "config.h"
41
42 #if 0
43 /* Users are not supposed to use _POSIX_SOURCE to say the
44    system is a POSIX system.  That is not what _POSIX_SOURCE means! -- rms  */ 
45 /* If the user asked for POSIX via _POSIX_SOURCE, turn on POSIX code.  */
46 #if defined(_POSIX_SOURCE) && !defined(POSIX)
47 #define POSIX
48 #endif
49 #endif /* 0 */
50
51 #ifdef POSIX /* We should be able to define _POSIX_SOURCE unconditionally,
52                 but some systems respond in buggy ways to it,
53                 including SunOS 4.1.1.  Which we don't classify as POSIX.  */
54 /* In case this is a POSIX system with an ANSI C compiler,
55    ask for definition of all POSIX facilities.  */
56 #undef _POSIX_SOURCE
57 #define _POSIX_SOURCE
58 #endif
59
60 #include "gvarargs.h"
61 /* On some systems stdio.h includes stdarg.h;
62    we must bring in gvarargs.h first.  */
63 #include <stdio.h>
64 #include <ctype.h>
65 #include <errno.h>
66 #include <sys/types.h>
67 #include <sys/stat.h>
68 #ifdef POSIX
69 #include <dirent.h>
70 #else
71 #include <sys/dir.h>
72 #endif
73 #include <setjmp.h>
74
75 /* Include getopt.h for the sake of getopt_long.
76    We don't need the declaration of getopt, and it could conflict
77    with something from a system header file, so effectively nullify that.  */
78 #define getopt getopt_loser
79 #include "getopt.h"
80 #undef getopt
81
82 extern int errno;
83 #if defined(bsd4_4)
84 extern const char *const sys_errlist[];
85 #else
86 extern char *sys_errlist[];
87 #endif
88 extern char *version_string;
89
90 /* Systems which are compatible only with POSIX 1003.1-1988 (but *not*
91    with POSIX 1003.1-1990), e.g. Ultrix 4.2, might not have
92    const qualifiers in the prototypes in the system include files.
93    Unfortunately, this can lead to GCC issuing lots of warnings for
94    calls to the following functions.  To eliminate these warnings we
95    provide the following #defines.  */
96
97 #define my_access(file,flag)    access((char *)file, flag)
98 #define my_stat(file,pkt)       stat((char *)file, pkt)
99 #define my_execvp(prog,argv)    execvp((char *)prog, (char **)argv)
100 #define my_link(file1, file2)   link((char *)file1, (char *)file2)
101 #define my_unlink(file)         unlink((char *)file)
102 #define my_open(file, mode, flag)       open((char *)file, mode, flag)
103 #define my_chmod(file, mode)    chmod((char *)file, mode)
104
105 extern char *getpwd ();
106
107 /* Aliases for pointers to void.
108    These were made to facilitate compilation with old brain-dead DEC C
109    compilers which didn't properly grok `void*' types.  */
110
111 #ifdef __STDC__
112 typedef void * pointer_type;
113 typedef const void * const_pointer_type;
114 #else
115 typedef char * pointer_type;
116 typedef char * const_pointer_type;
117 #endif
118
119 #if defined(POSIX)
120
121 #include <stdlib.h>
122 #include <unistd.h>
123 #include <signal.h>
124 #include <fcntl.h>
125
126 #else /* !defined(POSIX) */
127
128 #define R_OK    4       /* Test for Read permission */
129 #define W_OK    2       /* Test for Write permission */
130 #define X_OK    1       /* Test for eXecute permission */
131 #define F_OK    0       /* Test for existence of File */
132
133 #define O_RDONLY        0
134 #define O_WRONLY        1
135
136 /* Declaring stat or __flsbuf with a prototype
137    causes conflicts with system headers on some systems.  */
138
139 #ifndef abort
140 typedef void voidfn ();
141 extern VOLATILE voidfn abort;
142 #endif
143 extern int kill ();
144 extern int creat ();
145 #if 0 /* These conflict with stdio.h on some systems.  */
146 extern int fprintf (FILE *, const char *, ...);
147 extern int printf (const char *, ...);
148 extern int open (const char *, int, ...);
149 #endif /* 0 */
150 extern void exit ();
151 extern pointer_type malloc ();
152 extern pointer_type realloc ();
153 extern void free ();
154 extern int read ();
155 extern int write ();
156 extern int close ();
157 extern int fflush ();
158 extern int atoi ();
159 extern int puts ();
160 extern int fputs ();
161 extern int fputc ();
162 extern int link ();
163 extern int unlink ();
164 extern int access ();
165 extern int execvp ();
166 /* In 2.6, try deleting these decls entirely since setjmp.h should
167    take care of them.  */
168 #ifndef __NeXT__
169 #ifndef setjmp
170 extern int setjmp ();
171 #endif
172 #ifndef longjmp
173 extern void longjmp ();
174 #endif
175 #endif
176
177 #if 0 /* size_t from sys/types.h may fail to match GCC.
178          If so, we would get a warning from this.  */
179 extern size_t   strlen ()
180 #endif
181
182 /* Fork is not declared because the declaration caused a conflict
183    on the HPPA.  */
184 #if !(defined (USG) || defined (VMS))
185 #define fork vfork
186 #endif /* (defined (USG) || defined (VMS)) */
187
188 #endif /* !defined (POSIX) */
189
190 extern char *rindex ();
191
192 /* Look for these where the `const' qualifier is intentionally cast aside.  */
193
194 #define NONCONST
195
196 /* Define a STRINGIFY macro that's right for ANSI or traditional C.  */
197
198 #ifdef __STDC__
199 #define STRINGIFY(STRING) #STRING
200 #else
201 #define STRINGIFY(STRING) "STRING"
202 #endif
203
204 /* Define a default place to find the SYSCALLS.X file.  */
205
206 #ifndef STD_PROTO_DIR
207 #define STD_PROTO_DIR "/usr/local/lib"
208 #endif /* !defined (STD_PROTO_DIR) */
209
210 /* Suffix of aux_info files.  */
211
212 static const char * const aux_info_suffix = ".X";
213
214 /* String to attach to filenames for saved versions of original files.  */
215
216 static const char * const save_suffix = ".save";
217
218 #ifndef UNPROTOIZE
219
220 /* File name of the file which contains descriptions of standard system
221    routines.  Note that we never actually do anything with this file per se,
222    but we do read in its corresponding aux_info file.  */
223
224 static const char syscalls_filename[] = "SYSCALLS.c";
225
226 /* Default place to find the above file.  */
227
228 static const char * const default_syscalls_dir = STD_PROTO_DIR;
229
230 /* Variable to hold the complete absolutized filename of the SYSCALLS.c.X
231    file.  */
232
233 static char * syscalls_absolute_filename;
234
235 #endif /* !defined (UNPROTOIZE) */
236
237 /* Type of the structure that holds information about macro unexpansions. */
238
239 struct unexpansion_struct {
240   const char *expanded;
241   const char *contracted;
242 };
243 typedef struct unexpansion_struct unexpansion;
244
245 /* A table of conversions that may need to be made for some (stupid) older
246    operating systems where these types are preprocessor macros rather than
247    typedefs (as they really ought to be).
248
249    WARNING: The contracted forms must be as small (or smaller) as the
250    expanded forms, or else havoc will ensue.  */
251
252 static const unexpansion unexpansions[] = {
253   { "struct _iobuf", "FILE" },
254   { 0, 0 }
255 };
256
257 /* The number of "primary" slots in the hash tables for filenames and for
258    function names.  This can be as big or as small as you like, except that
259    it must be a power of two.  */
260
261 #define HASH_TABLE_SIZE         (1 << 9)
262
263 /* Bit mask to use when computing hash values.  */
264
265 static const int hash_mask = (HASH_TABLE_SIZE - 1);
266
267 /* Make a table of default system include directories
268    just as it is done in cccp.c.  */
269
270 #ifndef STANDARD_INCLUDE_DIR
271 #define STANDARD_INCLUDE_DIR "/usr/include"
272 #endif
273
274 #ifndef LOCAL_INCLUDE_DIR
275 #define LOCAL_INCLUDE_DIR "/usr/local/include"
276 #endif
277
278 struct default_include { const char *fname; int cplusplus; } include_defaults[]
279 #ifdef INCLUDE_DEFAULTS
280   = INCLUDE_DEFAULTS;
281 #else
282   = {
283     /* Pick up GNU C++ specific include files.  */
284     { GPLUSPLUS_INCLUDE_DIR, 1},
285 #ifdef CROSS_COMPILE
286     /* This is the dir for fixincludes.  Put it just before
287        the files that we fix.  */
288     { GCC_INCLUDE_DIR, 0},
289     /* For cross-compilation, this dir name is generated
290        automatically in Makefile.in.  */
291     { CROSS_INCLUDE_DIR, 0 },
292     /* This is another place that the target system's headers might be.  */
293     { TOOL_INCLUDE_DIR, 0},
294 #else /* not CROSS_COMPILE */
295     /* This should be /use/local/include and should come before
296        the fixincludes-fixed header files.  */
297     { LOCAL_INCLUDE_DIR, 0},
298     /* This is here ahead of GCC_INCLUDE_DIR because assert.h goes here.
299        Likewise, behind LOCAL_INCLUDE_DIR, where glibc puts its assert.h.  */
300     { TOOL_INCLUDE_DIR, 0},
301     /* This is the dir for fixincludes.  Put it just before
302        the files that we fix.  */
303     { GCC_INCLUDE_DIR, 0},
304     /* Some systems have an extra dir of include files.  */
305 #ifdef SYSTEM_INCLUDE_DIR
306     { SYSTEM_INCLUDE_DIR, 0},
307 #endif
308     { STANDARD_INCLUDE_DIR, 0},
309 #endif /* not CROSS_COMPILE */
310     { 0, 0}
311     };
312 #endif /* no INCLUDE_DEFAULTS */
313
314 /* Datatype for lists of directories or filenames.  */
315 struct string_list
316 {
317   char *name;
318   struct string_list *next;
319 };
320
321 /* List of directories in which files should be converted.  */
322
323 struct string_list *directory_list;
324
325 /* List of file names which should not be converted.
326    A file is excluded if the end of its name, following a /,
327    matches one of the names in this list.  */
328
329 struct string_list *exclude_list;
330
331 /* The name of the other style of variable-number-of-parameters functions
332    (i.e. the style that we want to leave unconverted because we don't yet
333    know how to convert them to this style.  This string is used in warning
334    messages.  */
335
336 /* Also define here the string that we can search for in the parameter lists
337    taken from the .X files which will unambiguously indicate that we have
338    found a varargs style function.  */
339
340 #ifdef UNPROTOIZE
341 static const char * const other_var_style = "stdarg";
342 #else /* !defined (UNPROTOIZE) */
343 static const char * const other_var_style = "varargs";
344 /* Note that this is a string containing the expansion of va_alist.
345    But in `main' we discard all but the first token.  */
346 static const char *varargs_style_indicator = STRINGIFY (va_alist);
347 #endif /* !defined (UNPROTOIZE) */
348
349 /* The following two types are used to create hash tables.  In this program,
350    there are two hash tables which are used to store and quickly lookup two
351    different classes of strings.  The first type of strings stored in the
352    first hash table are absolute filenames of files which protoize needs to
353    know about.  The second type of strings (stored in the second hash table)
354    are function names.  It is this second class of strings which really
355    inspired the use of the hash tables, because there may be a lot of them.  */
356
357 typedef struct hash_table_entry_struct hash_table_entry;
358
359 /* Do some typedefs so that we don't have to write "struct" so often.  */
360
361 typedef struct def_dec_info_struct def_dec_info;
362 typedef struct file_info_struct file_info;
363 typedef struct f_list_chain_item_struct f_list_chain_item;
364
365 /* In the struct below, note that the "_info" field has two different uses
366    depending on the type of hash table we are in (i.e. either the filenames
367    hash table or the function names hash table).  In the filenames hash table
368    the info fields of the entries point to the file_info struct which is
369    associated with each filename (1 per filename).  In the function names
370    hash table, the info field points to the head of a singly linked list of
371    def_dec_info entries which are all defs or decs of the function whose
372    name is pointed to by the "symbol" field.  Keeping all of the defs/decs
373    for a given function name on a special list specifically for that function
374    name makes it quick and easy to find out all of the important information
375    about a given (named) function.  */
376
377 struct hash_table_entry_struct {
378   hash_table_entry *            hash_next;      /* -> to secondary entries */
379   const char *                  symbol;         /* -> to the hashed string */
380   union {
381     const def_dec_info *        _ddip;
382     file_info *                 _fip;
383   } _info;
384 };
385 #define ddip _info._ddip
386 #define fip _info._fip
387
388 /* Define a type specifically for our two hash tables.  */
389
390 typedef hash_table_entry hash_table[HASH_TABLE_SIZE];
391
392 /* The following struct holds all of the important information about any
393    single filename (e.g. file) which we need to know about.  */
394
395 struct file_info_struct {
396   const hash_table_entry *      hash_entry; /* -> to associated hash entry */
397   const def_dec_info *          defs_decs;  /* -> to chain of defs/decs */
398   time_t                        mtime;      /* Time of last modification.  */
399 };
400
401 /* Due to the possibility that functions may return pointers to functions,
402    (which may themselves have their own parameter lists) and due to the
403    fact that returned pointers-to-functions may be of type "pointer-to-
404    function-returning-pointer-to-function" (ad nauseum) we have to keep
405    an entire chain of ANSI style formal parameter lists for each function.
406
407    Normally, for any given function, there will only be one formals list
408    on the chain, but you never know.
409
410    Note that the head of each chain of formals lists is pointed to by the
411    `f_list_chain' field of the corresponding def_dec_info record.
412
413    For any given chain, the item at the head of the chain is the *leftmost*
414    parameter list seen in the actual C language function declaration.  If
415    there are other members of the chain, then these are linked in left-to-right
416    order from the head of the chain.  */
417
418 struct f_list_chain_item_struct {
419   const f_list_chain_item *     chain_next;     /* -> to next item on chain */
420   const char *                  formals_list;   /* -> to formals list string */
421 };
422
423 /* The following struct holds all of the important information about any
424    single function definition or declaration which we need to know about.
425    Note that for unprotoize we don't need to know very much because we
426    never even create records for stuff that we don't intend to convert
427    (like for instance defs and decs which are already in old K&R format
428    and "implicit" function declarations).  */
429
430 struct def_dec_info_struct {
431   const def_dec_info *  next_in_file;   /* -> to rest of chain for file */
432   file_info *           file;           /* -> file_info for containing file */
433   int                   line;           /* source line number of def/dec */
434   const char *          ansi_decl;      /* -> left end of ansi decl */
435   hash_table_entry *    hash_entry;     /* -> hash entry for function name */
436   unsigned int          is_func_def;    /* = 0 means this is a declaration */
437   const def_dec_info *  next_for_func;  /* -> to rest of chain for func name */
438   unsigned int          f_list_count;   /* count of formals lists we expect */
439   char                  prototyped;     /* = 0 means already prototyped */
440 #ifndef UNPROTOIZE
441   const f_list_chain_item * f_list_chain;       /* -> chain of formals lists */
442   const def_dec_info *  definition;     /* -> def/dec containing related def */
443   char                  is_static;      /* = 0 means visibility is "extern"  */
444   char                  is_implicit;    /* != 0 for implicit func decl's */
445   char                  written;        /* != 0 means written for implicit */
446 #else /* !defined (UNPROTOIZE) */
447   const char *          formal_names;   /* -> to list of names of formals */
448   const char *          formal_decls;   /* -> to string of formal declarations */
449 #endif /* !defined (UNPROTOIZE) */
450 };
451
452 /* Pointer to the tail component of the filename by which this program was
453    invoked.  Used everywhere in error and warning messages.  */
454
455 static const char *pname;
456
457 /* Error counter.  Will be non-zero if we should give up at the next convenient
458    stopping point.  */
459
460 static int errors = 0;
461
462 /* Option flags.  */
463 /* ??? These comments should say what the flag mean as well as the options
464    that set them.  */
465
466 /* File name to use for running gcc.  Allows GCC 2 to be named
467    something other than gcc.  */
468 static const char *compiler_file_name = "gcc";
469
470 static int version_flag = 0;            /* Print our version number.  */
471 static int quiet_flag = 0;              /* Don't print messages normally.  */
472 static int nochange_flag = 0;           /* Don't convert, just say what files
473                                            we would have converted.  */
474 static int nosave_flag = 0;             /* Don't save the old version.  */
475 static int keep_flag = 0;               /* Don't delete the .X files.  */
476 static const char ** compile_params = 0;        /* Option string for gcc.  */
477 #ifdef UNPROTOIZE
478 static const char *indent_string = "     ";     /* Indentation for newly
479                                                    inserted parm decls.  */
480 #else /* !defined (UNPROTOIZE) */
481 static int local_flag = 0;              /* Insert new local decls (when?).  */
482 static int global_flag = 0;             /* set by -g option */
483 static int cplusplus_flag = 0;          /* Rename converted files to *.C.  */
484 static const char* nondefault_syscalls_dir = 0; /* Dir to look for
485                                                    SYSCALLS.c.X in.  */
486 #endif /* !defined (UNPROTOIZE) */
487
488 /* An index into the compile_params array where we should insert the source
489    file name when we are ready to exec the C compiler.  A zero value indicates
490    that we have not yet called munge_compile_params.  */
491
492 static int input_file_name_index = 0;
493
494 /* An index into the compile_params array where we should insert the filename
495    for the aux info file, when we run the C compiler.  */
496 static int aux_info_file_name_index = 0;
497
498 /* Count of command line arguments which were "filename" arguments.  */
499
500 static int n_base_source_files = 0;
501
502 /* Points to a malloc'ed list of pointers to all of the filenames of base
503    source files which were specified on the command line.  */
504
505 static const char **base_source_filenames;
506
507 /* Line number of the line within the current aux_info file that we
508    are currently processing.  Used for error messages in case the prototypes
509    info file is corrupted somehow.  */
510
511 static int current_aux_info_lineno;
512
513 /* Pointer to the name of the source file currently being converted.  */
514
515 static const char *convert_filename;
516
517 /* Pointer to relative root string (taken from aux_info file) which indicates
518    where directory the user was in when he did the compilation step that
519    produced the containing aux_info file. */
520
521 static const char *invocation_filename;
522
523 /* Pointer to the base of the input buffer that holds the original text for the
524    source file currently being converted.  */
525
526 static const char *orig_text_base;
527
528 /* Pointer to the byte just beyond the end of the input buffer that holds the
529    original text for the source file currently being converted.  */
530
531 static const char *orig_text_limit;
532
533 /* Pointer to the base of the input buffer that holds the cleaned text for the
534    source file currently being converted.  */
535
536 static const char *clean_text_base;
537
538 /* Pointer to the byte just beyond the end of the input buffer that holds the
539    cleaned text for the source file currently being converted.  */
540
541 static const char *clean_text_limit;
542
543 /* Pointer to the last byte in the cleaned text buffer that we have already
544    (virtually) copied to the output buffer (or decided to ignore).  */
545
546 static const char * clean_read_ptr;
547
548 /* Pointer to the base of the output buffer that holds the replacement text
549    for the source file currently being converted.  */
550
551 static char *repl_text_base;
552
553 /* Pointer to the byte just beyond the end of the output buffer that holds the
554    replacement text for the source file currently being converted.  */
555
556 static char *repl_text_limit;
557
558 /* Pointer to the last byte which has been stored into the output buffer.
559    The next byte to be stored should be stored just past where this points
560    to.  */
561
562 static char * repl_write_ptr;
563
564 /* Pointer into the cleaned text buffer for the source file we are currently
565    converting.  This points to the first character of the line that we last
566    did a "seek_to_line" to (see below).  */
567
568 static const char *last_known_line_start;
569
570 /* Number of the line (in the cleaned text buffer) that we last did a
571    "seek_to_line" to.  Will be one if we just read a new source file
572    into the cleaned text buffer.  */
573
574 static int last_known_line_number;
575
576 /* The filenames hash table.  */
577
578 static hash_table filename_primary;
579
580 /* The function names hash table.  */
581
582 static hash_table function_name_primary;
583
584 /* The place to keep the recovery address which is used only in cases where
585    we get hopelessly confused by something in the cleaned original text.  */
586
587 static jmp_buf source_confusion_recovery;
588
589 /* A pointer to the current directory filename (used by abspath).  */
590
591 static char *cwd_buffer;
592
593 /* A place to save the read pointer until we are sure that an individual
594    attempt at editing will succeed.  */
595
596 static const char * saved_clean_read_ptr;
597
598 /* A place to save the write pointer until we are sure that an individual
599    attempt at editing will succeed.  */
600
601 static char * saved_repl_write_ptr;
602
603 /* Forward declaration.  */
604
605 static const char *shortpath ();
606 \f
607 /* Allocate some space, but check that the allocation was successful.  */
608 /* alloca.c uses this, so don't make it static.  */
609
610 pointer_type
611 xmalloc (byte_count)
612      size_t byte_count;
613 {
614   pointer_type rv;
615
616   rv = malloc (byte_count);
617   if (rv == NULL)
618     {
619       fprintf (stderr, "\n%s: virtual memory exceeded\n", pname);
620       exit (1);
621       return 0;         /* avoid warnings */
622     }
623   else
624     return rv;
625 }
626
627 /* Reallocate some space, but check that the reallocation was successful.  */
628
629 pointer_type
630 xrealloc (old_space, byte_count)
631      pointer_type old_space;
632      size_t byte_count;
633 {
634   pointer_type rv;
635
636   rv = realloc (old_space, byte_count);
637   if (rv == NULL)
638     {
639       fprintf (stderr, "\n%s: virtual memory exceeded\n", pname);
640       exit (1);
641       return 0;         /* avoid warnings */
642     }
643   else
644     return rv;
645 }
646
647 /* Deallocate the area pointed to by an arbitrary pointer, but first, strip
648    the `const' qualifier from it and also make sure that the pointer value
649    is non-null.  */
650
651 void
652 xfree (p)
653      const_pointer_type p;
654 {
655   if (p)
656     free ((NONCONST pointer_type) p);
657 }
658
659 /* Make a copy of a string INPUT with size SIZE.  */
660
661 static char *
662 savestring (input, size)
663      const char *input;
664      unsigned int size;
665 {
666   char *output = (char *) xmalloc (size + 1);
667   strcpy (output, input);
668   return output;
669 }
670
671 /* Make a copy of the concatenation of INPUT1 and INPUT2.  */
672
673 static char *
674 savestring2 (input1, size1, input2, size2)
675      const char *input1;
676      unsigned int size1;
677      const char *input2;
678      unsigned int size2;
679 {
680   char *output = (char *) xmalloc (size1 + size2 + 1);
681   strcpy (output, input1);
682   strcpy (&output[size1], input2);
683   return output;
684 }
685
686 /* More 'friendly' abort that prints the line and file.
687    config.h can #define abort fancy_abort if you like that sort of thing.  */
688
689 void
690 fancy_abort ()
691 {
692   fprintf (stderr, "%s: internal abort\n", pname);
693   exit (1);
694 }
695 \f
696 /* Make a duplicate of the first N bytes of a given string in a newly
697    allocated area.  */
698
699 static char *
700 dupnstr (s, n)
701      const char *s;
702      size_t n;
703 {
704   char *ret_val = (char *) xmalloc (n + 1);
705
706   strncpy (ret_val, s, n);
707   ret_val[n] = '\0';
708   return ret_val;
709 }
710
711 /* Return a pointer to the first occurrence of s2 within s1 or NULL if s2
712    does not occur within s1.  Assume neither s1 nor s2 are null pointers.  */
713
714 static const char *
715 substr (s1, s2)
716      const char *s1;
717      const char *const s2;
718 {
719   for (; *s1 ; s1++)
720     {
721       const char *p1;
722       const char *p2;
723       int c;
724
725       for (p1 = s1, p2 = s2; c = *p2; p1++, p2++)
726         if (*p1 != c)
727           goto outer;
728       return s1;
729 outer:
730       ;
731     }
732   return 0;
733 }
734 \f
735 /* Read LEN bytes at PTR from descriptor DESC, for file FILENAME,
736    retrying if necessary.  Return the actual number of bytes read.  */
737
738 static int
739 safe_read (desc, ptr, len)
740      int desc;
741      char *ptr;
742      int len;
743 {
744   int left = len;
745   while (left > 0) {
746     int nchars = read (desc, ptr, left);
747     if (nchars < 0)
748       {
749 #ifdef EINTR
750         if (errno == EINTR)
751           continue;
752 #endif
753         return nchars;
754       }
755     if (nchars == 0)
756       break;
757     ptr += nchars;
758     left -= nchars;
759   }
760   return len - left;
761 }
762
763 /* Write LEN bytes at PTR to descriptor DESC,
764    retrying if necessary, and treating any real error as fatal.  */
765
766 static void
767 safe_write (desc, ptr, len, out_fname)
768      int desc;
769      char *ptr;
770      int len;
771      char *out_fname;
772 {
773   while (len > 0) {
774     int written = write (desc, ptr, len);
775     if (written < 0)
776       {
777 #ifdef EINTR
778         if (errno == EINTR)
779           continue;
780 #endif
781         fprintf (stderr, "%s: error writing file `%s': %s\n",
782                  pname, shortpath (NULL, out_fname), sys_errlist[errno]);
783       }
784     ptr += written;
785     len -= written;
786   }
787 }
788 \f
789 /* Get setup to recover in case the edit we are about to do goes awry.  */
790
791 void
792 save_pointers ()
793 {
794   saved_clean_read_ptr = clean_read_ptr;
795   saved_repl_write_ptr = repl_write_ptr;
796 }
797
798 /* Call this routine to recover our previous state whenever something looks
799    too confusing in the source code we are trying to edit.  */
800
801 void
802 restore_pointers ()
803 {
804   clean_read_ptr = saved_clean_read_ptr;
805   repl_write_ptr = saved_repl_write_ptr;
806 }
807
808 /* Return true if the given character is a legal identifier character.  */
809
810 static int
811 is_id_char (ch)
812      char ch;
813 {
814   return (isalnum (ch) || (ch == '_') || (ch == '$'));
815 }
816
817 /* Give a message indicating the proper way to invoke this program and then
818    exit with non-zero status.  */
819
820 static void
821 usage ()
822 {
823 #ifdef UNPROTOIZE
824   fprintf (stderr, "%s: usage '%s [ -VqfnkN ] [ -i <istring> ] [ filename ... ]'\n",
825            pname, pname);
826 #else /* !defined (UNPROTOIZE) */
827   fprintf (stderr, "%s: usage '%s [ -VqfnkNlgC ] [ -B <diname> ] [ filename ... ]'\n",
828            pname, pname);
829 #endif /* !defined (UNPROTOIZE) */
830   exit (1);
831 }
832
833 /* Return true if the given filename (assumed to be an absolute filename)
834    designates a file residing anywhere beneath any one of the "system"
835    include directories.  */
836
837 static int
838 in_system_include_dir (path)
839      const char *path;
840 {
841   struct default_include *p;
842
843   if (path[0] != '/')
844     abort ();           /* Must be an absolutized filename.  */
845
846   for (p = include_defaults; p->fname; p++)
847     if (!strncmp (path, p->fname, strlen (p->fname))
848         && path[strlen (p->fname)] == '/')
849       return 1;
850   return 0;
851 }
852 \f
853 #if 0
854 /* Return true if the given filename designates a file that the user has
855    read access to and for which the user has write access to the containing
856    directory.  */
857
858 static int
859 file_could_be_converted (const char *path)
860 {
861   char *const dir_name = (char *) alloca (strlen (path) + 1);
862
863   if (my_access (path, R_OK))
864     return 0;
865
866   {
867     char *dir_last_slash;
868
869     strcpy (dir_name, path);
870     dir_last_slash = rindex (dir_name, '/');
871     if (dir_last_slash)
872       *dir_last_slash = '\0';
873     else
874       abort ();  /* Should have been an absolutized filename.  */
875   }
876
877   if (my_access (path, W_OK))
878     return 0;
879
880   return 1;
881 }
882
883 /* Return true if the given filename designates a file that we are allowed
884    to modify.  Files which we should not attempt to modify are (a) "system"
885    include files, and (b) files which the user doesn't have write access to,
886    and (c) files which reside in directories which the user doesn't have
887    write access to.  Unless requested to be quiet, give warnings about
888    files that we will not try to convert for one reason or another.  An
889    exception is made for "system" include files, which we never try to
890    convert and for which we don't issue the usual warnings.  */
891
892 static int
893 file_normally_convertible (const char *path)
894 {
895   char *const dir_name = alloca (strlen (path) + 1);
896
897   if (in_system_include_dir (path))
898     return 0;
899
900   {
901     char *dir_last_slash;
902
903     strcpy (dir_name, path);
904     dir_last_slash = rindex (dir_name, '/');
905     if (dir_last_slash)
906       *dir_last_slash = '\0';
907     else
908       abort ();  /* Should have been an absolutized filename.  */
909   }
910
911   if (my_access (path, R_OK))
912     {
913       if (!quiet_flag)
914         fprintf (stderr, "%s: warning: no read access for file `%s'\n",
915                  pname, shortpath (NULL, path));
916       return 0;
917     }
918
919   if (my_access (path, W_OK))
920     {
921       if (!quiet_flag)
922         fprintf (stderr, "%s: warning: no write access for file `%s'\n",
923                  pname, shortpath (NULL, path));
924       return 0;
925     }
926
927   if (my_access (dir_name, W_OK))
928     {
929       if (!quiet_flag)
930         fprintf (stderr, "%s: warning: no write access for dir containing `%s'\n",
931                  pname, shortpath (NULL, path));
932       return 0;
933     }
934
935   return 1;
936 }
937 #endif /* 0 */
938 \f
939 #ifndef UNPROTOIZE
940
941 /* Return true if the given file_info struct refers to the special SYSCALLS.c.X
942    file.  Return false otherwise.  */
943
944 static int
945 is_syscalls_file (fi_p)
946      const file_info *fi_p;
947 {
948   char const *f = fi_p->hash_entry->symbol;
949   size_t fl = strlen (f), sysl = sizeof (syscalls_filename) - 1;
950   return sysl <= fl  &&  strcmp (f + fl - sysl, syscalls_filename) == 0;
951 }
952
953 #endif /* !defined (UNPROTOIZE) */
954
955 /* Check to see if this file will need to have anything done to it on this
956    run.  If there is nothing in the given file which both needs conversion
957    and for which we have the necessary stuff to do the conversion, return
958    false.  Otherwise, return true.
959
960    Note that (for protoize) it is only valid to call this function *after*
961    the connections between declarations and definitions have all been made
962    by connect_defs_and_decs.  */
963
964 static int
965 needs_to_be_converted (file_p)
966      const file_info *file_p;
967 {
968   const def_dec_info *ddp;
969
970 #ifndef UNPROTOIZE
971
972   if (is_syscalls_file (file_p))
973     return 0;
974
975 #endif /* !defined (UNPROTOIZE) */
976
977   for (ddp = file_p->defs_decs; ddp; ddp = ddp->next_in_file)
978
979     if (
980
981 #ifndef UNPROTOIZE
982
983       /* ... and if we a protoizing and this function is in old style ... */
984       !ddp->prototyped
985       /* ... and if this a definition or is a decl with an associated def ... */
986       && (ddp->is_func_def || (!ddp->is_func_def && ddp->definition))
987
988 #else /* defined (UNPROTOIZE) */
989
990       /* ... and if we are unprotoizing and this function is in new style ... */
991       ddp->prototyped
992
993 #endif /* defined (UNPROTOIZE) */
994       )
995           /* ... then the containing file needs converting.  */
996           return -1;
997   return 0;
998 }
999
1000 /* Return 1 if the file name NAME is in a directory
1001    that should be converted.  */
1002
1003 static int
1004 directory_specified_p (name)
1005      const char *name;
1006 {
1007   struct string_list *p;
1008
1009   for (p = directory_list; p; p = p->next)
1010     if (!strncmp (name, p->name, strlen (p->name))
1011         && name[strlen (p->name)] == '/')
1012       {
1013         const char *q = name + strlen (p->name) + 1;
1014
1015         /* If there are more slashes, it's in a subdir, so
1016            this match doesn't count.  */
1017         while (*q)
1018           if (*q++ == '/')
1019             goto lose;
1020         return 1;
1021
1022       lose: ;
1023       }
1024
1025   return 0;
1026 }
1027
1028 /* Return 1 if the file named NAME should be excluded from conversion.  */
1029
1030 static int
1031 file_excluded_p (name)
1032      const char *name;
1033 {
1034   struct string_list *p;
1035   int len = strlen (name);
1036
1037   for (p = exclude_list; p; p = p->next)
1038     if (!strcmp (name + len - strlen (p->name), p->name)
1039         && name[len - strlen (p->name) - 1] == '/')
1040       return 1;
1041
1042   return 0;
1043 }
1044
1045 /* Construct a new element of a string_list.
1046    STRING is the new element value, and REST holds the remaining elements.  */
1047
1048 static struct string_list *
1049 string_list_cons (string, rest)
1050      char *string;
1051      struct string_list *rest;
1052 {
1053   struct string_list *temp
1054     = (struct string_list *) xmalloc (sizeof (struct string_list));
1055
1056   temp->next = rest;
1057   temp->name = string;
1058   return temp;
1059 }
1060 \f
1061 /* ??? The GNU convention for mentioning function args in its comments
1062    is to capitalize them.  So change "hash_tab_p" to HASH_TAB_P below.
1063    Likewise for all the other functions.  */
1064
1065 /* Given a hash table, apply some function to each node in the table. The
1066    table to traverse is given as the "hash_tab_p" argument, and the
1067    function to be applied to each node in the table is given as "func"
1068    argument.  */
1069
1070 static void
1071 visit_each_hash_node (hash_tab_p, func)
1072      const hash_table_entry *hash_tab_p;
1073      void (*func)();
1074 {
1075   const hash_table_entry *primary;
1076
1077   for (primary = hash_tab_p; primary < &hash_tab_p[HASH_TABLE_SIZE]; primary++)
1078     if (primary->symbol)
1079       {
1080         hash_table_entry *second;
1081
1082         (*func)(primary);
1083         for (second = primary->hash_next; second; second = second->hash_next)
1084           (*func) (second);
1085       }
1086 }
1087
1088 /* Initialize all of the fields of a new hash table entry, pointed
1089    to by the "p" parameter.  Note that the space to hold the entry
1090    is assumed to have already been allocated before this routine is
1091    called.  */
1092
1093 static hash_table_entry *
1094 add_symbol (p, s)
1095      hash_table_entry *p;
1096      const char *s;
1097 {
1098   p->hash_next = NULL;
1099   p->symbol = savestring (s, strlen (s));
1100   p->ddip = NULL;
1101   p->fip = NULL;
1102   return p;
1103 }
1104
1105 /* Look for a particular function name or filename in the particular
1106    hash table indicated by "hash_tab_p".  If the name is not in the
1107    given hash table, add it.  Either way, return a pointer to the
1108    hash table entry for the given name.  */
1109
1110 static hash_table_entry *
1111 lookup (hash_tab_p, search_symbol)
1112      hash_table_entry *hash_tab_p;
1113      const char *search_symbol;
1114 {
1115   int hash_value = 0;
1116   const char *search_symbol_char_p = search_symbol;
1117   hash_table_entry *p;
1118
1119   while (*search_symbol_char_p)
1120     hash_value += *search_symbol_char_p++;
1121   hash_value &= hash_mask;
1122   p = &hash_tab_p[hash_value];
1123   if (! p->symbol)
1124       return add_symbol (p, search_symbol);
1125   if (!strcmp (p->symbol, search_symbol))
1126     return p;
1127   while (p->hash_next)
1128     {
1129       p = p->hash_next;
1130       if (!strcmp (p->symbol, search_symbol))
1131         return p;
1132     }
1133   p->hash_next = (hash_table_entry *) xmalloc (sizeof (hash_table_entry));
1134   p = p->hash_next;
1135   return add_symbol (p, search_symbol);
1136 }
1137 \f
1138 /* Throw a def/dec record on the junk heap.
1139
1140    Also, since we are not using this record anymore, free up all of the
1141    stuff it pointed to.  */
1142
1143 static void
1144 free_def_dec (p)
1145      def_dec_info *p;
1146 {
1147   xfree (p->ansi_decl);
1148
1149 #ifndef UNPROTOIZE
1150   {
1151     const f_list_chain_item * curr;
1152     const f_list_chain_item * next;
1153
1154     for (curr = p->f_list_chain; curr; curr = next)
1155       {
1156         next = curr->chain_next;
1157         xfree (curr);
1158       }
1159   }
1160 #endif /* !defined (UNPROTOIZE) */
1161
1162   xfree (p);
1163 }
1164
1165 /* Unexpand as many macro symbol as we can find.
1166
1167    If the given line must be unexpanded, make a copy of it in the heap and
1168    return a pointer to the unexpanded copy.  Otherwise return NULL.  */
1169
1170 static char *
1171 unexpand_if_needed (aux_info_line)
1172      const char *aux_info_line;
1173 {
1174   static char *line_buf = 0;
1175   static int line_buf_size = 0;
1176   const unexpansion* unexp_p;
1177   int got_unexpanded = 0;
1178   const char *s;
1179   char *copy_p = line_buf;
1180
1181   if (line_buf == 0)
1182     {
1183       line_buf_size = 1024;
1184       line_buf = (char *) xmalloc (line_buf_size);
1185     }
1186
1187   copy_p = line_buf;
1188
1189   /* Make a copy of the input string in line_buf, expanding as necessary.  */
1190
1191   for (s = aux_info_line; *s != '\n'; )
1192     {
1193       for (unexp_p = unexpansions; unexp_p->expanded; unexp_p++)
1194         {
1195           const char *in_p = unexp_p->expanded;
1196           size_t len = strlen (in_p);
1197
1198           if (*s == *in_p && !strncmp (s, in_p, len) && !is_id_char (s[len]))
1199             {
1200               int size = strlen (unexp_p->contracted);
1201               got_unexpanded = 1;
1202               if (copy_p + size - line_buf >= line_buf_size)
1203                 {
1204                   int offset = copy_p - line_buf;
1205                   line_buf_size *= 2;
1206                   line_buf_size += size;
1207                   line_buf = (char *) xrealloc (line_buf, line_buf_size);
1208                   copy_p = line_buf + offset;
1209                 }
1210               strcpy (copy_p, unexp_p->contracted);
1211               copy_p += size;
1212
1213               /* Assume the there will not be another replacement required
1214                  within the text just replaced.  */
1215
1216               s += len;
1217               goto continue_outer;
1218             }
1219         }
1220       if (copy_p - line_buf == line_buf_size)
1221         {
1222           int offset = copy_p - line_buf;
1223           line_buf_size *= 2;
1224           line_buf = (char *) xrealloc (line_buf, line_buf_size);
1225           copy_p = line_buf + offset;
1226         }
1227       *copy_p++ = *s++;
1228 continue_outer: ;
1229     }
1230   if (copy_p + 2 - line_buf >= line_buf_size)
1231     {
1232       int offset = copy_p - line_buf;
1233       line_buf_size *= 2;
1234       line_buf = (char *) xrealloc (line_buf, line_buf_size);
1235       copy_p = line_buf + offset;
1236     }
1237   *copy_p++ = '\n';
1238   *copy_p = '\0';
1239
1240   return (got_unexpanded ? savestring (line_buf, copy_p - line_buf) : 0);
1241 }
1242 \f
1243 /* Return the absolutized filename for the given relative
1244    filename.  Note that if that filename is already absolute, it may
1245    still be returned in a modified form because this routine also
1246    eliminates redundant slashes and single dots and eliminates double
1247    dots to get a shortest possible filename from the given input
1248    filename.  The absolutization of relative filenames is made by
1249    assuming that the given filename is to be taken as relative to
1250    the first argument (cwd) or to the current directory if cwd is
1251    NULL.  */
1252
1253 static char *
1254 abspath (cwd, rel_filename)
1255      const char *cwd;
1256      const char *rel_filename;
1257 {
1258   /* Setup the current working directory as needed.  */
1259   const char *cwd2 = (cwd) ? cwd : cwd_buffer;
1260   char *const abs_buffer
1261     = (char *) alloca (strlen (cwd2) + strlen (rel_filename) + 2);
1262   char *endp = abs_buffer;
1263   char *outp, *inp;
1264
1265   /* Copy the  filename (possibly preceded by the current working
1266      directory name) into the absolutization buffer.  */
1267
1268   {
1269     const char *src_p;
1270
1271     if (rel_filename[0] != '/')
1272       {
1273         src_p = cwd2;
1274         while (*endp++ = *src_p++)
1275           continue;
1276         *(endp-1) = '/';                        /* overwrite null */
1277       }
1278     src_p = rel_filename;
1279     while (*endp++ = *src_p++)
1280       continue;
1281   }
1282
1283   /* Now make a copy of abs_buffer into abs_buffer, shortening the
1284      filename (by taking out slashes and dots) as we go.  */
1285
1286   outp = inp = abs_buffer;
1287   *outp++ = *inp++;             /* copy first slash */
1288 #ifdef apollo
1289   if (inp[0] == '/')
1290     *outp++ = *inp++;           /* copy second slash */
1291 #endif
1292   for (;;)
1293     {
1294       if (!inp[0])
1295         break;
1296       else if (inp[0] == '/' && outp[-1] == '/')
1297         {
1298           inp++;
1299           continue;
1300         }
1301       else if (inp[0] == '.' && outp[-1] == '/')
1302         {
1303           if (!inp[1])
1304                   break;
1305           else if (inp[1] == '/')
1306             {
1307                     inp += 2;
1308                     continue;
1309             }
1310           else if ((inp[1] == '.') && (inp[2] == 0 || inp[2] == '/'))
1311             {
1312                     inp += (inp[2] == '/') ? 3 : 2;
1313                     outp -= 2;
1314                     while (outp >= abs_buffer && *outp != '/')
1315                 outp--;
1316                     if (outp < abs_buffer)
1317                 {
1318                   /* Catch cases like /.. where we try to backup to a
1319                      point above the absolute root of the logical file
1320                      system.  */
1321
1322                   fprintf (stderr, "%s: invalid file name: %s\n",
1323                            pname, rel_filename);
1324                   exit (1);
1325                 }
1326                     *++outp = '\0';
1327                     continue;
1328             }
1329         }
1330       *outp++ = *inp++;
1331     }
1332
1333   /* On exit, make sure that there is a trailing null, and make sure that
1334      the last character of the returned string is *not* a slash.  */
1335
1336   *outp = '\0';
1337   if (outp[-1] == '/')
1338     *--outp  = '\0';
1339
1340   /* Make a copy (in the heap) of the stuff left in the absolutization
1341      buffer and return a pointer to the copy.  */
1342
1343   return savestring (abs_buffer, outp - abs_buffer);
1344 }
1345 \f
1346 /* Given a filename (and possibly a directory name from which the filename
1347    is relative) return a string which is the shortest possible
1348    equivalent for the corresponding full (absolutized) filename.  The
1349    shortest possible equivalent may be constructed by converting the
1350    absolutized filename to be a relative filename (i.e. relative to
1351    the actual current working directory).  However if a relative filename
1352    is longer, then the full absolute filename is returned.
1353
1354    KNOWN BUG:
1355
1356    Note that "simple-minded" conversion of any given type of filename (either
1357    relative or absolute) may not result in a valid equivalent filename if any
1358    subpart of the original filename is actually a symbolic link.  */
1359
1360 static const char *
1361 shortpath (cwd, filename)
1362      const char *cwd;
1363      const char *filename;
1364 {
1365   char *rel_buffer;
1366   char *rel_buf_p;
1367   char *cwd_p = cwd_buffer;
1368   char *path_p;
1369   int unmatched_slash_count = 0;
1370   size_t filename_len = strlen (filename);
1371
1372   path_p = abspath (cwd, filename);
1373   rel_buf_p = rel_buffer = (char *) xmalloc (filename_len);
1374
1375   while (*cwd_p && (*cwd_p == *path_p))
1376     {
1377       cwd_p++;
1378       path_p++;
1379     }
1380   if (!*cwd_p && (!*path_p || *path_p == '/'))  /* whole pwd matched */
1381     {
1382       if (!*path_p)             /* input *is* the current path! */
1383         return ".";
1384       else
1385         return ++path_p;
1386     }
1387   else
1388     {
1389       if (*path_p)
1390         {
1391           --cwd_p;
1392           --path_p;
1393           while (*cwd_p != '/')         /* backup to last slash */
1394             {
1395               --cwd_p;
1396               --path_p;
1397             }
1398           cwd_p++;
1399           path_p++;
1400           unmatched_slash_count++;
1401         }
1402
1403       /* Find out how many directory levels in cwd were *not* matched.  */
1404       while (*cwd_p)
1405         if (*cwd_p++ == '/')
1406           unmatched_slash_count++;
1407
1408       /* Now we know how long the "short name" will be.
1409          Reject it if longer than the input.  */
1410       if (unmatched_slash_count * 3 + strlen (path_p) >= filename_len)
1411         return filename;
1412
1413       /* For each of them, put a `../' at the beginning of the short name.  */
1414       while (unmatched_slash_count--)
1415         {
1416           /* Give up if the result gets to be longer
1417              than the absolute path name.  */
1418           if (rel_buffer + filename_len <= rel_buf_p + 3)
1419             return filename;
1420           *rel_buf_p++ = '.';
1421           *rel_buf_p++ = '.';
1422           *rel_buf_p++ = '/';
1423         }
1424
1425       /* Then tack on the unmatched part of the desired file's name.  */
1426       do
1427         {
1428           if (rel_buffer + filename_len <= rel_buf_p)
1429             return filename;
1430         }
1431       while (*rel_buf_p++ = *path_p++);
1432
1433       --rel_buf_p;
1434       if (*(rel_buf_p-1) == '/')
1435         *--rel_buf_p = '\0';
1436       return rel_buffer;
1437     }
1438 }
1439 \f
1440 /* Lookup the given filename in the hash table for filenames.  If it is a
1441    new one, then the hash table info pointer will be null.  In this case,
1442    we create a new file_info record to go with the filename, and we initialize
1443    that record with some reasonable values.  */
1444
1445 /* FILENAME was const, but that causes a warning on AIX when calling stat.
1446    That is probably a bug in AIX, but might as well avoid the warning.  */
1447
1448 static file_info *
1449 find_file (filename, do_not_stat)
1450      char *filename;
1451      int do_not_stat;
1452 {
1453   hash_table_entry *hash_entry_p;
1454
1455   hash_entry_p = lookup (filename_primary, filename);
1456   if (hash_entry_p->fip)
1457     return hash_entry_p->fip;
1458   else
1459     {
1460       struct stat stat_buf;
1461       file_info *file_p = (file_info *) xmalloc (sizeof (file_info));
1462
1463       /* If we cannot get status on any given source file, give a warning
1464          and then just set its time of last modification to infinity.  */
1465
1466       if (do_not_stat)
1467         stat_buf.st_mtime = (time_t) 0;
1468       else
1469         {
1470           if (my_stat (filename, &stat_buf) == -1)
1471             {
1472               fprintf (stderr, "%s: %s: can't get status: %s\n",
1473                        pname, shortpath (NULL, filename), sys_errlist[errno]);
1474               stat_buf.st_mtime = (time_t) -1;
1475             }
1476         }
1477
1478       hash_entry_p->fip = file_p;
1479       file_p->hash_entry = hash_entry_p;
1480       file_p->defs_decs = NULL;
1481       file_p->mtime = stat_buf.st_mtime;
1482       return file_p;
1483     }
1484 }
1485
1486 /* Generate a fatal error because some part of the aux_info file is
1487    messed up.  */
1488
1489 static void
1490 aux_info_corrupted ()
1491 {
1492   fprintf (stderr, "\n%s: fatal error: aux info file corrupted at line %d\n",
1493            pname, current_aux_info_lineno);
1494   exit (1);
1495 }
1496
1497 /* ??? This comment is vague.  Say what the condition is for.  */
1498 /* Check to see that a condition is true.  This is kind of like an assert.  */
1499
1500 static void
1501 check_aux_info (cond)
1502      int cond;
1503 {
1504   if (! cond)
1505     aux_info_corrupted ();
1506 }
1507
1508 /* Given a pointer to the closing right parenthesis for a particular formals
1509    list (in an aux_info file) find the corresponding left parenthesis and
1510    return a pointer to it.  */
1511
1512 static const char *
1513 find_corresponding_lparen (p)
1514      const char *p;
1515 {
1516   const char *q;
1517   int paren_depth;
1518
1519   for (paren_depth = 1, q = p-1; paren_depth; q--)
1520     {
1521       switch (*q)
1522         {
1523           case ')':
1524             paren_depth++;
1525             break;
1526           case '(':
1527             paren_depth--;
1528             break;
1529         }
1530     }
1531   return ++q;
1532 }
1533 \f
1534 /* Given a line from  an aux info file, and a time at which the aux info
1535    file it came from was created, check to see if the item described in
1536    the line comes from a file which has been modified since the aux info
1537    file was created.  If so, return non-zero, else return zero.  */
1538
1539 static int
1540 referenced_file_is_newer (l, aux_info_mtime)
1541      const char *l;
1542      time_t aux_info_mtime;
1543 {
1544   const char *p;
1545   file_info *fi_p;
1546   char *filename;
1547
1548   check_aux_info (l[0] == '/');
1549   check_aux_info (l[1] == '*');
1550   check_aux_info (l[2] == ' ');
1551
1552   {
1553     const char *filename_start = p = l + 3;
1554
1555     while (*p != ':')
1556       p++;
1557     filename = (char *) alloca ((size_t) (p - filename_start) + 1);
1558     strncpy (filename, filename_start, (size_t) (p - filename_start));
1559     filename[p-filename_start] = '\0';
1560   }
1561
1562   /* Call find_file to find the file_info record associated with the file
1563      which contained this particular def or dec item.  Note that this call
1564      may cause a new file_info record to be created if this is the first time
1565      that we have ever known about this particular file.  */
1566
1567   fi_p = find_file (abspath (invocation_filename, filename), 0);
1568
1569   return (fi_p->mtime > aux_info_mtime);
1570 }
1571 \f
1572 /* Given a line of info from the aux_info file, create a new
1573    def_dec_info record to remember all of the important information about
1574    a function definition or declaration.
1575
1576    Link this record onto the list of such records for the particular file in
1577    which it occurred in proper (descending) line number order (for now).
1578
1579    If there is an identical record already on the list for the file, throw
1580    this one away.  Doing so takes care of the (useless and troublesome)
1581    duplicates which are bound to crop up due to multiple inclusions of any
1582    given individual header file.
1583
1584    Finally, link the new def_dec record onto the list of such records
1585    pertaining to this particular function name.  */
1586
1587 static void
1588 save_def_or_dec (l, is_syscalls)
1589      const char *l;
1590      int is_syscalls;
1591 {
1592   const char *p;
1593   const char *semicolon_p;
1594   def_dec_info *def_dec_p = (def_dec_info *) xmalloc (sizeof (def_dec_info));
1595
1596 #ifndef UNPROTOIZE
1597   def_dec_p->written = 0;
1598 #endif /* !defined (UNPROTOIZE) */
1599
1600   /* Start processing the line by picking off 5 pieces of information from
1601      the left hand end of the line.  These are filename, line number,
1602      new/old/implicit flag (new = ANSI prototype format), definition or
1603      declaration flag, and extern/static flag).  */
1604
1605   check_aux_info (l[0] == '/');
1606   check_aux_info (l[1] == '*');
1607   check_aux_info (l[2] == ' ');
1608
1609   {
1610     const char *filename_start = p = l + 3;
1611     char *filename;
1612
1613     while (*p != ':')
1614       p++;
1615     filename = (char *) alloca ((size_t) (p - filename_start) + 1);
1616     strncpy (filename, filename_start, (size_t) (p - filename_start));
1617     filename[p-filename_start] = '\0';
1618
1619     /* Call find_file to find the file_info record associated with the file
1620        which contained this particular def or dec item.  Note that this call
1621        may cause a new file_info record to be created if this is the first time
1622        that we have ever known about this particular file.
1623   
1624        Note that we started out by forcing all of the base source file names
1625        (i.e. the names of the aux_info files with the .X stripped off) into the
1626        filenames hash table, and we simultaneously setup file_info records for
1627        all of these base file names (even if they may be useless later).
1628        The file_info records for all of these "base" file names (properly)
1629        act as file_info records for the "original" (i.e. un-included) files
1630        which were submitted to gcc for compilation (when the -aux-info
1631        option was used).  */
1632   
1633     def_dec_p->file = find_file (abspath (invocation_filename, filename), is_syscalls);
1634   }
1635
1636   {
1637     const char *line_number_start = ++p;
1638     char line_number[10];
1639
1640     while (*p != ':')
1641       p++;
1642     strncpy (line_number, line_number_start, (size_t) (p - line_number_start));
1643     line_number[p-line_number_start] = '\0';
1644     def_dec_p->line = atoi (line_number);
1645   }
1646
1647   /* Check that this record describes a new-style, old-style, or implicit
1648      definition or declaration.  */
1649
1650   p++;  /* Skip over the `:'. */
1651   check_aux_info ((*p == 'N') || (*p == 'O') || (*p == 'I'));
1652
1653   /* Is this a new style (ANSI prototyped) definition or declaration? */
1654
1655   def_dec_p->prototyped = (*p == 'N');
1656
1657 #ifndef UNPROTOIZE
1658
1659   /* Is this an implicit declaration? */
1660
1661   def_dec_p->is_implicit = (*p == 'I');
1662
1663 #endif /* !defined (UNPROTOIZE) */
1664
1665   p++;
1666
1667   check_aux_info ((*p == 'C') || (*p == 'F'));
1668
1669   /* Is this item a function definition (F) or a declaration (C).  Note that
1670      we treat item taken from the syscalls file as though they were function
1671      definitions regardless of what the stuff in the file says.  */
1672
1673   def_dec_p->is_func_def = ((*p++ == 'F') || is_syscalls);
1674
1675 #ifndef UNPROTOIZE
1676   def_dec_p->definition = 0;    /* Fill this in later if protoizing.  */
1677 #endif /* !defined (UNPROTOIZE) */
1678
1679   check_aux_info (*p++ == ' ');
1680   check_aux_info (*p++ == '*');
1681   check_aux_info (*p++ == '/');
1682   check_aux_info (*p++ == ' ');
1683
1684 #ifdef UNPROTOIZE
1685   check_aux_info ((!strncmp (p, "static", 6)) || (!strncmp (p, "extern", 6)));
1686 #else /* !defined (UNPROTOIZE) */
1687   if (!strncmp (p, "static", 6))
1688     def_dec_p->is_static = -1;
1689   else if (!strncmp (p, "extern", 6))
1690     def_dec_p->is_static = 0;
1691   else
1692     check_aux_info (0); /* Didn't find either `extern' or `static'.  */
1693 #endif /* !defined (UNPROTOIZE) */
1694
1695   {
1696     const char *ansi_start = p;
1697
1698     p += 6;     /* Pass over the "static" or "extern".  */
1699
1700     /* We are now past the initial stuff.  Search forward from here to find
1701        the terminating semicolon that should immediately follow the entire
1702        ANSI format function declaration.  */
1703
1704     while (*++p != ';')
1705       continue;
1706
1707     semicolon_p = p;
1708
1709     /* Make a copy of the ansi declaration part of the line from the aux_info
1710        file.  */
1711
1712     def_dec_p->ansi_decl
1713       = dupnstr (ansi_start, (size_t) ((semicolon_p+1) - ansi_start));
1714   }
1715
1716   /* Backup and point at the final right paren of the final argument list.  */
1717
1718   p--;
1719
1720   /* Now isolate a whole set of formal argument lists, one-by-one.  Normally,
1721      there will only be one list to isolate, but there could be more.  */
1722
1723   def_dec_p->f_list_count = 0;
1724
1725 #ifndef UNPROTOIZE
1726   def_dec_p->f_list_chain = NULL;
1727 #endif /* !defined (UNPROTOIZE) */
1728
1729   for (;;)
1730     {
1731       const char *left_paren_p = find_corresponding_lparen (p);
1732 #ifndef UNPROTOIZE
1733       {
1734         f_list_chain_item *cip =
1735           (f_list_chain_item *) xmalloc (sizeof (f_list_chain_item));
1736
1737         cip->formals_list
1738           = dupnstr (left_paren_p + 1, (size_t) (p - (left_paren_p+1)));
1739       
1740         /* Add the new chain item at the head of the current list.  */
1741
1742         cip->chain_next = def_dec_p->f_list_chain;
1743         def_dec_p->f_list_chain = cip;
1744       }
1745 #endif /* !defined (UNPROTOIZE) */
1746       def_dec_p->f_list_count++;
1747
1748       p = left_paren_p - 2;
1749
1750       /* p must now point either to another right paren, or to the last
1751          character of the name of the function that was declared/defined.
1752          If p points to another right paren, then this indicates that we
1753          are dealing with multiple formals lists.  In that case, there
1754          really should be another right paren preceding this right paren.  */
1755
1756       if (*p != ')')
1757         break;
1758       else
1759         check_aux_info (*--p == ')');
1760     }
1761
1762
1763   {
1764     const char *past_fn = p + 1;
1765
1766     check_aux_info (*past_fn == ' ');
1767
1768     /* Scan leftwards over the identifier that names the function.  */
1769
1770     while (is_id_char (*p))
1771       p--;
1772     p++;
1773
1774     /* p now points to the leftmost character of the function name.  */
1775
1776     {
1777       char *fn_string = (char *) alloca (past_fn - p + 1);
1778
1779       strncpy (fn_string, p, (size_t) (past_fn - p));
1780       fn_string[past_fn-p] = '\0';
1781       def_dec_p->hash_entry = lookup (function_name_primary, fn_string);
1782     }
1783   }
1784
1785   /* Look at all of the defs and decs for this function name that we have
1786      collected so far.  If there is already one which is at the same
1787      line number in the same file, then we can discard this new def_dec_info
1788      record.
1789
1790      As an extra assurance that any such pair of (nominally) identical
1791      function declarations are in fact identical, we also compare the
1792      ansi_decl parts of the lines from the aux_info files just to be on
1793      the safe side.
1794
1795      This comparison will fail if (for instance) the user was playing
1796      messy games with the preprocessor which ultimately causes one
1797      function declaration in one header file to look differently when
1798      that file is included by two (or more) other files.  */
1799
1800   {
1801     const def_dec_info *other;
1802
1803     for (other = def_dec_p->hash_entry->ddip; other; other = other->next_for_func)
1804       {
1805         if (def_dec_p->line == other->line && def_dec_p->file == other->file)
1806           {
1807             if (strcmp (def_dec_p->ansi_decl, other->ansi_decl))
1808               {
1809                 fprintf (stderr, "%s:%d: declaration of function `%s' takes different forms\n",
1810                          def_dec_p->file->hash_entry->symbol,
1811                          def_dec_p->line,
1812                          def_dec_p->hash_entry->symbol);
1813                 exit (1);
1814               }
1815             free_def_dec (def_dec_p);
1816             return;
1817           }
1818       }
1819   }
1820
1821 #ifdef UNPROTOIZE
1822
1823   /* If we are doing unprotoizing, we must now setup the pointers that will
1824      point to the K&R name list and to the K&R argument declarations list.
1825
1826      Note that if this is only a function declaration, then we should not
1827      expect to find any K&R style formals list following the ANSI-style
1828      formals list.  This is because GCC knows that such information is
1829      useless in the case of function declarations (function definitions
1830      are a different story however).
1831
1832      Since we are unprotoizing, we don't need any such lists anyway.
1833      All we plan to do is to delete all characters between ()'s in any
1834      case.  */
1835
1836   def_dec_p->formal_names = NULL;
1837   def_dec_p->formal_decls = NULL;
1838
1839   if (def_dec_p->is_func_def)
1840     {
1841       p = semicolon_p;
1842       check_aux_info (*++p == ' ');
1843       check_aux_info (*++p == '/');
1844       check_aux_info (*++p == '*');
1845       check_aux_info (*++p == ' ');
1846       check_aux_info (*++p == '(');
1847
1848       {
1849         const char *kr_names_start = ++p;   /* Point just inside '('. */
1850
1851         while (*p++ != ')')
1852           continue;
1853         p--;            /* point to closing right paren */
1854
1855         /* Make a copy of the K&R parameter names list.  */
1856
1857         def_dec_p->formal_names
1858           = dupnstr (kr_names_start, (size_t) (p - kr_names_start));
1859       }
1860
1861       check_aux_info (*++p == ' ');
1862       p++;
1863
1864       /* p now points to the first character of the K&R style declarations
1865          list (if there is one) or to the star-slash combination that ends
1866          the comment in which such lists get embedded.  */
1867
1868       /* Make a copy of the K&R formal decls list and set the def_dec record
1869          to point to it.  */
1870
1871       if (*p == '*')            /* Are there no K&R declarations? */
1872         {
1873           check_aux_info (*++p == '/');
1874           def_dec_p->formal_decls = "";
1875         }
1876       else
1877         {
1878           const char *kr_decls_start = p;
1879
1880           while (p[0] != '*' || p[1] != '/')
1881             p++;
1882           p--;
1883
1884           check_aux_info (*p == ' ');
1885
1886           def_dec_p->formal_decls
1887             = dupnstr (kr_decls_start, (size_t) (p - kr_decls_start));
1888         }
1889
1890       /* Handle a special case.  If we have a function definition marked as
1891          being in "old" style, and if it's formal names list is empty, then
1892          it may actually have the string "void" in its real formals list
1893          in the original source code.  Just to make sure, we will get setup
1894          to convert such things anyway.
1895
1896          This kludge only needs to be here because of an insurmountable
1897          problem with generating .X files.  */
1898
1899       if (!def_dec_p->prototyped && !*def_dec_p->formal_names)
1900         def_dec_p->prototyped = 1;
1901     }
1902
1903   /* Since we are unprotoizing, if this item is already in old (K&R) style,
1904      we can just ignore it.  If that is true, throw away the itme now.  */
1905
1906   if (!def_dec_p->prototyped)
1907     {
1908       free_def_dec (def_dec_p);
1909       return;
1910     }
1911
1912 #endif /* defined (UNPROTOIZE) */
1913
1914   /* Add this record to the head of the list of records pertaining to this
1915      particular function name.  */
1916
1917   def_dec_p->next_for_func = def_dec_p->hash_entry->ddip;
1918   def_dec_p->hash_entry->ddip = def_dec_p;
1919
1920   /* Add this new def_dec_info record to the sorted list of def_dec_info
1921      records for this file.  Note that we don't have to worry about duplicates
1922      (caused by multiple inclusions of header files) here because we have
1923      already eliminated duplicates above.  */
1924
1925   if (!def_dec_p->file->defs_decs)
1926     {
1927       def_dec_p->file->defs_decs = def_dec_p;
1928       def_dec_p->next_in_file = NULL;
1929     }
1930   else
1931     {
1932       int line = def_dec_p->line;
1933       const def_dec_info *prev = NULL;
1934       const def_dec_info *curr = def_dec_p->file->defs_decs;
1935       const def_dec_info *next = curr->next_in_file;
1936
1937       while (next && (line < curr->line))
1938         {
1939           prev = curr;
1940           curr = next;
1941           next = next->next_in_file;
1942         }
1943       if (line >= curr->line)
1944         {
1945           def_dec_p->next_in_file = curr;
1946           if (prev)
1947             ((NONCONST def_dec_info *) prev)->next_in_file = def_dec_p;
1948           else
1949             def_dec_p->file->defs_decs = def_dec_p;
1950         }
1951       else      /* assert (next == NULL); */
1952         {
1953           ((NONCONST def_dec_info *) curr)->next_in_file = def_dec_p;
1954           /* assert (next == NULL); */
1955           def_dec_p->next_in_file = next;
1956         }
1957     }
1958 }
1959 \f
1960 /* Set up the vector COMPILE_PARAMS which is the argument list for running GCC.
1961    Also set input_file_name_index and aux_info_file_name_index
1962    to the indices of the slots where the file names should go.  */
1963
1964 /* We initialize the vector by  removing -g, -O, -S, -c, and -o options,
1965    and adding '-aux-info AUXFILE -S  -o /dev/null INFILE' at the end.  */
1966
1967 static void
1968 munge_compile_params (params_list)
1969      const char *params_list;
1970 {
1971   /* Build up the contents in a temporary vector
1972      that is so big that to has to be big enough.  */
1973   const char **temp_params
1974     = (const char **) alloca ((strlen (params_list) + 8) * sizeof (char *));
1975   int param_count = 0;
1976   const char *param;
1977
1978   temp_params[param_count++] = compiler_file_name;
1979   for (;;)
1980     {
1981       while (isspace (*params_list))
1982         params_list++;
1983       if (!*params_list)
1984         break;
1985       param = params_list;
1986       while (*params_list && !isspace (*params_list))
1987         params_list++;
1988       if (param[0] != '-')
1989         temp_params[param_count++]
1990           = dupnstr (param, (size_t) (params_list - param));
1991       else
1992         {
1993           switch (param[1])
1994             {
1995               case 'g':
1996               case 'O':
1997               case 'S':
1998               case 'c':
1999                 break;          /* Don't copy these.  */
2000               case 'o':
2001                 while (isspace (*params_list))
2002                   params_list++;
2003                 while (*params_list && !isspace (*params_list))
2004                   params_list++;
2005                 break;
2006               default:
2007                 temp_params[param_count++]
2008                   = dupnstr (param, (size_t) (params_list - param));
2009             }
2010         }
2011       if (!*params_list)
2012         break;
2013     }
2014   temp_params[param_count++] = "-aux-info";
2015
2016   /* Leave room for the aux-info file name argument.  */
2017   aux_info_file_name_index = param_count;
2018   temp_params[param_count++] = NULL;
2019
2020   temp_params[param_count++] = "-S";
2021   temp_params[param_count++] = "-o";
2022   temp_params[param_count++] = "/dev/null";
2023
2024   /* Leave room for the input file name argument.  */
2025   input_file_name_index = param_count;
2026   temp_params[param_count++] = NULL;
2027   /* Terminate the list.  */
2028   temp_params[param_count++] = NULL;
2029
2030   /* Make a copy of the compile_params in heap space.  */
2031
2032   compile_params
2033     = (const char **) xmalloc (sizeof (char *) * (param_count+1));
2034   memcpy (compile_params, temp_params, sizeof (char *) * param_count);
2035 }
2036
2037 /* Do a recompilation for the express purpose of generating a new aux_info
2038    file to go with a specific base source file.  */
2039
2040 static int
2041 gen_aux_info_file (base_filename)
2042      const char *base_filename;
2043 {
2044   int child_pid;
2045
2046   if (!input_file_name_index)
2047     munge_compile_params ("");
2048
2049   /* Store the full source file name in the argument vector.  */
2050   compile_params[input_file_name_index] = shortpath (NULL, base_filename);
2051   /* Add .X to source file name to get aux-info file name.  */
2052   compile_params[aux_info_file_name_index]
2053     = savestring2 (compile_params[input_file_name_index],
2054                    strlen (compile_params[input_file_name_index]),
2055                    ".X",
2056                    2);
2057
2058   if (!quiet_flag)
2059     fprintf (stderr, "%s: compiling `%s'\n",
2060              pname, compile_params[input_file_name_index]);
2061
2062   if (child_pid = fork ())
2063     {
2064       if (child_pid == -1)
2065         {
2066           fprintf (stderr, "%s: could not fork process: %s\n",
2067                    pname, sys_errlist[errno]);
2068           return 0;
2069         }
2070
2071 #if 0
2072       /* Print out the command line that the other process is now executing.  */
2073
2074       if (!quiet_flag)
2075         {
2076           const char **arg;
2077   
2078           fputs ("\t", stderr);
2079           for (arg = compile_params; *arg; arg++)
2080             {
2081               fputs (*arg, stderr);
2082               fputc (' ', stderr);
2083             }
2084           fputc ('\n', stderr);
2085           fflush (stderr);
2086         }
2087 #endif /* 0 */
2088
2089       {
2090         int wait_status;
2091
2092         if (wait (&wait_status) == -1)
2093           {
2094             fprintf (stderr, "%s: wait failed: %s\n",
2095                      pname, sys_errlist[errno]);
2096             return 0;
2097           }
2098         if ((wait_status & 0x7F) != 0)
2099           {
2100             fprintf (stderr, "%s: subprocess got fatal signal %d",
2101                      pname, (wait_status & 0x7F));
2102             return 0;
2103           }
2104         if (((wait_status & 0xFF00) >> 8) != 0)
2105           {
2106             fprintf (stderr, "%s: %s exited with status %d\n",
2107                      pname, base_filename, ((wait_status & 0xFF00) >> 8));
2108             return 0;
2109           }
2110         return 1;
2111       }
2112     }
2113   else
2114     {
2115       if (my_execvp (compile_params[0], (char *const *) compile_params))
2116         {
2117           int e = errno, f = fileno (stderr);
2118           write (f, pname, strlen (pname));
2119           write (f, ": ", 2);
2120           write (f, compile_params[0], strlen (compile_params[0]));
2121           write (f, ": ", 2);
2122           write (f, sys_errlist[e], strlen (sys_errlist[e]));
2123           write (f, "\n", 1);
2124           _exit (1);
2125         }
2126       return 1;         /* Never executed.  */
2127     }
2128 }
2129 \f
2130 /* Read in all of the information contained in a single aux_info file.
2131    Save all of the important stuff for later.  */
2132
2133 static void
2134 process_aux_info_file (base_source_filename, keep_it, is_syscalls)
2135      const char *base_source_filename;
2136      int keep_it;
2137      int is_syscalls;
2138 {
2139   size_t base_len = strlen (base_source_filename);
2140   char * aux_info_filename
2141     = (char *) alloca (base_len + strlen (aux_info_suffix) + 1);
2142   char *aux_info_base;
2143   char *aux_info_limit;
2144   char *aux_info_relocated_name;
2145   const char *aux_info_second_line;
2146   time_t aux_info_mtime;
2147   size_t aux_info_size;
2148   int must_create;
2149
2150   /* Construct the aux_info filename from the base source filename.  */
2151
2152   strcpy (aux_info_filename, base_source_filename);
2153   strcat (aux_info_filename, aux_info_suffix);
2154
2155   /* Check that the aux_info file exists and is readable.  If it does not
2156      exist, try to create it (once only).  */
2157
2158   /* If file doesn't exist, set must_create.
2159      Likewise if it exists and we can read it but it is obsolete.
2160      Otherwise, report an error.  */
2161   must_create = 0;
2162
2163   /* Come here with must_create set to 1 if file is out of date.  */
2164 start_over: ;
2165
2166   if (my_access (aux_info_filename, R_OK) == -1)
2167     {
2168       if (errno == ENOENT)
2169         {
2170           if (is_syscalls)
2171             {
2172               fprintf (stderr, "%s: warning: missing SYSCALLS file `%s'\n",
2173                        pname, aux_info_filename);
2174               return;
2175             }
2176           must_create = 1;
2177         }
2178       else
2179         {
2180           fprintf (stderr, "%s: can't read aux info file `%s': %s\n",
2181                    pname, shortpath (NULL, aux_info_filename),
2182                    sys_errlist[errno]);
2183           errors++;
2184           return;
2185         }
2186     }
2187 #if 0 /* There is code farther down to take care of this.  */
2188   else
2189     {
2190       struct stat s1, s2;
2191       stat (aux_info_file_name, &s1);
2192       stat (base_source_file_name, &s2);
2193       if (s2.st_mtime > s1.st_mtime)
2194         must_create = 1;
2195     }
2196 #endif /* 0 */
2197
2198   /* If we need a .X file, create it, and verify we can read it.  */
2199   if (must_create)
2200     {
2201       if (!gen_aux_info_file (base_source_filename))
2202         {
2203           errors++;
2204           return;
2205         }
2206       if (my_access (aux_info_filename, R_OK) == -1)
2207         {
2208           fprintf (stderr, "%s: can't read aux info file `%s': %s\n",
2209                    pname, shortpath (NULL, aux_info_filename),
2210                    sys_errlist[errno]);
2211           errors++;
2212           return;
2213         }
2214     }
2215
2216   {
2217     struct stat stat_buf;
2218
2219     /* Get some status information about this aux_info file.  */
2220   
2221     if (my_stat (aux_info_filename, &stat_buf) == -1)
2222       {
2223         fprintf (stderr, "%s: can't get status of aux info file `%s': %s\n",
2224                  pname, shortpath (NULL, aux_info_filename),
2225                  sys_errlist[errno]);
2226         errors++;
2227         return;
2228       }
2229   
2230     /* Check on whether or not this aux_info file is zero length.  If it is,
2231        then just ignore it and return.  */
2232   
2233     if ((aux_info_size = stat_buf.st_size) == 0)
2234       return;
2235   
2236     /* Get the date/time of last modification for this aux_info file and
2237        remember it.  We will have to check that any source files that it
2238        contains information about are at least this old or older.  */
2239   
2240     aux_info_mtime = stat_buf.st_mtime;
2241
2242     if (!is_syscalls)
2243       {
2244         /* Compare mod time with the .c file; update .X file if obsolete.
2245            The code later on can fail to check the .c file
2246            if it did not directly define any functions.  */
2247
2248         if (my_stat (base_source_filename, &stat_buf) == -1)
2249           {
2250             fprintf (stderr, "%s: can't get status of aux info file `%s': %s\n",
2251                      pname, shortpath (NULL, base_source_filename),
2252                      sys_errlist[errno]);
2253             errors++;
2254             return;
2255           }
2256         if (stat_buf.st_mtime > aux_info_mtime)
2257           {
2258             must_create = 1;
2259             goto start_over;
2260           }
2261       }
2262   }
2263
2264   {
2265     int aux_info_file;
2266
2267     /* Open the aux_info file.  */
2268   
2269     if ((aux_info_file = my_open (aux_info_filename, O_RDONLY, 0444 )) == -1)
2270       {
2271         fprintf (stderr, "%s: can't open aux info file `%s' for reading: %s\n",
2272                  pname, shortpath (NULL, aux_info_filename),
2273                  sys_errlist[errno]);
2274         return;
2275       }
2276   
2277     /* Allocate space to hold the aux_info file in memory.  */
2278   
2279     aux_info_base = xmalloc (aux_info_size + 1);
2280     aux_info_limit = aux_info_base + aux_info_size;
2281     *aux_info_limit = '\0';
2282   
2283     /* Read the aux_info file into memory.  */
2284   
2285     if (safe_read (aux_info_file, aux_info_base, aux_info_size) != aux_info_size)
2286       {
2287         fprintf (stderr, "%s: error reading aux info file `%s': %s\n",
2288                  pname, shortpath (NULL, aux_info_filename),
2289                  sys_errlist[errno]);
2290         free (aux_info_base);
2291         close (aux_info_file);
2292         return;
2293       }
2294   
2295     /* Close the aux info file.  */
2296   
2297     if (close (aux_info_file))
2298       {
2299         fprintf (stderr, "%s: error closing aux info file `%s': %s\n",
2300                  pname, shortpath (NULL, aux_info_filename),
2301                  sys_errlist[errno]);
2302         free (aux_info_base);
2303         close (aux_info_file);
2304         return;
2305       }
2306   }
2307
2308   /* Delete the aux_info file (unless requested not to).  If the deletion
2309      fails for some reason, don't even worry about it.  */
2310
2311   if (must_create && !keep_it)
2312     if (my_unlink (aux_info_filename) == -1)
2313       fprintf (stderr, "%s: can't delete aux info file `%s': %s\n",
2314                pname, shortpath (NULL, aux_info_filename),
2315                sys_errlist[errno]);
2316
2317   /* Save a pointer into the first line of the aux_info file which
2318      contains the filename of the directory from which the compiler
2319      was invoked when the associated source file was compiled.
2320      This information is used later to help create complete
2321      filenames out of the (potentially) relative filenames in
2322      the aux_info file.  */
2323
2324   {
2325     char *p = aux_info_base;
2326
2327     while (*p != ':')
2328       p++;
2329     p++;
2330     while (*p == ' ')
2331       p++;
2332     invocation_filename = p;    /* Save a pointer to first byte of path.  */
2333     while (*p != ' ')
2334       p++;
2335     *p++ = '/';
2336     *p++ = '\0';
2337     while (*p++ != '\n')
2338       continue;
2339     aux_info_second_line = p;
2340     aux_info_relocated_name = 0;
2341     if (invocation_filename[0] != '/')
2342       {
2343         /* INVOCATION_FILENAME is relative;
2344            append it to BASE_SOURCE_FILENAME's dir.  */
2345         char *dir_end;
2346         aux_info_relocated_name = xmalloc (base_len + (p-invocation_filename));
2347         strcpy (aux_info_relocated_name, base_source_filename);
2348         dir_end = rindex (aux_info_relocated_name, '/');
2349         if (dir_end)
2350           dir_end++;
2351         else
2352           dir_end = aux_info_relocated_name;
2353         strcpy (dir_end, invocation_filename);
2354         invocation_filename = aux_info_relocated_name;
2355       }
2356   }
2357
2358
2359   {
2360     const char *aux_info_p;
2361
2362     /* Do a pre-pass on the lines in the aux_info file, making sure that all
2363        of the source files referenced in there are at least as old as this
2364        aux_info file itself.  If not, go back and regenerate the aux_info
2365        file anew.  Don't do any of this for the syscalls file.  */
2366
2367     if (!is_syscalls)
2368       {
2369         current_aux_info_lineno = 2;
2370     
2371         for (aux_info_p = aux_info_second_line; *aux_info_p; )
2372           {
2373             if (referenced_file_is_newer (aux_info_p, aux_info_mtime))
2374               {
2375                 free (aux_info_base);
2376                 xfree (aux_info_relocated_name);
2377                 if (keep_it && my_unlink (aux_info_filename) == -1)
2378                   {
2379                     fprintf (stderr, "%s: can't delete file `%s': %s\n",
2380                              pname, shortpath (NULL, aux_info_filename),
2381                              sys_errlist[errno]);
2382                     return;
2383                   }
2384                 goto start_over;
2385               }
2386     
2387             /* Skip over the rest of this line to start of next line.  */
2388     
2389             while (*aux_info_p != '\n')
2390               aux_info_p++;
2391             aux_info_p++;
2392             current_aux_info_lineno++;
2393           }
2394       }
2395
2396     /* Now do the real pass on the aux_info lines.  Save their information in
2397        the in-core data base.  */
2398   
2399     current_aux_info_lineno = 2;
2400   
2401     for (aux_info_p = aux_info_second_line; *aux_info_p;)
2402       {
2403         char *unexpanded_line = unexpand_if_needed (aux_info_p);
2404   
2405         if (unexpanded_line)
2406           {
2407             save_def_or_dec (unexpanded_line, is_syscalls);
2408             free (unexpanded_line);
2409           }
2410         else
2411           save_def_or_dec (aux_info_p, is_syscalls);
2412   
2413         /* Skip over the rest of this line and get to start of next line.  */
2414   
2415         while (*aux_info_p != '\n')
2416           aux_info_p++;
2417         aux_info_p++;
2418         current_aux_info_lineno++;
2419       }
2420   }
2421
2422   free (aux_info_base);
2423   xfree (aux_info_relocated_name);
2424 }
2425 \f
2426 #ifndef UNPROTOIZE
2427
2428 /* Check an individual filename for a .c suffix.  If the filename has this
2429    suffix, rename the file such that its suffix is changed to .C.  This
2430    function implements the -C option.  */
2431
2432 static void
2433 rename_c_file (hp)
2434      const hash_table_entry *hp;
2435 {
2436   const char *filename = hp->symbol;
2437   int last_char_index = strlen (filename) - 1;
2438   char *const new_filename = (char *) alloca (strlen (filename) + 1);
2439
2440   /* Note that we don't care here if the given file was converted or not.  It
2441      is possible that the given file was *not* converted, simply because there
2442      was nothing in it which actually required conversion.  Even in this case,
2443      we want to do the renaming.  Note that we only rename files with the .c
2444      suffix.  */
2445
2446   if (filename[last_char_index] != 'c' || filename[last_char_index-1] != '.')
2447     return;
2448
2449   strcpy (new_filename, filename);
2450   new_filename[last_char_index] = 'C';
2451
2452   if (my_link (filename, new_filename) == -1)
2453     {
2454       fprintf (stderr, "%s: warning: can't link file `%s' to `%s': %s\n",
2455                pname, shortpath (NULL, filename),
2456                shortpath (NULL, new_filename), sys_errlist[errno]);
2457       errors++;
2458       return;
2459     }
2460
2461   if (my_unlink (filename) == -1)
2462     {
2463       fprintf (stderr, "%s: warning: can't delete file `%s': %s\n",
2464                pname, shortpath (NULL, filename), sys_errlist[errno]);
2465       errors++;
2466       return;
2467     }
2468 }
2469
2470 #endif /* !defined (UNPROTOIZE) */
2471 \f
2472 /* Take the list of definitions and declarations attached to a particular
2473    file_info node and reverse the order of the list.  This should get the
2474    list into an order such that the item with the lowest associated line
2475    number is nearest the head of the list.  When these lists are originally
2476    built, they are in the opposite order.  We want to traverse them in
2477    normal line number order later (i.e. lowest to highest) so reverse the
2478    order here.  */
2479
2480 static void
2481 reverse_def_dec_list (hp)
2482      const hash_table_entry *hp;
2483 {
2484   file_info *file_p = hp->fip;
2485   const def_dec_info *prev = NULL;
2486   const def_dec_info *current = file_p->defs_decs;
2487
2488   if (!( current = file_p->defs_decs))
2489     return;                     /* no list to reverse */
2490
2491   prev = current;
2492   if (! (current = current->next_in_file))
2493     return;                     /* can't reverse a single list element */
2494
2495   ((NONCONST def_dec_info *) prev)->next_in_file = NULL;
2496
2497   while (current)
2498     {
2499       const def_dec_info *next = current->next_in_file;
2500
2501       ((NONCONST def_dec_info *) current)->next_in_file = prev;
2502       prev = current;
2503       current = next;
2504     }
2505
2506   file_p->defs_decs = prev;
2507 }
2508
2509 #ifndef UNPROTOIZE
2510
2511 /* Find the (only?) extern definition for a particular function name, starting
2512    from the head of the linked list of entries for the given name.  If we
2513    cannot find an extern definition for the given function name, issue a
2514    warning and scrounge around for the next best thing, i.e. an extern
2515    function declaration with a prototype attached to it.  Note that we only
2516    allow such substitutions for extern declarations and never for static
2517    declarations.  That's because the only reason we allow them at all is
2518    to let un-prototyped function declarations for system-supplied library
2519    functions get their prototypes from our own extra SYSCALLS.c.X file which
2520    contains all of the correct prototypes for system functions.  */
2521
2522 static const def_dec_info *
2523 find_extern_def (head, user)
2524      const def_dec_info *head;
2525      const def_dec_info *user;
2526 {
2527   const def_dec_info *dd_p;
2528   const def_dec_info *extern_def_p = NULL;
2529   int conflict_noted = 0;
2530
2531   /* Don't act too stupid here.  Somebody may try to convert an entire system
2532      in one swell fwoop (rather than one program at a time, as should be done)
2533      and in that case, we may find that there are multiple extern definitions
2534      of a given function name in the entire set of source files that we are
2535      converting.  If however one of these definitions resides in exactly the
2536      same source file as the reference we are trying to satisfy then in that
2537      case it would be stupid for us to fail to realize that this one definition
2538      *must* be the precise one we are looking for.
2539
2540      To make sure that we don't miss an opportunity to make this "same file"
2541      leap of faith, we do a prescan of the list of records relating to the
2542      given function name, and we look (on this first scan) *only* for a
2543      definition of the function which is in the same file as the reference
2544      we are currently trying to satisfy.  */
2545
2546   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
2547     if (dd_p->is_func_def && !dd_p->is_static && dd_p->file == user->file)
2548       return dd_p;
2549
2550   /* Now, since we have not found a definition in the same file as the
2551      reference, we scan the list again and consider all possibilities from
2552      all files.  Here we may get conflicts with the things listed in the
2553      SYSCALLS.c.X file, but if that happens it only means that the source
2554      code being converted contains its own definition of a function which
2555      could have been supplied by libc.a.  In such cases, we should avoid
2556      issuing the normal warning, and defer to the definition given in the
2557      user's own code.   */
2558
2559   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
2560     if (dd_p->is_func_def && !dd_p->is_static)
2561       {
2562         if (!extern_def_p)      /* Previous definition? */
2563           extern_def_p = dd_p;  /* Remember the first definition found. */
2564         else
2565           {
2566             /* Ignore definition just found if it came from SYSCALLS.c.X.  */
2567
2568             if (is_syscalls_file (dd_p->file))
2569               continue;
2570
2571             /* Quietly replace the definition previously found with the one
2572                just found if the previous one was from SYSCALLS.c.X.  */
2573
2574             if (is_syscalls_file (extern_def_p->file))
2575               {
2576                 extern_def_p = dd_p;
2577                 continue;
2578               }
2579
2580             /* If we get here, then there is a conflict between two function
2581                declarations for the same function, both of which came from the
2582                user's own code.  */
2583
2584             if (!conflict_noted)        /* first time we noticed? */
2585               {
2586                 conflict_noted = 1;
2587                 fprintf (stderr, "%s: conflicting extern definitions of '%s'\n",
2588                          pname, head->hash_entry->symbol);
2589                 if (!quiet_flag)
2590                   {
2591                     fprintf (stderr, "%s: declarations of '%s' will not be converted\n",
2592                              pname, head->hash_entry->symbol);
2593                     fprintf (stderr, "%s: conflict list for '%s' follows:\n",
2594                              pname, head->hash_entry->symbol);
2595                     fprintf (stderr, "%s:     %s(%d): %s\n",
2596                              pname,
2597                              shortpath (NULL, extern_def_p->file->hash_entry->symbol),
2598                              extern_def_p->line, extern_def_p->ansi_decl);
2599                   }
2600               }
2601             if (!quiet_flag)
2602               fprintf (stderr, "%s:     %s(%d): %s\n",
2603                        pname,
2604                        shortpath (NULL, dd_p->file->hash_entry->symbol),
2605                        dd_p->line, dd_p->ansi_decl);
2606           }
2607       }
2608
2609   /* We want to err on the side of caution, so if we found multiple conflicting
2610      definitions for the same function, treat this as being that same as if we
2611      had found no definitions (i.e. return NULL).  */
2612
2613   if (conflict_noted)
2614     return NULL;
2615
2616   if (!extern_def_p)
2617     {
2618       /* We have no definitions for this function so do the next best thing.
2619          Search for an extern declaration already in prototype form.  */
2620
2621       for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
2622         if (!dd_p->is_func_def && !dd_p->is_static && dd_p->prototyped)
2623           {
2624             extern_def_p = dd_p;        /* save a pointer to the definition */
2625             if (!quiet_flag)
2626               fprintf (stderr, "%s: warning: using formals list from %s(%d) for function `%s'\n",
2627                        pname,
2628                        shortpath (NULL, dd_p->file->hash_entry->symbol),
2629                        dd_p->line, dd_p->hash_entry->symbol);
2630             break;
2631           }
2632
2633       /* Gripe about unprototyped function declarations that we found no
2634          corresponding definition (or other source of prototype information)
2635          for.
2636
2637          Gripe even if the unprototyped declaration we are worried about
2638          exists in a file in one of the "system" include directories.  We
2639          can gripe about these because we should have at least found a
2640          corresponding (pseudo) definition in the SYSCALLS.c.X file.  If we
2641          didn't, then that means that the SYSCALLS.c.X file is missing some
2642          needed prototypes for this particular system.  That is worth telling
2643          the user about!  */
2644
2645       if (!extern_def_p)
2646         {
2647           const char *file = user->file->hash_entry->symbol;
2648
2649           if (!quiet_flag)
2650             if (in_system_include_dir (file))
2651               {
2652                 /* Why copy this string into `needed' at all?
2653                    Why not just use user->ansi_decl without copying?  */
2654                 char *needed = (char *) alloca (strlen (user->ansi_decl) + 1);
2655                 char *p;
2656
2657                 strcpy (needed, user->ansi_decl);
2658                 p = (NONCONST char *) substr (needed, user->hash_entry->symbol)
2659                     + strlen (user->hash_entry->symbol) + 2;
2660                 /* Avoid having ??? in the string.  */
2661                 *p++ = '?';
2662                 *p++ = '?';
2663                 *p++ = '?';
2664                 strcpy (p, ");");
2665
2666                 fprintf (stderr, "%s: %d: `%s' used but missing from SYSCALLS\n",
2667                          shortpath (NULL, file), user->line,
2668                          needed+7);     /* Don't print "extern " */
2669               }
2670 #if 0
2671             else
2672               fprintf (stderr, "%s: %d: warning: no extern definition for `%s'\n",
2673                        shortpath (NULL, file), user->line,
2674                        user->hash_entry->symbol);
2675 #endif
2676         }
2677     }
2678   return extern_def_p;
2679 }
2680 \f
2681 /* Find the (only?) static definition for a particular function name in a
2682    given file.  Here we get the function-name and the file info indirectly
2683    from the def_dec_info record pointer which is passed in. */
2684
2685 static const def_dec_info *
2686 find_static_definition (user)
2687      const def_dec_info *user;
2688 {
2689   const def_dec_info *head = user->hash_entry->ddip;
2690   const def_dec_info *dd_p;
2691   int num_static_defs = 0;
2692   const def_dec_info *static_def_p = NULL;
2693
2694   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
2695     if (dd_p->is_func_def && dd_p->is_static && (dd_p->file == user->file))
2696       {
2697         static_def_p = dd_p;    /* save a pointer to the definition */
2698         num_static_defs++;
2699       }
2700   if (num_static_defs == 0)
2701     {
2702       if (!quiet_flag)
2703         fprintf (stderr, "%s: warning: no static definition for `%s' in file `%s'\n",
2704                  pname, head->hash_entry->symbol,
2705                  shortpath (NULL, user->file->hash_entry->symbol));
2706     }
2707   else if (num_static_defs > 1)
2708     {
2709       fprintf (stderr, "%s: multiple static defs of `%s' in file `%s'\n",
2710                pname, head->hash_entry->symbol,
2711                shortpath (NULL, user->file->hash_entry->symbol));
2712       return NULL;
2713     }
2714   return static_def_p;
2715 }
2716
2717 /* Find good prototype style formal argument lists for all of the function
2718    declarations which didn't have them before now.
2719
2720    To do this we consider each function name one at a time.  For each function
2721    name, we look at the items on the linked list of def_dec_info records for
2722    that particular name.
2723
2724    Somewhere on this list we should find one (and only one) def_dec_info
2725    record which represents the actual function definition, and this record
2726    should have a nice formal argument list already associated with it.
2727
2728    Thus, all we have to do is to connect up all of the other def_dec_info
2729    records for this particular function name to the special one which has
2730    the full-blown formals list.
2731
2732    Of course it is a little more complicated than just that.  See below for
2733    more details.  */
2734
2735 static void
2736 connect_defs_and_decs (hp)
2737      const hash_table_entry *hp;
2738 {
2739   const def_dec_info *dd_p;
2740   const def_dec_info *extern_def_p = NULL;
2741   int first_extern_reference = 1;
2742
2743   /* Traverse the list of definitions and declarations for this particular
2744      function name.  For each item on the list, if it is a function
2745      definition (either old style or new style) then GCC has already been
2746      kind enough to produce a prototype for us, and it is associated with
2747      the item already, so declare the item as its own associated "definition".
2748
2749      Also, for each item which is only a function declaration, but which
2750      nonetheless has its own prototype already (obviously supplied by the user)
2751      declare the item as it's own definition.
2752
2753      Note that when/if there are multiple user-supplied prototypes already
2754      present for multiple declarations of any given function, these multiple
2755      prototypes *should* all match exactly with one another and with the
2756      prototype for the actual function definition.  We don't check for this
2757      here however, since we assume that the compiler must have already done
2758      this consistency checking when it was creating the .X files.  */
2759
2760   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
2761     if (dd_p->prototyped)
2762       ((NONCONST def_dec_info *) dd_p)->definition = dd_p;
2763
2764   /* Traverse the list of definitions and declarations for this particular
2765      function name.  For each item on the list, if it is an extern function
2766      declaration and if it has no associated definition yet, go try to find
2767      the matching extern definition for the declaration.
2768
2769      When looking for the matching function definition, warn the user if we
2770      fail to find one.
2771
2772      If we find more that one function definition also issue a warning.
2773
2774      Do the search for the matching definition only once per unique function
2775      name (and only when absolutely needed) so that we can avoid putting out
2776      redundant warning messages, and so that we will only put out warning
2777      messages when there is actually a reference (i.e. a declaration) for
2778      which we need to find a matching definition.  */
2779
2780   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
2781     if (!dd_p->is_func_def && !dd_p->is_static && !dd_p->definition)
2782       {
2783         if (first_extern_reference)
2784           {
2785             extern_def_p = find_extern_def (hp->ddip, dd_p);
2786             first_extern_reference = 0;
2787           }
2788         ((NONCONST def_dec_info *) dd_p)->definition = extern_def_p;
2789       }
2790
2791   /* Traverse the list of definitions and declarations for this particular
2792      function name.  For each item on the list, if it is a static function
2793      declaration and if it has no associated definition yet, go try to find
2794      the matching static definition for the declaration within the same file.
2795
2796      When looking for the matching function definition, warn the user if we
2797      fail to find one in the same file with the declaration, and refuse to
2798      convert this kind of cross-file static function declaration.  After all,
2799      this is stupid practice and should be discouraged.
2800
2801      We don't have to worry about the possibility that there is more than one
2802      matching function definition in the given file because that would have
2803      been flagged as an error by the compiler.
2804
2805      Do the search for the matching definition only once per unique
2806      function-name/source-file pair (and only when absolutely needed) so that
2807      we can avoid putting out redundant warning messages, and so that we will
2808      only put out warning messages when there is actually a reference (i.e. a
2809      declaration) for which we actually need to find a matching definition.  */
2810
2811   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
2812     if (!dd_p->is_func_def && dd_p->is_static && !dd_p->definition)
2813       {
2814         const def_dec_info *dd_p2;
2815         const def_dec_info *static_def;
2816
2817         /* We have now found a single static declaration for which we need to
2818            find a matching definition.  We want to minimize the work (and the
2819            number of warnings), so we will find an appropriate (matching)
2820            static definition for this declaration, and then distribute it
2821            (as the definition for) any and all other static declarations
2822            for this function name which occur within the same file, and which
2823            do not already have definitions.
2824
2825            Note that a trick is used here to prevent subsequent attempts to
2826            call find_static_definition for a given function-name & file
2827            if the first such call returns NULL.  Essentially, we convert
2828            these NULL return values to -1, and put the -1 into the definition
2829            field for each other static declaration from the same file which
2830            does not already have an associated definition.
2831            This makes these other static declarations look like they are
2832            actually defined already when the outer loop here revisits them
2833            later on.  Thus, the outer loop will skip over them.  Later, we
2834            turn the -1's back to NULL's.  */
2835
2836       ((NONCONST def_dec_info *) dd_p)->definition =
2837         (static_def = find_static_definition (dd_p))
2838           ? static_def
2839           : (const def_dec_info *) -1;
2840
2841       for (dd_p2 = dd_p->next_for_func; dd_p2; dd_p2 = dd_p2->next_for_func)
2842         if (!dd_p2->is_func_def && dd_p2->is_static
2843          && !dd_p2->definition && (dd_p2->file == dd_p->file))
2844           ((NONCONST def_dec_info *)dd_p2)->definition = dd_p->definition;
2845       }
2846
2847   /* Convert any dummy (-1) definitions we created in the step above back to
2848      NULL's (as they should be).  */
2849
2850   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
2851     if (dd_p->definition == (def_dec_info *) -1)
2852       ((NONCONST def_dec_info *) dd_p)->definition = NULL;
2853 }
2854
2855 #endif /* !defined (UNPROTOIZE) */
2856
2857 /* Give a pointer into the clean text buffer, return a number which is the
2858    original source line number that the given pointer points into.  */
2859
2860 static int
2861 identify_lineno (clean_p)
2862      const char *clean_p;
2863 {
2864   int line_num = 1;
2865   const char *scan_p;
2866
2867   for (scan_p = clean_text_base; scan_p <= clean_p; scan_p++)
2868     if (*scan_p == '\n')
2869       line_num++;
2870   return line_num;
2871 }
2872
2873 /* Issue an error message and give up on doing this particular edit.  */
2874
2875 static void
2876 declare_source_confusing (clean_p)
2877      const char *clean_p;
2878 {
2879   if (!quiet_flag)
2880     {
2881       if (clean_p == 0)
2882         fprintf (stderr, "%s: %d: warning: source too confusing\n",
2883                  shortpath (NULL, convert_filename), last_known_line_number);
2884       else
2885         fprintf (stderr, "%s: %d: warning: source too confusing\n",
2886                  shortpath (NULL, convert_filename),
2887                  identify_lineno (clean_p));
2888     }
2889   longjmp (source_confusion_recovery, 1);
2890 }
2891
2892 /* Check that a condition which is expected to be true in the original source
2893    code is in fact true.  If not, issue an error message and give up on
2894    converting this particular source file.  */
2895
2896 static void
2897 check_source (cond, clean_p)
2898      int cond;
2899      const char *clean_p;
2900 {
2901   if (!cond)
2902     declare_source_confusing (clean_p);
2903 }
2904
2905 /* If we think of the in-core cleaned text buffer as a memory mapped
2906    file (with the variable last_known_line_start acting as sort of a
2907    file pointer) then we can imagine doing "seeks" on the buffer.  The
2908    following routine implements a kind of "seek" operation for the in-core
2909    (cleaned) copy of the source file.  When finished, it returns a pointer to
2910    the start of a given (numbered) line in the cleaned text buffer.
2911
2912    Note that protoize only has to "seek" in the forward direction on the
2913    in-core cleaned text file buffers, and it never needs to back up.
2914
2915    This routine is made a little bit faster by remembering the line number
2916    (and pointer value) supplied (and returned) from the previous "seek".
2917    This prevents us from always having to start all over back at the top
2918    of the in-core cleaned buffer again.  */
2919
2920 static const char *
2921 seek_to_line (n)
2922      int n;
2923 {
2924   if (n < last_known_line_number)
2925     abort ();
2926
2927   while (n > last_known_line_number)
2928     {
2929       while (*last_known_line_start != '\n')
2930         check_source (++last_known_line_start < clean_text_limit, 0);
2931       last_known_line_start++;
2932       last_known_line_number++;
2933     }
2934   return last_known_line_start;
2935 }
2936
2937 /* Given a pointer to a character in the cleaned text buffer, return a pointer
2938    to the next non-whitepace character which follows it.  */
2939
2940 static const char *
2941 forward_to_next_token_char (ptr)
2942      const char *ptr;
2943 {
2944   for (++ptr; isspace (*ptr); check_source (++ptr < clean_text_limit, 0))
2945     continue;
2946   return ptr;
2947 }
2948
2949 /* Copy a chunk of text of length `len' and starting at `str' to the current
2950    output buffer.  Note that all attempts to add stuff to the current output
2951    buffer ultimately go through here.  */
2952
2953 static void
2954 output_bytes (str, len)
2955      const char *str;
2956      size_t len;
2957 {
2958   if ((repl_write_ptr + 1) + len >= repl_text_limit)
2959     {
2960       size_t new_size = (repl_text_limit - repl_text_base) << 1;
2961       char *new_buf = (char *) xrealloc (repl_text_base, new_size);
2962
2963       repl_write_ptr = new_buf + (repl_write_ptr - repl_text_base);
2964       repl_text_base = new_buf;
2965       repl_text_limit = new_buf + new_size;
2966     }
2967   memcpy (repl_write_ptr + 1, str, len);
2968   repl_write_ptr += len;
2969 }
2970
2971 /* Copy all bytes (except the trailing null) of a null terminated string to
2972    the current output buffer.  */
2973
2974 static void
2975 output_string (str)
2976      const char *str;
2977 {
2978   output_bytes (str, strlen (str));
2979 }
2980
2981 /* Copy some characters from the original text buffer to the current output
2982    buffer.
2983
2984    This routine takes a pointer argument `p' which is assumed to be a pointer
2985    into the cleaned text buffer.  The bytes which are copied are the `original'
2986    equivalents for the set of bytes between the last value of `clean_read_ptr'
2987    and the argument value `p'.
2988
2989    The set of bytes copied however, comes *not* from the cleaned text buffer,
2990    but rather from the direct counterparts of these bytes within the original
2991    text buffer.
2992
2993    Thus, when this function is called, some bytes from the original text
2994    buffer (which may include original comments and preprocessing directives)
2995    will be copied into the  output buffer.
2996
2997    Note that the request implide when this routine is called includes the
2998    byte pointed to by the argument pointer `p'.  */
2999
3000 static void
3001 output_up_to (p)
3002      const char *p;
3003 {
3004   size_t copy_length = (size_t) (p - clean_read_ptr);
3005   const char *copy_start = orig_text_base+(clean_read_ptr-clean_text_base)+1;
3006
3007   if (copy_length == 0)
3008     return;
3009
3010   output_bytes (copy_start, copy_length);
3011   clean_read_ptr = p;
3012 }
3013
3014 /* Given a pointer to a def_dec_info record which represents some form of
3015    definition of a function (perhaps a real definition, or in lieu of that
3016    perhaps just a declaration with a full prototype) return true if this
3017    function is one which we should avoid converting.  Return false
3018    otherwise.  */
3019
3020 static int
3021 other_variable_style_function (ansi_header)
3022      const char *ansi_header;
3023 {
3024 #ifdef UNPROTOIZE
3025
3026   /* See if we have a stdarg function, or a function which has stdarg style
3027      parameters or a stdarg style return type.  */
3028
3029   return substr (ansi_header, "...") != 0;
3030
3031 #else /* !defined (UNPROTOIZE) */
3032
3033   /* See if we have a varargs function, or a function which has varargs style
3034      parameters or a varargs style return type.  */
3035
3036   const char *p;
3037   int len = strlen (varargs_style_indicator);
3038
3039   for (p = ansi_header; p; )
3040     {
3041       const char *candidate;
3042
3043       if ((candidate = substr (p, varargs_style_indicator)) == 0)
3044         return 0;
3045       else
3046         if (!is_id_char (candidate[-1]) && !is_id_char (candidate[len]))
3047           return 1;
3048         else
3049           p = candidate + 1;
3050     }
3051   return 0;
3052 #endif /* !defined (UNPROTOIZE) */
3053 }
3054
3055 /* Do the editing operation specifically for a function "declaration".  Note
3056    that editing for function "definitions" are handled in a separate routine
3057    below.  */
3058
3059 static void
3060 edit_fn_declaration (def_dec_p, clean_text_p)
3061      const def_dec_info *def_dec_p;
3062      const char *volatile clean_text_p;
3063 {
3064   const char *start_formals;
3065   const char *end_formals;
3066   const char *function_to_edit = def_dec_p->hash_entry->symbol;
3067   size_t func_name_len = strlen (function_to_edit);
3068   const char *end_of_fn_name;
3069
3070 #ifndef UNPROTOIZE
3071
3072   const f_list_chain_item *this_f_list_chain_item;
3073   const def_dec_info *definition = def_dec_p->definition;
3074
3075   /* If we are protoizing, and if we found no corresponding definition for
3076      this particular function declaration, then just leave this declaration
3077      exactly as it is.  */
3078
3079   if (!definition)
3080     return;
3081
3082   /* If we are protoizing, and if the corresponding definition that we found
3083      for this particular function declaration defined an old style varargs
3084      function, then we want to issue a warning and just leave this function
3085      declaration unconverted.  */
3086
3087   if (other_variable_style_function (definition->ansi_decl))
3088     {
3089       if (!quiet_flag)
3090         fprintf (stderr, "%s: %d: warning: varargs function declaration not converted\n",
3091                  shortpath (NULL, def_dec_p->file->hash_entry->symbol),
3092                  def_dec_p->line);
3093       return;
3094     }
3095
3096 #endif /* !defined (UNPROTOIZE) */
3097
3098   /* Setup here to recover from confusing source code detected during this
3099      particular "edit".  */
3100
3101   save_pointers ();
3102   if (setjmp (source_confusion_recovery))
3103     {
3104       restore_pointers ();
3105       fprintf (stderr, "%s: declaration of function `%s' not converted\n",
3106                pname, function_to_edit);
3107       return;
3108     }
3109
3110   /* We are editing a function declaration.  The line number we did a seek to
3111      contains the comma or semicolon which follows the declaration.  Our job
3112      now is to scan backwards looking for the function name.  This name *must*
3113      be followed by open paren (ignoring whitespace, of course).  We need to
3114      replace everything between that open paren and the corresponding closing
3115      paren.  If we are protoizing, we need to insert the prototype-style
3116      formals lists.  If we are unprotoizing, we need to just delete everything
3117      between the pairs of opening and closing parens.  */
3118
3119   /* First move up to the end of the line.  */
3120
3121   while (*clean_text_p != '\n')
3122     check_source (++clean_text_p < clean_text_limit, 0);
3123   clean_text_p--;  /* Point to just before the newline character.  */
3124
3125   /* Now we can scan backwards for the function name.  */
3126
3127   do
3128     {
3129       for (;;)
3130         {
3131           /* Scan leftwards until we find some character which can be
3132              part of an identifier.  */
3133
3134           while (!is_id_char (*clean_text_p))
3135             check_source (--clean_text_p > clean_read_ptr, 0);
3136
3137           /* Scan backwards until we find a char that cannot be part of an
3138              identifier.  */
3139
3140           while (is_id_char (*clean_text_p))
3141             check_source (--clean_text_p > clean_read_ptr, 0);
3142
3143           /* Having found an "id break", see if the following id is the one
3144              that we are looking for.  If so, then exit from this loop.  */
3145
3146           if (!strncmp (clean_text_p+1, function_to_edit, func_name_len))
3147             {
3148               char ch = *(clean_text_p + 1 + func_name_len);
3149
3150               /* Must also check to see that the name in the source text
3151                  ends where it should (in order to prevent bogus matches
3152                  on similar but longer identifiers.  */
3153
3154               if (! is_id_char (ch))
3155                 break;                  /* exit from loop */
3156             }
3157         }
3158     
3159       /* We have now found the first perfect match for the function name in
3160          our backward search.  This may or may not be the actual function
3161          name at the start of the actual function declaration (i.e. we could
3162          have easily been mislead).  We will try to avoid getting fooled too
3163          often by looking forward for the open paren which should follow the
3164          identifier we just found.  We ignore whitespace while hunting.  If
3165          the next non-whitespace byte we see is *not* an open left paren,
3166          then we must assume that we have been fooled and we start over
3167          again accordingly.  Note that there is no guarantee, that even if
3168          we do see the open paren, that we are in the right place.
3169          Programmers do the strangest things sometimes!  */
3170     
3171       end_of_fn_name = clean_text_p + strlen (def_dec_p->hash_entry->symbol);
3172       start_formals = forward_to_next_token_char (end_of_fn_name);
3173     }
3174   while (*start_formals != '(');
3175
3176   /* start_of_formals now points to the opening left paren which immediately
3177      follows the name of the function.  */
3178
3179   /* Note that there may be several formals lists which need to be modified
3180      due to the possibility that the return type of this function is a
3181      pointer-to-function type.  If there are several formals lists, we
3182      convert them in left-to-right order here.  */
3183
3184 #ifndef UNPROTOIZE
3185   this_f_list_chain_item = definition->f_list_chain;
3186 #endif /* !defined (UNPROTOIZE) */
3187
3188   for (;;)
3189     {
3190       {
3191         int depth;
3192
3193         end_formals = start_formals + 1;
3194         depth = 1;
3195         for (; depth; check_source (++end_formals < clean_text_limit, 0))
3196           {
3197             switch (*end_formals)
3198               {
3199                 case '(':
3200                   depth++;
3201                   break;
3202                 case ')':
3203                   depth--;
3204                   break;
3205               }
3206           }
3207         end_formals--;
3208       }
3209
3210       /* end_formals now points to the closing right paren of the formals
3211          list whose left paren is pointed to by start_formals.  */
3212     
3213       /* Now, if we are protoizing, we insert the new ANSI-style formals list
3214          attached to the associated definition of this function.  If however
3215          we are unprotoizing, then we simply delete any formals list which
3216          may be present.  */
3217     
3218       output_up_to (start_formals);
3219 #ifndef UNPROTOIZE
3220       if (this_f_list_chain_item)
3221         {
3222           output_string (this_f_list_chain_item->formals_list);
3223           this_f_list_chain_item = this_f_list_chain_item->chain_next;
3224         }
3225       else
3226         {
3227           if (!quiet_flag)
3228             fprintf (stderr, "%s: warning: too many parameter lists in declaration of `%s'\n",
3229                      pname, def_dec_p->hash_entry->symbol);
3230           check_source (0, end_formals);  /* leave the declaration intact */
3231         }
3232 #endif /* !defined (UNPROTOIZE) */
3233       clean_read_ptr = end_formals - 1;
3234
3235       /* Now see if it looks like there may be another formals list associated
3236          with the function declaration that we are converting (following the
3237          formals list that we just converted.  */
3238
3239       {
3240         const char *another_r_paren = forward_to_next_token_char (end_formals);
3241
3242         if ((*another_r_paren != ')')
3243             || (*(start_formals = forward_to_next_token_char (another_r_paren)) != '('))
3244           {
3245 #ifndef UNPROTOIZE
3246             if (this_f_list_chain_item)
3247               {
3248                 if (!quiet_flag)
3249                   fprintf (stderr, "\n%s: warning: too few parameter lists in declaration of `%s'\n",
3250                            pname, def_dec_p->hash_entry->symbol);
3251                 check_source (0, start_formals); /* leave the decl intact */
3252               }
3253 #endif /* !defined (UNPROTOIZE) */
3254             break;
3255   
3256           }
3257       }
3258
3259       /* There does appear to be yet another formals list, so loop around
3260          again, and convert it also.  */
3261     }
3262 }
3263
3264 /* Edit a whole group of formals lists, starting with the rightmost one
3265    from some set of formals lists.  This routine is called once (from the
3266    outside) for each function declaration which is converted.  It is
3267    recursive however, and it calls itself once for each remaining formal
3268    list that lies to the left of the one it was originally called to work
3269    on.  Thus, a whole set gets done in right-to-left order.
3270
3271    This routine returns non-zero if it thinks that it should not be trying
3272    to convert this particular function definition (because the name of the
3273    function doesn't match the one expected).  */
3274
3275 static int
3276 edit_formals_lists (end_formals, f_list_count, def_dec_p)
3277      const char *end_formals;
3278      unsigned int f_list_count;
3279      const def_dec_info *def_dec_p;
3280 {
3281   const char *start_formals;
3282   int depth;
3283
3284   start_formals = end_formals - 1;
3285   depth = 1;
3286   for (; depth; check_source (--start_formals > clean_read_ptr, 0))
3287     {
3288       switch (*start_formals)
3289         {
3290           case '(':
3291             depth--;
3292             break;
3293           case ')':
3294             depth++;
3295             break;
3296         }
3297     }
3298   start_formals++;
3299
3300   /* start_formals now points to the opening left paren of the formals list.  */
3301
3302   f_list_count--;
3303
3304   if (f_list_count)
3305     {
3306       const char *next_end;
3307
3308       /* There should be more formal lists to the left of here.  */
3309
3310       next_end = start_formals - 1;
3311       check_source (next_end > clean_read_ptr, 0);
3312       while (isspace (*next_end))
3313         check_source (--next_end > clean_read_ptr, 0);
3314       check_source (*next_end == ')', next_end);
3315       check_source (--next_end > clean_read_ptr, 0);
3316       check_source (*next_end == ')', next_end);
3317       if (edit_formals_lists (next_end, f_list_count, def_dec_p))
3318         return 1;
3319     }
3320
3321   /* Check that the function name in the header we are working on is the same
3322      as the one we would expect to find.  If not, issue a warning and return
3323      non-zero.  */
3324
3325   if (f_list_count == 0)
3326     {
3327       const char *expected = def_dec_p->hash_entry->symbol;
3328       const char *func_name_start;
3329       const char *func_name_limit;
3330       size_t func_name_len;
3331
3332       for (func_name_limit = start_formals-1; isspace (*func_name_limit); )
3333         check_source (--func_name_limit > clean_read_ptr, 0);
3334
3335       for (func_name_start = func_name_limit++;
3336            is_id_char (*func_name_start);
3337            func_name_start--)
3338         check_source (func_name_start > clean_read_ptr, 0);
3339       func_name_start++;
3340       func_name_len = func_name_limit - func_name_start;
3341       if (func_name_len == 0)
3342         check_source (0, func_name_start);
3343       if (func_name_len != strlen (expected)
3344           || strncmp (func_name_start, expected, func_name_len))
3345         {
3346           fprintf (stderr, "%s: %d: warning: found `%s' but expected `%s'\n",
3347                    shortpath (NULL, def_dec_p->file->hash_entry->symbol),
3348                    identify_lineno (func_name_start),
3349                    dupnstr (func_name_start, func_name_len),
3350                    expected);
3351           return 1;
3352         }
3353     }
3354
3355   output_up_to (start_formals);
3356
3357 #ifdef UNPROTOIZE
3358   if (f_list_count == 0)
3359     output_string (def_dec_p->formal_names);
3360 #else /* !defined (UNPROTOIZE) */
3361   {
3362     unsigned f_list_depth;
3363     const f_list_chain_item *flci_p = def_dec_p->f_list_chain;
3364
3365     /* At this point, the current value of f_list count says how many
3366        links we have to follow through the f_list_chain to get to the
3367        particular formals list that we need to output next.  */
3368
3369     for (f_list_depth = 0; f_list_depth < f_list_count; f_list_depth++)
3370       flci_p = flci_p->chain_next;
3371     output_string (flci_p->formals_list);
3372   }
3373 #endif /* !defined (UNPROTOIZE) */
3374
3375   clean_read_ptr = end_formals - 1;
3376   return 0;
3377 }
3378
3379 /* Given a pointer to a byte in the clean text buffer which points to the
3380    beginning of a line that contains a "follower" token for a function
3381    definition header, do whatever is necessary to find the right closing
3382    paren for the rightmost formals list of the function definition header.
3383 */
3384
3385 static const char *
3386 find_rightmost_formals_list (clean_text_p)
3387      const char *clean_text_p;
3388 {
3389   const char *end_formals;
3390
3391   /* We are editing a function definition.  The line number we did a seek
3392      to contains the first token which immediately follows the entire set of
3393      formals lists which are part of this particular function definition
3394      header.
3395
3396      Our job now is to scan leftwards in the clean text looking for the
3397      right-paren which is at the end of the function header's rightmost
3398      formals list.
3399
3400      If we ignore whitespace, this right paren should be the first one we
3401      see which is (ignoring whitespace) immediately followed either by the
3402      open curly-brace beginning the function body or by an alphabetic
3403      character (in the case where the function definition is in old (K&R)
3404      style and there are some declarations of formal parameters).  */
3405
3406    /* It is possible that the right paren we are looking for is on the
3407       current line (together with its following token).  Just in case that
3408       might be true, we start out here by skipping down to the right end of
3409       the current line before starting our scan.  */
3410
3411   for (end_formals = clean_text_p; *end_formals != '\n'; end_formals++)
3412     continue;
3413   end_formals--;
3414
3415 #ifdef UNPROTOIZE
3416
3417   /* Now scan backwards while looking for the right end of the rightmost
3418      formals list associated with this function definition.  */
3419
3420   {
3421     char ch;
3422     const char *l_brace_p;
3423
3424     /* Look leftward and try to find a right-paren.  */
3425
3426     while (*end_formals != ')')
3427       {
3428         if (isspace (*end_formals))
3429           while (isspace (*end_formals))
3430             check_source (--end_formals > clean_read_ptr, 0);
3431         else
3432           check_source (--end_formals > clean_read_ptr, 0);
3433       }
3434
3435     ch = *(l_brace_p = forward_to_next_token_char (end_formals));
3436     /* Since we are unprotoizing an ANSI-style (prototyped) function
3437        definition, there had better not be anything (except whitespace)
3438        between the end of the ANSI formals list and the beginning of the
3439        function body (i.e. the '{').  */
3440
3441     check_source (ch == '{', l_brace_p);
3442   }
3443
3444 #else /* !defined (UNPROTOIZE) */
3445
3446   /* Now scan backwards while looking for the right end of the rightmost
3447      formals list associated with this function definition.  */
3448
3449   while (1)
3450     {
3451       char ch;
3452       const char *l_brace_p;
3453
3454       /* Look leftward and try to find a right-paren.  */
3455
3456       while (*end_formals != ')')
3457         {
3458           if (isspace (*end_formals))
3459             while (isspace (*end_formals))
3460               check_source (--end_formals > clean_read_ptr, 0);
3461           else
3462             check_source (--end_formals > clean_read_ptr, 0);
3463         }
3464
3465       ch = *(l_brace_p = forward_to_next_token_char (end_formals));
3466
3467       /* Since it is possible that we found a right paren before the starting
3468          '{' of the body which IS NOT the one at the end of the real K&R
3469          formals list (say for instance, we found one embedded inside one of
3470          the old K&R formal parameter declarations) we have to check to be
3471          sure that this is in fact the right paren that we were looking for.
3472
3473          The one we were looking for *must* be followed by either a '{' or
3474          by an alphabetic character, while others *cannot* legally be followed
3475          by such characters.  */
3476
3477       if ((ch == '{') || isalpha (ch))
3478         break;
3479
3480       /* At this point, we have found a right paren, but we know that it is
3481          not the one we were looking for, so backup one character and keep
3482          looking.  */
3483
3484       check_source (--end_formals > clean_read_ptr, 0);
3485     }
3486
3487 #endif /* !defined (UNPROTOIZE) */
3488
3489   return end_formals;
3490 }
3491
3492 #ifndef UNPROTOIZE
3493
3494 /* Insert into the output file a totally new declaration for a function
3495    which (up until now) was being called from within the current block
3496    without having been declared at any point such that the declaration
3497    was visible (i.e. in scope) at the point of the call.
3498
3499    We need to add in explicit declarations for all such function calls
3500    in order to get the full benefit of prototype-based function call
3501    parameter type checking.  */
3502
3503 static void
3504 add_local_decl (def_dec_p, clean_text_p)
3505      const def_dec_info *def_dec_p;
3506      const char *clean_text_p;
3507 {
3508   const char *start_of_block;
3509   const char *function_to_edit = def_dec_p->hash_entry->symbol;
3510
3511   /* Don't insert new local explicit declarations unless explicitly requested
3512      to do so.  */
3513
3514   if (!local_flag)
3515     return;
3516
3517   /* Setup here to recover from confusing source code detected during this
3518      particular "edit".  */
3519
3520   save_pointers ();
3521   if (setjmp (source_confusion_recovery))
3522     {
3523       restore_pointers ();
3524       fprintf (stderr, "%s: local declaration for function `%s' not inserted\n",
3525                pname, function_to_edit);
3526       return;
3527     }
3528
3529   /* We have already done a seek to the start of the line which should
3530      contain *the* open curly brace which begins the block in which we need
3531      to insert an explicit function declaration (to replace the implicit one).
3532
3533      Now we scan that line, starting from the left, until we find the
3534      open curly brace we are looking for.  Note that there may actually be
3535      multiple open curly braces on the given line, but we will be happy
3536      with the leftmost one no matter what.  */
3537
3538   start_of_block = clean_text_p;
3539   while (*start_of_block != '{' && *start_of_block != '\n')
3540     check_source (++start_of_block < clean_text_limit, 0);
3541
3542   /* Note that the line from the original source could possibly
3543      contain *no* open curly braces!  This happens if the line contains
3544      a macro call which expands into a chunk of text which includes a
3545      block (and that block's associated open and close curly braces).
3546      In cases like this, we give up, issue a warning, and do nothing.  */
3547
3548   if (*start_of_block != '{')
3549     {
3550       if (!quiet_flag)
3551         fprintf (stderr,
3552           "\n%s: %d: warning: can't add declaration of `%s' into macro call\n",
3553           def_dec_p->file->hash_entry->symbol, def_dec_p->line, 
3554           def_dec_p->hash_entry->symbol);
3555       return;
3556     }
3557
3558   /* Figure out what a nice (pretty) indentation would be for the new
3559      declaration we are adding.  In order to do this, we must scan forward
3560      from the '{' until we find the first line which starts with some
3561      non-whitespace characters (i.e. real "token" material).  */
3562
3563   {
3564     const char *ep = forward_to_next_token_char (start_of_block) - 1;
3565     const char *sp;
3566
3567     /* Now we have ep pointing at the rightmost byte of some existing indent
3568        stuff.  At least that is the hope.
3569
3570        We can now just scan backwards and find the left end of the existing
3571        indentation string, and then copy it to the output buffer.  */
3572
3573     for (sp = ep; isspace (*sp) && *sp != '\n'; sp--)
3574       continue;
3575
3576     /* Now write out the open { which began this block, and any following
3577        trash up to and including the last byte of the existing indent that
3578        we just found.  */
3579
3580     output_up_to (ep);
3581   
3582     /* Now we go ahead and insert the new declaration at this point.
3583
3584        If the definition of the given function is in the same file that we
3585        are currently editing, and if its full ANSI declaration normally
3586        would start with the keyword `extern', suppress the `extern'.  */
3587   
3588     {
3589       const char *decl = def_dec_p->definition->ansi_decl;
3590   
3591       if ((*decl == 'e') && (def_dec_p->file == def_dec_p->definition->file))
3592         decl += 7;
3593       output_string (decl);
3594     }
3595
3596     /* Finally, write out a new indent string, just like the preceding one
3597        that we found.  This will typically include a newline as the first
3598        character of the indent string.  */
3599
3600     output_bytes (sp, (size_t) (ep - sp) + 1);
3601   }
3602 }
3603
3604 /* Given a pointer to a file_info record, and a pointer to the beginning
3605    of a line (in the clean text buffer) which is assumed to contain the
3606    first "follower" token for the first function definition header in the
3607    given file, find a good place to insert some new global function
3608    declarations (which will replace scattered and imprecise implicit ones)
3609    and then insert the new explicit declaration at that point in the file.  */
3610
3611 static void
3612 add_global_decls (file_p, clean_text_p)
3613      const file_info *file_p;
3614      const char *clean_text_p;
3615 {
3616   const def_dec_info *dd_p;
3617   const char *scan_p;
3618
3619   /* Setup here to recover from confusing source code detected during this
3620      particular "edit".  */
3621
3622   save_pointers ();
3623   if (setjmp (source_confusion_recovery))
3624     {
3625       restore_pointers ();
3626       fprintf (stderr, "%s: global declarations for file `%s' not inserted\n",
3627                pname, shortpath (NULL, file_p->hash_entry->symbol));
3628       return;
3629     }
3630
3631   /* Start by finding a good location for adding the new explicit function
3632      declarations.  To do this, we scan backwards, ignoring whitespace
3633      and comments and other junk until we find either a semicolon, or until
3634      we hit the beginning of the file.  */
3635
3636   scan_p = find_rightmost_formals_list (clean_text_p);
3637   for (;; --scan_p)
3638     {
3639       if (scan_p < clean_text_base)
3640         break;
3641       check_source (scan_p > clean_read_ptr, 0);
3642       if (*scan_p == ';')
3643         break;
3644     }
3645
3646   /* scan_p now points either to a semicolon, or to just before the start
3647      of the whole file.  */
3648
3649   /* Now scan forward for the first non-whitespace character.  In theory,
3650      this should be the first character of the following function definition
3651      header.  We will put in the added declarations just prior to that. */
3652
3653   scan_p++;
3654   while (isspace (*scan_p))
3655     scan_p++;
3656   scan_p--;
3657
3658   output_up_to (scan_p);
3659
3660   /* Now write out full prototypes for all of the things that had been
3661      implicitly declared in this file (but only those for which we were
3662      actually able to find unique matching definitions).  Avoid duplicates
3663      by marking things that we write out as we go.   */
3664
3665   {
3666     int some_decls_added = 0;
3667   
3668     for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
3669       if (dd_p->is_implicit && dd_p->definition && !dd_p->definition->written)
3670         {
3671           const char *decl = dd_p->definition->ansi_decl;
3672   
3673           /* If the function for which we are inserting a declaration is
3674              actually defined later in the same file, then suppress the
3675              leading `extern' keyword (if there is one).  */
3676   
3677           if (*decl == 'e' && (dd_p->file == dd_p->definition->file))
3678             decl += 7;
3679   
3680           output_string ("\n");
3681           output_string (decl);
3682           some_decls_added = 1;
3683           ((NONCONST def_dec_info *) dd_p->definition)->written = 1;
3684         }
3685     if (some_decls_added)
3686       output_string ("\n\n");
3687   }
3688
3689   /* Unmark all of the definitions that we just marked.  */
3690
3691   for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
3692     if (dd_p->definition)
3693       ((NONCONST def_dec_info *) dd_p->definition)->written = 0;
3694 }
3695
3696 #endif /* !defined (UNPROTOIZE) */
3697
3698 /* Do the editing operation specifically for a function "definition".  Note
3699    that editing operations for function "declarations" are handled by a
3700    separate routine above.  */
3701
3702 static void
3703 edit_fn_definition (def_dec_p, clean_text_p)
3704      const def_dec_info *def_dec_p;
3705      const char *clean_text_p;
3706 {
3707   const char *end_formals;
3708   const char *function_to_edit = def_dec_p->hash_entry->symbol;
3709
3710   /* Setup here to recover from confusing source code detected during this
3711      particular "edit".  */
3712
3713   save_pointers ();
3714   if (setjmp (source_confusion_recovery))
3715     {
3716       restore_pointers ();
3717       fprintf (stderr, "%s: definition of function `%s' not converted\n",
3718                pname, function_to_edit);
3719       return;
3720     }
3721
3722   end_formals = find_rightmost_formals_list (clean_text_p);
3723
3724   /* end_of_formals now points to the closing right paren of the rightmost
3725      formals list which is actually part of the `header' of the function
3726      definition that we are converting.  */
3727
3728   /* If the header of this function definition looks like it declares a
3729      function with a variable number of arguments, and if the way it does
3730      that is different from that way we would like it (i.e. varargs vs.
3731      stdarg) then issue a warning and leave the header unconverted.  */
3732      
3733   if (other_variable_style_function (def_dec_p->ansi_decl))
3734     {
3735       if (!quiet_flag)
3736         fprintf (stderr, "%s: %d: warning: definition of %s not converted\n",
3737                  shortpath (NULL, def_dec_p->file->hash_entry->symbol),
3738                  identify_lineno (end_formals), 
3739                  other_var_style);
3740       output_up_to (end_formals);
3741       return;
3742     }
3743
3744   if (edit_formals_lists (end_formals, def_dec_p->f_list_count, def_dec_p))
3745     {
3746       restore_pointers ();
3747       fprintf (stderr, "%s: definition of function `%s' not converted\n",
3748                pname, function_to_edit);
3749       return;
3750     }
3751
3752   /* Have to output the last right paren because this never gets flushed by
3753      edit_formals_list.  */
3754
3755   output_up_to (end_formals);
3756
3757 #ifdef UNPROTOIZE
3758   {
3759     const char *decl_p;
3760     const char *semicolon_p;
3761     const char *limit_p;
3762     const char *scan_p;
3763     int had_newlines = 0;
3764
3765     /* Now write out the K&R style formal declarations, one per line.  */
3766
3767     decl_p = def_dec_p->formal_decls;
3768     limit_p = decl_p + strlen (decl_p);
3769     for (;decl_p < limit_p; decl_p = semicolon_p + 2)
3770       {
3771         for (semicolon_p = decl_p; *semicolon_p != ';'; semicolon_p++)
3772           continue;
3773         output_string ("\n");
3774         output_string (indent_string);
3775         output_bytes (decl_p, (size_t) ((semicolon_p + 1) - decl_p));
3776       }
3777
3778     /* If there are no newlines between the end of the formals list and the
3779        start of the body, we should insert one now.  */
3780
3781     for (scan_p = end_formals+1; *scan_p != '{'; )
3782       {
3783         if (*scan_p == '\n')
3784           {
3785             had_newlines = 1;
3786             break;
3787           }
3788         check_source (++scan_p < clean_text_limit, 0);
3789       }
3790     if (!had_newlines)
3791       output_string ("\n");
3792   }
3793 #else /* !defined (UNPROTOIZE) */
3794   /* If we are protoizing, there may be some flotsum & jetsum (like comments
3795      and preprocessing directives) after the old formals list but before
3796      the following { and we would like to preserve that stuff while effectively
3797      deleting the existing K&R formal parameter declarations.  We do so here
3798      in a rather tricky way.  Basically, we white out any stuff *except*
3799      the comments/pp-directives in the original text buffer, then, if there
3800      is anything in this area *other* than whitespace, we output it.  */
3801   {
3802     const char *end_formals_orig;
3803     const char *start_body;
3804     const char *start_body_orig;
3805     const char *scan;
3806     const char *scan_orig;
3807     int have_flotsum = 0;
3808     int have_newlines = 0;
3809
3810     for (start_body = end_formals + 1; *start_body != '{';)
3811       check_source (++start_body < clean_text_limit, 0);
3812
3813     end_formals_orig = orig_text_base + (end_formals - clean_text_base);
3814     start_body_orig = orig_text_base + (start_body - clean_text_base);
3815     scan = end_formals + 1;
3816     scan_orig = end_formals_orig + 1;
3817     for (; scan < start_body; scan++, scan_orig++)
3818       {
3819         if (*scan == *scan_orig)
3820           {
3821             have_newlines |= (*scan_orig == '\n');
3822             /* Leave identical whitespace alone.  */
3823             if (!isspace (*scan_orig))
3824               *((NONCONST char *)scan_orig) = ' '; /* identical - so whiteout */
3825           }
3826         else
3827           have_flotsum = 1;
3828       }
3829     if (have_flotsum)
3830       output_bytes (end_formals_orig + 1,
3831                     (size_t) (start_body_orig - end_formals_orig) - 1);
3832     else
3833       if (have_newlines)
3834         output_string ("\n");
3835       else
3836         output_string (" ");
3837     clean_read_ptr = start_body - 1;
3838   }
3839 #endif /* !defined (UNPROTOIZE) */
3840 }
3841
3842 /* Clean up the clean text buffer.  Do this by converting comments and
3843    preprocessor directives into spaces.   Also convert line continuations
3844    into whitespace.  Also, whiteout string and character literals.  */
3845
3846 static void
3847 do_cleaning (new_clean_text_base, new_clean_text_limit)
3848      char *new_clean_text_base;
3849      char *new_clean_text_limit;
3850 {
3851   char *scan_p;
3852   int non_whitespace_since_newline = 0;
3853
3854   for (scan_p = new_clean_text_base; scan_p < new_clean_text_limit; scan_p++)
3855     {
3856       switch (*scan_p)
3857         {
3858           case '/':                     /* Handle comments.  */
3859             if (scan_p[1] != '*')
3860               goto regular;
3861             non_whitespace_since_newline = 1;
3862             scan_p[0] = ' ';
3863             scan_p[1] = ' ';
3864             scan_p += 2;
3865             while (scan_p[1] != '/' || scan_p[0] != '*')
3866               {
3867                 if (!isspace (*scan_p))
3868                   *scan_p = ' ';
3869                 if (++scan_p >= new_clean_text_limit)
3870                   abort ();
3871               }
3872             *scan_p++ = ' ';
3873             *scan_p = ' ';
3874             break;
3875
3876           case '#':                     /* Handle pp directives.  */
3877             if (non_whitespace_since_newline)
3878               goto regular;
3879             *scan_p = ' ';
3880             while (scan_p[1] != '\n' || scan_p[0] == '\\')
3881               {
3882                 if (!isspace (*scan_p))
3883                   *scan_p = ' ';
3884                 if (++scan_p >= new_clean_text_limit)
3885                   abort ();
3886               }
3887             *scan_p++ = ' ';
3888             break;
3889
3890           case '\'':                    /* Handle character literals.  */
3891             non_whitespace_since_newline = 1;
3892             while (scan_p[1] != '\'' || scan_p[0] == '\\')
3893               {
3894                 if (scan_p[0] == '\\' && !isspace (scan_p[1]))
3895                   scan_p[1] = ' ';
3896                 if (!isspace (*scan_p))
3897                   *scan_p = ' ';
3898                 if (++scan_p >= new_clean_text_limit)
3899                   abort ();
3900               }
3901             *scan_p++ = ' ';
3902             break;
3903
3904           case '"':                     /* Handle string literals.  */
3905             non_whitespace_since_newline = 1;
3906             while (scan_p[1] != '"' || scan_p[0] == '\\')
3907               {
3908                 if (scan_p[0] == '\\' && !isspace (scan_p[1]))
3909                   scan_p[1] = ' ';
3910                 if (!isspace (*scan_p))
3911                   *scan_p = ' ';
3912                 if (++scan_p >= new_clean_text_limit)
3913                   abort ();
3914               }
3915             *scan_p++ = ' ';
3916             break;
3917
3918           case '\\':                    /* Handle line continuations.  */
3919             if (scan_p[1] != '\n')
3920               goto regular;
3921             *scan_p = ' ';
3922             break;
3923
3924           case '\n':
3925             non_whitespace_since_newline = 0;   /* Reset.  */
3926             break;
3927
3928           case ' ':
3929           case '\v':
3930           case '\t':
3931           case '\r':
3932           case '\f':
3933           case '\b':
3934             break;              /* Whitespace characters.  */
3935
3936           default:
3937 regular:
3938             non_whitespace_since_newline = 1;
3939             break;
3940         }
3941     }
3942 }
3943
3944 /* Given a pointer to the closing right parenthesis for a particular formals
3945    list (in the clean text buffer) find the corresponding left parenthesis
3946    and return a pointer to it.  */
3947
3948 static const char *
3949 careful_find_l_paren (p)
3950      const char *p;
3951 {
3952   const char *q;
3953   int paren_depth;
3954
3955   for (paren_depth = 1, q = p-1; paren_depth; check_source (--q >= clean_text_base, 0))
3956     {
3957       switch (*q)
3958         {
3959           case ')':
3960             paren_depth++;
3961             break;
3962           case '(':
3963             paren_depth--;
3964             break;
3965         }
3966     }
3967   return ++q;
3968 }
3969
3970 /* Scan the clean text buffer for cases of function definitions that we
3971    don't really know about because they were preprocessed out when the
3972    aux info files were created.
3973
3974    In this version of protoize/unprotoize we just give a warning for each
3975    one found.  A later version may be able to at least unprotoize such
3976    missed items.
3977
3978    Note that we may easily find all function definitions simply by
3979    looking for places where there is a left paren which is (ignoring
3980    whitespace) immediately followed by either a left-brace or by an
3981    upper or lower case letter.  Whenever we find this combination, we
3982    have also found a function definition header.
3983
3984    Finding function *declarations* using syntactic clues is much harder.
3985    I will probably try to do this in a later version though.  */
3986
3987 static void
3988 scan_for_missed_items (file_p)
3989      const file_info *file_p;
3990 {
3991   static const char *scan_p;
3992   const char *limit = clean_text_limit - 3;
3993   static const char *backup_limit;
3994
3995   backup_limit = clean_text_base - 1;
3996
3997   for (scan_p = clean_text_base; scan_p < limit; scan_p++)
3998     {
3999       if (*scan_p == ')')
4000         {
4001           static const char *last_r_paren;
4002           const char *ahead_p;
4003
4004           last_r_paren = scan_p;
4005
4006           for (ahead_p = scan_p + 1; isspace (*ahead_p); )
4007             check_source (++ahead_p < limit, limit);
4008
4009           scan_p = ahead_p - 1;
4010
4011           if (isalpha (*ahead_p) || *ahead_p == '{')
4012             {
4013               const char *last_l_paren;
4014               const int lineno = identify_lineno (ahead_p);
4015
4016               if (setjmp (source_confusion_recovery))
4017                 continue;
4018
4019               /* We know we have a function definition header.  Now skip
4020                  leftwards over all of its associated formals lists.  */
4021
4022               do
4023                 {
4024                   last_l_paren = careful_find_l_paren (last_r_paren);
4025                   for (last_r_paren = last_l_paren-1; isspace (*last_r_paren); )
4026                     check_source (--last_r_paren >= backup_limit, backup_limit);
4027                 }
4028               while (*last_r_paren == ')');
4029
4030               if (is_id_char (*last_r_paren))
4031                 {
4032                   const char *id_limit = last_r_paren + 1;
4033                   const char *id_start;
4034                   size_t id_length;
4035                   const def_dec_info *dd_p;
4036
4037                   for (id_start = id_limit-1; is_id_char (*id_start); )
4038                     check_source (--id_start >= backup_limit, backup_limit);
4039                   id_start++;
4040                   backup_limit = id_start;
4041                   if ((id_length = (size_t) (id_limit - id_start)) == 0)
4042                     goto not_missed;
4043
4044                   {
4045                     char *func_name = (char *) alloca (id_length + 1);
4046                     static const char * const stmt_keywords[]
4047                       = { "if", "else", "do", "while", "for", "switch", "case", "return", 0 };
4048                     const char * const *stmt_keyword;
4049
4050                     strncpy (func_name, id_start, id_length);
4051                     func_name[id_length] = '\0';
4052
4053                     /* We must check here to see if we are actually looking at
4054                        a statement rather than an actual function call.  */
4055
4056                     for (stmt_keyword = stmt_keywords; *stmt_keyword; stmt_keyword++)
4057                       if (!strcmp (func_name, *stmt_keyword))
4058                         goto not_missed;
4059
4060 #if 0
4061                     fprintf (stderr, "%s: found definition of `%s' at %s(%d)\n",
4062                              pname,
4063                              func_name,
4064                              shortpath (NULL, file_p->hash_entry->symbol),
4065                              identify_lineno (id_start));
4066 #endif                          /* 0 */
4067                     /* We really should check for a match of the function name
4068                        here also, but why bother.  */
4069
4070                     for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
4071                       if (dd_p->is_func_def && dd_p->line == lineno)
4072                         goto not_missed;
4073
4074                     /* If we make it here, then we did not know about this
4075                        function definition.  */
4076
4077                     fprintf (stderr, "%s: %d: warning: `%s' excluded by preprocessing\n",
4078                              shortpath (NULL, file_p->hash_entry->symbol),
4079                              identify_lineno (id_start), func_name);
4080                     fprintf (stderr, "%s: function definition not converted\n",
4081                              pname);
4082                   }
4083                 not_missed: ;
4084                 }
4085             }
4086         }
4087     }
4088 }
4089
4090 /* Do all editing operations for a single source file (either a "base" file
4091    or an "include" file).  To do this we read the file into memory, keep a
4092    virgin copy there, make another cleaned in-core copy of the original file
4093    (i.e. one in which all of the comments and preprocessor directives have
4094    been replaced with whitespace), then use these two in-core copies of the
4095    file to make a new edited in-core copy of the file.  Finally, rename the
4096    original file (as a way of saving it), and then write the edited version
4097    of the file from core to a disk file of the same name as the original.
4098
4099    Note that the trick of making a copy of the original sans comments &
4100    preprocessor directives make the editing a whole lot easier.  */
4101    
4102 static void
4103 edit_file (hp)
4104      const hash_table_entry *hp;
4105 {
4106   struct stat stat_buf;
4107   const file_info *file_p = hp->fip;
4108   char *new_orig_text_base;
4109   char *new_orig_text_limit;
4110   char *new_clean_text_base;
4111   char *new_clean_text_limit;
4112   size_t orig_size;
4113   size_t repl_size;
4114   int first_definition_in_file;
4115
4116   /* If we are not supposed to be converting this file, or if there is
4117      nothing in there which needs converting, just skip this file.  */
4118
4119   if (!needs_to_be_converted (file_p))
4120     return;
4121
4122   convert_filename = file_p->hash_entry->symbol;
4123
4124   /* Convert a file if it is in a directory where we want conversion
4125      and the file is not excluded.  */
4126
4127   if (!directory_specified_p (convert_filename)
4128       || file_excluded_p (convert_filename))
4129     {
4130       if (!quiet_flag
4131 #ifdef UNPROTOIZE
4132           /* Don't even mention "system" include files unless we are
4133              protoizing.  If we are protoizing, we mention these as a
4134              gentle way of prodding the user to convert his "system"
4135              include files to prototype format.  */
4136           && !in_system_include_dir (convert_filename)
4137 #endif /* defined (UNPROTOIZE) */
4138           )
4139         fprintf (stderr, "%s: `%s' not converted\n",
4140                  pname, shortpath (NULL, convert_filename));
4141       return;
4142     }
4143
4144   /* Let the user know what we are up to.  */
4145
4146   if (nochange_flag)
4147     fprintf (stderr, "%s: would convert file `%s'\n",
4148              pname, shortpath (NULL, convert_filename));
4149   else
4150     fprintf (stderr, "%s: converting file `%s'\n",
4151              pname, shortpath (NULL, convert_filename));
4152   fflush (stderr);
4153
4154   /* Find out the size (in bytes) of the original file.  */
4155
4156   /* The cast avoids an erroneous warning on AIX.  */
4157   if (my_stat ((char *)convert_filename, &stat_buf) == -1)
4158     {
4159       fprintf (stderr, "%s: can't get status for file `%s': %s\n",
4160                pname, shortpath (NULL, convert_filename), sys_errlist[errno]);
4161       return;
4162     }
4163   orig_size = stat_buf.st_size;
4164
4165   /* Allocate a buffer to hold the original text.  */
4166
4167   orig_text_base = new_orig_text_base = (char *) xmalloc (orig_size + 2);
4168   orig_text_limit = new_orig_text_limit = new_orig_text_base + orig_size;
4169
4170   /* Allocate a buffer to hold the cleaned-up version of the original text.  */
4171
4172   clean_text_base = new_clean_text_base = (char *) xmalloc (orig_size + 2);
4173   clean_text_limit = new_clean_text_limit = new_clean_text_base + orig_size;
4174   clean_read_ptr = clean_text_base - 1;
4175
4176   /* Allocate a buffer that will hopefully be large enough to hold the entire
4177      converted output text.  As an initial guess for the maximum size of the
4178      output buffer, use 125% of the size of the original + some extra.  This
4179      buffer can be expanded later as needed.  */
4180
4181   repl_size = orig_size + (orig_size >> 2) + 4096;
4182   repl_text_base = (char *) xmalloc (repl_size + 2);
4183   repl_text_limit = repl_text_base + repl_size - 1;
4184   repl_write_ptr = repl_text_base - 1;
4185
4186   {
4187     int input_file;
4188
4189     /* Open the file to be converted in READ ONLY mode.  */
4190
4191     if ((input_file = my_open (convert_filename, O_RDONLY, 0444)) == -1)
4192       {
4193         fprintf (stderr, "%s: can't open file `%s' for reading: %s\n",
4194                  pname, shortpath (NULL, convert_filename),
4195                  sys_errlist[errno]);
4196         return;
4197       }
4198
4199     /* Read the entire original source text file into the original text buffer
4200        in one swell fwoop.  Then figure out where the end of the text is and
4201        make sure that it ends with a newline followed by a null.  */
4202
4203     if (safe_read (input_file, new_orig_text_base, orig_size) != orig_size)
4204       {
4205         close (input_file);
4206         fprintf (stderr, "\n%s: error reading input file `%s': %s\n",
4207                  pname, shortpath (NULL, convert_filename),
4208                  sys_errlist[errno]);
4209         return;
4210       }
4211
4212     close (input_file);
4213   }
4214
4215   if (orig_size == 0 || orig_text_limit[-1] != '\n')
4216     {
4217       *new_orig_text_limit++ = '\n';
4218       orig_text_limit++;
4219     }
4220
4221   /* Create the cleaned up copy of the original text.  */
4222
4223   memcpy (new_clean_text_base, orig_text_base,
4224           (size_t) (orig_text_limit - orig_text_base));
4225   do_cleaning (new_clean_text_base, new_clean_text_limit);
4226
4227 #if 0
4228   {
4229     int clean_file;
4230     size_t clean_size = orig_text_limit - orig_text_base;
4231     char *const clean_filename = (char *) alloca (strlen (convert_filename) + 6 + 1);
4232
4233     /* Open (and create) the clean file.  */
4234   
4235     strcpy (clean_filename, convert_filename);
4236     strcat (clean_filename, ".clean");
4237     if ((clean_file = creat (clean_filename, 0666)) == -1)
4238       {
4239         fprintf (stderr, "%s: can't create/open clean file `%s': %s\n",
4240                  pname, shortpath (NULL, clean_filename),
4241                  sys_errlist[errno]);
4242         return;
4243       }
4244   
4245     /* Write the clean file.  */
4246   
4247     safe_write (clean_file, new_clean_text_base, clean_size, clean_filename);
4248   
4249     close (clean_file);
4250   }
4251 #endif /* 0 */
4252
4253   /* Do a simplified scan of the input looking for things that were not
4254      mentioned in the aux info files because of the fact that they were
4255      in a region of the source which was preprocessed-out (via #if or
4256      via #ifdef).  */
4257
4258   scan_for_missed_items (file_p);
4259
4260   /* Setup to do line-oriented forward seeking in the clean text buffer.  */
4261
4262   last_known_line_number = 1;
4263   last_known_line_start = clean_text_base;
4264
4265   /* Now get down to business and make all of the necessary edits.  */
4266
4267   {
4268     const def_dec_info *def_dec_p;
4269
4270     first_definition_in_file = 1;
4271     def_dec_p = file_p->defs_decs;
4272     for (; def_dec_p; def_dec_p = def_dec_p->next_in_file)
4273       {
4274         const char *clean_text_p = seek_to_line (def_dec_p->line);
4275   
4276         /* clean_text_p now points to the first character of the line which
4277            contains the `terminator' for the declaration or definition that
4278            we are about to process.  */
4279   
4280 #ifndef UNPROTOIZE
4281   
4282         if (global_flag && def_dec_p->is_func_def && first_definition_in_file)
4283           {
4284             add_global_decls (def_dec_p->file, clean_text_p);
4285             first_definition_in_file = 0;
4286           }
4287
4288         /* Don't edit this item if it is already in prototype format or if it
4289            is a function declaration and we have found no corresponding
4290            definition.  */
4291
4292         if (def_dec_p->prototyped
4293          || (!def_dec_p->is_func_def && !def_dec_p->definition))
4294           continue;
4295
4296 #endif /* !defined (UNPROTOIZE) */
4297
4298         if (def_dec_p->is_func_def)
4299           edit_fn_definition (def_dec_p, clean_text_p);
4300         else
4301 #ifndef UNPROTOIZE
4302         if (def_dec_p->is_implicit)
4303           add_local_decl (def_dec_p, clean_text_p);
4304         else
4305 #endif /* !defined (UNPROTOIZE) */
4306             edit_fn_declaration (def_dec_p, clean_text_p);
4307       }
4308   }
4309
4310   /* Finalize things.  Output the last trailing part of the original text.  */
4311
4312   output_up_to (clean_text_limit - 1);
4313
4314   /* If this is just a test run, stop now and just deallocate the buffers.  */
4315
4316   if (nochange_flag)
4317     {
4318       free (new_orig_text_base);
4319       free (new_clean_text_base);
4320       free (repl_text_base);
4321       return;
4322     }
4323
4324   /* Change the name of the original input file.  This is just a quick way of
4325      saving the original file.  */
4326
4327   if (!nosave_flag)
4328     {
4329       char *new_filename =
4330           (char *) xmalloc (strlen (convert_filename) + strlen (save_suffix) + 2);
4331   
4332       strcpy (new_filename, convert_filename);
4333       strcat (new_filename, save_suffix);
4334       if (my_link (convert_filename, new_filename) == -1)
4335         {
4336           if (errno == EEXIST)
4337             {
4338               if (!quiet_flag)
4339                 fprintf (stderr, "%s: warning: file `%s' already saved in `%s'\n",
4340                          pname,
4341                          shortpath (NULL, convert_filename),
4342                          shortpath (NULL, new_filename));
4343             }
4344           else
4345             {
4346               fprintf (stderr, "%s: can't link file `%s' to `%s': %s\n",
4347                        pname,
4348                        shortpath (NULL, convert_filename),
4349                        shortpath (NULL, new_filename),
4350                        sys_errlist[errno]);
4351               return;
4352             }
4353         }
4354     }
4355
4356   if (my_unlink (convert_filename) == -1)
4357     {
4358       fprintf (stderr, "%s: can't delete file `%s': %s\n",
4359                pname, shortpath (NULL, convert_filename), sys_errlist[errno]);
4360       return;
4361     }
4362
4363   {
4364     int output_file;
4365
4366     /* Open (and create) the output file.  */
4367   
4368     if ((output_file = creat (convert_filename, 0666)) == -1)
4369       {
4370         fprintf (stderr, "%s: can't create/open output file `%s': %s\n",
4371                  pname, shortpath (NULL, convert_filename),
4372                  sys_errlist[errno]);
4373         return;
4374       }
4375   
4376     /* Write the output file.  */
4377   
4378     {
4379       unsigned int out_size = (repl_write_ptr + 1) - repl_text_base;
4380   
4381       safe_write (output_file, repl_text_base, out_size, convert_filename);
4382     }
4383   
4384     close (output_file);
4385   }
4386
4387   /* Deallocate the conversion buffers.  */
4388
4389   free (new_orig_text_base);
4390   free (new_clean_text_base);
4391   free (repl_text_base);
4392
4393   /* Change the mode of the output file to match the original file.  */
4394
4395   /* The cast avoids an erroneous warning on AIX.  */
4396   if (my_chmod ((char *)convert_filename, stat_buf.st_mode) == -1)
4397     fprintf (stderr, "%s: can't change mode of file `%s': %s\n",
4398              pname, shortpath (NULL, convert_filename), sys_errlist[errno]);
4399
4400   /* Note:  We would try to change the owner and group of the output file
4401      to match those of the input file here, except that may not be a good
4402      thing to do because it might be misleading.  Also, it might not even
4403      be possible to do that (on BSD systems with quotas for instance).  */
4404 }
4405
4406 /* Do all of the individual steps needed to do the protoization (or
4407    unprotoization) of the files referenced in the aux_info files given
4408    in the command line.  */
4409
4410 static void
4411 do_processing ()
4412 {
4413   const char * const *base_pp;
4414   const char * const * const end_pps
4415     = &base_source_filenames[n_base_source_files];
4416
4417 #ifndef UNPROTOIZE
4418   int syscalls_len;
4419 #endif /* !defined (UNPROTOIZE) */
4420
4421   /* One-by-one, check (and create if necessary), open, and read all of the
4422      stuff in each aux_info file.  After reading each aux_info file, the
4423      aux_info_file just read will be automatically deleted unless the
4424      keep_flag is set.  */
4425
4426   for (base_pp = base_source_filenames; base_pp < end_pps; base_pp++)
4427     process_aux_info_file (*base_pp, keep_flag, 0);
4428
4429 #ifndef UNPROTOIZE
4430
4431   /* Also open and read the special SYSCALLS.c aux_info file which gives us
4432      the prototypes for all of the standard system-supplied functions.  */
4433
4434   if (nondefault_syscalls_dir)
4435     {
4436       syscalls_absolute_filename
4437         = (char *) xmalloc (strlen (nondefault_syscalls_dir)
4438                             + sizeof (syscalls_filename) + 1);
4439       strcpy (syscalls_absolute_filename, nondefault_syscalls_dir);
4440     }
4441   else
4442     {
4443       syscalls_absolute_filename
4444         = (char *) xmalloc (strlen (default_syscalls_dir)
4445                             + sizeof (syscalls_filename) + 1);
4446       strcpy (syscalls_absolute_filename, default_syscalls_dir);
4447     }
4448
4449   syscalls_len = strlen (syscalls_absolute_filename);
4450   if (*(syscalls_absolute_filename + syscalls_len - 1) != '/')
4451     {
4452       *(syscalls_absolute_filename + syscalls_len++) = '/';
4453       *(syscalls_absolute_filename + syscalls_len) = '\0';
4454     }
4455   strcat (syscalls_absolute_filename, syscalls_filename);
4456   
4457   /* Call process_aux_info_file in such a way that it does not try to
4458      delete the SYSCALLS aux_info file.  */
4459
4460   process_aux_info_file (syscalls_absolute_filename, 1, 1);
4461
4462 #endif /* !defined (UNPROTOIZE) */
4463
4464   /* When we first read in all of the information from the aux_info files
4465      we saved in it descending line number order, because that was likely to
4466      be faster.  Now however, we want the chains of def & dec records to
4467      appear in ascending line number order as we get further away from the
4468      file_info record that they hang from.  The following line causes all of
4469      these lists to be rearranged into ascending line number order.  */
4470
4471   visit_each_hash_node (filename_primary, reverse_def_dec_list);
4472
4473 #ifndef UNPROTOIZE
4474
4475   /* Now do the "real" work.  The following line causes each declaration record
4476      to be "visited".  For each of these nodes, an attempt is made to match
4477      up the function declaration with a corresponding function definition,
4478      which should have a full prototype-format formals list with it.  Once
4479      these match-ups are made, the conversion of the function declarations
4480      to prototype format can be made.  */
4481
4482   visit_each_hash_node (function_name_primary, connect_defs_and_decs);
4483
4484 #endif /* !defined (UNPROTOIZE) */
4485
4486   /* Now convert each file that can be converted (and needs to be).  */
4487
4488   visit_each_hash_node (filename_primary, edit_file);
4489
4490 #ifndef UNPROTOIZE
4491
4492   /* If we are working in cplusplus mode, try to rename all .c files to .C
4493      files.  Don't panic if some of the renames don't work.  */
4494
4495   if (cplusplus_flag && !nochange_flag)
4496     visit_each_hash_node (filename_primary, rename_c_file);
4497
4498 #endif /* !defined (UNPROTOIZE) */
4499 }
4500 \f
4501 static struct option longopts[] =
4502 {
4503   {"version", 0, 0, 'V'},
4504   {"file_name", 0, 0, 'p'},
4505   {"quiet", 0, 0, 'q'},
4506   {"silent", 0, 0, 'q'},
4507   {"force", 0, 0, 'f'},
4508   {"keep", 0, 0, 'k'},
4509   {"nosave", 0, 0, 'N'},
4510   {"nochange", 0, 0, 'n'},
4511   {"compiler-options", 1, 0, 'c'},
4512   {"exclude", 1, 0, 'x'},
4513   {"directory", 1, 0, 'd'},
4514 #ifdef UNPROTOIZE
4515   {"indent", 1, 0, 'i'},
4516 #else
4517   {"local", 0, 0, 'l'},
4518   {"global", 0, 0, 'g'},
4519   {"c++", 0, 0, 'C'},
4520   {"syscalls-dir", 1, 0, 'B'},
4521 #endif
4522   {0, 0, 0, 0}
4523 };
4524
4525 int
4526 main (argc, argv)
4527      int argc;
4528      char **const argv;
4529 {
4530   int longind;
4531   int c;
4532   const char *params = "";
4533
4534   pname = rindex (argv[0], '/');
4535   pname = pname ? pname+1 : argv[0];
4536
4537   cwd_buffer = getpwd ();
4538   if (!cwd_buffer)
4539     {
4540       fprintf (stderr, "%s: cannot get working directory: %s\n",
4541                pname, sys_errlist[errno]);
4542       exit (1);
4543     }
4544
4545   /* By default, convert the files in the current directory.  */
4546   directory_list = string_list_cons (cwd_buffer, NULL);
4547
4548   while ((c = getopt_long (argc, argv,
4549 #ifdef UNPROTOIZE
4550                            "c:d:i:knNp:qvVx:",
4551 #else
4552                            "B:c:Cd:gklnNp:qvVx:",
4553 #endif
4554                            longopts, &longind)) != EOF)
4555     {
4556       if (c == 0)               /* Long option. */
4557         c = longopts[longind].val;
4558       switch (c)
4559         {
4560         case 'p':
4561           compiler_file_name = optarg;
4562           break;
4563         case 'd':
4564           directory_list
4565             = string_list_cons (abspath (NULL, optarg), directory_list);
4566           break;
4567         case 'x':
4568           exclude_list = string_list_cons (optarg, exclude_list);
4569           break;
4570             
4571         case 'v':
4572         case 'V':
4573           version_flag = 1;
4574           break;
4575         case 'q':
4576           quiet_flag = 1;
4577           break;
4578 #if 0
4579         case 'f':
4580           force_flag = 1;
4581           break;
4582 #endif
4583         case 'n':
4584           nochange_flag = 1;
4585           keep_flag = 1;
4586           break;
4587         case 'N':
4588           nosave_flag = 1;
4589           break;
4590         case 'k':
4591           keep_flag = 1;
4592           break;
4593         case 'c':
4594           params = optarg;
4595           break;
4596 #ifdef UNPROTOIZE
4597         case 'i':
4598           indent_string = optarg;
4599           break;
4600 #else                           /* !defined (UNPROTOIZE) */
4601         case 'l':
4602           local_flag = 1;
4603           break;
4604         case 'g':
4605           global_flag = 1;
4606           break;
4607         case 'C':
4608           cplusplus_flag = 1;
4609           break;
4610         case 'B':
4611           nondefault_syscalls_dir = optarg;
4612           break;
4613 #endif                          /* !defined (UNPROTOIZE) */
4614         default:
4615           usage ();
4616         }
4617     }
4618  
4619   /* Set up compile_params based on -p and -c options.  */
4620   munge_compile_params (params);
4621
4622   n_base_source_files = argc - optind;
4623
4624   /* Now actually make a list of the base source filenames.  */
4625
4626   base_source_filenames =
4627     (const char **) xmalloc ((n_base_source_files + 1) * sizeof (char *));
4628   n_base_source_files = 0;
4629   for (; optind < argc; optind++)
4630     {
4631       const char *path = abspath (NULL, argv[optind]);
4632       int len = strlen (path);
4633
4634       if (path[len-1] == 'c' && path[len-2] == '.')
4635         base_source_filenames[n_base_source_files++] = path;
4636       else
4637         {
4638           fprintf (stderr, "%s: input file names must have .c suffixes: %s\n",
4639                    pname, shortpath (NULL, path));
4640           errors++;
4641         }
4642     }
4643
4644 #ifndef UNPROTOIZE
4645   /* We are only interested in the very first identifier token in the
4646      definition of `va_list', so if there is more junk after that first
4647      identifier token, delete it from the `varargs_style_indicator'.  */
4648   {
4649     const char *cp;
4650
4651     for (cp = varargs_style_indicator; isalnum (*cp) || *cp == '_'; cp++)
4652       continue;
4653     if (*cp != 0)
4654       varargs_style_indicator = savestring (varargs_style_indicator,
4655                                             cp - varargs_style_indicator);
4656   }
4657 #endif /* !defined (UNPROTOIZE) */
4658
4659   if (errors)
4660     usage ();
4661   else
4662     {
4663       if (version_flag)
4664         fprintf (stderr, "%s: %s\n", pname, version_string);
4665       do_processing ();
4666     }
4667   if (errors)
4668     exit (1);
4669   else
4670     exit (0);
4671   return 1;
4672 }