OSDN Git Service

* calls.c (store_one_arg): Don't divide align by BITS_PER_UNIT.
[pf3gnuchains/gcc-fork.git] / gcc / calls.c
1 /* Convert function calls to rtl insns, for GNU C compiler.
2    Copyright (C) 1989, 1992, 1993, 1994, 1995, 1996, 1997, 1998
3    1999, 2000, 2001 Free Software Foundation, Inc.
4
5 This file is part of GNU CC.
6
7 GNU CC is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 2, or (at your option)
10 any later version.
11
12 GNU CC is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GNU CC; see the file COPYING.  If not, write to
19 the Free Software Foundation, 59 Temple Place - Suite 330,
20 Boston, MA 02111-1307, USA.  */
21
22 #include "config.h"
23 #include "system.h"
24 #include "rtl.h"
25 #include "tree.h"
26 #include "flags.h"
27 #include "expr.h"
28 #include "function.h"
29 #include "regs.h"
30 #include "toplev.h"
31 #include "output.h"
32 #include "tm_p.h"
33 #include "timevar.h"
34 #include "sbitmap.h"
35
36 #if !defined FUNCTION_OK_FOR_SIBCALL
37 #define FUNCTION_OK_FOR_SIBCALL(DECL) 1
38 #endif
39
40 #if !defined PREFERRED_STACK_BOUNDARY && defined STACK_BOUNDARY
41 #define PREFERRED_STACK_BOUNDARY STACK_BOUNDARY
42 #endif
43
44 /* Decide whether a function's arguments should be processed
45    from first to last or from last to first.
46
47    They should if the stack and args grow in opposite directions, but
48    only if we have push insns.  */
49
50 #ifdef PUSH_ROUNDING
51
52 #if defined (STACK_GROWS_DOWNWARD) != defined (ARGS_GROW_DOWNWARD)
53 #define PUSH_ARGS_REVERSED  PUSH_ARGS
54 #endif
55
56 #endif
57
58 #ifndef PUSH_ARGS_REVERSED
59 #define PUSH_ARGS_REVERSED 0
60 #endif
61
62 #ifndef STACK_POINTER_OFFSET
63 #define STACK_POINTER_OFFSET    0
64 #endif
65
66 /* Like PREFERRED_STACK_BOUNDARY but in units of bytes, not bits.  */
67 #define STACK_BYTES (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT)
68
69 /* Data structure and subroutines used within expand_call.  */
70
71 struct arg_data
72 {
73   /* Tree node for this argument.  */
74   tree tree_value;
75   /* Mode for value; TYPE_MODE unless promoted.  */
76   enum machine_mode mode;
77   /* Current RTL value for argument, or 0 if it isn't precomputed.  */
78   rtx value;
79   /* Initially-compute RTL value for argument; only for const functions.  */
80   rtx initial_value;
81   /* Register to pass this argument in, 0 if passed on stack, or an
82      PARALLEL if the arg is to be copied into multiple non-contiguous
83      registers.  */
84   rtx reg;
85   /* Register to pass this argument in when generating tail call sequence.
86      This is not the same register as for normal calls on machines with
87      register windows.  */
88   rtx tail_call_reg;
89   /* If REG was promoted from the actual mode of the argument expression,
90      indicates whether the promotion is sign- or zero-extended.  */
91   int unsignedp;
92   /* Number of registers to use.  0 means put the whole arg in registers.
93      Also 0 if not passed in registers.  */
94   int partial;
95   /* Non-zero if argument must be passed on stack.
96      Note that some arguments may be passed on the stack
97      even though pass_on_stack is zero, just because FUNCTION_ARG says so.
98      pass_on_stack identifies arguments that *cannot* go in registers.  */
99   int pass_on_stack;
100   /* Offset of this argument from beginning of stack-args.  */
101   struct args_size offset;
102   /* Similar, but offset to the start of the stack slot.  Different from
103      OFFSET if this arg pads downward.  */
104   struct args_size slot_offset;
105   /* Size of this argument on the stack, rounded up for any padding it gets,
106      parts of the argument passed in registers do not count.
107      If REG_PARM_STACK_SPACE is defined, then register parms
108      are counted here as well.  */
109   struct args_size size;
110   /* Location on the stack at which parameter should be stored.  The store
111      has already been done if STACK == VALUE.  */
112   rtx stack;
113   /* Location on the stack of the start of this argument slot.  This can
114      differ from STACK if this arg pads downward.  This location is known
115      to be aligned to FUNCTION_ARG_BOUNDARY.  */
116   rtx stack_slot;
117   /* Place that this stack area has been saved, if needed.  */
118   rtx save_area;
119   /* If an argument's alignment does not permit direct copying into registers,
120      copy in smaller-sized pieces into pseudos.  These are stored in a
121      block pointed to by this field.  The next field says how many
122      word-sized pseudos we made.  */
123   rtx *aligned_regs;
124   int n_aligned_regs;
125   /* The amount that the stack pointer needs to be adjusted to
126      force alignment for the next argument.  */
127   struct args_size alignment_pad;
128 };
129
130 /* A vector of one char per byte of stack space.  A byte if non-zero if
131    the corresponding stack location has been used.
132    This vector is used to prevent a function call within an argument from
133    clobbering any stack already set up.  */
134 static char *stack_usage_map;
135
136 /* Size of STACK_USAGE_MAP.  */
137 static int highest_outgoing_arg_in_use;
138
139 /* A bitmap of virtual-incoming stack space.  Bit is set if the corresponding
140    stack location's tail call argument has been already stored into the stack.
141    This bitmap is used to prevent sibling call optimization if function tries
142    to use parent's incoming argument slots when they have been already
143    overwritten with tail call arguments.  */
144 static sbitmap stored_args_map;
145
146 /* stack_arg_under_construction is nonzero when an argument may be
147    initialized with a constructor call (including a C function that
148    returns a BLKmode struct) and expand_call must take special action
149    to make sure the object being constructed does not overlap the
150    argument list for the constructor call.  */
151 int stack_arg_under_construction;
152
153 static int calls_function       PARAMS ((tree, int));
154 static int calls_function_1     PARAMS ((tree, int));
155
156 /* Nonzero if this is a call to a `const' function.  */
157 #define ECF_CONST               1
158 /* Nonzero if this is a call to a `volatile' function.  */
159 #define ECF_NORETURN            2
160 /* Nonzero if this is a call to malloc or a related function.  */
161 #define ECF_MALLOC              4
162 /* Nonzero if it is plausible that this is a call to alloca.  */
163 #define ECF_MAY_BE_ALLOCA       8
164 /* Nonzero if this is a call to a function that won't throw an exception.  */
165 #define ECF_NOTHROW             16
166 /* Nonzero if this is a call to setjmp or a related function.  */
167 #define ECF_RETURNS_TWICE       32
168 /* Nonzero if this is a call to `longjmp'.  */
169 #define ECF_LONGJMP             64
170 /* Nonzero if this is a syscall that makes a new process in the image of
171    the current one.  */
172 #define ECF_FORK_OR_EXEC        128
173 #define ECF_SIBCALL             256
174 /* Nonzero if this is a call to "pure" function (like const function,
175    but may read memory.  */
176 #define ECF_PURE                512
177 /* Nonzero if this is a call to a function that returns with the stack
178    pointer depressed.  */
179 #define ECF_SP_DEPRESSED        1024
180
181 static void emit_call_1         PARAMS ((rtx, tree, tree, HOST_WIDE_INT,
182                                          HOST_WIDE_INT, HOST_WIDE_INT, rtx,
183                                          rtx, int, rtx, int));
184 static void precompute_register_parameters      PARAMS ((int,
185                                                          struct arg_data *,
186                                                          int *));
187 static int store_one_arg        PARAMS ((struct arg_data *, rtx, int, int,
188                                          int));
189 static void store_unaligned_arguments_into_pseudos PARAMS ((struct arg_data *,
190                                                             int));
191 static int finalize_must_preallocate            PARAMS ((int, int,
192                                                          struct arg_data *,
193                                                          struct args_size *));
194 static void precompute_arguments                PARAMS ((int, int,
195                                                          struct arg_data *));
196 static int compute_argument_block_size          PARAMS ((int,
197                                                          struct args_size *,
198                                                          int));
199 static void initialize_argument_information     PARAMS ((int,
200                                                          struct arg_data *,
201                                                          struct args_size *,
202                                                          int, tree, tree,
203                                                          CUMULATIVE_ARGS *,
204                                                          int, rtx *, int *,
205                                                          int *, int *));
206 static void compute_argument_addresses          PARAMS ((struct arg_data *,
207                                                          rtx, int));
208 static rtx rtx_for_function_call                PARAMS ((tree, tree));
209 static void load_register_parameters            PARAMS ((struct arg_data *,
210                                                          int, rtx *, int));
211 static rtx emit_library_call_value_1            PARAMS ((int, rtx, rtx,
212                                                          enum libcall_type,
213                                                          enum machine_mode,
214                                                          int, va_list));
215 static int special_function_p                   PARAMS ((tree, int));
216 static int flags_from_decl_or_type              PARAMS ((tree));
217 static rtx try_to_integrate                     PARAMS ((tree, tree, rtx,
218                                                          int, tree, rtx));
219 static int check_sibcall_argument_overlap_1     PARAMS ((rtx));
220 static int check_sibcall_argument_overlap       PARAMS ((rtx, struct arg_data *));
221
222 static int combine_pending_stack_adjustment_and_call
223                                                 PARAMS ((int, struct args_size *, int));
224
225 #ifdef REG_PARM_STACK_SPACE
226 static rtx save_fixed_argument_area     PARAMS ((int, rtx, int *, int *));
227 static void restore_fixed_argument_area PARAMS ((rtx, rtx, int, int));
228 #endif
229 \f
230 /* If WHICH is 1, return 1 if EXP contains a call to the built-in function
231    `alloca'.
232
233    If WHICH is 0, return 1 if EXP contains a call to any function.
234    Actually, we only need return 1 if evaluating EXP would require pushing
235    arguments on the stack, but that is too difficult to compute, so we just
236    assume any function call might require the stack.  */
237
238 static tree calls_function_save_exprs;
239
240 static int
241 calls_function (exp, which)
242      tree exp;
243      int which;
244 {
245   int val;
246
247   calls_function_save_exprs = 0;
248   val = calls_function_1 (exp, which);
249   calls_function_save_exprs = 0;
250   return val;
251 }
252
253 /* Recursive function to do the work of above function.  */
254
255 static int
256 calls_function_1 (exp, which)
257      tree exp;
258      int which;
259 {
260   register int i;
261   enum tree_code code = TREE_CODE (exp);
262   int class = TREE_CODE_CLASS (code);
263   int length = first_rtl_op (code);
264
265   /* If this code is language-specific, we don't know what it will do.  */
266   if ((int) code >= NUM_TREE_CODES)
267     return 1;
268
269   switch (code)
270     {
271     case CALL_EXPR:
272       if (which == 0)
273         return 1;
274       else if ((TREE_CODE (TREE_TYPE (TREE_TYPE (TREE_OPERAND (exp, 0))))
275                 == FUNCTION_TYPE)
276                && (TYPE_RETURNS_STACK_DEPRESSED
277                    (TREE_TYPE (TREE_TYPE (TREE_OPERAND (exp, 0))))))
278         return 1;
279       else if (TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
280                && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
281                    == FUNCTION_DECL)
282                && (special_function_p (TREE_OPERAND (TREE_OPERAND (exp, 0), 0),
283                                        0)
284                    & ECF_MAY_BE_ALLOCA))
285         return 1;
286
287       break;
288
289     case CONSTRUCTOR:
290       {
291         tree tem;
292
293         for (tem = CONSTRUCTOR_ELTS (exp); tem != 0; tem = TREE_CHAIN (tem))
294           if (calls_function_1 (TREE_VALUE (tem), which))
295             return 1;
296       }
297
298       return 0;
299
300     case SAVE_EXPR:
301       if (SAVE_EXPR_RTL (exp) != 0)
302         return 0;
303       if (value_member (exp, calls_function_save_exprs))
304         return 0;
305       calls_function_save_exprs = tree_cons (NULL_TREE, exp,
306                                              calls_function_save_exprs);
307       return (TREE_OPERAND (exp, 0) != 0
308               && calls_function_1 (TREE_OPERAND (exp, 0), which));
309
310     case BLOCK:
311       {
312         register tree local;
313         register tree subblock;
314
315         for (local = BLOCK_VARS (exp); local; local = TREE_CHAIN (local))
316           if (DECL_INITIAL (local) != 0
317               && calls_function_1 (DECL_INITIAL (local), which))
318             return 1;
319
320         for (subblock = BLOCK_SUBBLOCKS (exp);
321              subblock;
322              subblock = TREE_CHAIN (subblock))
323           if (calls_function_1 (subblock, which))
324             return 1;
325       }
326       return 0;
327
328     case TREE_LIST:
329       for (; exp != 0; exp = TREE_CHAIN (exp))
330         if (calls_function_1 (TREE_VALUE (exp), which))
331           return 1;
332       return 0;
333
334     default:
335       break;
336     }
337
338   /* Only expressions, references, and blocks can contain calls.  */
339   if (! IS_EXPR_CODE_CLASS (class) && class != 'r' && class != 'b')
340     return 0;
341
342   for (i = 0; i < length; i++)
343     if (TREE_OPERAND (exp, i) != 0
344         && calls_function_1 (TREE_OPERAND (exp, i), which))
345       return 1;
346
347   return 0;
348 }
349 \f
350 /* Force FUNEXP into a form suitable for the address of a CALL,
351    and return that as an rtx.  Also load the static chain register
352    if FNDECL is a nested function.
353
354    CALL_FUSAGE points to a variable holding the prospective
355    CALL_INSN_FUNCTION_USAGE information.  */
356
357 rtx
358 prepare_call_address (funexp, fndecl, call_fusage, reg_parm_seen)
359      rtx funexp;
360      tree fndecl;
361      rtx *call_fusage;
362      int reg_parm_seen;
363 {
364   rtx static_chain_value = 0;
365
366   funexp = protect_from_queue (funexp, 0);
367
368   if (fndecl != 0)
369     /* Get possible static chain value for nested function in C.  */
370     static_chain_value = lookup_static_chain (fndecl);
371
372   /* Make a valid memory address and copy constants thru pseudo-regs,
373      but not for a constant address if -fno-function-cse.  */
374   if (GET_CODE (funexp) != SYMBOL_REF)
375     /* If we are using registers for parameters, force the
376        function address into a register now.  */
377     funexp = ((SMALL_REGISTER_CLASSES && reg_parm_seen)
378               ? force_not_mem (memory_address (FUNCTION_MODE, funexp))
379               : memory_address (FUNCTION_MODE, funexp));
380   else
381     {
382 #ifndef NO_FUNCTION_CSE
383       if (optimize && ! flag_no_function_cse)
384 #ifdef NO_RECURSIVE_FUNCTION_CSE
385         if (fndecl != current_function_decl)
386 #endif
387           funexp = force_reg (Pmode, funexp);
388 #endif
389     }
390
391   if (static_chain_value != 0)
392     {
393       emit_move_insn (static_chain_rtx, static_chain_value);
394
395       if (GET_CODE (static_chain_rtx) == REG)
396         use_reg (call_fusage, static_chain_rtx);
397     }
398
399   return funexp;
400 }
401
402 /* Generate instructions to call function FUNEXP,
403    and optionally pop the results.
404    The CALL_INSN is the first insn generated.
405
406    FNDECL is the declaration node of the function.  This is given to the
407    macro RETURN_POPS_ARGS to determine whether this function pops its own args.
408
409    FUNTYPE is the data type of the function.  This is given to the macro
410    RETURN_POPS_ARGS to determine whether this function pops its own args.
411    We used to allow an identifier for library functions, but that doesn't
412    work when the return type is an aggregate type and the calling convention
413    says that the pointer to this aggregate is to be popped by the callee.
414
415    STACK_SIZE is the number of bytes of arguments on the stack,
416    ROUNDED_STACK_SIZE is that number rounded up to
417    PREFERRED_STACK_BOUNDARY; zero if the size is variable.  This is
418    both to put into the call insn and to generate explicit popping
419    code if necessary.
420
421    STRUCT_VALUE_SIZE is the number of bytes wanted in a structure value.
422    It is zero if this call doesn't want a structure value.
423
424    NEXT_ARG_REG is the rtx that results from executing
425      FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1)
426    just after all the args have had their registers assigned.
427    This could be whatever you like, but normally it is the first
428    arg-register beyond those used for args in this call,
429    or 0 if all the arg-registers are used in this call.
430    It is passed on to `gen_call' so you can put this info in the call insn.
431
432    VALREG is a hard register in which a value is returned,
433    or 0 if the call does not return a value.
434
435    OLD_INHIBIT_DEFER_POP is the value that `inhibit_defer_pop' had before
436    the args to this call were processed.
437    We restore `inhibit_defer_pop' to that value.
438
439    CALL_FUSAGE is either empty or an EXPR_LIST of USE expressions that
440    denote registers used by the called function.   */
441
442 static void
443 emit_call_1 (funexp, fndecl, funtype, stack_size, rounded_stack_size,
444              struct_value_size, next_arg_reg, valreg, old_inhibit_defer_pop,
445              call_fusage, ecf_flags)
446      rtx funexp;
447      tree fndecl ATTRIBUTE_UNUSED;
448      tree funtype ATTRIBUTE_UNUSED;
449      HOST_WIDE_INT stack_size ATTRIBUTE_UNUSED;
450      HOST_WIDE_INT rounded_stack_size;
451      HOST_WIDE_INT struct_value_size ATTRIBUTE_UNUSED;
452      rtx next_arg_reg;
453      rtx valreg;
454      int old_inhibit_defer_pop;
455      rtx call_fusage;
456      int ecf_flags;
457 {
458   rtx rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
459   rtx call_insn;
460   int already_popped = 0;
461   HOST_WIDE_INT n_popped = RETURN_POPS_ARGS (fndecl, funtype, stack_size);
462 #if defined (HAVE_call) && defined (HAVE_call_value)
463   rtx struct_value_size_rtx;
464   struct_value_size_rtx = GEN_INT (struct_value_size);
465 #endif
466
467   /* Ensure address is valid.  SYMBOL_REF is already valid, so no need,
468      and we don't want to load it into a register as an optimization,
469      because prepare_call_address already did it if it should be done.  */
470   if (GET_CODE (funexp) != SYMBOL_REF)
471     funexp = memory_address (FUNCTION_MODE, funexp);
472
473 #if defined (HAVE_sibcall_pop) && defined (HAVE_sibcall_value_pop)
474   if ((ecf_flags & ECF_SIBCALL)
475       && HAVE_sibcall_pop && HAVE_sibcall_value_pop
476       && (n_popped > 0 || stack_size == 0))
477     {
478       rtx n_pop = GEN_INT (n_popped));
479       rtx pat;
480
481       /* If this subroutine pops its own args, record that in the call insn
482          if possible, for the sake of frame pointer elimination.  */
483
484       if (valreg)
485         pat = GEN_SIBCALL_VALUE_POP (valreg,
486                                      gen_rtx_MEM (FUNCTION_MODE, funexp),
487                                      rounded_stack_size_rtx, next_arg_reg,
488                                      n_pop);
489       else
490         pat = GEN_SIBCALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
491                                rounded_stack_size_rtx, next_arg_reg, n_pop);
492
493       emit_call_insn (pat);
494       already_popped = 1;
495     }
496   else
497 #endif
498
499 #if defined (HAVE_call_pop) && defined (HAVE_call_value_pop)
500 /* If the target has "call" or "call_value" insns, then prefer them
501    if no arguments are actually popped.  If the target does not have
502    "call" or "call_value" insns, then we must use the popping versions
503    even if the call has no arguments to pop.  */
504 #if defined (HAVE_call) && defined (HAVE_call_value)
505   if (HAVE_call && HAVE_call_value && HAVE_call_pop && HAVE_call_value_pop
506       && n_popped > 0 && ! (ecf_flags & ECF_SP_DEPRESSED))
507 #else
508   if (HAVE_call_pop && HAVE_call_value_pop)
509 #endif
510     {
511       rtx n_pop = GEN_INT (n_popped);
512       rtx pat;
513
514       /* If this subroutine pops its own args, record that in the call insn
515          if possible, for the sake of frame pointer elimination.  */
516
517       if (valreg)
518         pat = GEN_CALL_VALUE_POP (valreg,
519                                   gen_rtx_MEM (FUNCTION_MODE, funexp),
520                                   rounded_stack_size_rtx, next_arg_reg, n_pop);
521       else
522         pat = GEN_CALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
523                             rounded_stack_size_rtx, next_arg_reg, n_pop);
524
525       emit_call_insn (pat);
526       already_popped = 1;
527     }
528   else
529 #endif
530
531 #if defined (HAVE_sibcall) && defined (HAVE_sibcall_value)
532   if ((ecf_flags & ECF_SIBCALL)
533       && HAVE_sibcall && HAVE_sibcall_value)
534     {
535       if (valreg)
536         emit_call_insn (GEN_SIBCALL_VALUE (valreg,
537                                            gen_rtx_MEM (FUNCTION_MODE, funexp),
538                                            rounded_stack_size_rtx,
539                                            next_arg_reg, NULL_RTX));
540       else
541         emit_call_insn (GEN_SIBCALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
542                                      rounded_stack_size_rtx, next_arg_reg,
543                                      struct_value_size_rtx));
544     }
545   else
546 #endif
547
548 #if defined (HAVE_call) && defined (HAVE_call_value)
549   if (HAVE_call && HAVE_call_value)
550     {
551       if (valreg)
552         emit_call_insn (GEN_CALL_VALUE (valreg,
553                                         gen_rtx_MEM (FUNCTION_MODE, funexp),
554                                         rounded_stack_size_rtx, next_arg_reg,
555                                         NULL_RTX));
556       else
557         emit_call_insn (GEN_CALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
558                                   rounded_stack_size_rtx, next_arg_reg,
559                                   struct_value_size_rtx));
560     }
561   else
562 #endif
563     abort ();
564
565   /* Find the CALL insn we just emitted.  */
566   for (call_insn = get_last_insn ();
567        call_insn && GET_CODE (call_insn) != CALL_INSN;
568        call_insn = PREV_INSN (call_insn))
569     ;
570
571   if (! call_insn)
572     abort ();
573
574   /* Mark memory as used for "pure" function call.  */
575   if (ecf_flags & ECF_PURE)
576     {
577       call_fusage =  gen_rtx_EXPR_LIST (VOIDmode,
578         gen_rtx_USE (VOIDmode,
579                      gen_rtx_MEM (BLKmode,
580                                   gen_rtx_SCRATCH (VOIDmode))), call_fusage);
581     }
582
583   /* Put the register usage information on the CALL.  If there is already
584      some usage information, put ours at the end.  */
585   if (CALL_INSN_FUNCTION_USAGE (call_insn))
586     {
587       rtx link;
588
589       for (link = CALL_INSN_FUNCTION_USAGE (call_insn); XEXP (link, 1) != 0;
590            link = XEXP (link, 1))
591         ;
592
593       XEXP (link, 1) = call_fusage;
594     }
595   else
596     CALL_INSN_FUNCTION_USAGE (call_insn) = call_fusage;
597
598   /* If this is a const call, then set the insn's unchanging bit.  */
599   if (ecf_flags & (ECF_CONST | ECF_PURE))
600     CONST_CALL_P (call_insn) = 1;
601
602   /* If this call can't throw, attach a REG_EH_REGION reg note to that
603      effect.  */
604   if (ecf_flags & ECF_NOTHROW)
605     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_EH_REGION, const0_rtx,
606                                                REG_NOTES (call_insn));
607
608   if (ecf_flags & ECF_NORETURN)
609     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_NORETURN, const0_rtx,
610                                                REG_NOTES (call_insn));
611
612   SIBLING_CALL_P (call_insn) = ((ecf_flags & ECF_SIBCALL) != 0);
613
614   /* Restore this now, so that we do defer pops for this call's args
615      if the context of the call as a whole permits.  */
616   inhibit_defer_pop = old_inhibit_defer_pop;
617
618   if (n_popped > 0)
619     {
620       if (!already_popped)
621         CALL_INSN_FUNCTION_USAGE (call_insn)
622           = gen_rtx_EXPR_LIST (VOIDmode,
623                                gen_rtx_CLOBBER (VOIDmode, stack_pointer_rtx),
624                                CALL_INSN_FUNCTION_USAGE (call_insn));
625       rounded_stack_size -= n_popped;
626       rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
627       stack_pointer_delta -= n_popped;
628     }
629
630   if (!ACCUMULATE_OUTGOING_ARGS)
631     {
632       /* If returning from the subroutine does not automatically pop the args,
633          we need an instruction to pop them sooner or later.
634          Perhaps do it now; perhaps just record how much space to pop later.
635
636          If returning from the subroutine does pop the args, indicate that the
637          stack pointer will be changed.  */
638
639       if (rounded_stack_size != 0 && ! (ecf_flags & ECF_SP_DEPRESSED))
640         {
641           if (flag_defer_pop && inhibit_defer_pop == 0
642               && ! (ecf_flags & (ECF_CONST | ECF_PURE)))
643             pending_stack_adjust += rounded_stack_size;
644           else
645             adjust_stack (rounded_stack_size_rtx);
646         }
647     }
648   /* When we accumulate outgoing args, we must avoid any stack manipulations.
649      Restore the stack pointer to its original value now.  Usually
650      ACCUMULATE_OUTGOING_ARGS targets don't get here, but there are exceptions.
651      On  i386 ACCUMULATE_OUTGOING_ARGS can be enabled on demand, and
652      popping variants of functions exist as well.
653
654      ??? We may optimize similar to defer_pop above, but it is
655      probably not worthwhile.
656
657      ??? It will be worthwhile to enable combine_stack_adjustments even for
658      such machines.  */
659   else if (n_popped)
660     anti_adjust_stack (GEN_INT (n_popped));
661 }
662
663 /* Determine if the function identified by NAME and FNDECL is one with
664    special properties we wish to know about.
665
666    For example, if the function might return more than one time (setjmp), then
667    set RETURNS_TWICE to a nonzero value.
668
669    Similarly set LONGJMP for if the function is in the longjmp family.
670
671    Set MALLOC for any of the standard memory allocation functions which
672    allocate from the heap.
673
674    Set MAY_BE_ALLOCA for any memory allocation function that might allocate
675    space from the stack such as alloca.  */
676
677 static int
678 special_function_p (fndecl, flags)
679      tree fndecl;
680      int flags;
681 {
682   if (! (flags & ECF_MALLOC)
683       && fndecl && DECL_NAME (fndecl)
684       && IDENTIFIER_LENGTH (DECL_NAME (fndecl)) <= 17
685       /* Exclude functions not at the file scope, or not `extern',
686          since they are not the magic functions we would otherwise
687          think they are.  */
688       && DECL_CONTEXT (fndecl) == NULL_TREE && TREE_PUBLIC (fndecl))
689     {
690       const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
691       const char *tname = name;
692
693       /* We assume that alloca will always be called by name.  It
694          makes no sense to pass it as a pointer-to-function to
695          anything that does not understand its behavior.  */
696       if (((IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 6
697             && name[0] == 'a'
698             && ! strcmp (name, "alloca"))
699            || (IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 16
700                && name[0] == '_'
701                && ! strcmp (name, "__builtin_alloca"))))
702         flags |= ECF_MAY_BE_ALLOCA;
703
704       /* Disregard prefix _, __ or __x.  */
705       if (name[0] == '_')
706         {
707           if (name[1] == '_' && name[2] == 'x')
708             tname += 3;
709           else if (name[1] == '_')
710             tname += 2;
711           else
712             tname += 1;
713         }
714
715       if (tname[0] == 's')
716         {
717           if ((tname[1] == 'e'
718                && (! strcmp (tname, "setjmp")
719                    || ! strcmp (tname, "setjmp_syscall")))
720               || (tname[1] == 'i'
721                   && ! strcmp (tname, "sigsetjmp"))
722               || (tname[1] == 'a'
723                   && ! strcmp (tname, "savectx")))
724             flags |= ECF_RETURNS_TWICE;
725
726           if (tname[1] == 'i'
727               && ! strcmp (tname, "siglongjmp"))
728             flags |= ECF_LONGJMP;
729         }
730       else if ((tname[0] == 'q' && tname[1] == 's'
731                 && ! strcmp (tname, "qsetjmp"))
732                || (tname[0] == 'v' && tname[1] == 'f'
733                    && ! strcmp (tname, "vfork")))
734         flags |= ECF_RETURNS_TWICE;
735
736       else if (tname[0] == 'l' && tname[1] == 'o'
737                && ! strcmp (tname, "longjmp"))
738         flags |= ECF_LONGJMP;
739
740       else if ((tname[0] == 'f' && tname[1] == 'o'
741                 && ! strcmp (tname, "fork"))
742                /* Linux specific: __clone.  check NAME to insist on the
743                   leading underscores, to avoid polluting the ISO / POSIX
744                   namespace.  */
745                || (name[0] == '_' && name[1] == '_'
746                    && ! strcmp (tname, "clone"))
747                || (tname[0] == 'e' && tname[1] == 'x' && tname[2] == 'e'
748                    && tname[3] == 'c' && (tname[4] == 'l' || tname[4] == 'v')
749                    && (tname[5] == '\0'
750                        || ((tname[5] == 'p' || tname[5] == 'e')
751                            && tname[6] == '\0'))))
752         flags |= ECF_FORK_OR_EXEC;
753
754       /* Do not add any more malloc-like functions to this list,
755          instead mark them as malloc functions using the malloc attribute.
756          Note, realloc is not suitable for attribute malloc since
757          it may return the same address across multiple calls.
758          C++ operator new is not suitable because it is not required
759          to return a unique pointer; indeed, the standard placement new
760          just returns its argument.  */
761       else if (TYPE_MODE (TREE_TYPE (TREE_TYPE (fndecl))) == Pmode
762                && (! strcmp (tname, "malloc")
763                    || ! strcmp (tname, "calloc")
764                    || ! strcmp (tname, "strdup")))
765         flags |= ECF_MALLOC;
766     }
767   return flags;
768 }
769
770 /* Return nonzero when tree represent call to longjmp.  */
771
772 int
773 setjmp_call_p (fndecl)
774      tree fndecl;
775 {
776   return special_function_p (fndecl, 0) & ECF_RETURNS_TWICE;
777 }
778
779 /* Detect flags (function attributes) from the function type node.  */
780
781 static int
782 flags_from_decl_or_type (exp)
783      tree exp;
784 {
785   int flags = 0;
786
787   /* ??? We can't set IS_MALLOC for function types?  */
788   if (DECL_P (exp))
789     {
790       /* The function exp may have the `malloc' attribute.  */
791       if (DECL_P (exp) && DECL_IS_MALLOC (exp))
792         flags |= ECF_MALLOC;
793
794       /* The function exp may have the `pure' attribute.  */
795       if (DECL_P (exp) && DECL_IS_PURE (exp))
796         flags |= ECF_PURE;
797
798       if (TREE_NOTHROW (exp))
799         flags |= ECF_NOTHROW;
800     }
801
802   if (TREE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
803     flags |= ECF_CONST;
804
805   if (TREE_THIS_VOLATILE (exp))
806     flags |= ECF_NORETURN;
807
808   return flags;
809 }
810
811 /* Precompute all register parameters as described by ARGS, storing values
812    into fields within the ARGS array.
813
814    NUM_ACTUALS indicates the total number elements in the ARGS array.
815
816    Set REG_PARM_SEEN if we encounter a register parameter.  */
817
818 static void
819 precompute_register_parameters (num_actuals, args, reg_parm_seen)
820      int num_actuals;
821      struct arg_data *args;
822      int *reg_parm_seen;
823 {
824   int i;
825
826   *reg_parm_seen = 0;
827
828   for (i = 0; i < num_actuals; i++)
829     if (args[i].reg != 0 && ! args[i].pass_on_stack)
830       {
831         *reg_parm_seen = 1;
832
833         if (args[i].value == 0)
834           {
835             push_temp_slots ();
836             args[i].value = expand_expr (args[i].tree_value, NULL_RTX,
837                                          VOIDmode, 0);
838             preserve_temp_slots (args[i].value);
839             pop_temp_slots ();
840
841             /* ANSI doesn't require a sequence point here,
842                but PCC has one, so this will avoid some problems.  */
843             emit_queue ();
844           }
845
846         /* If we are to promote the function arg to a wider mode,
847            do it now.  */
848
849         if (args[i].mode != TYPE_MODE (TREE_TYPE (args[i].tree_value)))
850           args[i].value
851             = convert_modes (args[i].mode,
852                              TYPE_MODE (TREE_TYPE (args[i].tree_value)),
853                              args[i].value, args[i].unsignedp);
854
855         /* If the value is expensive, and we are inside an appropriately
856            short loop, put the value into a pseudo and then put the pseudo
857            into the hard reg.
858
859            For small register classes, also do this if this call uses
860            register parameters.  This is to avoid reload conflicts while
861            loading the parameters registers.  */
862
863         if ((! (GET_CODE (args[i].value) == REG
864                 || (GET_CODE (args[i].value) == SUBREG
865                     && GET_CODE (SUBREG_REG (args[i].value)) == REG)))
866             && args[i].mode != BLKmode
867             && rtx_cost (args[i].value, SET) > COSTS_N_INSNS (1)
868             && ((SMALL_REGISTER_CLASSES && *reg_parm_seen)
869                 || preserve_subexpressions_p ()))
870           args[i].value = copy_to_mode_reg (args[i].mode, args[i].value);
871       }
872 }
873
874 #ifdef REG_PARM_STACK_SPACE
875
876   /* The argument list is the property of the called routine and it
877      may clobber it.  If the fixed area has been used for previous
878      parameters, we must save and restore it.  */
879
880 static rtx
881 save_fixed_argument_area (reg_parm_stack_space, argblock,
882                           low_to_save, high_to_save)
883      int reg_parm_stack_space;
884      rtx argblock;
885      int *low_to_save;
886      int *high_to_save;
887 {
888   int i;
889   rtx save_area = NULL_RTX;
890
891   /* Compute the boundary of the that needs to be saved, if any.  */
892 #ifdef ARGS_GROW_DOWNWARD
893   for (i = 0; i < reg_parm_stack_space + 1; i++)
894 #else
895   for (i = 0; i < reg_parm_stack_space; i++)
896 #endif
897     {
898       if (i >= highest_outgoing_arg_in_use
899           || stack_usage_map[i] == 0)
900         continue;
901
902       if (*low_to_save == -1)
903         *low_to_save = i;
904
905       *high_to_save = i;
906     }
907
908   if (*low_to_save >= 0)
909     {
910       int num_to_save = *high_to_save - *low_to_save + 1;
911       enum machine_mode save_mode
912         = mode_for_size (num_to_save * BITS_PER_UNIT, MODE_INT, 1);
913       rtx stack_area;
914
915       /* If we don't have the required alignment, must do this in BLKmode.  */
916       if ((*low_to_save & (MIN (GET_MODE_SIZE (save_mode),
917                                 BIGGEST_ALIGNMENT / UNITS_PER_WORD) - 1)))
918         save_mode = BLKmode;
919
920 #ifdef ARGS_GROW_DOWNWARD
921       stack_area
922         = gen_rtx_MEM (save_mode,
923                        memory_address (save_mode,
924                                        plus_constant (argblock,
925                                                       - *high_to_save)));
926 #else
927       stack_area = gen_rtx_MEM (save_mode,
928                                 memory_address (save_mode,
929                                                 plus_constant (argblock,
930                                                                *low_to_save)));
931 #endif
932       if (save_mode == BLKmode)
933         {
934           save_area = assign_stack_temp (BLKmode, num_to_save, 0);
935           /* Cannot use emit_block_move here because it can be done by a
936              library call which in turn gets into this place again and deadly
937              infinite recursion happens.  */
938           move_by_pieces (validize_mem (save_area), stack_area, num_to_save,
939                           PARM_BOUNDARY);
940         }
941       else
942         {
943           save_area = gen_reg_rtx (save_mode);
944           emit_move_insn (save_area, stack_area);
945         }
946     }
947   return save_area;
948 }
949
950 static void
951 restore_fixed_argument_area (save_area, argblock, high_to_save, low_to_save)
952      rtx save_area;
953      rtx argblock;
954      int high_to_save;
955      int low_to_save;
956 {
957   enum machine_mode save_mode = GET_MODE (save_area);
958 #ifdef ARGS_GROW_DOWNWARD
959   rtx stack_area
960     = gen_rtx_MEM (save_mode,
961                    memory_address (save_mode,
962                                    plus_constant (argblock,
963                                                   - high_to_save)));
964 #else
965   rtx stack_area
966     = gen_rtx_MEM (save_mode,
967                    memory_address (save_mode,
968                                    plus_constant (argblock,
969                                                   low_to_save)));
970 #endif
971
972   if (save_mode != BLKmode)
973     emit_move_insn (stack_area, save_area);
974   else
975     /* Cannot use emit_block_move here because it can be done by a library
976        call which in turn gets into this place again and deadly infinite
977        recursion happens.  */
978     move_by_pieces (stack_area, validize_mem (save_area),
979                     high_to_save - low_to_save + 1, PARM_BOUNDARY);
980 }
981 #endif
982
983 /* If any elements in ARGS refer to parameters that are to be passed in
984    registers, but not in memory, and whose alignment does not permit a
985    direct copy into registers.  Copy the values into a group of pseudos
986    which we will later copy into the appropriate hard registers.
987
988    Pseudos for each unaligned argument will be stored into the array
989    args[argnum].aligned_regs.  The caller is responsible for deallocating
990    the aligned_regs array if it is nonzero.  */
991
992 static void
993 store_unaligned_arguments_into_pseudos (args, num_actuals)
994      struct arg_data *args;
995      int num_actuals;
996 {
997   int i, j;
998
999   for (i = 0; i < num_actuals; i++)
1000     if (args[i].reg != 0 && ! args[i].pass_on_stack
1001         && args[i].mode == BLKmode
1002         && (TYPE_ALIGN (TREE_TYPE (args[i].tree_value))
1003             < (unsigned int) MIN (BIGGEST_ALIGNMENT, BITS_PER_WORD)))
1004       {
1005         int bytes = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1006         int big_endian_correction = 0;
1007
1008         args[i].n_aligned_regs
1009           = args[i].partial ? args[i].partial
1010             : (bytes + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD;
1011
1012         args[i].aligned_regs = (rtx *) xmalloc (sizeof (rtx)
1013                                                 * args[i].n_aligned_regs);
1014
1015         /* Structures smaller than a word are aligned to the least
1016            significant byte (to the right).  On a BYTES_BIG_ENDIAN machine,
1017            this means we must skip the empty high order bytes when
1018            calculating the bit offset.  */
1019         if (BYTES_BIG_ENDIAN && bytes < UNITS_PER_WORD)
1020           big_endian_correction = (BITS_PER_WORD  - (bytes * BITS_PER_UNIT));
1021
1022         for (j = 0; j < args[i].n_aligned_regs; j++)
1023           {
1024             rtx reg = gen_reg_rtx (word_mode);
1025             rtx word = operand_subword_force (args[i].value, j, BLKmode);
1026             int bitsize = MIN (bytes * BITS_PER_UNIT, BITS_PER_WORD);
1027             int bitalign = TYPE_ALIGN (TREE_TYPE (args[i].tree_value));
1028
1029             args[i].aligned_regs[j] = reg;
1030
1031             /* There is no need to restrict this code to loading items
1032                in TYPE_ALIGN sized hunks.  The bitfield instructions can
1033                load up entire word sized registers efficiently.
1034
1035                ??? This may not be needed anymore.
1036                We use to emit a clobber here but that doesn't let later
1037                passes optimize the instructions we emit.  By storing 0 into
1038                the register later passes know the first AND to zero out the
1039                bitfield being set in the register is unnecessary.  The store
1040                of 0 will be deleted as will at least the first AND.  */
1041
1042             emit_move_insn (reg, const0_rtx);
1043
1044             bytes -= bitsize / BITS_PER_UNIT;
1045             store_bit_field (reg, bitsize, big_endian_correction, word_mode,
1046                              extract_bit_field (word, bitsize, 0, 1, NULL_RTX,
1047                                                 word_mode, word_mode, bitalign,
1048                                                 BITS_PER_WORD),
1049                              bitalign, BITS_PER_WORD);
1050           }
1051       }
1052 }
1053
1054 /* Fill in ARGS_SIZE and ARGS array based on the parameters found in
1055    ACTPARMS.
1056
1057    NUM_ACTUALS is the total number of parameters.
1058
1059    N_NAMED_ARGS is the total number of named arguments.
1060
1061    FNDECL is the tree code for the target of this call (if known)
1062
1063    ARGS_SO_FAR holds state needed by the target to know where to place
1064    the next argument.
1065
1066    REG_PARM_STACK_SPACE is the number of bytes of stack space reserved
1067    for arguments which are passed in registers.
1068
1069    OLD_STACK_LEVEL is a pointer to an rtx which olds the old stack level
1070    and may be modified by this routine.
1071
1072    OLD_PENDING_ADJ, MUST_PREALLOCATE and FLAGS are pointers to integer
1073    flags which may may be modified by this routine.  */
1074
1075 static void
1076 initialize_argument_information (num_actuals, args, args_size, n_named_args,
1077                                  actparms, fndecl, args_so_far,
1078                                  reg_parm_stack_space, old_stack_level,
1079                                  old_pending_adj, must_preallocate,
1080                                  ecf_flags)
1081      int num_actuals ATTRIBUTE_UNUSED;
1082      struct arg_data *args;
1083      struct args_size *args_size;
1084      int n_named_args ATTRIBUTE_UNUSED;
1085      tree actparms;
1086      tree fndecl;
1087      CUMULATIVE_ARGS *args_so_far;
1088      int reg_parm_stack_space;
1089      rtx *old_stack_level;
1090      int *old_pending_adj;
1091      int *must_preallocate;
1092      int *ecf_flags;
1093 {
1094   /* 1 if scanning parms front to back, -1 if scanning back to front.  */
1095   int inc;
1096
1097   /* Count arg position in order args appear.  */
1098   int argpos;
1099
1100   struct args_size alignment_pad;
1101   int i;
1102   tree p;
1103
1104   args_size->constant = 0;
1105   args_size->var = 0;
1106
1107   /* In this loop, we consider args in the order they are written.
1108      We fill up ARGS from the front or from the back if necessary
1109      so that in any case the first arg to be pushed ends up at the front.  */
1110
1111   if (PUSH_ARGS_REVERSED)
1112     {
1113       i = num_actuals - 1, inc = -1;
1114       /* In this case, must reverse order of args
1115          so that we compute and push the last arg first.  */
1116     }
1117   else
1118     {
1119       i = 0, inc = 1;
1120     }
1121
1122   /* I counts args in order (to be) pushed; ARGPOS counts in order written.  */
1123   for (p = actparms, argpos = 0; p; p = TREE_CHAIN (p), i += inc, argpos++)
1124     {
1125       tree type = TREE_TYPE (TREE_VALUE (p));
1126       int unsignedp;
1127       enum machine_mode mode;
1128
1129       args[i].tree_value = TREE_VALUE (p);
1130
1131       /* Replace erroneous argument with constant zero.  */
1132       if (type == error_mark_node || !COMPLETE_TYPE_P (type))
1133         args[i].tree_value = integer_zero_node, type = integer_type_node;
1134
1135       /* If TYPE is a transparent union, pass things the way we would
1136          pass the first field of the union.  We have already verified that
1137          the modes are the same.  */
1138       if (TREE_CODE (type) == UNION_TYPE && TYPE_TRANSPARENT_UNION (type))
1139         type = TREE_TYPE (TYPE_FIELDS (type));
1140
1141       /* Decide where to pass this arg.
1142
1143          args[i].reg is nonzero if all or part is passed in registers.
1144
1145          args[i].partial is nonzero if part but not all is passed in registers,
1146          and the exact value says how many words are passed in registers.
1147
1148          args[i].pass_on_stack is nonzero if the argument must at least be
1149          computed on the stack.  It may then be loaded back into registers
1150          if args[i].reg is nonzero.
1151
1152          These decisions are driven by the FUNCTION_... macros and must agree
1153          with those made by function.c.  */
1154
1155       /* See if this argument should be passed by invisible reference.  */
1156       if ((TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST
1157            && contains_placeholder_p (TYPE_SIZE (type)))
1158           || TREE_ADDRESSABLE (type)
1159 #ifdef FUNCTION_ARG_PASS_BY_REFERENCE
1160           || FUNCTION_ARG_PASS_BY_REFERENCE (*args_so_far, TYPE_MODE (type),
1161                                              type, argpos < n_named_args)
1162 #endif
1163           )
1164         {
1165           /* If we're compiling a thunk, pass through invisible
1166              references instead of making a copy.  */
1167           if (current_function_is_thunk
1168 #ifdef FUNCTION_ARG_CALLEE_COPIES
1169               || (FUNCTION_ARG_CALLEE_COPIES (*args_so_far, TYPE_MODE (type),
1170                                              type, argpos < n_named_args)
1171                   /* If it's in a register, we must make a copy of it too.  */
1172                   /* ??? Is this a sufficient test?  Is there a better one? */
1173                   && !(TREE_CODE (args[i].tree_value) == VAR_DECL
1174                        && REG_P (DECL_RTL (args[i].tree_value)))
1175                   && ! TREE_ADDRESSABLE (type))
1176 #endif
1177               )
1178             {
1179               /* C++ uses a TARGET_EXPR to indicate that we want to make a
1180                  new object from the argument.  If we are passing by
1181                  invisible reference, the callee will do that for us, so we
1182                  can strip off the TARGET_EXPR.  This is not always safe,
1183                  but it is safe in the only case where this is a useful
1184                  optimization; namely, when the argument is a plain object.
1185                  In that case, the frontend is just asking the backend to
1186                  make a bitwise copy of the argument.  */
1187
1188               if (TREE_CODE (args[i].tree_value) == TARGET_EXPR
1189                   && (DECL_P (TREE_OPERAND (args[i].tree_value, 1)))
1190                   && ! REG_P (DECL_RTL (TREE_OPERAND (args[i].tree_value, 1))))
1191                 args[i].tree_value = TREE_OPERAND (args[i].tree_value, 1);
1192
1193               args[i].tree_value = build1 (ADDR_EXPR,
1194                                            build_pointer_type (type),
1195                                            args[i].tree_value);
1196               type = build_pointer_type (type);
1197             }
1198           else
1199             {
1200               /* We make a copy of the object and pass the address to the
1201                  function being called.  */
1202               rtx copy;
1203
1204               if (!COMPLETE_TYPE_P (type)
1205                   || TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST
1206                   || (flag_stack_check && ! STACK_CHECK_BUILTIN
1207                       && (0 < compare_tree_int (TYPE_SIZE_UNIT (type),
1208                                                 STACK_CHECK_MAX_VAR_SIZE))))
1209                 {
1210                   /* This is a variable-sized object.  Make space on the stack
1211                      for it.  */
1212                   rtx size_rtx = expr_size (TREE_VALUE (p));
1213
1214                   if (*old_stack_level == 0)
1215                     {
1216                       emit_stack_save (SAVE_BLOCK, old_stack_level, NULL_RTX);
1217                       *old_pending_adj = pending_stack_adjust;
1218                       pending_stack_adjust = 0;
1219                     }
1220
1221                   copy = gen_rtx_MEM (BLKmode,
1222                                       allocate_dynamic_stack_space
1223                                       (size_rtx, NULL_RTX, TYPE_ALIGN (type)));
1224                   set_mem_attributes (copy, type, 1);
1225                 }
1226               else
1227                 copy = assign_temp (type, 0, 1, 0);
1228
1229               store_expr (args[i].tree_value, copy, 0);
1230               *ecf_flags &= ~(ECF_CONST | ECF_PURE);
1231
1232               args[i].tree_value = build1 (ADDR_EXPR,
1233                                            build_pointer_type (type),
1234                                            make_tree (type, copy));
1235               type = build_pointer_type (type);
1236             }
1237         }
1238
1239       mode = TYPE_MODE (type);
1240       unsignedp = TREE_UNSIGNED (type);
1241
1242 #ifdef PROMOTE_FUNCTION_ARGS
1243       mode = promote_mode (type, mode, &unsignedp, 1);
1244 #endif
1245
1246       args[i].unsignedp = unsignedp;
1247       args[i].mode = mode;
1248
1249       args[i].reg = FUNCTION_ARG (*args_so_far, mode, type,
1250                                   argpos < n_named_args);
1251 #ifdef FUNCTION_INCOMING_ARG
1252       /* If this is a sibling call and the machine has register windows, the
1253          register window has to be unwinded before calling the routine, so
1254          arguments have to go into the incoming registers.  */
1255       args[i].tail_call_reg = FUNCTION_INCOMING_ARG (*args_so_far, mode, type,
1256                                                      argpos < n_named_args);
1257 #else
1258       args[i].tail_call_reg = args[i].reg;
1259 #endif
1260
1261 #ifdef FUNCTION_ARG_PARTIAL_NREGS
1262       if (args[i].reg)
1263         args[i].partial
1264           = FUNCTION_ARG_PARTIAL_NREGS (*args_so_far, mode, type,
1265                                         argpos < n_named_args);
1266 #endif
1267
1268       args[i].pass_on_stack = MUST_PASS_IN_STACK (mode, type);
1269
1270       /* If FUNCTION_ARG returned a (parallel [(expr_list (nil) ...) ...]),
1271          it means that we are to pass this arg in the register(s) designated
1272          by the PARALLEL, but also to pass it in the stack.  */
1273       if (args[i].reg && GET_CODE (args[i].reg) == PARALLEL
1274           && XEXP (XVECEXP (args[i].reg, 0, 0), 0) == 0)
1275         args[i].pass_on_stack = 1;
1276
1277       /* If this is an addressable type, we must preallocate the stack
1278          since we must evaluate the object into its final location.
1279
1280          If this is to be passed in both registers and the stack, it is simpler
1281          to preallocate.  */
1282       if (TREE_ADDRESSABLE (type)
1283           || (args[i].pass_on_stack && args[i].reg != 0))
1284         *must_preallocate = 1;
1285
1286       /* If this is an addressable type, we cannot pre-evaluate it.  Thus,
1287          we cannot consider this function call constant.  */
1288       if (TREE_ADDRESSABLE (type))
1289         *ecf_flags &= ~(ECF_CONST | ECF_PURE);
1290
1291       /* Compute the stack-size of this argument.  */
1292       if (args[i].reg == 0 || args[i].partial != 0
1293           || reg_parm_stack_space > 0
1294           || args[i].pass_on_stack)
1295         locate_and_pad_parm (mode, type,
1296 #ifdef STACK_PARMS_IN_REG_PARM_AREA
1297                              1,
1298 #else
1299                              args[i].reg != 0,
1300 #endif
1301                              fndecl, args_size, &args[i].offset,
1302                              &args[i].size, &alignment_pad);
1303
1304 #ifndef ARGS_GROW_DOWNWARD
1305       args[i].slot_offset = *args_size;
1306 #endif
1307
1308       args[i].alignment_pad = alignment_pad;
1309
1310       /* If a part of the arg was put into registers,
1311          don't include that part in the amount pushed.  */
1312       if (reg_parm_stack_space == 0 && ! args[i].pass_on_stack)
1313         args[i].size.constant -= ((args[i].partial * UNITS_PER_WORD)
1314                                   / (PARM_BOUNDARY / BITS_PER_UNIT)
1315                                   * (PARM_BOUNDARY / BITS_PER_UNIT));
1316
1317       /* Update ARGS_SIZE, the total stack space for args so far.  */
1318
1319       args_size->constant += args[i].size.constant;
1320       if (args[i].size.var)
1321         {
1322           ADD_PARM_SIZE (*args_size, args[i].size.var);
1323         }
1324
1325       /* Since the slot offset points to the bottom of the slot,
1326          we must record it after incrementing if the args grow down.  */
1327 #ifdef ARGS_GROW_DOWNWARD
1328       args[i].slot_offset = *args_size;
1329
1330       args[i].slot_offset.constant = -args_size->constant;
1331       if (args_size->var)
1332         SUB_PARM_SIZE (args[i].slot_offset, args_size->var);
1333 #endif
1334
1335       /* Increment ARGS_SO_FAR, which has info about which arg-registers
1336          have been used, etc.  */
1337
1338       FUNCTION_ARG_ADVANCE (*args_so_far, TYPE_MODE (type), type,
1339                             argpos < n_named_args);
1340     }
1341 }
1342
1343 /* Update ARGS_SIZE to contain the total size for the argument block.
1344    Return the original constant component of the argument block's size.
1345
1346    REG_PARM_STACK_SPACE holds the number of bytes of stack space reserved
1347    for arguments passed in registers.  */
1348
1349 static int
1350 compute_argument_block_size (reg_parm_stack_space, args_size,
1351                              preferred_stack_boundary)
1352      int reg_parm_stack_space;
1353      struct args_size *args_size;
1354      int preferred_stack_boundary ATTRIBUTE_UNUSED;
1355 {
1356   int unadjusted_args_size = args_size->constant;
1357
1358   /* For accumulate outgoing args mode we don't need to align, since the frame
1359      will be already aligned.  Align to STACK_BOUNDARY in order to prevent
1360      backends from generating missaligned frame sizes.  */
1361 #ifdef STACK_BOUNDARY
1362   if (ACCUMULATE_OUTGOING_ARGS && preferred_stack_boundary > STACK_BOUNDARY)
1363     preferred_stack_boundary = STACK_BOUNDARY;
1364 #endif
1365
1366   /* Compute the actual size of the argument block required.  The variable
1367      and constant sizes must be combined, the size may have to be rounded,
1368      and there may be a minimum required size.  */
1369
1370   if (args_size->var)
1371     {
1372       args_size->var = ARGS_SIZE_TREE (*args_size);
1373       args_size->constant = 0;
1374
1375 #ifdef PREFERRED_STACK_BOUNDARY
1376       preferred_stack_boundary /= BITS_PER_UNIT;
1377       if (preferred_stack_boundary > 1)
1378         {
1379           /* We don't handle this case yet.  To handle it correctly we have
1380              to add the delta, round and substract the delta.
1381              Currently no machine description requires this support.  */
1382           if (stack_pointer_delta & (preferred_stack_boundary - 1))
1383             abort ();
1384           args_size->var = round_up (args_size->var, preferred_stack_boundary);
1385         }
1386 #endif
1387
1388       if (reg_parm_stack_space > 0)
1389         {
1390           args_size->var
1391             = size_binop (MAX_EXPR, args_size->var,
1392                           ssize_int (reg_parm_stack_space));
1393
1394 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1395           /* The area corresponding to register parameters is not to count in
1396              the size of the block we need.  So make the adjustment.  */
1397           args_size->var
1398             = size_binop (MINUS_EXPR, args_size->var,
1399                           ssize_int (reg_parm_stack_space));
1400 #endif
1401         }
1402     }
1403   else
1404     {
1405 #ifdef PREFERRED_STACK_BOUNDARY
1406       preferred_stack_boundary /= BITS_PER_UNIT;
1407       if (preferred_stack_boundary < 1)
1408         preferred_stack_boundary = 1;
1409       args_size->constant = (((args_size->constant
1410                                + stack_pointer_delta
1411                                + preferred_stack_boundary - 1)
1412                               / preferred_stack_boundary
1413                               * preferred_stack_boundary)
1414                              - stack_pointer_delta);
1415 #endif
1416
1417       args_size->constant = MAX (args_size->constant,
1418                                  reg_parm_stack_space);
1419
1420 #ifdef MAYBE_REG_PARM_STACK_SPACE
1421       if (reg_parm_stack_space == 0)
1422         args_size->constant = 0;
1423 #endif
1424
1425 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1426       args_size->constant -= reg_parm_stack_space;
1427 #endif
1428     }
1429   return unadjusted_args_size;
1430 }
1431
1432 /* Precompute parameters as needed for a function call.
1433
1434    FLAGS is mask of ECF_* constants.
1435
1436    NUM_ACTUALS is the number of arguments.
1437
1438    ARGS is an array containing information for each argument; this
1439    routine fills in the INITIAL_VALUE and VALUE fields for each
1440    precomputed argument.  */
1441
1442 static void
1443 precompute_arguments (flags, num_actuals, args)
1444      int flags;
1445      int num_actuals;
1446      struct arg_data *args;
1447 {
1448   int i;
1449
1450   /* If this function call is cse'able, precompute all the parameters.
1451      Note that if the parameter is constructed into a temporary, this will
1452      cause an additional copy because the parameter will be constructed
1453      into a temporary location and then copied into the outgoing arguments.
1454      If a parameter contains a call to alloca and this function uses the
1455      stack, precompute the parameter.  */
1456
1457   /* If we preallocated the stack space, and some arguments must be passed
1458      on the stack, then we must precompute any parameter which contains a
1459      function call which will store arguments on the stack.
1460      Otherwise, evaluating the parameter may clobber previous parameters
1461      which have already been stored into the stack.  (we have code to avoid
1462      such case by saving the ougoing stack arguments, but it results in
1463      worse code)  */
1464
1465   for (i = 0; i < num_actuals; i++)
1466     if ((flags & (ECF_CONST | ECF_PURE))
1467         || calls_function (args[i].tree_value, !ACCUMULATE_OUTGOING_ARGS))
1468       {
1469         enum machine_mode mode;
1470
1471         /* If this is an addressable type, we cannot pre-evaluate it.  */
1472         if (TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value)))
1473           abort ();
1474
1475         push_temp_slots ();
1476
1477         args[i].value
1478           = expand_expr (args[i].tree_value, NULL_RTX, VOIDmode, 0);
1479
1480         preserve_temp_slots (args[i].value);
1481         pop_temp_slots ();
1482
1483         /* ANSI doesn't require a sequence point here,
1484            but PCC has one, so this will avoid some problems.  */
1485         emit_queue ();
1486
1487         args[i].initial_value = args[i].value
1488           = protect_from_queue (args[i].value, 0);
1489
1490         mode = TYPE_MODE (TREE_TYPE (args[i].tree_value));
1491         if (mode != args[i].mode)
1492           {
1493             args[i].value
1494               = convert_modes (args[i].mode, mode,
1495                                args[i].value, args[i].unsignedp);
1496 #ifdef PROMOTE_FOR_CALL_ONLY
1497             /* CSE will replace this only if it contains args[i].value
1498                pseudo, so convert it down to the declared mode using
1499                a SUBREG.  */
1500             if (GET_CODE (args[i].value) == REG
1501                 && GET_MODE_CLASS (args[i].mode) == MODE_INT)
1502               {
1503                 args[i].initial_value
1504                   = gen_lowpart_SUBREG (mode, args[i].value);
1505                 SUBREG_PROMOTED_VAR_P (args[i].initial_value) = 1;
1506                 SUBREG_PROMOTED_UNSIGNED_P (args[i].initial_value)
1507                   = args[i].unsignedp;
1508               }
1509 #endif
1510           }
1511       }
1512 }
1513
1514 /* Given the current state of MUST_PREALLOCATE and information about
1515    arguments to a function call in NUM_ACTUALS, ARGS and ARGS_SIZE,
1516    compute and return the final value for MUST_PREALLOCATE.  */
1517
1518 static int
1519 finalize_must_preallocate (must_preallocate, num_actuals, args, args_size)
1520      int must_preallocate;
1521      int num_actuals;
1522      struct arg_data *args;
1523      struct args_size *args_size;
1524 {
1525   /* See if we have or want to preallocate stack space.
1526
1527      If we would have to push a partially-in-regs parm
1528      before other stack parms, preallocate stack space instead.
1529
1530      If the size of some parm is not a multiple of the required stack
1531      alignment, we must preallocate.
1532
1533      If the total size of arguments that would otherwise create a copy in
1534      a temporary (such as a CALL) is more than half the total argument list
1535      size, preallocation is faster.
1536
1537      Another reason to preallocate is if we have a machine (like the m88k)
1538      where stack alignment is required to be maintained between every
1539      pair of insns, not just when the call is made.  However, we assume here
1540      that such machines either do not have push insns (and hence preallocation
1541      would occur anyway) or the problem is taken care of with
1542      PUSH_ROUNDING.  */
1543
1544   if (! must_preallocate)
1545     {
1546       int partial_seen = 0;
1547       int copy_to_evaluate_size = 0;
1548       int i;
1549
1550       for (i = 0; i < num_actuals && ! must_preallocate; i++)
1551         {
1552           if (args[i].partial > 0 && ! args[i].pass_on_stack)
1553             partial_seen = 1;
1554           else if (partial_seen && args[i].reg == 0)
1555             must_preallocate = 1;
1556
1557           if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode
1558               && (TREE_CODE (args[i].tree_value) == CALL_EXPR
1559                   || TREE_CODE (args[i].tree_value) == TARGET_EXPR
1560                   || TREE_CODE (args[i].tree_value) == COND_EXPR
1561                   || TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value))))
1562             copy_to_evaluate_size
1563               += int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1564         }
1565
1566       if (copy_to_evaluate_size * 2 >= args_size->constant
1567           && args_size->constant > 0)
1568         must_preallocate = 1;
1569     }
1570   return must_preallocate;
1571 }
1572
1573 /* If we preallocated stack space, compute the address of each argument
1574    and store it into the ARGS array.
1575
1576    We need not ensure it is a valid memory address here; it will be
1577    validized when it is used.
1578
1579    ARGBLOCK is an rtx for the address of the outgoing arguments.  */
1580
1581 static void
1582 compute_argument_addresses (args, argblock, num_actuals)
1583      struct arg_data *args;
1584      rtx argblock;
1585      int num_actuals;
1586 {
1587   if (argblock)
1588     {
1589       rtx arg_reg = argblock;
1590       int i, arg_offset = 0;
1591
1592       if (GET_CODE (argblock) == PLUS)
1593         arg_reg = XEXP (argblock, 0), arg_offset = INTVAL (XEXP (argblock, 1));
1594
1595       for (i = 0; i < num_actuals; i++)
1596         {
1597           rtx offset = ARGS_SIZE_RTX (args[i].offset);
1598           rtx slot_offset = ARGS_SIZE_RTX (args[i].slot_offset);
1599           rtx addr;
1600
1601           /* Skip this parm if it will not be passed on the stack.  */
1602           if (! args[i].pass_on_stack && args[i].reg != 0)
1603             continue;
1604
1605           if (GET_CODE (offset) == CONST_INT)
1606             addr = plus_constant (arg_reg, INTVAL (offset));
1607           else
1608             addr = gen_rtx_PLUS (Pmode, arg_reg, offset);
1609
1610           addr = plus_constant (addr, arg_offset);
1611           args[i].stack = gen_rtx_MEM (args[i].mode, addr);
1612           set_mem_attributes (args[i].stack,
1613                               TREE_TYPE (args[i].tree_value), 1);
1614
1615           if (GET_CODE (slot_offset) == CONST_INT)
1616             addr = plus_constant (arg_reg, INTVAL (slot_offset));
1617           else
1618             addr = gen_rtx_PLUS (Pmode, arg_reg, slot_offset);
1619
1620           addr = plus_constant (addr, arg_offset);
1621           args[i].stack_slot = gen_rtx_MEM (args[i].mode, addr);
1622           set_mem_attributes (args[i].stack_slot,
1623                               TREE_TYPE (args[i].tree_value), 1);
1624
1625           /* Function incoming arguments may overlap with sibling call
1626              outgoing arguments and we cannot allow reordering of reads
1627              from function arguments with stores to outgoing arguments
1628              of sibling calls.  */
1629           MEM_ALIAS_SET (args[i].stack) = 0;
1630           MEM_ALIAS_SET (args[i].stack_slot) = 0;
1631         }
1632     }
1633 }
1634
1635 /* Given a FNDECL and EXP, return an rtx suitable for use as a target address
1636    in a call instruction.
1637
1638    FNDECL is the tree node for the target function.  For an indirect call
1639    FNDECL will be NULL_TREE.
1640
1641    EXP is the CALL_EXPR for this call.  */
1642
1643 static rtx
1644 rtx_for_function_call (fndecl, exp)
1645      tree fndecl;
1646      tree exp;
1647 {
1648   rtx funexp;
1649
1650   /* Get the function to call, in the form of RTL.  */
1651   if (fndecl)
1652     {
1653       /* If this is the first use of the function, see if we need to
1654          make an external definition for it.  */
1655       if (! TREE_USED (fndecl))
1656         {
1657           assemble_external (fndecl);
1658           TREE_USED (fndecl) = 1;
1659         }
1660
1661       /* Get a SYMBOL_REF rtx for the function address.  */
1662       funexp = XEXP (DECL_RTL (fndecl), 0);
1663     }
1664   else
1665     /* Generate an rtx (probably a pseudo-register) for the address.  */
1666     {
1667       rtx funaddr;
1668       push_temp_slots ();
1669       funaddr = funexp =
1670         expand_expr (TREE_OPERAND (exp, 0), NULL_RTX, VOIDmode, 0);
1671       pop_temp_slots ();        /* FUNEXP can't be BLKmode.  */
1672
1673       /* Check the function is executable.  */
1674       if (current_function_check_memory_usage)
1675         {
1676 #ifdef POINTERS_EXTEND_UNSIGNED
1677           /* It might be OK to convert funexp in place, but there's
1678              a lot going on between here and when it happens naturally
1679              that this seems safer.  */
1680           funaddr = convert_memory_address (Pmode, funexp);
1681 #endif
1682           emit_library_call (chkr_check_exec_libfunc, LCT_CONST_MAKE_BLOCK,
1683                              VOIDmode, 1, funaddr, Pmode);
1684         }
1685       emit_queue ();
1686     }
1687   return funexp;
1688 }
1689
1690 /* Do the register loads required for any wholly-register parms or any
1691    parms which are passed both on the stack and in a register.  Their
1692    expressions were already evaluated.
1693
1694    Mark all register-parms as living through the call, putting these USE
1695    insns in the CALL_INSN_FUNCTION_USAGE field.  */
1696
1697 static void
1698 load_register_parameters (args, num_actuals, call_fusage, flags)
1699      struct arg_data *args;
1700      int num_actuals;
1701      rtx *call_fusage;
1702      int flags;
1703 {
1704   int i, j;
1705
1706 #ifdef LOAD_ARGS_REVERSED
1707   for (i = num_actuals - 1; i >= 0; i--)
1708 #else
1709   for (i = 0; i < num_actuals; i++)
1710 #endif
1711     {
1712       rtx reg = ((flags & ECF_SIBCALL)
1713                  ? args[i].tail_call_reg : args[i].reg);
1714       int partial = args[i].partial;
1715       int nregs;
1716
1717       if (reg)
1718         {
1719           /* Set to non-negative if must move a word at a time, even if just
1720              one word (e.g, partial == 1 && mode == DFmode).  Set to -1 if
1721              we just use a normal move insn.  This value can be zero if the
1722              argument is a zero size structure with no fields.  */
1723           nregs = (partial ? partial
1724                    : (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode
1725                       ? ((int_size_in_bytes (TREE_TYPE (args[i].tree_value))
1726                           + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD)
1727                       : -1));
1728
1729           /* Handle calls that pass values in multiple non-contiguous
1730              locations.  The Irix 6 ABI has examples of this.  */
1731
1732           if (GET_CODE (reg) == PARALLEL)
1733             emit_group_load (reg, args[i].value,
1734                              int_size_in_bytes (TREE_TYPE (args[i].tree_value)),
1735                              TYPE_ALIGN (TREE_TYPE (args[i].tree_value)));
1736
1737           /* If simple case, just do move.  If normal partial, store_one_arg
1738              has already loaded the register for us.  In all other cases,
1739              load the register(s) from memory.  */
1740
1741           else if (nregs == -1)
1742             emit_move_insn (reg, args[i].value);
1743
1744           /* If we have pre-computed the values to put in the registers in
1745              the case of non-aligned structures, copy them in now.  */
1746
1747           else if (args[i].n_aligned_regs != 0)
1748             for (j = 0; j < args[i].n_aligned_regs; j++)
1749               emit_move_insn (gen_rtx_REG (word_mode, REGNO (reg) + j),
1750                               args[i].aligned_regs[j]);
1751
1752           else if (partial == 0 || args[i].pass_on_stack)
1753             move_block_to_reg (REGNO (reg),
1754                                validize_mem (args[i].value), nregs,
1755                                args[i].mode);
1756
1757           /* Handle calls that pass values in multiple non-contiguous
1758              locations.  The Irix 6 ABI has examples of this.  */
1759           if (GET_CODE (reg) == PARALLEL)
1760             use_group_regs (call_fusage, reg);
1761           else if (nregs == -1)
1762             use_reg (call_fusage, reg);
1763           else
1764             use_regs (call_fusage, REGNO (reg), nregs == 0 ? 1 : nregs);
1765         }
1766     }
1767 }
1768
1769 /* Try to integrate function.  See expand_inline_function for documentation
1770    about the parameters.  */
1771
1772 static rtx
1773 try_to_integrate (fndecl, actparms, target, ignore, type, structure_value_addr)
1774      tree fndecl;
1775      tree actparms;
1776      rtx target;
1777      int ignore;
1778      tree type;
1779      rtx structure_value_addr;
1780 {
1781   rtx temp;
1782   rtx before_call;
1783   int i;
1784   rtx old_stack_level = 0;
1785   int reg_parm_stack_space = 0;
1786
1787 #ifdef REG_PARM_STACK_SPACE
1788 #ifdef MAYBE_REG_PARM_STACK_SPACE
1789   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
1790 #else
1791   reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
1792 #endif
1793 #endif
1794
1795   before_call = get_last_insn ();
1796
1797   timevar_push (TV_INTEGRATION);
1798
1799   temp = expand_inline_function (fndecl, actparms, target,
1800                                  ignore, type,
1801                                  structure_value_addr);
1802
1803   timevar_pop (TV_INTEGRATION);
1804
1805   /* If inlining succeeded, return.  */
1806   if (temp != (rtx) (HOST_WIDE_INT) - 1)
1807     {
1808       if (ACCUMULATE_OUTGOING_ARGS)
1809         {
1810           /* If the outgoing argument list must be preserved, push
1811              the stack before executing the inlined function if it
1812              makes any calls.  */
1813
1814           for (i = reg_parm_stack_space - 1; i >= 0; i--)
1815             if (i < highest_outgoing_arg_in_use && stack_usage_map[i] != 0)
1816               break;
1817
1818           if (stack_arg_under_construction || i >= 0)
1819             {
1820               rtx first_insn
1821                 = before_call ? NEXT_INSN (before_call) : get_insns ();
1822               rtx insn = NULL_RTX, seq;
1823
1824               /* Look for a call in the inline function code.
1825                  If DECL_SAVED_INSNS (fndecl)->outgoing_args_size is
1826                  nonzero then there is a call and it is not necessary
1827                  to scan the insns.  */
1828
1829               if (DECL_SAVED_INSNS (fndecl)->outgoing_args_size == 0)
1830                 for (insn = first_insn; insn; insn = NEXT_INSN (insn))
1831                   if (GET_CODE (insn) == CALL_INSN)
1832                     break;
1833
1834               if (insn)
1835                 {
1836                   /* Reserve enough stack space so that the largest
1837                      argument list of any function call in the inline
1838                      function does not overlap the argument list being
1839                      evaluated.  This is usually an overestimate because
1840                      allocate_dynamic_stack_space reserves space for an
1841                      outgoing argument list in addition to the requested
1842                      space, but there is no way to ask for stack space such
1843                      that an argument list of a certain length can be
1844                      safely constructed.
1845
1846                      Add the stack space reserved for register arguments, if
1847                      any, in the inline function.  What is really needed is the
1848                      largest value of reg_parm_stack_space in the inline
1849                      function, but that is not available.  Using the current
1850                      value of reg_parm_stack_space is wrong, but gives
1851                      correct results on all supported machines.  */
1852
1853                   int adjust = (DECL_SAVED_INSNS (fndecl)->outgoing_args_size
1854                                 + reg_parm_stack_space);
1855
1856                   start_sequence ();
1857                   emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
1858                   allocate_dynamic_stack_space (GEN_INT (adjust),
1859                                                 NULL_RTX, BITS_PER_UNIT);
1860                   seq = get_insns ();
1861                   end_sequence ();
1862                   emit_insns_before (seq, first_insn);
1863                   emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
1864                 }
1865             }
1866         }
1867
1868       /* If the result is equivalent to TARGET, return TARGET to simplify
1869          checks in store_expr.  They can be equivalent but not equal in the
1870          case of a function that returns BLKmode.  */
1871       if (temp != target && rtx_equal_p (temp, target))
1872         return target;
1873       return temp;
1874     }
1875
1876   /* If inlining failed, mark FNDECL as needing to be compiled
1877      separately after all.  If function was declared inline,
1878      give a warning.  */
1879   if (DECL_INLINE (fndecl) && warn_inline && !flag_no_inline
1880       && optimize > 0 && !TREE_ADDRESSABLE (fndecl))
1881     {
1882       warning_with_decl (fndecl, "inlining failed in call to `%s'");
1883       warning ("called from here");
1884     }
1885   mark_addressable (fndecl);
1886   return (rtx) (HOST_WIDE_INT) - 1;
1887 }
1888
1889 /* We need to pop PENDING_STACK_ADJUST bytes.  But, if the arguments
1890    wouldn't fill up an even multiple of PREFERRED_UNIT_STACK_BOUNDARY
1891    bytes, then we would need to push some additional bytes to pad the
1892    arguments.  So, we compute an adjust to the stack pointer for an
1893    amount that will leave the stack under-aligned by UNADJUSTED_ARGS_SIZE
1894    bytes.  Then, when the arguments are pushed the stack will be perfectly
1895    aligned.  ARGS_SIZE->CONSTANT is set to the number of bytes that should
1896    be popped after the call.  Returns the adjustment.  */
1897
1898 static int
1899 combine_pending_stack_adjustment_and_call (unadjusted_args_size,
1900                                            args_size,
1901                                            preferred_unit_stack_boundary)
1902      int unadjusted_args_size;
1903      struct args_size *args_size;
1904      int preferred_unit_stack_boundary;
1905 {
1906   /* The number of bytes to pop so that the stack will be
1907      under-aligned by UNADJUSTED_ARGS_SIZE bytes.  */
1908   HOST_WIDE_INT adjustment;
1909   /* The alignment of the stack after the arguments are pushed, if we
1910      just pushed the arguments without adjust the stack here.  */
1911   HOST_WIDE_INT unadjusted_alignment;
1912
1913   unadjusted_alignment
1914     = ((stack_pointer_delta + unadjusted_args_size)
1915        % preferred_unit_stack_boundary);
1916
1917   /* We want to get rid of as many of the PENDING_STACK_ADJUST bytes
1918      as possible -- leaving just enough left to cancel out the
1919      UNADJUSTED_ALIGNMENT.  In other words, we want to ensure that the
1920      PENDING_STACK_ADJUST is non-negative, and congruent to
1921      -UNADJUSTED_ALIGNMENT modulo the PREFERRED_UNIT_STACK_BOUNDARY.  */
1922
1923   /* Begin by trying to pop all the bytes.  */
1924   unadjusted_alignment
1925     = (unadjusted_alignment
1926        - (pending_stack_adjust % preferred_unit_stack_boundary));
1927   adjustment = pending_stack_adjust;
1928   /* Push enough additional bytes that the stack will be aligned
1929      after the arguments are pushed.  */
1930   if (preferred_unit_stack_boundary > 1)
1931     {
1932       if (unadjusted_alignment > 0)
1933         adjustment -= preferred_unit_stack_boundary - unadjusted_alignment;
1934       else
1935         adjustment += unadjusted_alignment;
1936     }
1937
1938   /* Now, sets ARGS_SIZE->CONSTANT so that we pop the right number of
1939      bytes after the call.  The right number is the entire
1940      PENDING_STACK_ADJUST less our ADJUSTMENT plus the amount required
1941      by the arguments in the first place.  */
1942   args_size->constant
1943     = pending_stack_adjust - adjustment + unadjusted_args_size;
1944
1945   return adjustment;
1946 }
1947
1948 /* Scan X expression if it does not dereference any argument slots
1949    we already clobbered by tail call arguments (as noted in stored_args_map
1950    bitmap).
1951    Return non-zero if X expression dereferences such argument slots,
1952    zero otherwise.  */
1953
1954 static int
1955 check_sibcall_argument_overlap_1 (x)
1956      rtx x;
1957 {
1958   RTX_CODE code;
1959   int i, j;
1960   unsigned int k;
1961   const char *fmt;
1962
1963   if (x == NULL_RTX)
1964     return 0;
1965
1966   code = GET_CODE (x);
1967
1968   if (code == MEM)
1969     {
1970       if (XEXP (x, 0) == current_function_internal_arg_pointer)
1971         i = 0;
1972       else if (GET_CODE (XEXP (x, 0)) == PLUS
1973                && XEXP (XEXP (x, 0), 0) ==
1974                   current_function_internal_arg_pointer
1975                && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT)
1976         i = INTVAL (XEXP (XEXP (x, 0), 1));
1977       else
1978         return 0;
1979
1980 #ifdef ARGS_GROW_DOWNWARD
1981       i = -i - GET_MODE_SIZE (GET_MODE (x));
1982 #endif
1983
1984       for (k = 0; k < GET_MODE_SIZE (GET_MODE (x)); k++)
1985         if (i + k < stored_args_map->n_bits
1986             && TEST_BIT (stored_args_map, i + k))
1987           return 1;
1988
1989       return 0;
1990     }
1991
1992   /* Scan all subexpressions.  */
1993   fmt = GET_RTX_FORMAT (code);
1994   for (i = 0; i < GET_RTX_LENGTH (code); i++, fmt++)
1995     {
1996       if (*fmt == 'e')
1997         {
1998           if (check_sibcall_argument_overlap_1 (XEXP (x, i)))
1999             return 1;
2000         }
2001       else if (*fmt == 'E')
2002         {
2003           for (j = 0; j < XVECLEN (x, i); j++)
2004             if (check_sibcall_argument_overlap_1 (XVECEXP (x, i, j)))
2005               return 1;
2006         }
2007     }
2008   return 0;
2009 }
2010
2011 /* Scan sequence after INSN if it does not dereference any argument slots
2012    we already clobbered by tail call arguments (as noted in stored_args_map
2013    bitmap).  Add stack slots for ARG to stored_args_map bitmap afterwards.
2014    Return non-zero if sequence after INSN dereferences such argument slots,
2015    zero otherwise.  */
2016
2017 static int
2018 check_sibcall_argument_overlap (insn, arg)
2019      rtx insn;
2020      struct arg_data *arg;
2021 {
2022   int low, high;
2023
2024   if (insn == NULL_RTX)
2025     insn = get_insns ();
2026   else
2027     insn = NEXT_INSN (insn);
2028
2029   for (; insn; insn = NEXT_INSN (insn))
2030     if (INSN_P (insn)
2031         && check_sibcall_argument_overlap_1 (PATTERN (insn)))
2032       break;
2033
2034 #ifdef ARGS_GROW_DOWNWARD
2035   low = -arg->offset.constant - arg->size.constant;
2036 #else
2037   low = arg->offset.constant;
2038 #endif
2039
2040   for (high = low + arg->size.constant; low < high; low++)
2041     SET_BIT (stored_args_map, low);
2042   return insn != NULL_RTX;
2043 }
2044
2045 /* Generate all the code for a function call
2046    and return an rtx for its value.
2047    Store the value in TARGET (specified as an rtx) if convenient.
2048    If the value is stored in TARGET then TARGET is returned.
2049    If IGNORE is nonzero, then we ignore the value of the function call.  */
2050
2051 rtx
2052 expand_call (exp, target, ignore)
2053      tree exp;
2054      rtx target;
2055      int ignore;
2056 {
2057   /* Nonzero if we are currently expanding a call.  */
2058   static int currently_expanding_call = 0;
2059
2060   /* List of actual parameters.  */
2061   tree actparms = TREE_OPERAND (exp, 1);
2062   /* RTX for the function to be called.  */
2063   rtx funexp;
2064   /* Sequence of insns to perform a tail recursive "call".  */
2065   rtx tail_recursion_insns = NULL_RTX;
2066   /* Sequence of insns to perform a normal "call".  */
2067   rtx normal_call_insns = NULL_RTX;
2068   /* Sequence of insns to perform a tail recursive "call".  */
2069   rtx tail_call_insns = NULL_RTX;
2070   /* Data type of the function.  */
2071   tree funtype;
2072   /* Declaration of the function being called,
2073      or 0 if the function is computed (not known by name).  */
2074   tree fndecl = 0;
2075   rtx insn;
2076   int try_tail_call = 1;
2077   int try_tail_recursion = 1;
2078   int pass;
2079
2080   /* Register in which non-BLKmode value will be returned,
2081      or 0 if no value or if value is BLKmode.  */
2082   rtx valreg;
2083   /* Address where we should return a BLKmode value;
2084      0 if value not BLKmode.  */
2085   rtx structure_value_addr = 0;
2086   /* Nonzero if that address is being passed by treating it as
2087      an extra, implicit first parameter.  Otherwise,
2088      it is passed by being copied directly into struct_value_rtx.  */
2089   int structure_value_addr_parm = 0;
2090   /* Size of aggregate value wanted, or zero if none wanted
2091      or if we are using the non-reentrant PCC calling convention
2092      or expecting the value in registers.  */
2093   HOST_WIDE_INT struct_value_size = 0;
2094   /* Nonzero if called function returns an aggregate in memory PCC style,
2095      by returning the address of where to find it.  */
2096   int pcc_struct_value = 0;
2097
2098   /* Number of actual parameters in this call, including struct value addr.  */
2099   int num_actuals;
2100   /* Number of named args.  Args after this are anonymous ones
2101      and they must all go on the stack.  */
2102   int n_named_args;
2103
2104   /* Vector of information about each argument.
2105      Arguments are numbered in the order they will be pushed,
2106      not the order they are written.  */
2107   struct arg_data *args;
2108
2109   /* Total size in bytes of all the stack-parms scanned so far.  */
2110   struct args_size args_size;
2111   struct args_size adjusted_args_size;
2112   /* Size of arguments before any adjustments (such as rounding).  */
2113   int unadjusted_args_size;
2114   /* Data on reg parms scanned so far.  */
2115   CUMULATIVE_ARGS args_so_far;
2116   /* Nonzero if a reg parm has been scanned.  */
2117   int reg_parm_seen;
2118   /* Nonzero if this is an indirect function call.  */
2119
2120   /* Nonzero if we must avoid push-insns in the args for this call.
2121      If stack space is allocated for register parameters, but not by the
2122      caller, then it is preallocated in the fixed part of the stack frame.
2123      So the entire argument block must then be preallocated (i.e., we
2124      ignore PUSH_ROUNDING in that case).  */
2125
2126   int must_preallocate = !PUSH_ARGS;
2127
2128   /* Size of the stack reserved for parameter registers.  */
2129   int reg_parm_stack_space = 0;
2130
2131   /* Address of space preallocated for stack parms
2132      (on machines that lack push insns), or 0 if space not preallocated.  */
2133   rtx argblock = 0;
2134
2135   /* Mask of ECF_ flags.  */
2136   int flags = 0;
2137   /* Nonzero if this is a call to an inline function.  */
2138   int is_integrable = 0;
2139 #ifdef REG_PARM_STACK_SPACE
2140   /* Define the boundary of the register parm stack space that needs to be
2141      save, if any.  */
2142   int low_to_save = -1, high_to_save;
2143   rtx save_area = 0;            /* Place that it is saved */
2144 #endif
2145
2146   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
2147   char *initial_stack_usage_map = stack_usage_map;
2148   int old_stack_arg_under_construction = 0;
2149
2150   rtx old_stack_level = 0;
2151   int old_pending_adj = 0;
2152   int old_inhibit_defer_pop = inhibit_defer_pop;
2153   int old_stack_allocated;
2154   rtx call_fusage;
2155   register tree p = TREE_OPERAND (exp, 0);
2156   register int i;
2157   /* The alignment of the stack, in bits.  */
2158   HOST_WIDE_INT preferred_stack_boundary;
2159   /* The alignment of the stack, in bytes.  */
2160   HOST_WIDE_INT preferred_unit_stack_boundary;
2161
2162   /* The value of the function call can be put in a hard register.  But
2163      if -fcheck-memory-usage, code which invokes functions (and thus
2164      damages some hard registers) can be inserted before using the value.
2165      So, target is always a pseudo-register in that case.  */
2166   if (current_function_check_memory_usage)
2167     target = 0;
2168
2169   /* See if this is "nothrow" function call.  */
2170   if (TREE_NOTHROW (exp))
2171     flags |= ECF_NOTHROW;
2172
2173   /* See if we can find a DECL-node for the actual function.
2174      As a result, decide whether this is a call to an integrable function.  */
2175
2176   fndecl = get_callee_fndecl (exp);
2177   if (fndecl)
2178     {
2179       if (!flag_no_inline
2180           && fndecl != current_function_decl
2181           && DECL_INLINE (fndecl)
2182           && DECL_SAVED_INSNS (fndecl)
2183           && DECL_SAVED_INSNS (fndecl)->inlinable)
2184         is_integrable = 1;
2185       else if (! TREE_ADDRESSABLE (fndecl))
2186         {
2187           /* In case this function later becomes inlinable,
2188              record that there was already a non-inline call to it.
2189
2190              Use abstraction instead of setting TREE_ADDRESSABLE
2191              directly.  */
2192           if (DECL_INLINE (fndecl) && warn_inline && !flag_no_inline
2193               && optimize > 0)
2194             {
2195               warning_with_decl (fndecl, "can't inline call to `%s'");
2196               warning ("called from here");
2197             }
2198           mark_addressable (fndecl);
2199         }
2200
2201       flags |= flags_from_decl_or_type (fndecl);
2202     }
2203
2204   /* If we don't have specific function to call, see if we have a
2205      attributes set in the type.  */
2206   else
2207     flags |= flags_from_decl_or_type (TREE_TYPE (TREE_TYPE (p)));
2208
2209   /* Mark if the function returns with the stack pointer depressed.  */
2210   if (TREE_CODE (TREE_TYPE (TREE_TYPE (p))) == FUNCTION_TYPE
2211       && TYPE_RETURNS_STACK_DEPRESSED (TREE_TYPE (TREE_TYPE (p))))
2212     {
2213       flags |= ECF_SP_DEPRESSED;
2214       flags &= ~(ECF_PURE | ECF_CONST);
2215     }
2216
2217 #ifdef REG_PARM_STACK_SPACE
2218 #ifdef MAYBE_REG_PARM_STACK_SPACE
2219   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
2220 #else
2221   reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
2222 #endif
2223 #endif
2224
2225 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2226   if (reg_parm_stack_space > 0 && PUSH_ARGS)
2227     must_preallocate = 1;
2228 #endif
2229
2230   /* Warn if this value is an aggregate type,
2231      regardless of which calling convention we are using for it.  */
2232   if (warn_aggregate_return && AGGREGATE_TYPE_P (TREE_TYPE (exp)))
2233     warning ("function call has aggregate value");
2234
2235   /* Set up a place to return a structure.  */
2236
2237   /* Cater to broken compilers.  */
2238   if (aggregate_value_p (exp))
2239     {
2240       /* This call returns a big structure.  */
2241       flags &= ~(ECF_CONST | ECF_PURE);
2242
2243 #ifdef PCC_STATIC_STRUCT_RETURN
2244       {
2245         pcc_struct_value = 1;
2246         /* Easier than making that case work right.  */
2247         if (is_integrable)
2248           {
2249             /* In case this is a static function, note that it has been
2250                used.  */
2251             if (! TREE_ADDRESSABLE (fndecl))
2252               mark_addressable (fndecl);
2253             is_integrable = 0;
2254           }
2255       }
2256 #else /* not PCC_STATIC_STRUCT_RETURN */
2257       {
2258         struct_value_size = int_size_in_bytes (TREE_TYPE (exp));
2259
2260         if (target && GET_CODE (target) == MEM)
2261           structure_value_addr = XEXP (target, 0);
2262         else
2263           {
2264             /* For variable-sized objects, we must be called with a target
2265                specified.  If we were to allocate space on the stack here,
2266                we would have no way of knowing when to free it.  */
2267             rtx d = assign_temp (TREE_TYPE (exp), 1, 1, 1);
2268
2269             mark_temp_addr_taken (d);
2270             structure_value_addr = XEXP (d, 0);
2271             target = 0;
2272           }
2273       }
2274 #endif /* not PCC_STATIC_STRUCT_RETURN */
2275     }
2276
2277   /* If called function is inline, try to integrate it.  */
2278
2279   if (is_integrable)
2280     {
2281       rtx temp = try_to_integrate (fndecl, actparms, target,
2282                                    ignore, TREE_TYPE (exp),
2283                                    structure_value_addr);
2284       if (temp != (rtx) (HOST_WIDE_INT) - 1)
2285         return temp;
2286     }
2287
2288   /* Figure out the amount to which the stack should be aligned.  */
2289 #ifdef PREFERRED_STACK_BOUNDARY
2290   preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
2291 #else
2292   preferred_stack_boundary = STACK_BOUNDARY;
2293 #endif
2294
2295   /* Operand 0 is a pointer-to-function; get the type of the function.  */
2296   funtype = TREE_TYPE (TREE_OPERAND (exp, 0));
2297   if (! POINTER_TYPE_P (funtype))
2298     abort ();
2299   funtype = TREE_TYPE (funtype);
2300
2301   /* See if this is a call to a function that can return more than once
2302      or a call to longjmp or malloc.  */
2303   flags |= special_function_p (fndecl, flags);
2304
2305   if (flags & ECF_MAY_BE_ALLOCA)
2306     current_function_calls_alloca = 1;
2307
2308   /* If struct_value_rtx is 0, it means pass the address
2309      as if it were an extra parameter.  */
2310   if (structure_value_addr && struct_value_rtx == 0)
2311     {
2312       /* If structure_value_addr is a REG other than
2313          virtual_outgoing_args_rtx, we can use always use it.  If it
2314          is not a REG, we must always copy it into a register.
2315          If it is virtual_outgoing_args_rtx, we must copy it to another
2316          register in some cases.  */
2317       rtx temp = (GET_CODE (structure_value_addr) != REG
2318                   || (ACCUMULATE_OUTGOING_ARGS
2319                       && stack_arg_under_construction
2320                       && structure_value_addr == virtual_outgoing_args_rtx)
2321                   ? copy_addr_to_reg (structure_value_addr)
2322                   : structure_value_addr);
2323
2324       actparms
2325         = tree_cons (error_mark_node,
2326                      make_tree (build_pointer_type (TREE_TYPE (funtype)),
2327                                 temp),
2328                      actparms);
2329       structure_value_addr_parm = 1;
2330     }
2331
2332   /* Count the arguments and set NUM_ACTUALS.  */
2333   for (p = actparms, num_actuals = 0; p; p = TREE_CHAIN (p))
2334     num_actuals++;
2335
2336   /* Compute number of named args.
2337      Normally, don't include the last named arg if anonymous args follow.
2338      We do include the last named arg if STRICT_ARGUMENT_NAMING is nonzero.
2339      (If no anonymous args follow, the result of list_length is actually
2340      one too large.  This is harmless.)
2341
2342      If PRETEND_OUTGOING_VARARGS_NAMED is set and STRICT_ARGUMENT_NAMING is
2343      zero, this machine will be able to place unnamed args that were
2344      passed in registers into the stack.  So treat all args as named.
2345      This allows the insns emitting for a specific argument list to be
2346      independent of the function declaration.
2347
2348      If PRETEND_OUTGOING_VARARGS_NAMED is not set, we do not have any
2349      reliable way to pass unnamed args in registers, so we must force
2350      them into memory.  */
2351
2352   if ((STRICT_ARGUMENT_NAMING
2353        || ! PRETEND_OUTGOING_VARARGS_NAMED)
2354       && TYPE_ARG_TYPES (funtype) != 0)
2355     n_named_args
2356       = (list_length (TYPE_ARG_TYPES (funtype))
2357          /* Don't include the last named arg.  */
2358          - (STRICT_ARGUMENT_NAMING ? 0 : 1)
2359          /* Count the struct value address, if it is passed as a parm.  */
2360          + structure_value_addr_parm);
2361   else
2362     /* If we know nothing, treat all args as named.  */
2363     n_named_args = num_actuals;
2364
2365   /* Start updating where the next arg would go.
2366
2367      On some machines (such as the PA) indirect calls have a different
2368      calling convention than normal calls.  The last argument in
2369      INIT_CUMULATIVE_ARGS tells the backend if this is an indirect call
2370      or not.  */
2371   INIT_CUMULATIVE_ARGS (args_so_far, funtype, NULL_RTX, (fndecl == 0));
2372
2373   /* Make a vector to hold all the information about each arg.  */
2374   args = (struct arg_data *) alloca (num_actuals * sizeof (struct arg_data));
2375   memset ((char *) args, 0, num_actuals * sizeof (struct arg_data));
2376
2377   /* Build up entries in the ARGS array, compute the size of the
2378      arguments into ARGS_SIZE, etc.  */
2379   initialize_argument_information (num_actuals, args, &args_size,
2380                                    n_named_args, actparms, fndecl,
2381                                    &args_so_far, reg_parm_stack_space,
2382                                    &old_stack_level, &old_pending_adj,
2383                                    &must_preallocate, &flags);
2384
2385   if (args_size.var)
2386     {
2387       /* If this function requires a variable-sized argument list, don't
2388          try to make a cse'able block for this call.  We may be able to
2389          do this eventually, but it is too complicated to keep track of
2390          what insns go in the cse'able block and which don't.   */
2391
2392       flags &= ~(ECF_CONST | ECF_PURE);
2393       must_preallocate = 1;
2394     }
2395
2396   /* Now make final decision about preallocating stack space.  */
2397   must_preallocate = finalize_must_preallocate (must_preallocate,
2398                                                 num_actuals, args,
2399                                                 &args_size);
2400
2401   /* If the structure value address will reference the stack pointer, we
2402      must stabilize it.  We don't need to do this if we know that we are
2403      not going to adjust the stack pointer in processing this call.  */
2404
2405   if (structure_value_addr
2406       && (reg_mentioned_p (virtual_stack_dynamic_rtx, structure_value_addr)
2407           || reg_mentioned_p (virtual_outgoing_args_rtx,
2408                               structure_value_addr))
2409       && (args_size.var
2410           || (!ACCUMULATE_OUTGOING_ARGS && args_size.constant)))
2411     structure_value_addr = copy_to_reg (structure_value_addr);
2412
2413   /* Tail calls can make things harder to debug, and we're traditionally
2414      pushed these optimizations into -O2.  Don't try if we're already
2415      expanding a call, as that means we're an argument.  Don't try if
2416      there's cleanups, as we know there's code to follow the call.
2417
2418      If rtx_equal_function_value_matters is false, that means we've
2419      finished with regular parsing.  Which means that some of the
2420      machinery we use to generate tail-calls is no longer in place.
2421      This is most often true of sjlj-exceptions, which we couldn't
2422      tail-call to anyway.  */
2423
2424   if (currently_expanding_call++ != 0
2425       || !flag_optimize_sibling_calls
2426       || !rtx_equal_function_value_matters
2427       || any_pending_cleanups (1)
2428       || args_size.var)
2429     try_tail_call = try_tail_recursion = 0;
2430
2431   /* Tail recursion fails, when we are not dealing with recursive calls.  */
2432   if (!try_tail_recursion
2433       || TREE_CODE (TREE_OPERAND (exp, 0)) != ADDR_EXPR
2434       || TREE_OPERAND (TREE_OPERAND (exp, 0), 0) != current_function_decl)
2435     try_tail_recursion = 0;
2436
2437   /*  Rest of purposes for tail call optimizations to fail.  */
2438   if (
2439 #ifdef HAVE_sibcall_epilogue
2440       !HAVE_sibcall_epilogue
2441 #else
2442       1
2443 #endif
2444       || !try_tail_call
2445       /* Doing sibling call optimization needs some work, since
2446          structure_value_addr can be allocated on the stack.
2447          It does not seem worth the effort since few optimizable
2448          sibling calls will return a structure.  */
2449       || structure_value_addr != NULL_RTX
2450       /* If the register holding the address is a callee saved
2451          register, then we lose.  We have no way to prevent that,
2452          so we only allow calls to named functions.  */
2453       /* ??? This could be done by having the insn constraints
2454          use a register class that is all call-clobbered.  Any
2455          reload insns generated to fix things up would appear
2456          before the sibcall_epilogue.  */
2457       || fndecl == NULL_TREE
2458       || (flags & (ECF_RETURNS_TWICE | ECF_LONGJMP))
2459       || TREE_THIS_VOLATILE (fndecl)
2460       || !FUNCTION_OK_FOR_SIBCALL (fndecl)
2461       /* If this function requires more stack slots than the current
2462          function, we cannot change it into a sibling call.  */
2463       || args_size.constant > current_function_args_size
2464       /* If the callee pops its own arguments, then it must pop exactly
2465          the same number of arguments as the current function.  */
2466       || RETURN_POPS_ARGS (fndecl, funtype, args_size.constant)
2467          != RETURN_POPS_ARGS (current_function_decl,
2468                               TREE_TYPE (current_function_decl),
2469                               current_function_args_size))
2470   try_tail_call = 0;
2471
2472   if (try_tail_call || try_tail_recursion)
2473     {
2474       int end, inc;
2475       actparms = NULL_TREE;
2476       /* Ok, we're going to give the tail call the old college try.
2477          This means we're going to evaluate the function arguments
2478          up to three times.  There are two degrees of badness we can
2479          encounter, those that can be unsaved and those that can't.
2480          (See unsafe_for_reeval commentary for details.)
2481
2482          Generate a new argument list.  Pass safe arguments through
2483          unchanged.  For the easy badness wrap them in UNSAVE_EXPRs.
2484          For hard badness, evaluate them now and put their resulting
2485          rtx in a temporary VAR_DECL.
2486
2487          initialize_argument_information has ordered the array for the
2488          order to be pushed, and we must remember this when reconstructing
2489          the original argument orde.  */
2490
2491       if (PUSH_ARGS_REVERSED)
2492         {
2493           inc = 1;
2494           i = 0;
2495           end = num_actuals;
2496         }
2497       else
2498         {
2499           inc = -1;
2500           i = num_actuals - 1;
2501           end = -1;
2502         }
2503
2504       for (; i != end; i += inc)
2505         {
2506           switch (unsafe_for_reeval (args[i].tree_value))
2507             {
2508             case 0: /* Safe.  */
2509               break;
2510
2511             case 1: /* Mildly unsafe.  */
2512               args[i].tree_value = unsave_expr (args[i].tree_value);
2513               break;
2514
2515             case 2: /* Wildly unsafe.  */
2516               {
2517                 tree var = build_decl (VAR_DECL, NULL_TREE,
2518                                        TREE_TYPE (args[i].tree_value));
2519                 SET_DECL_RTL (var,
2520                               expand_expr (args[i].tree_value, NULL_RTX,
2521                                            VOIDmode, EXPAND_NORMAL));
2522                 args[i].tree_value = var;
2523               }
2524               break;
2525
2526             default:
2527               abort ();
2528             }
2529           /* We need to build actparms for optimize_tail_recursion.  We can
2530              safely trash away TREE_PURPOSE, since it is unused by this
2531              function.  */
2532           if (try_tail_recursion)
2533             actparms = tree_cons (NULL_TREE, args[i].tree_value, actparms);
2534         }
2535       /* Expanding one of those dangerous arguments could have added
2536          cleanups, but otherwise give it a whirl.  */
2537       if (any_pending_cleanups (1))
2538         try_tail_call = try_tail_recursion = 0;
2539     }
2540
2541   /* Generate a tail recursion sequence when calling ourselves.  */
2542
2543   if (try_tail_recursion)
2544     {
2545       /* We want to emit any pending stack adjustments before the tail
2546          recursion "call".  That way we know any adjustment after the tail
2547          recursion call can be ignored if we indeed use the tail recursion
2548          call expansion.  */
2549       int save_pending_stack_adjust = pending_stack_adjust;
2550       int save_stack_pointer_delta = stack_pointer_delta;
2551
2552       /* Emit any queued insns now; otherwise they would end up in
2553          only one of the alternates.  */
2554       emit_queue ();
2555
2556       /* Use a new sequence to hold any RTL we generate.  We do not even
2557          know if we will use this RTL yet.  The final decision can not be
2558          made until after RTL generation for the entire function is
2559          complete.  */
2560       start_sequence ();
2561       /* If expanding any of the arguments creates cleanups, we can't
2562          do a tailcall.  So, we'll need to pop the pending cleanups
2563          list.  If, however, all goes well, and there are no cleanups
2564          then the call to expand_start_target_temps will have no
2565          effect.  */
2566       expand_start_target_temps ();
2567       if (optimize_tail_recursion (actparms, get_last_insn ()))
2568         {
2569           if (any_pending_cleanups (1))
2570             try_tail_call = try_tail_recursion = 0;
2571           else
2572             tail_recursion_insns = get_insns ();
2573         }
2574       expand_end_target_temps ();
2575       end_sequence ();
2576
2577       /* Restore the original pending stack adjustment for the sibling and
2578          normal call cases below.  */
2579       pending_stack_adjust = save_pending_stack_adjust;
2580       stack_pointer_delta = save_stack_pointer_delta;
2581     }
2582
2583   if (profile_arc_flag && (flags & ECF_FORK_OR_EXEC))
2584     {
2585       /* A fork duplicates the profile information, and an exec discards
2586          it.  We can't rely on fork/exec to be paired.  So write out the
2587          profile information we have gathered so far, and clear it.  */
2588       /* ??? When Linux's __clone is called with CLONE_VM set, profiling
2589          is subject to race conditions, just as with multithreaded
2590          programs.  */
2591
2592       emit_library_call (gen_rtx_SYMBOL_REF (Pmode, "__bb_fork_func"), 0,
2593                          VOIDmode, 0);
2594     }
2595
2596   /* Ensure current function's preferred stack boundary is at least
2597      what we need.  We don't have to increase alignment for recursive
2598      functions.  */
2599   if (cfun->preferred_stack_boundary < preferred_stack_boundary
2600       && fndecl != current_function_decl)
2601     cfun->preferred_stack_boundary = preferred_stack_boundary;
2602
2603   preferred_unit_stack_boundary = preferred_stack_boundary / BITS_PER_UNIT;
2604
2605   function_call_count++;
2606
2607   /* We want to make two insn chains; one for a sibling call, the other
2608      for a normal call.  We will select one of the two chains after
2609      initial RTL generation is complete.  */
2610   for (pass = 0; pass < 2; pass++)
2611     {
2612       int sibcall_failure = 0;
2613       /* We want to emit ay pending stack adjustments before the tail
2614          recursion "call".  That way we know any adjustment after the tail
2615          recursion call can be ignored if we indeed use the tail recursion
2616          call expansion.  */
2617       int save_pending_stack_adjust = 0;
2618       int save_stack_pointer_delta = 0;
2619       rtx insns;
2620       rtx before_call, next_arg_reg;
2621
2622       if (pass == 0)
2623         {
2624           if (! try_tail_call)
2625             continue;
2626
2627           /* Emit any queued insns now; otherwise they would end up in
2628              only one of the alternates.  */
2629           emit_queue ();
2630
2631           /* State variables we need to save and restore between
2632              iterations.  */
2633           save_pending_stack_adjust = pending_stack_adjust;
2634           save_stack_pointer_delta = stack_pointer_delta;
2635         }
2636       if (pass)
2637         flags &= ~ECF_SIBCALL;
2638       else
2639         flags |= ECF_SIBCALL;
2640
2641       /* Other state variables that we must reinitialize each time
2642          through the loop (that are not initialized by the loop itself).  */
2643       argblock = 0;
2644       call_fusage = 0;
2645
2646       /* Start a new sequence for the normal call case.
2647
2648          From this point on, if the sibling call fails, we want to set
2649          sibcall_failure instead of continuing the loop.  */
2650       start_sequence ();
2651
2652       if (pass == 0)
2653         {
2654           /* We know at this point that there are not currently any
2655              pending cleanups.  If, however, in the process of evaluating
2656              the arguments we were to create some, we'll need to be
2657              able to get rid of them.  */
2658           expand_start_target_temps ();
2659         }
2660
2661       /* Don't let pending stack adjusts add up to too much.
2662          Also, do all pending adjustments now if there is any chance
2663          this might be a call to alloca or if we are expanding a sibling
2664          call sequence.  */
2665       if (pending_stack_adjust >= 32
2666           || (pending_stack_adjust > 0 && (flags & ECF_MAY_BE_ALLOCA))
2667           || pass == 0)
2668         do_pending_stack_adjust ();
2669
2670       /* When calling a const function, we must pop the stack args right away,
2671          so that the pop is deleted or moved with the call.  */
2672       if (flags & (ECF_CONST | ECF_PURE))
2673         NO_DEFER_POP;
2674
2675       /* Push the temporary stack slot level so that we can free any
2676          temporaries we make.  */
2677       push_temp_slots ();
2678
2679 #ifdef FINAL_REG_PARM_STACK_SPACE
2680       reg_parm_stack_space = FINAL_REG_PARM_STACK_SPACE (args_size.constant,
2681                                                          args_size.var);
2682 #endif
2683       /* Precompute any arguments as needed.  */
2684       if (pass)
2685         precompute_arguments (flags, num_actuals, args);
2686
2687       /* Now we are about to start emitting insns that can be deleted
2688          if a libcall is deleted.  */
2689       if (flags & (ECF_CONST | ECF_PURE | ECF_MALLOC))
2690         start_sequence ();
2691
2692       adjusted_args_size = args_size;
2693       /* Compute the actual size of the argument block required.  The variable
2694          and constant sizes must be combined, the size may have to be rounded,
2695          and there may be a minimum required size.  When generating a sibcall
2696          pattern, do not round up, since we'll be re-using whatever space our
2697          caller provided.  */
2698       unadjusted_args_size
2699         = compute_argument_block_size (reg_parm_stack_space,
2700                                        &adjusted_args_size,
2701                                        (pass == 0 ? 0
2702                                         : preferred_stack_boundary));
2703
2704       old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
2705
2706       /* The argument block when performing a sibling call is the
2707          incoming argument block.  */
2708       if (pass == 0)
2709         {
2710           argblock = virtual_incoming_args_rtx;
2711           stored_args_map = sbitmap_alloc (args_size.constant);
2712           sbitmap_zero (stored_args_map);
2713         }
2714
2715       /* If we have no actual push instructions, or shouldn't use them,
2716          make space for all args right now.  */
2717       else if (adjusted_args_size.var != 0)
2718         {
2719           if (old_stack_level == 0)
2720             {
2721               emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
2722               old_pending_adj = pending_stack_adjust;
2723               pending_stack_adjust = 0;
2724               /* stack_arg_under_construction says whether a stack arg is
2725                  being constructed at the old stack level.  Pushing the stack
2726                  gets a clean outgoing argument block.  */
2727               old_stack_arg_under_construction = stack_arg_under_construction;
2728               stack_arg_under_construction = 0;
2729             }
2730           argblock = push_block (ARGS_SIZE_RTX (adjusted_args_size), 0, 0);
2731         }
2732       else
2733         {
2734           /* Note that we must go through the motions of allocating an argument
2735              block even if the size is zero because we may be storing args
2736              in the area reserved for register arguments, which may be part of
2737              the stack frame.  */
2738
2739           int needed = adjusted_args_size.constant;
2740
2741           /* Store the maximum argument space used.  It will be pushed by
2742              the prologue (if ACCUMULATE_OUTGOING_ARGS, or stack overflow
2743              checking).  */
2744
2745           if (needed > current_function_outgoing_args_size)
2746             current_function_outgoing_args_size = needed;
2747
2748           if (must_preallocate)
2749             {
2750               if (ACCUMULATE_OUTGOING_ARGS)
2751                 {
2752                   /* Since the stack pointer will never be pushed, it is
2753                      possible for the evaluation of a parm to clobber
2754                      something we have already written to the stack.
2755                      Since most function calls on RISC machines do not use
2756                      the stack, this is uncommon, but must work correctly.
2757
2758                      Therefore, we save any area of the stack that was already
2759                      written and that we are using.  Here we set up to do this
2760                      by making a new stack usage map from the old one.  The
2761                      actual save will be done by store_one_arg.
2762
2763                      Another approach might be to try to reorder the argument
2764                      evaluations to avoid this conflicting stack usage.  */
2765
2766 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2767                   /* Since we will be writing into the entire argument area,
2768                      the map must be allocated for its entire size, not just
2769                      the part that is the responsibility of the caller.  */
2770                   needed += reg_parm_stack_space;
2771 #endif
2772
2773 #ifdef ARGS_GROW_DOWNWARD
2774                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2775                                                      needed + 1);
2776 #else
2777                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2778                                                      needed);
2779 #endif
2780                   stack_usage_map
2781                     = (char *) alloca (highest_outgoing_arg_in_use);
2782
2783                   if (initial_highest_arg_in_use)
2784                     memcpy (stack_usage_map, initial_stack_usage_map,
2785                             initial_highest_arg_in_use);
2786
2787                   if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
2788                     memset (&stack_usage_map[initial_highest_arg_in_use], 0,
2789                            (highest_outgoing_arg_in_use
2790                             - initial_highest_arg_in_use));
2791                   needed = 0;
2792
2793                   /* The address of the outgoing argument list must not be
2794                      copied to a register here, because argblock would be left
2795                      pointing to the wrong place after the call to
2796                      allocate_dynamic_stack_space below.  */
2797
2798                   argblock = virtual_outgoing_args_rtx;
2799                 }
2800               else
2801                 {
2802                   if (inhibit_defer_pop == 0)
2803                     {
2804                       /* Try to reuse some or all of the pending_stack_adjust
2805                          to get this space.  */
2806                       needed
2807                         = (combine_pending_stack_adjustment_and_call
2808                            (unadjusted_args_size,
2809                             &adjusted_args_size,
2810                             preferred_unit_stack_boundary));
2811
2812                       /* combine_pending_stack_adjustment_and_call computes
2813                          an adjustment before the arguments are allocated.
2814                          Account for them and see whether or not the stack
2815                          needs to go up or down.  */
2816                       needed = unadjusted_args_size - needed;
2817
2818                       if (needed < 0)
2819                         {
2820                           /* We're releasing stack space.  */
2821                           /* ??? We can avoid any adjustment at all if we're
2822                              already aligned.  FIXME.  */
2823                           pending_stack_adjust = -needed;
2824                           do_pending_stack_adjust ();
2825                           needed = 0;
2826                         }
2827                       else
2828                         /* We need to allocate space.  We'll do that in
2829                            push_block below.  */
2830                         pending_stack_adjust = 0;
2831                     }
2832
2833                   /* Special case this because overhead of `push_block' in
2834                      this case is non-trivial.  */
2835                   if (needed == 0)
2836                     argblock = virtual_outgoing_args_rtx;
2837                   else
2838                     argblock = push_block (GEN_INT (needed), 0, 0);
2839
2840                   /* We only really need to call `copy_to_reg' in the case
2841                      where push insns are going to be used to pass ARGBLOCK
2842                      to a function call in ARGS.  In that case, the stack
2843                      pointer changes value from the allocation point to the
2844                      call point, and hence the value of
2845                      VIRTUAL_OUTGOING_ARGS_RTX changes as well.  But might
2846                      as well always do it.  */
2847                   argblock = copy_to_reg (argblock);
2848
2849                   /* The save/restore code in store_one_arg handles all
2850                      cases except one: a constructor call (including a C
2851                      function returning a BLKmode struct) to initialize
2852                      an argument.  */
2853                   if (stack_arg_under_construction)
2854                     {
2855 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2856                       rtx push_size = GEN_INT (reg_parm_stack_space
2857                                                + adjusted_args_size.constant);
2858 #else
2859                       rtx push_size = GEN_INT (adjusted_args_size.constant);
2860 #endif
2861                       if (old_stack_level == 0)
2862                         {
2863                           emit_stack_save (SAVE_BLOCK, &old_stack_level,
2864                                            NULL_RTX);
2865                           old_pending_adj = pending_stack_adjust;
2866                           pending_stack_adjust = 0;
2867                           /* stack_arg_under_construction says whether a stack
2868                              arg is being constructed at the old stack level.
2869                              Pushing the stack gets a clean outgoing argument
2870                              block.  */
2871                           old_stack_arg_under_construction
2872                             = stack_arg_under_construction;
2873                           stack_arg_under_construction = 0;
2874                           /* Make a new map for the new argument list.  */
2875                           stack_usage_map = (char *)
2876                             alloca (highest_outgoing_arg_in_use);
2877                           memset (stack_usage_map, 0, highest_outgoing_arg_in_use);
2878                           highest_outgoing_arg_in_use = 0;
2879                         }
2880                       allocate_dynamic_stack_space (push_size, NULL_RTX,
2881                                                     BITS_PER_UNIT);
2882                     }
2883                   /* If argument evaluation might modify the stack pointer,
2884                      copy the address of the argument list to a register.  */
2885                   for (i = 0; i < num_actuals; i++)
2886                     if (args[i].pass_on_stack)
2887                       {
2888                         argblock = copy_addr_to_reg (argblock);
2889                         break;
2890                       }
2891                 }
2892             }
2893         }
2894
2895       compute_argument_addresses (args, argblock, num_actuals);
2896
2897 #ifdef PREFERRED_STACK_BOUNDARY
2898       /* If we push args individually in reverse order, perform stack alignment
2899          before the first push (the last arg).  */
2900       if (PUSH_ARGS_REVERSED && argblock == 0
2901           && adjusted_args_size.constant != unadjusted_args_size)
2902         {
2903           /* When the stack adjustment is pending, we get better code
2904              by combining the adjustments.  */
2905           if (pending_stack_adjust
2906               && ! (flags & (ECF_CONST | ECF_PURE))
2907               && ! inhibit_defer_pop)
2908             {
2909               pending_stack_adjust
2910                 = (combine_pending_stack_adjustment_and_call
2911                    (unadjusted_args_size,
2912                     &adjusted_args_size,
2913                     preferred_unit_stack_boundary));
2914               do_pending_stack_adjust ();
2915             }
2916           else if (argblock == 0)
2917             anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2918                                         - unadjusted_args_size));
2919         }
2920       /* Now that the stack is properly aligned, pops can't safely
2921          be deferred during the evaluation of the arguments.  */
2922       NO_DEFER_POP;
2923 #endif
2924
2925       /* Don't try to defer pops if preallocating, not even from the first arg,
2926          since ARGBLOCK probably refers to the SP.  */
2927       if (argblock)
2928         NO_DEFER_POP;
2929
2930       funexp = rtx_for_function_call (fndecl, exp);
2931
2932       /* Figure out the register where the value, if any, will come back.  */
2933       valreg = 0;
2934       if (TYPE_MODE (TREE_TYPE (exp)) != VOIDmode
2935           && ! structure_value_addr)
2936         {
2937           if (pcc_struct_value)
2938             valreg = hard_function_value (build_pointer_type (TREE_TYPE (exp)),
2939                                           fndecl, (pass == 0));
2940           else
2941             valreg = hard_function_value (TREE_TYPE (exp), fndecl, (pass == 0));
2942         }
2943
2944       /* Precompute all register parameters.  It isn't safe to compute anything
2945          once we have started filling any specific hard regs.  */
2946       precompute_register_parameters (num_actuals, args, &reg_parm_seen);
2947
2948 #ifdef REG_PARM_STACK_SPACE
2949       /* Save the fixed argument area if it's part of the caller's frame and
2950          is clobbered by argument setup for this call.  */
2951       if (ACCUMULATE_OUTGOING_ARGS && pass)
2952         save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
2953                                               &low_to_save, &high_to_save);
2954 #endif
2955
2956       /* Now store (and compute if necessary) all non-register parms.
2957          These come before register parms, since they can require block-moves,
2958          which could clobber the registers used for register parms.
2959          Parms which have partial registers are not stored here,
2960          but we do preallocate space here if they want that.  */
2961
2962       for (i = 0; i < num_actuals; i++)
2963         if (args[i].reg == 0 || args[i].pass_on_stack)
2964           {
2965             rtx before_arg = get_last_insn ();
2966
2967             if (store_one_arg (&args[i], argblock, flags,
2968                                adjusted_args_size.var != 0,
2969                                reg_parm_stack_space)
2970                 || (pass == 0
2971                     && check_sibcall_argument_overlap (before_arg,
2972                                                        &args[i])))
2973               sibcall_failure = 1;
2974           }
2975
2976       /* If we have a parm that is passed in registers but not in memory
2977          and whose alignment does not permit a direct copy into registers,
2978          make a group of pseudos that correspond to each register that we
2979          will later fill.  */
2980       if (STRICT_ALIGNMENT)
2981         store_unaligned_arguments_into_pseudos (args, num_actuals);
2982
2983       /* Now store any partially-in-registers parm.
2984          This is the last place a block-move can happen.  */
2985       if (reg_parm_seen)
2986         for (i = 0; i < num_actuals; i++)
2987           if (args[i].partial != 0 && ! args[i].pass_on_stack)
2988             {
2989               rtx before_arg = get_last_insn ();
2990
2991               if (store_one_arg (&args[i], argblock, flags,
2992                                  adjusted_args_size.var != 0,
2993                                  reg_parm_stack_space)
2994                   || (pass == 0
2995                       && check_sibcall_argument_overlap (before_arg,
2996                                                          &args[i])))
2997                 sibcall_failure = 1;
2998             }
2999
3000 #ifdef PREFERRED_STACK_BOUNDARY
3001       /* If we pushed args in forward order, perform stack alignment
3002          after pushing the last arg.  */
3003       if (!PUSH_ARGS_REVERSED && argblock == 0)
3004         anti_adjust_stack (GEN_INT (adjusted_args_size.constant
3005                                     - unadjusted_args_size));
3006 #endif
3007
3008       /* If register arguments require space on the stack and stack space
3009          was not preallocated, allocate stack space here for arguments
3010          passed in registers.  */
3011 #ifdef OUTGOING_REG_PARM_STACK_SPACE
3012       if (!ACCUMULATE_OUTGOING_ARGS
3013           && must_preallocate == 0 && reg_parm_stack_space > 0)
3014         anti_adjust_stack (GEN_INT (reg_parm_stack_space));
3015 #endif
3016
3017       /* Pass the function the address in which to return a
3018          structure value.  */
3019       if (pass != 0 && structure_value_addr && ! structure_value_addr_parm)
3020         {
3021           emit_move_insn (struct_value_rtx,
3022                           force_reg (Pmode,
3023                                      force_operand (structure_value_addr,
3024                                                     NULL_RTX)));
3025
3026           /* Mark the memory for the aggregate as write-only.  */
3027           if (current_function_check_memory_usage)
3028             emit_library_call (chkr_set_right_libfunc, LCT_CONST_MAKE_BLOCK,
3029                                VOIDmode, 3,
3030                                structure_value_addr, ptr_mode,
3031                                GEN_INT (struct_value_size),
3032                                TYPE_MODE (sizetype),
3033                                GEN_INT (MEMORY_USE_WO),
3034                                TYPE_MODE (integer_type_node));
3035
3036           if (GET_CODE (struct_value_rtx) == REG)
3037             use_reg (&call_fusage, struct_value_rtx);
3038         }
3039
3040       funexp = prepare_call_address (funexp, fndecl, &call_fusage,
3041                                      reg_parm_seen);
3042
3043       load_register_parameters (args, num_actuals, &call_fusage, flags);
3044
3045       /* Perform postincrements before actually calling the function.  */
3046       emit_queue ();
3047
3048       /* Save a pointer to the last insn before the call, so that we can
3049          later safely search backwards to find the CALL_INSN.  */
3050       before_call = get_last_insn ();
3051
3052       /* Set up next argument register.  For sibling calls on machines
3053          with register windows this should be the incoming register.  */
3054 #ifdef FUNCTION_INCOMING_ARG
3055       if (pass == 0)
3056         next_arg_reg = FUNCTION_INCOMING_ARG (args_so_far, VOIDmode,
3057                                               void_type_node, 1);
3058       else
3059 #endif
3060         next_arg_reg = FUNCTION_ARG (args_so_far, VOIDmode,
3061                                      void_type_node, 1);
3062
3063       /* All arguments and registers used for the call must be set up by
3064          now!  */
3065
3066 #ifdef PREFERRED_STACK_BOUNDARY
3067       /* Stack must be properly aligned now.  */
3068       if (pass && stack_pointer_delta % preferred_unit_stack_boundary)
3069         abort ();
3070 #endif
3071
3072       /* Generate the actual call instruction.  */
3073       emit_call_1 (funexp, fndecl, funtype, unadjusted_args_size,
3074                    adjusted_args_size.constant, struct_value_size,
3075                    next_arg_reg, valreg, old_inhibit_defer_pop, call_fusage,
3076                    flags);
3077
3078       /* Verify that we've deallocated all the stack we used.  */
3079       if (pass
3080           && old_stack_allocated != stack_pointer_delta - pending_stack_adjust)
3081         abort ();
3082
3083       /* If call is cse'able, make appropriate pair of reg-notes around it.
3084          Test valreg so we don't crash; may safely ignore `const'
3085          if return type is void.  Disable for PARALLEL return values, because
3086          we have no way to move such values into a pseudo register.  */
3087       if (pass
3088           && (flags & (ECF_CONST | ECF_PURE))
3089           && valreg != 0 && GET_CODE (valreg) != PARALLEL)
3090         {
3091           rtx note = 0;
3092           rtx temp = gen_reg_rtx (GET_MODE (valreg));
3093           rtx insns;
3094
3095           /* Mark the return value as a pointer if needed.  */
3096           if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
3097             mark_reg_pointer (temp, TYPE_ALIGN (TREE_TYPE (TREE_TYPE (exp))));
3098
3099           /* Construct an "equal form" for the value which mentions all the
3100              arguments in order as well as the function name.  */
3101           for (i = 0; i < num_actuals; i++)
3102             note = gen_rtx_EXPR_LIST (VOIDmode, args[i].initial_value, note);
3103           note = gen_rtx_EXPR_LIST (VOIDmode, funexp, note);
3104
3105           insns = get_insns ();
3106           end_sequence ();
3107
3108           if (flags & ECF_PURE)
3109             note = gen_rtx_EXPR_LIST (VOIDmode,
3110                gen_rtx_USE (VOIDmode,
3111                             gen_rtx_MEM (BLKmode,
3112                                          gen_rtx_SCRATCH (VOIDmode))), note);
3113
3114           emit_libcall_block (insns, temp, valreg, note);
3115
3116           valreg = temp;
3117         }
3118       else if (flags & (ECF_CONST | ECF_PURE))
3119         {
3120           /* Otherwise, just write out the sequence without a note.  */
3121           rtx insns = get_insns ();
3122
3123           end_sequence ();
3124           emit_insns (insns);
3125         }
3126       else if (flags & ECF_MALLOC)
3127         {
3128           rtx temp = gen_reg_rtx (GET_MODE (valreg));
3129           rtx last, insns;
3130
3131           /* The return value from a malloc-like function is a pointer.  */
3132           if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
3133             mark_reg_pointer (temp, BIGGEST_ALIGNMENT);
3134
3135           emit_move_insn (temp, valreg);
3136
3137           /* The return value from a malloc-like function can not alias
3138              anything else.  */
3139           last = get_last_insn ();
3140           REG_NOTES (last) =
3141             gen_rtx_EXPR_LIST (REG_NOALIAS, temp, REG_NOTES (last));
3142
3143           /* Write out the sequence.  */
3144           insns = get_insns ();
3145           end_sequence ();
3146           emit_insns (insns);
3147           valreg = temp;
3148         }
3149
3150       /* For calls to `setjmp', etc., inform flow.c it should complain
3151          if nonvolatile values are live.  For functions that cannot return,
3152          inform flow that control does not fall through.  */
3153
3154       if ((flags & (ECF_RETURNS_TWICE | ECF_NORETURN | ECF_LONGJMP)) || pass == 0)
3155         {
3156           /* The barrier or NOTE_INSN_SETJMP note must be emitted
3157              immediately after the CALL_INSN.  Some ports emit more
3158              than just a CALL_INSN above, so we must search for it here.  */
3159
3160           rtx last = get_last_insn ();
3161           while (GET_CODE (last) != CALL_INSN)
3162             {
3163               last = PREV_INSN (last);
3164               /* There was no CALL_INSN?  */
3165               if (last == before_call)
3166                 abort ();
3167             }
3168
3169           if (flags & ECF_RETURNS_TWICE)
3170             {
3171               emit_note_after (NOTE_INSN_SETJMP, last);
3172               current_function_calls_setjmp = 1;
3173             }
3174           else
3175             emit_barrier_after (last);
3176         }
3177
3178       if (flags & ECF_LONGJMP)
3179         current_function_calls_longjmp = 1;
3180
3181       /* If this function is returning into a memory location marked as
3182          readonly, it means it is initializing that location.  But we normally
3183          treat functions as not clobbering such locations, so we need to
3184          specify that this one does.  */
3185       if (target != 0 && GET_CODE (target) == MEM
3186           && structure_value_addr != 0 && RTX_UNCHANGING_P (target))
3187         emit_insn (gen_rtx_CLOBBER (VOIDmode, target));
3188
3189       /* If value type not void, return an rtx for the value.  */
3190
3191       /* If there are cleanups to be called, don't use a hard reg as target.
3192          We need to double check this and see if it matters anymore.  */
3193       if (any_pending_cleanups (1))
3194         {
3195           if (target && REG_P (target)
3196               && REGNO (target) < FIRST_PSEUDO_REGISTER)
3197             target = 0;
3198           sibcall_failure = 1;
3199         }
3200
3201       if (TYPE_MODE (TREE_TYPE (exp)) == VOIDmode
3202           || ignore)
3203         {
3204           target = const0_rtx;
3205         }
3206       else if (structure_value_addr)
3207         {
3208           if (target == 0 || GET_CODE (target) != MEM)
3209             {
3210               target
3211                 = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
3212                                memory_address (TYPE_MODE (TREE_TYPE (exp)),
3213                                                structure_value_addr));
3214               set_mem_attributes (target, exp, 1);
3215             }
3216         }
3217       else if (pcc_struct_value)
3218         {
3219           /* This is the special C++ case where we need to
3220              know what the true target was.  We take care to
3221              never use this value more than once in one expression.  */
3222           target = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
3223                                 copy_to_reg (valreg));
3224           set_mem_attributes (target, exp, 1);
3225         }
3226       /* Handle calls that return values in multiple non-contiguous locations.
3227          The Irix 6 ABI has examples of this.  */
3228       else if (GET_CODE (valreg) == PARALLEL)
3229         {
3230           if (target == 0)
3231             {
3232               /* This will only be assigned once, so it can be readonly.  */
3233               tree nt = build_qualified_type (TREE_TYPE (exp),
3234                                               (TYPE_QUALS (TREE_TYPE (exp))
3235                                                | TYPE_QUAL_CONST));
3236
3237               target = assign_temp (nt, 0, 1, 1);
3238               preserve_temp_slots (target);
3239             }
3240
3241           if (! rtx_equal_p (target, valreg))
3242             emit_group_store (target, valreg,
3243                               int_size_in_bytes (TREE_TYPE (exp)),
3244                               TYPE_ALIGN (TREE_TYPE (exp)));
3245
3246           /* We can not support sibling calls for this case.  */
3247           sibcall_failure = 1;
3248         }
3249       else if (target
3250                && GET_MODE (target) == TYPE_MODE (TREE_TYPE (exp))
3251                && GET_MODE (target) == GET_MODE (valreg))
3252         {
3253           /* TARGET and VALREG cannot be equal at this point because the
3254              latter would not have REG_FUNCTION_VALUE_P true, while the
3255              former would if it were referring to the same register.
3256
3257              If they refer to the same register, this move will be a no-op,
3258              except when function inlining is being done.  */
3259           emit_move_insn (target, valreg);
3260         }
3261       else if (TYPE_MODE (TREE_TYPE (exp)) == BLKmode)
3262         {
3263           target = copy_blkmode_from_reg (target, valreg, TREE_TYPE (exp));
3264
3265           /* We can not support sibling calls for this case.  */
3266           sibcall_failure = 1;
3267         }
3268       else
3269         target = copy_to_reg (valreg);
3270
3271 #ifdef PROMOTE_FUNCTION_RETURN
3272       /* If we promoted this return value, make the proper SUBREG.  TARGET
3273          might be const0_rtx here, so be careful.  */
3274       if (GET_CODE (target) == REG
3275           && TYPE_MODE (TREE_TYPE (exp)) != BLKmode
3276           && GET_MODE (target) != TYPE_MODE (TREE_TYPE (exp)))
3277         {
3278           tree type = TREE_TYPE (exp);
3279           int unsignedp = TREE_UNSIGNED (type);
3280           int offset = 0;
3281
3282           /* If we don't promote as expected, something is wrong.  */
3283           if (GET_MODE (target)
3284               != promote_mode (type, TYPE_MODE (type), &unsignedp, 1))
3285             abort ();
3286
3287         if ((WORDS_BIG_ENDIAN || BYTES_BIG_ENDIAN)
3288             && GET_MODE_SIZE (GET_MODE (target))
3289                > GET_MODE_SIZE (TYPE_MODE (type)))
3290           {
3291             offset = GET_MODE_SIZE (GET_MODE (target))
3292                      - GET_MODE_SIZE (TYPE_MODE (type));
3293             if (! BYTES_BIG_ENDIAN)
3294               offset = (offset / UNITS_PER_WORD) * UNITS_PER_WORD;
3295             else if (! WORDS_BIG_ENDIAN)
3296               offset %= UNITS_PER_WORD;
3297           }
3298           target = gen_rtx_SUBREG (TYPE_MODE (type), target, offset);
3299           SUBREG_PROMOTED_VAR_P (target) = 1;
3300           SUBREG_PROMOTED_UNSIGNED_P (target) = unsignedp;
3301         }
3302 #endif
3303
3304       /* If size of args is variable or this was a constructor call for a stack
3305          argument, restore saved stack-pointer value.  */
3306
3307       if (old_stack_level && ! (flags & ECF_SP_DEPRESSED))
3308         {
3309           emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
3310           pending_stack_adjust = old_pending_adj;
3311           stack_arg_under_construction = old_stack_arg_under_construction;
3312           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3313           stack_usage_map = initial_stack_usage_map;
3314           sibcall_failure = 1;
3315         }
3316       else if (ACCUMULATE_OUTGOING_ARGS && pass)
3317         {
3318 #ifdef REG_PARM_STACK_SPACE
3319           if (save_area)
3320             {
3321               restore_fixed_argument_area (save_area, argblock,
3322                                            high_to_save, low_to_save);
3323             }
3324 #endif
3325
3326           /* If we saved any argument areas, restore them.  */
3327           for (i = 0; i < num_actuals; i++)
3328             if (args[i].save_area)
3329               {
3330                 enum machine_mode save_mode = GET_MODE (args[i].save_area);
3331                 rtx stack_area
3332                   = gen_rtx_MEM (save_mode,
3333                                  memory_address (save_mode,
3334                                                  XEXP (args[i].stack_slot, 0)));
3335
3336                 if (save_mode != BLKmode)
3337                   emit_move_insn (stack_area, args[i].save_area);
3338                 else
3339                   emit_block_move (stack_area,
3340                                    validize_mem (args[i].save_area),
3341                                    GEN_INT (args[i].size.constant),
3342                                    PARM_BOUNDARY);
3343               }
3344
3345           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3346           stack_usage_map = initial_stack_usage_map;
3347         }
3348
3349       /* If this was alloca, record the new stack level for nonlocal gotos.
3350          Check for the handler slots since we might not have a save area
3351          for non-local gotos.  */
3352
3353       if ((flags & ECF_MAY_BE_ALLOCA) && nonlocal_goto_handler_slots != 0)
3354         emit_stack_save (SAVE_NONLOCAL, &nonlocal_goto_stack_level, NULL_RTX);
3355
3356       pop_temp_slots ();
3357
3358       /* Free up storage we no longer need.  */
3359       for (i = 0; i < num_actuals; ++i)
3360         if (args[i].aligned_regs)
3361           free (args[i].aligned_regs);
3362
3363       if (pass == 0)
3364         {
3365           /* Undo the fake expand_start_target_temps we did earlier.  If
3366              there had been any cleanups created, we've already set
3367              sibcall_failure.  */
3368           expand_end_target_temps ();
3369         }
3370
3371       insns = get_insns ();
3372       end_sequence ();
3373
3374       if (pass == 0)
3375         {
3376           tail_call_insns = insns;
3377
3378           /* Restore the pending stack adjustment now that we have
3379              finished generating the sibling call sequence.  */
3380
3381           pending_stack_adjust = save_pending_stack_adjust;
3382           stack_pointer_delta = save_stack_pointer_delta;
3383
3384           /* Prepare arg structure for next iteration.  */
3385           for (i = 0; i < num_actuals; i++)
3386             {
3387               args[i].value = 0;
3388               args[i].aligned_regs = 0;
3389               args[i].stack = 0;
3390             }
3391
3392           sbitmap_free (stored_args_map);
3393         }
3394       else
3395         normal_call_insns = insns;
3396
3397       /* If something prevents making this a sibling call,
3398          zero out the sequence.  */
3399       if (sibcall_failure)
3400         tail_call_insns = NULL_RTX;
3401     }
3402
3403   /* The function optimize_sibling_and_tail_recursive_calls doesn't
3404      handle CALL_PLACEHOLDERs inside other CALL_PLACEHOLDERs.  This
3405      can happen if the arguments to this function call an inline
3406      function who's expansion contains another CALL_PLACEHOLDER.
3407
3408      If there are any C_Ps in any of these sequences, replace them
3409      with their normal call.  */
3410
3411   for (insn = normal_call_insns; insn; insn = NEXT_INSN (insn))
3412     if (GET_CODE (insn) == CALL_INSN
3413         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3414       replace_call_placeholder (insn, sibcall_use_normal);
3415
3416   for (insn = tail_call_insns; insn; insn = NEXT_INSN (insn))
3417     if (GET_CODE (insn) == CALL_INSN
3418         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3419       replace_call_placeholder (insn, sibcall_use_normal);
3420
3421   for (insn = tail_recursion_insns; insn; insn = NEXT_INSN (insn))
3422     if (GET_CODE (insn) == CALL_INSN
3423         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3424       replace_call_placeholder (insn, sibcall_use_normal);
3425
3426   /* If this was a potential tail recursion site, then emit a
3427      CALL_PLACEHOLDER with the normal and the tail recursion streams.
3428      One of them will be selected later.  */
3429   if (tail_recursion_insns || tail_call_insns)
3430     {
3431       /* The tail recursion label must be kept around.  We could expose
3432          its use in the CALL_PLACEHOLDER, but that creates unwanted edges
3433          and makes determining true tail recursion sites difficult.
3434
3435          So we set LABEL_PRESERVE_P here, then clear it when we select
3436          one of the call sequences after rtl generation is complete.  */
3437       if (tail_recursion_insns)
3438         LABEL_PRESERVE_P (tail_recursion_label) = 1;
3439       emit_call_insn (gen_rtx_CALL_PLACEHOLDER (VOIDmode, normal_call_insns,
3440                                                 tail_call_insns,
3441                                                 tail_recursion_insns,
3442                                                 tail_recursion_label));
3443     }
3444   else
3445     emit_insns (normal_call_insns);
3446
3447   currently_expanding_call--;
3448
3449   /* If this function returns with the stack pointer depressed, ensure
3450      this block saves and restores the stack pointer, show it was
3451      changed, and adjust for any outgoing arg space.  */
3452   if (flags & ECF_SP_DEPRESSED)
3453     {
3454       clear_pending_stack_adjust ();
3455       emit_insn (gen_rtx (CLOBBER, VOIDmode, stack_pointer_rtx));
3456       emit_move_insn (virtual_stack_dynamic_rtx, stack_pointer_rtx);
3457       save_stack_pointer ();
3458     }
3459
3460   return target;
3461 }
3462 \f
3463 /* Output a library call to function FUN (a SYMBOL_REF rtx).
3464    The RETVAL parameter specifies whether return value needs to be saved, other
3465    parameters are documented in the emit_library_call function bellow.  */
3466 static rtx
3467 emit_library_call_value_1 (retval, orgfun, value, fn_type, outmode, nargs, p)
3468      int retval;
3469      rtx orgfun;
3470      rtx value;
3471      enum libcall_type fn_type;
3472      enum machine_mode outmode;
3473      int nargs;
3474      va_list p;
3475 {
3476   /* Total size in bytes of all the stack-parms scanned so far.  */
3477   struct args_size args_size;
3478   /* Size of arguments before any adjustments (such as rounding).  */
3479   struct args_size original_args_size;
3480   register int argnum;
3481   rtx fun;
3482   int inc;
3483   int count;
3484   struct args_size alignment_pad;
3485   rtx argblock = 0;
3486   CUMULATIVE_ARGS args_so_far;
3487   struct arg
3488   {
3489     rtx value;
3490     enum machine_mode mode;
3491     rtx reg;
3492     int partial;
3493     struct args_size offset;
3494     struct args_size size;
3495     rtx save_area;
3496   };
3497   struct arg *argvec;
3498   int old_inhibit_defer_pop = inhibit_defer_pop;
3499   rtx call_fusage = 0;
3500   rtx mem_value = 0;
3501   rtx valreg;
3502   int pcc_struct_value = 0;
3503   int struct_value_size = 0;
3504   int flags;
3505   int reg_parm_stack_space = 0;
3506   int needed;
3507   rtx before_call;
3508
3509 #ifdef REG_PARM_STACK_SPACE
3510   /* Define the boundary of the register parm stack space that needs to be
3511      save, if any.  */
3512   int low_to_save = -1, high_to_save = 0;
3513   rtx save_area = 0;            /* Place that it is saved.  */
3514 #endif
3515
3516   /* Size of the stack reserved for parameter registers.  */
3517   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
3518   char *initial_stack_usage_map = stack_usage_map;
3519
3520 #ifdef REG_PARM_STACK_SPACE
3521 #ifdef MAYBE_REG_PARM_STACK_SPACE
3522   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
3523 #else
3524   reg_parm_stack_space = REG_PARM_STACK_SPACE ((tree) 0);
3525 #endif
3526 #endif
3527
3528   /* By default, library functions can not throw.  */
3529   flags = ECF_NOTHROW;
3530
3531   switch (fn_type)
3532     {
3533     case LCT_NORMAL:
3534     case LCT_CONST:
3535     case LCT_PURE:
3536       /* Nothing to do here.  */
3537       break;
3538     case LCT_CONST_MAKE_BLOCK:
3539       flags |= ECF_CONST;
3540       break;
3541     case LCT_PURE_MAKE_BLOCK:
3542       flags |= ECF_PURE;
3543       break;
3544     case LCT_NORETURN:
3545       flags |= ECF_NORETURN;
3546       break;
3547     case LCT_THROW:
3548       flags = ECF_NORETURN;
3549       break;
3550     }
3551   fun = orgfun;
3552
3553 #ifdef PREFERRED_STACK_BOUNDARY
3554   /* Ensure current function's preferred stack boundary is at least
3555      what we need.  */
3556   if (cfun->preferred_stack_boundary < PREFERRED_STACK_BOUNDARY)
3557     cfun->preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
3558 #endif
3559
3560   /* If this kind of value comes back in memory,
3561      decide where in memory it should come back.  */
3562   if (outmode != VOIDmode && aggregate_value_p (type_for_mode (outmode, 0)))
3563     {
3564 #ifdef PCC_STATIC_STRUCT_RETURN
3565       rtx pointer_reg
3566         = hard_function_value (build_pointer_type (type_for_mode (outmode, 0)),
3567                                0, 0);
3568       mem_value = gen_rtx_MEM (outmode, pointer_reg);
3569       pcc_struct_value = 1;
3570       if (value == 0)
3571         value = gen_reg_rtx (outmode);
3572 #else /* not PCC_STATIC_STRUCT_RETURN */
3573       struct_value_size = GET_MODE_SIZE (outmode);
3574       if (value != 0 && GET_CODE (value) == MEM)
3575         mem_value = value;
3576       else
3577         mem_value = assign_temp (type_for_mode (outmode, 0), 0, 1, 1);
3578 #endif
3579
3580       /* This call returns a big structure.  */
3581       flags &= ~(ECF_CONST | ECF_PURE);
3582     }
3583
3584   /* ??? Unfinished: must pass the memory address as an argument.  */
3585
3586   /* Copy all the libcall-arguments out of the varargs data
3587      and into a vector ARGVEC.
3588
3589      Compute how to pass each argument.  We only support a very small subset
3590      of the full argument passing conventions to limit complexity here since
3591      library functions shouldn't have many args.  */
3592
3593   argvec = (struct arg *) alloca ((nargs + 1) * sizeof (struct arg));
3594   memset ((char *) argvec, 0, (nargs + 1) * sizeof (struct arg));
3595
3596 #ifdef INIT_CUMULATIVE_LIBCALL_ARGS
3597   INIT_CUMULATIVE_LIBCALL_ARGS (args_so_far, outmode, fun);
3598 #else
3599   INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun, 0);
3600 #endif
3601
3602   args_size.constant = 0;
3603   args_size.var = 0;
3604
3605   count = 0;
3606
3607   /* Now we are about to start emitting insns that can be deleted
3608      if a libcall is deleted.  */
3609   if (flags & (ECF_CONST | ECF_PURE))
3610     start_sequence ();
3611
3612   push_temp_slots ();
3613
3614   /* If there's a structure value address to be passed,
3615      either pass it in the special place, or pass it as an extra argument.  */
3616   if (mem_value && struct_value_rtx == 0 && ! pcc_struct_value)
3617     {
3618       rtx addr = XEXP (mem_value, 0);
3619       nargs++;
3620
3621       /* Make sure it is a reasonable operand for a move or push insn.  */
3622       if (GET_CODE (addr) != REG && GET_CODE (addr) != MEM
3623           && ! (CONSTANT_P (addr) && LEGITIMATE_CONSTANT_P (addr)))
3624         addr = force_operand (addr, NULL_RTX);
3625
3626       argvec[count].value = addr;
3627       argvec[count].mode = Pmode;
3628       argvec[count].partial = 0;
3629
3630       argvec[count].reg = FUNCTION_ARG (args_so_far, Pmode, NULL_TREE, 1);
3631 #ifdef FUNCTION_ARG_PARTIAL_NREGS
3632       if (FUNCTION_ARG_PARTIAL_NREGS (args_so_far, Pmode, NULL_TREE, 1))
3633         abort ();
3634 #endif
3635
3636       locate_and_pad_parm (Pmode, NULL_TREE,
3637 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3638                            1,
3639 #else
3640                            argvec[count].reg != 0,
3641 #endif
3642                            NULL_TREE, &args_size, &argvec[count].offset,
3643                            &argvec[count].size, &alignment_pad);
3644
3645       if (argvec[count].reg == 0 || argvec[count].partial != 0
3646           || reg_parm_stack_space > 0)
3647         args_size.constant += argvec[count].size.constant;
3648
3649       FUNCTION_ARG_ADVANCE (args_so_far, Pmode, (tree) 0, 1);
3650
3651       count++;
3652     }
3653
3654   for (; count < nargs; count++)
3655     {
3656       rtx val = va_arg (p, rtx);
3657       enum machine_mode mode = va_arg (p, enum machine_mode);
3658
3659       /* We cannot convert the arg value to the mode the library wants here;
3660          must do it earlier where we know the signedness of the arg.  */
3661       if (mode == BLKmode
3662           || (GET_MODE (val) != mode && GET_MODE (val) != VOIDmode))
3663         abort ();
3664
3665       /* On some machines, there's no way to pass a float to a library fcn.
3666          Pass it as a double instead.  */
3667 #ifdef LIBGCC_NEEDS_DOUBLE
3668       if (LIBGCC_NEEDS_DOUBLE && mode == SFmode)
3669         val = convert_modes (DFmode, SFmode, val, 0), mode = DFmode;
3670 #endif
3671
3672       /* There's no need to call protect_from_queue, because
3673          either emit_move_insn or emit_push_insn will do that.  */
3674
3675       /* Make sure it is a reasonable operand for a move or push insn.  */
3676       if (GET_CODE (val) != REG && GET_CODE (val) != MEM
3677           && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
3678         val = force_operand (val, NULL_RTX);
3679
3680 #ifdef FUNCTION_ARG_PASS_BY_REFERENCE
3681       if (FUNCTION_ARG_PASS_BY_REFERENCE (args_so_far, mode, NULL_TREE, 1))
3682         {
3683           rtx slot;
3684           int must_copy = 1
3685 #ifdef FUNCTION_ARG_CALLEE_COPIES         
3686             && ! FUNCTION_ARG_CALLEE_COPIES (args_so_far, mode,
3687                                              NULL_TREE, 1)
3688 #endif
3689             ;
3690
3691           if (GET_MODE (val) == MEM && ! must_copy)
3692             slot = val;
3693           else if (must_copy)
3694             {
3695               slot = assign_temp (type_for_mode (mode, 0), 0, 1, 1);
3696               emit_move_insn (slot, val);
3697             }
3698           else
3699             {
3700               tree type = type_for_mode (mode, 0);
3701
3702               slot = gen_rtx_MEM (mode,
3703                                   expand_expr (build1 (ADDR_EXPR,
3704                                                        build_pointer_type
3705                                                        (type),
3706                                                        make_tree (type, val)),
3707                                                NULL_RTX, VOIDmode, 0));
3708             }
3709
3710           call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3711                                            gen_rtx_USE (VOIDmode, slot),
3712                                            call_fusage);
3713           if (must_copy)
3714             call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3715                                              gen_rtx_CLOBBER (VOIDmode,
3716                                                               slot),
3717                                              call_fusage);
3718
3719           mode = Pmode;
3720           val = force_operand (XEXP (slot, 0), NULL_RTX);
3721         }
3722 #endif
3723
3724       argvec[count].value = val;
3725       argvec[count].mode = mode;
3726
3727       argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
3728
3729 #ifdef FUNCTION_ARG_PARTIAL_NREGS
3730       argvec[count].partial
3731         = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, mode, NULL_TREE, 1);
3732 #else
3733       argvec[count].partial = 0;
3734 #endif
3735
3736       locate_and_pad_parm (mode, NULL_TREE,
3737 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3738                            1,
3739 #else
3740                            argvec[count].reg != 0,
3741 #endif
3742                            NULL_TREE, &args_size, &argvec[count].offset,
3743                            &argvec[count].size, &alignment_pad);
3744
3745       if (argvec[count].size.var)
3746         abort ();
3747
3748       if (reg_parm_stack_space == 0 && argvec[count].partial)
3749         argvec[count].size.constant -= argvec[count].partial * UNITS_PER_WORD;
3750
3751       if (argvec[count].reg == 0 || argvec[count].partial != 0
3752           || reg_parm_stack_space > 0)
3753         args_size.constant += argvec[count].size.constant;
3754
3755       FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree) 0, 1);
3756     }
3757
3758 #ifdef FINAL_REG_PARM_STACK_SPACE
3759   reg_parm_stack_space = FINAL_REG_PARM_STACK_SPACE (args_size.constant,
3760                                                      args_size.var);
3761 #endif
3762   /* If this machine requires an external definition for library
3763      functions, write one out.  */
3764   assemble_external_libcall (fun);
3765
3766   original_args_size = args_size;
3767 #ifdef PREFERRED_STACK_BOUNDARY
3768   args_size.constant = (((args_size.constant
3769                           + stack_pointer_delta
3770                           + STACK_BYTES - 1)
3771                           / STACK_BYTES
3772                           * STACK_BYTES)
3773                          - stack_pointer_delta);
3774 #endif
3775
3776   args_size.constant = MAX (args_size.constant,
3777                             reg_parm_stack_space);
3778
3779 #ifndef OUTGOING_REG_PARM_STACK_SPACE
3780   args_size.constant -= reg_parm_stack_space;
3781 #endif
3782
3783   if (args_size.constant > current_function_outgoing_args_size)
3784     current_function_outgoing_args_size = args_size.constant;
3785
3786   if (ACCUMULATE_OUTGOING_ARGS)
3787     {
3788       /* Since the stack pointer will never be pushed, it is possible for
3789          the evaluation of a parm to clobber something we have already
3790          written to the stack.  Since most function calls on RISC machines
3791          do not use the stack, this is uncommon, but must work correctly.
3792
3793          Therefore, we save any area of the stack that was already written
3794          and that we are using.  Here we set up to do this by making a new
3795          stack usage map from the old one.
3796
3797          Another approach might be to try to reorder the argument
3798          evaluations to avoid this conflicting stack usage.  */
3799
3800       needed = args_size.constant;
3801
3802 #ifndef OUTGOING_REG_PARM_STACK_SPACE
3803       /* Since we will be writing into the entire argument area, the
3804          map must be allocated for its entire size, not just the part that
3805          is the responsibility of the caller.  */
3806       needed += reg_parm_stack_space;
3807 #endif
3808
3809 #ifdef ARGS_GROW_DOWNWARD
3810       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3811                                          needed + 1);
3812 #else
3813       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3814                                          needed);
3815 #endif
3816       stack_usage_map = (char *) alloca (highest_outgoing_arg_in_use);
3817
3818       if (initial_highest_arg_in_use)
3819         memcpy (stack_usage_map, initial_stack_usage_map,
3820                 initial_highest_arg_in_use);
3821
3822       if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
3823         memset (&stack_usage_map[initial_highest_arg_in_use], 0,
3824                highest_outgoing_arg_in_use - initial_highest_arg_in_use);
3825       needed = 0;
3826
3827       /* We must be careful to use virtual regs before they're instantiated,
3828          and real regs afterwards.  Loop optimization, for example, can create
3829          new libcalls after we've instantiated the virtual regs, and if we
3830          use virtuals anyway, they won't match the rtl patterns.  */
3831
3832       if (virtuals_instantiated)
3833         argblock = plus_constant (stack_pointer_rtx, STACK_POINTER_OFFSET);
3834       else
3835         argblock = virtual_outgoing_args_rtx;
3836     }
3837   else
3838     {
3839       if (!PUSH_ARGS)
3840         argblock = push_block (GEN_INT (args_size.constant), 0, 0);
3841     }
3842
3843 #ifdef PREFERRED_STACK_BOUNDARY
3844   /* If we push args individually in reverse order, perform stack alignment
3845      before the first push (the last arg).  */
3846   if (argblock == 0 && PUSH_ARGS_REVERSED)
3847     anti_adjust_stack (GEN_INT (args_size.constant
3848                                 - original_args_size.constant));
3849 #endif
3850
3851   if (PUSH_ARGS_REVERSED)
3852     {
3853       inc = -1;
3854       argnum = nargs - 1;
3855     }
3856   else
3857     {
3858       inc = 1;
3859       argnum = 0;
3860     }
3861
3862 #ifdef REG_PARM_STACK_SPACE
3863   if (ACCUMULATE_OUTGOING_ARGS)
3864     {
3865       /* The argument list is the property of the called routine and it
3866          may clobber it.  If the fixed area has been used for previous
3867          parameters, we must save and restore it.
3868
3869          Here we compute the boundary of the that needs to be saved, if any.  */
3870
3871 #ifdef ARGS_GROW_DOWNWARD
3872       for (count = 0; count < reg_parm_stack_space + 1; count++)
3873 #else
3874       for (count = 0; count < reg_parm_stack_space; count++)
3875 #endif
3876         {
3877           if (count >= highest_outgoing_arg_in_use
3878               || stack_usage_map[count] == 0)
3879             continue;
3880
3881           if (low_to_save == -1)
3882             low_to_save = count;
3883
3884           high_to_save = count;
3885         }
3886
3887       if (low_to_save >= 0)
3888         {
3889           int num_to_save = high_to_save - low_to_save + 1;
3890           enum machine_mode save_mode
3891             = mode_for_size (num_to_save * BITS_PER_UNIT, MODE_INT, 1);
3892           rtx stack_area;
3893
3894           /* If we don't have the required alignment, must do this in BLKmode.  */
3895           if ((low_to_save & (MIN (GET_MODE_SIZE (save_mode),
3896                                    BIGGEST_ALIGNMENT / UNITS_PER_WORD) - 1)))
3897             save_mode = BLKmode;
3898
3899 #ifdef ARGS_GROW_DOWNWARD
3900           stack_area = gen_rtx_MEM (save_mode,
3901                                     memory_address (save_mode,
3902                                                     plus_constant (argblock,
3903                                                                    -high_to_save)));
3904 #else
3905           stack_area = gen_rtx_MEM (save_mode,
3906                                     memory_address (save_mode,
3907                                                     plus_constant (argblock,
3908                                                                    low_to_save)));
3909 #endif
3910           if (save_mode == BLKmode)
3911             {
3912               save_area = assign_stack_temp (BLKmode, num_to_save, 0);
3913               emit_block_move (validize_mem (save_area), stack_area,
3914                                GEN_INT (num_to_save), PARM_BOUNDARY);
3915             }
3916           else
3917             {
3918               save_area = gen_reg_rtx (save_mode);
3919               emit_move_insn (save_area, stack_area);
3920             }
3921         }
3922     }
3923 #endif
3924
3925   /* Push the args that need to be pushed.  */
3926
3927   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
3928      are to be pushed.  */
3929   for (count = 0; count < nargs; count++, argnum += inc)
3930     {
3931       register enum machine_mode mode = argvec[argnum].mode;
3932       register rtx val = argvec[argnum].value;
3933       rtx reg = argvec[argnum].reg;
3934       int partial = argvec[argnum].partial;
3935       int lower_bound = 0, upper_bound = 0, i;
3936
3937       if (! (reg != 0 && partial == 0))
3938         {
3939           if (ACCUMULATE_OUTGOING_ARGS)
3940             {
3941               /* If this is being stored into a pre-allocated, fixed-size,
3942                  stack area, save any previous data at that location.  */
3943
3944 #ifdef ARGS_GROW_DOWNWARD
3945               /* stack_slot is negative, but we want to index stack_usage_map
3946                  with positive values.  */
3947               upper_bound = -argvec[argnum].offset.constant + 1;
3948               lower_bound = upper_bound - argvec[argnum].size.constant;
3949 #else
3950               lower_bound = argvec[argnum].offset.constant;
3951               upper_bound = lower_bound + argvec[argnum].size.constant;
3952 #endif
3953
3954               for (i = lower_bound; i < upper_bound; i++)
3955                 if (stack_usage_map[i]
3956                     /* Don't store things in the fixed argument area at this
3957                        point; it has already been saved.  */
3958                     && i > reg_parm_stack_space)
3959                   break;
3960
3961               if (i != upper_bound)
3962                 {
3963                   /* We need to make a save area.  See what mode we can make
3964                      it.  */
3965                   enum machine_mode save_mode
3966                     = mode_for_size (argvec[argnum].size.constant
3967                                      * BITS_PER_UNIT,
3968                                      MODE_INT, 1);
3969                   rtx stack_area
3970                     = gen_rtx_MEM
3971                       (save_mode,
3972                        memory_address
3973                        (save_mode,
3974                         plus_constant (argblock,
3975                                        argvec[argnum].offset.constant)));
3976                   argvec[argnum].save_area = gen_reg_rtx (save_mode);
3977
3978                   emit_move_insn (argvec[argnum].save_area, stack_area);
3979                 }
3980             }
3981
3982           emit_push_insn (val, mode, NULL_TREE, NULL_RTX, 0, partial, reg, 0,
3983                           argblock, GEN_INT (argvec[argnum].offset.constant),
3984                           reg_parm_stack_space, ARGS_SIZE_RTX (alignment_pad));
3985
3986           /* Now mark the segment we just used.  */
3987           if (ACCUMULATE_OUTGOING_ARGS)
3988             for (i = lower_bound; i < upper_bound; i++)
3989               stack_usage_map[i] = 1;
3990
3991           NO_DEFER_POP;
3992         }
3993     }
3994
3995 #ifdef PREFERRED_STACK_BOUNDARY
3996   /* If we pushed args in forward order, perform stack alignment
3997      after pushing the last arg.  */
3998   if (argblock == 0 && !PUSH_ARGS_REVERSED)
3999     anti_adjust_stack (GEN_INT (args_size.constant
4000                                 - original_args_size.constant));
4001 #endif
4002
4003   if (PUSH_ARGS_REVERSED)
4004     argnum = nargs - 1;
4005   else
4006     argnum = 0;
4007
4008   fun = prepare_call_address (fun, NULL_TREE, &call_fusage, 0);
4009
4010   /* Now load any reg parms into their regs.  */
4011
4012   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
4013      are to be pushed.  */
4014   for (count = 0; count < nargs; count++, argnum += inc)
4015     {
4016       register rtx val = argvec[argnum].value;
4017       rtx reg = argvec[argnum].reg;
4018       int partial = argvec[argnum].partial;
4019
4020       /* Handle calls that pass values in multiple non-contiguous
4021          locations.  The PA64 has examples of this for library calls.  */
4022       if (reg != 0 && GET_CODE (reg) == PARALLEL)
4023         emit_group_load (reg, val,
4024                          GET_MODE_SIZE (GET_MODE (val)),
4025                          GET_MODE_ALIGNMENT (GET_MODE (val)));
4026       else if (reg != 0 && partial == 0)
4027         emit_move_insn (reg, val);
4028
4029       NO_DEFER_POP;
4030     }
4031
4032   /* Any regs containing parms remain in use through the call.  */
4033   for (count = 0; count < nargs; count++)
4034     {
4035       rtx reg = argvec[count].reg;
4036       if (reg != 0 && GET_CODE (reg) == PARALLEL)
4037         use_group_regs (&call_fusage, reg);
4038       else if (reg != 0)
4039         use_reg (&call_fusage, reg);
4040     }
4041
4042   /* Pass the function the address in which to return a structure value.  */
4043   if (mem_value != 0 && struct_value_rtx != 0 && ! pcc_struct_value)
4044     {
4045       emit_move_insn (struct_value_rtx,
4046                       force_reg (Pmode,
4047                                  force_operand (XEXP (mem_value, 0),
4048                                                 NULL_RTX)));
4049       if (GET_CODE (struct_value_rtx) == REG)
4050         use_reg (&call_fusage, struct_value_rtx);
4051     }
4052
4053   /* Don't allow popping to be deferred, since then
4054      cse'ing of library calls could delete a call and leave the pop.  */
4055   NO_DEFER_POP;
4056   valreg = (mem_value == 0 && outmode != VOIDmode
4057             ? hard_libcall_value (outmode) : NULL_RTX);
4058
4059 #ifdef PREFERRED_STACK_BOUNDARY
4060   /* Stack must be properly aligned now.  */
4061   if (stack_pointer_delta & (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT - 1))
4062     abort ();
4063 #endif
4064
4065   before_call = get_last_insn ();
4066
4067   /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
4068      will set inhibit_defer_pop to that value.  */
4069   /* The return type is needed to decide how many bytes the function pops.
4070      Signedness plays no role in that, so for simplicity, we pretend it's
4071      always signed.  We also assume that the list of arguments passed has
4072      no impact, so we pretend it is unknown.  */
4073
4074   emit_call_1 (fun,
4075                get_identifier (XSTR (orgfun, 0)),
4076                build_function_type (outmode == VOIDmode ? void_type_node
4077                                     : type_for_mode (outmode, 0), NULL_TREE),
4078                original_args_size.constant, args_size.constant,
4079                struct_value_size,
4080                FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
4081                valreg,
4082                old_inhibit_defer_pop + 1, call_fusage, flags);
4083
4084   /* For calls to `setjmp', etc., inform flow.c it should complain
4085      if nonvolatile values are live.  For functions that cannot return,
4086      inform flow that control does not fall through.  */
4087
4088   if (flags & (ECF_RETURNS_TWICE | ECF_NORETURN | ECF_LONGJMP))
4089     {
4090       /* The barrier or NOTE_INSN_SETJMP note must be emitted
4091          immediately after the CALL_INSN.  Some ports emit more than
4092          just a CALL_INSN above, so we must search for it here.  */
4093
4094       rtx last = get_last_insn ();
4095       while (GET_CODE (last) != CALL_INSN)
4096         {
4097           last = PREV_INSN (last);
4098           /* There was no CALL_INSN?  */
4099           if (last == before_call)
4100             abort ();
4101         }
4102
4103       if (flags & ECF_RETURNS_TWICE)
4104         {
4105           emit_note_after (NOTE_INSN_SETJMP, last);
4106           current_function_calls_setjmp = 1;
4107         }
4108       else
4109         emit_barrier_after (last);
4110     }
4111
4112   /* Now restore inhibit_defer_pop to its actual original value.  */
4113   OK_DEFER_POP;
4114
4115   /* If call is cse'able, make appropriate pair of reg-notes around it.
4116      Test valreg so we don't crash; may safely ignore `const'
4117      if return type is void.  Disable for PARALLEL return values, because
4118      we have no way to move such values into a pseudo register.  */
4119   if ((flags & (ECF_CONST | ECF_PURE))
4120       && valreg != 0 && GET_CODE (valreg) != PARALLEL)
4121     {
4122       rtx note = 0;
4123       rtx temp = gen_reg_rtx (GET_MODE (valreg));
4124       rtx insns;
4125       int i;
4126
4127       /* Construct an "equal form" for the value which mentions all the
4128          arguments in order as well as the function name.  */
4129       for (i = 0; i < nargs; i++)
4130         note = gen_rtx_EXPR_LIST (VOIDmode, argvec[i].value, note);
4131       note = gen_rtx_EXPR_LIST (VOIDmode, fun, note);
4132
4133       insns = get_insns ();
4134       end_sequence ();
4135
4136       if (flags & ECF_PURE)
4137         note = gen_rtx_EXPR_LIST (VOIDmode,
4138            gen_rtx_USE (VOIDmode,
4139                         gen_rtx_MEM (BLKmode,
4140                                      gen_rtx_SCRATCH (VOIDmode))), note);
4141
4142       emit_libcall_block (insns, temp, valreg, note);
4143
4144       valreg = temp;
4145     }
4146   else if (flags & (ECF_CONST | ECF_PURE))
4147     {
4148       /* Otherwise, just write out the sequence without a note.  */
4149       rtx insns = get_insns ();
4150
4151       end_sequence ();
4152       emit_insns (insns);
4153     }
4154   pop_temp_slots ();
4155
4156   /* Copy the value to the right place.  */
4157   if (outmode != VOIDmode && retval)
4158     {
4159       if (mem_value)
4160         {
4161           if (value == 0)
4162             value = mem_value;
4163           if (value != mem_value)
4164             emit_move_insn (value, mem_value);
4165         }
4166       else if (value != 0)
4167         emit_move_insn (value, hard_libcall_value (outmode));
4168       else
4169         value = hard_libcall_value (outmode);
4170     }
4171
4172   if (ACCUMULATE_OUTGOING_ARGS)
4173     {
4174 #ifdef REG_PARM_STACK_SPACE
4175       if (save_area)
4176         {
4177           enum machine_mode save_mode = GET_MODE (save_area);
4178 #ifdef ARGS_GROW_DOWNWARD
4179           rtx stack_area
4180             = gen_rtx_MEM (save_mode,
4181                            memory_address (save_mode,
4182                                            plus_constant (argblock,
4183                                                           - high_to_save)));
4184 #else
4185           rtx stack_area
4186             = gen_rtx_MEM (save_mode,
4187                            memory_address (save_mode,
4188                                            plus_constant (argblock, low_to_save)));
4189 #endif
4190           if (save_mode != BLKmode)
4191             emit_move_insn (stack_area, save_area);
4192           else
4193             emit_block_move (stack_area, validize_mem (save_area),
4194                              GEN_INT (high_to_save - low_to_save + 1),
4195                              PARM_BOUNDARY);
4196         }
4197 #endif
4198
4199       /* If we saved any argument areas, restore them.  */
4200       for (count = 0; count < nargs; count++)
4201         if (argvec[count].save_area)
4202           {
4203             enum machine_mode save_mode = GET_MODE (argvec[count].save_area);
4204             rtx stack_area
4205               = gen_rtx_MEM (save_mode,
4206                              memory_address
4207                              (save_mode,
4208                               plus_constant (argblock,
4209                                              argvec[count].offset.constant)));
4210
4211             emit_move_insn (stack_area, argvec[count].save_area);
4212           }
4213
4214       highest_outgoing_arg_in_use = initial_highest_arg_in_use;
4215       stack_usage_map = initial_stack_usage_map;
4216     }
4217
4218   return value;
4219
4220 }
4221 \f
4222 /* Output a library call to function FUN (a SYMBOL_REF rtx)
4223    (emitting the queue unless NO_QUEUE is nonzero),
4224    for a value of mode OUTMODE,
4225    with NARGS different arguments, passed as alternating rtx values
4226    and machine_modes to convert them to.
4227    The rtx values should have been passed through protect_from_queue already.
4228
4229    FN_TYPE will is zero for `normal' calls, one for `const' calls, wich
4230    which will be enclosed in REG_LIBCALL/REG_RETVAL notes and two for `pure'
4231    calls, that are handled like `const' calls with extra
4232    (use (memory (scratch)).  */
4233
4234 void
4235 emit_library_call VPARAMS((rtx orgfun, enum libcall_type fn_type,
4236                            enum machine_mode outmode, int nargs, ...))
4237 {
4238 #ifndef ANSI_PROTOTYPES
4239   rtx orgfun;
4240   int fn_type;
4241   enum machine_mode outmode;
4242   int nargs;
4243 #endif
4244   va_list p;
4245
4246   VA_START (p, nargs);
4247
4248 #ifndef ANSI_PROTOTYPES
4249   orgfun = va_arg (p, rtx);
4250   fn_type = va_arg (p, int);
4251   outmode = va_arg (p, enum machine_mode);
4252   nargs = va_arg (p, int);
4253 #endif
4254
4255   emit_library_call_value_1 (0, orgfun, NULL_RTX, fn_type, outmode, nargs, p);
4256
4257   va_end (p);
4258 }
4259 \f
4260 /* Like emit_library_call except that an extra argument, VALUE,
4261    comes second and says where to store the result.
4262    (If VALUE is zero, this function chooses a convenient way
4263    to return the value.
4264
4265    This function returns an rtx for where the value is to be found.
4266    If VALUE is nonzero, VALUE is returned.  */
4267
4268 rtx
4269 emit_library_call_value VPARAMS((rtx orgfun, rtx value,
4270                                  enum libcall_type fn_type,
4271                                  enum machine_mode outmode, int nargs, ...))
4272 {
4273 #ifndef ANSI_PROTOTYPES
4274   rtx orgfun;
4275   rtx value;
4276   int fn_type;
4277   enum machine_mode outmode;
4278   int nargs;
4279 #endif
4280   va_list p;
4281
4282   VA_START (p, nargs);
4283
4284 #ifndef ANSI_PROTOTYPES
4285   orgfun = va_arg (p, rtx);
4286   value = va_arg (p, rtx);
4287   fn_type = va_arg (p, int);
4288   outmode = va_arg (p, enum machine_mode);
4289   nargs = va_arg (p, int);
4290 #endif
4291
4292   value = emit_library_call_value_1 (1, orgfun, value, fn_type, outmode, nargs, p);
4293
4294   va_end (p);
4295
4296   return value;
4297 }
4298 \f
4299 #if 0
4300 /* Return an rtx which represents a suitable home on the stack
4301    given TYPE, the type of the argument looking for a home.
4302    This is called only for BLKmode arguments.
4303
4304    SIZE is the size needed for this target.
4305    ARGS_ADDR is the address of the bottom of the argument block for this call.
4306    OFFSET describes this parameter's offset into ARGS_ADDR.  It is meaningless
4307    if this machine uses push insns.  */
4308
4309 static rtx
4310 target_for_arg (type, size, args_addr, offset)
4311      tree type;
4312      rtx size;
4313      rtx args_addr;
4314      struct args_size offset;
4315 {
4316   rtx target;
4317   rtx offset_rtx = ARGS_SIZE_RTX (offset);
4318
4319   /* We do not call memory_address if possible,
4320      because we want to address as close to the stack
4321      as possible.  For non-variable sized arguments,
4322      this will be stack-pointer relative addressing.  */
4323   if (GET_CODE (offset_rtx) == CONST_INT)
4324     target = plus_constant (args_addr, INTVAL (offset_rtx));
4325   else
4326     {
4327       /* I have no idea how to guarantee that this
4328          will work in the presence of register parameters.  */
4329       target = gen_rtx_PLUS (Pmode, args_addr, offset_rtx);
4330       target = memory_address (QImode, target);
4331     }
4332
4333   return gen_rtx_MEM (BLKmode, target);
4334 }
4335 #endif
4336 \f
4337 /* Store a single argument for a function call
4338    into the register or memory area where it must be passed.
4339    *ARG describes the argument value and where to pass it.
4340
4341    ARGBLOCK is the address of the stack-block for all the arguments,
4342    or 0 on a machine where arguments are pushed individually.
4343
4344    MAY_BE_ALLOCA nonzero says this could be a call to `alloca'
4345    so must be careful about how the stack is used.
4346
4347    VARIABLE_SIZE nonzero says that this was a variable-sized outgoing
4348    argument stack.  This is used if ACCUMULATE_OUTGOING_ARGS to indicate
4349    that we need not worry about saving and restoring the stack.
4350
4351    FNDECL is the declaration of the function we are calling.
4352
4353    Return non-zero if this arg should cause sibcall failure,
4354    zero otherwise.  */
4355
4356 static int
4357 store_one_arg (arg, argblock, flags, variable_size, reg_parm_stack_space)
4358      struct arg_data *arg;
4359      rtx argblock;
4360      int flags;
4361      int variable_size ATTRIBUTE_UNUSED;
4362      int reg_parm_stack_space;
4363 {
4364   register tree pval = arg->tree_value;
4365   rtx reg = 0;
4366   int partial = 0;
4367   int used = 0;
4368   int i, lower_bound = 0, upper_bound = 0;
4369   int sibcall_failure = 0;
4370
4371   if (TREE_CODE (pval) == ERROR_MARK)
4372     return 1;
4373
4374   /* Push a new temporary level for any temporaries we make for
4375      this argument.  */
4376   push_temp_slots ();
4377
4378   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL))
4379     {
4380       /* If this is being stored into a pre-allocated, fixed-size, stack area,
4381          save any previous data at that location.  */
4382       if (argblock && ! variable_size && arg->stack)
4383         {
4384 #ifdef ARGS_GROW_DOWNWARD
4385           /* stack_slot is negative, but we want to index stack_usage_map
4386              with positive values.  */
4387           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4388             upper_bound = -INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1)) + 1;
4389           else
4390             upper_bound = 0;
4391
4392           lower_bound = upper_bound - arg->size.constant;
4393 #else
4394           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4395             lower_bound = INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1));
4396           else
4397             lower_bound = 0;
4398
4399           upper_bound = lower_bound + arg->size.constant;
4400 #endif
4401
4402           for (i = lower_bound; i < upper_bound; i++)
4403             if (stack_usage_map[i]
4404                 /* Don't store things in the fixed argument area at this point;
4405                    it has already been saved.  */
4406                 && i > reg_parm_stack_space)
4407               break;
4408
4409           if (i != upper_bound)
4410             {
4411               /* We need to make a save area.  See what mode we can make it.  */
4412               enum machine_mode save_mode
4413                 = mode_for_size (arg->size.constant * BITS_PER_UNIT, MODE_INT, 1);
4414               rtx stack_area
4415                 = gen_rtx_MEM (save_mode,
4416                                memory_address (save_mode,
4417                                                XEXP (arg->stack_slot, 0)));
4418
4419               if (save_mode == BLKmode)
4420                 {
4421                   tree ot = TREE_TYPE (arg->tree_value);
4422                   tree nt = build_qualified_type (ot, (TYPE_QUALS (ot)
4423                                                        | TYPE_QUAL_CONST));
4424
4425                   arg->save_area = assign_temp (nt, 0, 1, 1);
4426                   preserve_temp_slots (arg->save_area);
4427                   emit_block_move (validize_mem (arg->save_area), stack_area,
4428                                    expr_size (arg->tree_value),
4429                                    MIN (PARM_BOUNDARY, TYPE_ALIGN (nt)));
4430                 }
4431               else
4432                 {
4433                   arg->save_area = gen_reg_rtx (save_mode);
4434                   emit_move_insn (arg->save_area, stack_area);
4435                 }
4436             }
4437         }
4438       /* Now that we have saved any slots that will be overwritten by this
4439          store, mark all slots this store will use.  We must do this before
4440          we actually expand the argument since the expansion itself may
4441          trigger library calls which might need to use the same stack slot.  */
4442       if (argblock && ! variable_size && arg->stack)
4443         for (i = lower_bound; i < upper_bound; i++)
4444           stack_usage_map[i] = 1;
4445     }
4446
4447   /* If this isn't going to be placed on both the stack and in registers,
4448      set up the register and number of words.  */
4449   if (! arg->pass_on_stack)
4450     reg = arg->reg, partial = arg->partial;
4451
4452   if (reg != 0 && partial == 0)
4453     /* Being passed entirely in a register.  We shouldn't be called in
4454        this case.   */
4455     abort ();
4456
4457   /* If this arg needs special alignment, don't load the registers
4458      here.  */
4459   if (arg->n_aligned_regs != 0)
4460     reg = 0;
4461
4462   /* If this is being passed partially in a register, we can't evaluate
4463      it directly into its stack slot.  Otherwise, we can.  */
4464   if (arg->value == 0)
4465     {
4466       /* stack_arg_under_construction is nonzero if a function argument is
4467          being evaluated directly into the outgoing argument list and
4468          expand_call must take special action to preserve the argument list
4469          if it is called recursively.
4470
4471          For scalar function arguments stack_usage_map is sufficient to
4472          determine which stack slots must be saved and restored.  Scalar
4473          arguments in general have pass_on_stack == 0.
4474
4475          If this argument is initialized by a function which takes the
4476          address of the argument (a C++ constructor or a C function
4477          returning a BLKmode structure), then stack_usage_map is
4478          insufficient and expand_call must push the stack around the
4479          function call.  Such arguments have pass_on_stack == 1.
4480
4481          Note that it is always safe to set stack_arg_under_construction,
4482          but this generates suboptimal code if set when not needed.  */
4483
4484       if (arg->pass_on_stack)
4485         stack_arg_under_construction++;
4486
4487       arg->value = expand_expr (pval,
4488                                 (partial
4489                                  || TYPE_MODE (TREE_TYPE (pval)) != arg->mode)
4490                                 ? NULL_RTX : arg->stack,
4491                                 VOIDmode, 0);
4492
4493       /* If we are promoting object (or for any other reason) the mode
4494          doesn't agree, convert the mode.  */
4495
4496       if (arg->mode != TYPE_MODE (TREE_TYPE (pval)))
4497         arg->value = convert_modes (arg->mode, TYPE_MODE (TREE_TYPE (pval)),
4498                                     arg->value, arg->unsignedp);
4499
4500       if (arg->pass_on_stack)
4501         stack_arg_under_construction--;
4502     }
4503
4504   /* Don't allow anything left on stack from computation
4505      of argument to alloca.  */
4506   if (flags & ECF_MAY_BE_ALLOCA)
4507     do_pending_stack_adjust ();
4508
4509   if (arg->value == arg->stack)
4510     {
4511       /* If the value is already in the stack slot, we are done.  */
4512       if (current_function_check_memory_usage && GET_CODE (arg->stack) == MEM)
4513         {
4514           emit_library_call (chkr_set_right_libfunc, LCT_CONST_MAKE_BLOCK,
4515                              VOIDmode, 3, XEXP (arg->stack, 0), Pmode,
4516                              ARGS_SIZE_RTX (arg->size),
4517                              TYPE_MODE (sizetype),
4518                              GEN_INT (MEMORY_USE_RW),
4519                              TYPE_MODE (integer_type_node));
4520         }
4521     }
4522   else if (arg->mode != BLKmode)
4523     {
4524       register int size;
4525
4526       /* Argument is a scalar, not entirely passed in registers.
4527          (If part is passed in registers, arg->partial says how much
4528          and emit_push_insn will take care of putting it there.)
4529
4530          Push it, and if its size is less than the
4531          amount of space allocated to it,
4532          also bump stack pointer by the additional space.
4533          Note that in C the default argument promotions
4534          will prevent such mismatches.  */
4535
4536       size = GET_MODE_SIZE (arg->mode);
4537       /* Compute how much space the push instruction will push.
4538          On many machines, pushing a byte will advance the stack
4539          pointer by a halfword.  */
4540 #ifdef PUSH_ROUNDING
4541       size = PUSH_ROUNDING (size);
4542 #endif
4543       used = size;
4544
4545       /* Compute how much space the argument should get:
4546          round up to a multiple of the alignment for arguments.  */
4547       if (none != FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)))
4548         used = (((size + PARM_BOUNDARY / BITS_PER_UNIT - 1)
4549                  / (PARM_BOUNDARY / BITS_PER_UNIT))
4550                 * (PARM_BOUNDARY / BITS_PER_UNIT));
4551
4552       /* This isn't already where we want it on the stack, so put it there.
4553          This can either be done with push or copy insns.  */
4554       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), NULL_RTX, 0,
4555                       partial, reg, used - size, argblock,
4556                       ARGS_SIZE_RTX (arg->offset), reg_parm_stack_space,
4557                       ARGS_SIZE_RTX (arg->alignment_pad));
4558     }
4559   else
4560     {
4561       /* BLKmode, at least partly to be pushed.  */
4562
4563       register int excess;
4564       rtx size_rtx;
4565
4566       /* Pushing a nonscalar.
4567          If part is passed in registers, PARTIAL says how much
4568          and emit_push_insn will take care of putting it there.  */
4569
4570       /* Round its size up to a multiple
4571          of the allocation unit for arguments.  */
4572
4573       if (arg->size.var != 0)
4574         {
4575           excess = 0;
4576           size_rtx = ARGS_SIZE_RTX (arg->size);
4577         }
4578       else
4579         {
4580           /* PUSH_ROUNDING has no effect on us, because
4581              emit_push_insn for BLKmode is careful to avoid it.  */
4582           excess = (arg->size.constant - int_size_in_bytes (TREE_TYPE (pval))
4583                     + partial * UNITS_PER_WORD);
4584           size_rtx = expr_size (pval);
4585         }
4586
4587       if ((flags & ECF_SIBCALL) && GET_CODE (arg->value) == MEM)
4588         {
4589           /* emit_push_insn might not work properly if arg->value and
4590              argblock + arg->offset areas overlap.  */
4591           rtx x = arg->value;
4592           int i = 0;
4593
4594           if (XEXP (x, 0) == current_function_internal_arg_pointer
4595               || (GET_CODE (XEXP (x, 0)) == PLUS
4596                   && XEXP (XEXP (x, 0), 0) ==
4597                      current_function_internal_arg_pointer
4598                   && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT))
4599             {
4600               if (XEXP (x, 0) != current_function_internal_arg_pointer)
4601                 i = INTVAL (XEXP (XEXP (x, 0), 1));
4602
4603               /* expand_call should ensure this */
4604               if (arg->offset.var || GET_CODE (size_rtx) != CONST_INT)
4605                 abort ();
4606
4607               if (arg->offset.constant > i)
4608                 {
4609                   if (arg->offset.constant < i + INTVAL (size_rtx))
4610                     sibcall_failure = 1;
4611                 }
4612               else if (arg->offset.constant < i)
4613                 {
4614                   if (i < arg->offset.constant + INTVAL (size_rtx))
4615                     sibcall_failure = 1;
4616                 }
4617             }
4618         }
4619
4620       /*  If parm is passed both in stack and in register and offset is 
4621           greater than reg_parm_stack_space, split the offset. */
4622       if (arg->reg && arg->pass_on_stack)
4623         {
4624           if (arg->offset.constant < reg_parm_stack_space && arg->offset.var)
4625             error ("variable offset is passed paritially in stack and in reg");
4626           else if (arg->offset.constant < reg_parm_stack_space && arg->size.var)
4627             error ("variable size is passed partially in stack and in reg");
4628           else if (arg->offset.constant < reg_parm_stack_space 
4629               && ((arg->offset.constant + arg->size.constant) 
4630                    > reg_parm_stack_space))
4631           {
4632             rtx size_rtx1 = GEN_INT (reg_parm_stack_space - arg->offset.constant);
4633             emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx1,
4634                             TYPE_ALIGN (TREE_TYPE (pval)), partial, reg,
4635                             excess, argblock, ARGS_SIZE_RTX (arg->offset),
4636                             reg_parm_stack_space,
4637                             ARGS_SIZE_RTX (arg->alignment_pad));
4638
4639             size_rtx = GEN_INT (INTVAL(size_rtx) - reg_parm_stack_space);
4640           }
4641         }
4642         
4643
4644       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx,
4645                       TYPE_ALIGN (TREE_TYPE (pval)), partial, reg, excess,
4646                       argblock, ARGS_SIZE_RTX (arg->offset),
4647                       reg_parm_stack_space,
4648                       ARGS_SIZE_RTX (arg->alignment_pad));
4649     }
4650
4651   /* Unless this is a partially-in-register argument, the argument is now
4652      in the stack.
4653
4654      ??? Note that this can change arg->value from arg->stack to
4655      arg->stack_slot and it matters when they are not the same.
4656      It isn't totally clear that this is correct in all cases.  */
4657   if (partial == 0)
4658     arg->value = arg->stack_slot;
4659
4660   /* Once we have pushed something, pops can't safely
4661      be deferred during the rest of the arguments.  */
4662   NO_DEFER_POP;
4663
4664   /* ANSI doesn't require a sequence point here,
4665      but PCC has one, so this will avoid some problems.  */
4666   emit_queue ();
4667
4668   /* Free any temporary slots made in processing this argument.  Show
4669      that we might have taken the address of something and pushed that
4670      as an operand.  */
4671   preserve_temp_slots (NULL_RTX);
4672   free_temp_slots ();
4673   pop_temp_slots ();
4674
4675   return sibcall_failure;
4676 }