OSDN Git Service

2007-02-13 Seongbae Park <seongbae.park@gmail.com>
[pf3gnuchains/gcc-fork.git] / gcc / calls.c
1 /* Convert function calls to rtl insns, for GNU C compiler.
2    Copyright (C) 1989, 1992, 1993, 1994, 1995, 1996, 1997, 1998,
3    1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007
4    Free Software Foundation, Inc.
5
6 This file is part of GCC.
7
8 GCC is free software; you can redistribute it and/or modify it under
9 the terms of the GNU General Public License as published by the Free
10 Software Foundation; either version 2, or (at your option) any later
11 version.
12
13 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
14 WARRANTY; without even the implied warranty of MERCHANTABILITY or
15 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
16 for more details.
17
18 You should have received a copy of the GNU General Public License
19 along with GCC; see the file COPYING.  If not, write to the Free
20 Software Foundation, 51 Franklin Street, Fifth Floor, Boston, MA
21 02110-1301, USA.  */
22
23 #include "config.h"
24 #include "system.h"
25 #include "coretypes.h"
26 #include "tm.h"
27 #include "rtl.h"
28 #include "tree.h"
29 #include "flags.h"
30 #include "expr.h"
31 #include "optabs.h"
32 #include "libfuncs.h"
33 #include "function.h"
34 #include "regs.h"
35 #include "toplev.h"
36 #include "output.h"
37 #include "tm_p.h"
38 #include "timevar.h"
39 #include "sbitmap.h"
40 #include "langhooks.h"
41 #include "target.h"
42 #include "cgraph.h"
43 #include "except.h"
44
45 /* Like PREFERRED_STACK_BOUNDARY but in units of bytes, not bits.  */
46 #define STACK_BYTES (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT)
47
48 /* Data structure and subroutines used within expand_call.  */
49
50 struct arg_data
51 {
52   /* Tree node for this argument.  */
53   tree tree_value;
54   /* Mode for value; TYPE_MODE unless promoted.  */
55   enum machine_mode mode;
56   /* Current RTL value for argument, or 0 if it isn't precomputed.  */
57   rtx value;
58   /* Initially-compute RTL value for argument; only for const functions.  */
59   rtx initial_value;
60   /* Register to pass this argument in, 0 if passed on stack, or an
61      PARALLEL if the arg is to be copied into multiple non-contiguous
62      registers.  */
63   rtx reg;
64   /* Register to pass this argument in when generating tail call sequence.
65      This is not the same register as for normal calls on machines with
66      register windows.  */
67   rtx tail_call_reg;
68   /* If REG is a PARALLEL, this is a copy of VALUE pulled into the correct
69      form for emit_group_move.  */
70   rtx parallel_value;
71   /* If REG was promoted from the actual mode of the argument expression,
72      indicates whether the promotion is sign- or zero-extended.  */
73   int unsignedp;
74   /* Number of bytes to put in registers.  0 means put the whole arg
75      in registers.  Also 0 if not passed in registers.  */
76   int partial;
77   /* Nonzero if argument must be passed on stack.
78      Note that some arguments may be passed on the stack
79      even though pass_on_stack is zero, just because FUNCTION_ARG says so.
80      pass_on_stack identifies arguments that *cannot* go in registers.  */
81   int pass_on_stack;
82   /* Some fields packaged up for locate_and_pad_parm.  */
83   struct locate_and_pad_arg_data locate;
84   /* Location on the stack at which parameter should be stored.  The store
85      has already been done if STACK == VALUE.  */
86   rtx stack;
87   /* Location on the stack of the start of this argument slot.  This can
88      differ from STACK if this arg pads downward.  This location is known
89      to be aligned to FUNCTION_ARG_BOUNDARY.  */
90   rtx stack_slot;
91   /* Place that this stack area has been saved, if needed.  */
92   rtx save_area;
93   /* If an argument's alignment does not permit direct copying into registers,
94      copy in smaller-sized pieces into pseudos.  These are stored in a
95      block pointed to by this field.  The next field says how many
96      word-sized pseudos we made.  */
97   rtx *aligned_regs;
98   int n_aligned_regs;
99 };
100
101 /* A vector of one char per byte of stack space.  A byte if nonzero if
102    the corresponding stack location has been used.
103    This vector is used to prevent a function call within an argument from
104    clobbering any stack already set up.  */
105 static char *stack_usage_map;
106
107 /* Size of STACK_USAGE_MAP.  */
108 static int highest_outgoing_arg_in_use;
109
110 /* A bitmap of virtual-incoming stack space.  Bit is set if the corresponding
111    stack location's tail call argument has been already stored into the stack.
112    This bitmap is used to prevent sibling call optimization if function tries
113    to use parent's incoming argument slots when they have been already
114    overwritten with tail call arguments.  */
115 static sbitmap stored_args_map;
116
117 /* stack_arg_under_construction is nonzero when an argument may be
118    initialized with a constructor call (including a C function that
119    returns a BLKmode struct) and expand_call must take special action
120    to make sure the object being constructed does not overlap the
121    argument list for the constructor call.  */
122 static int stack_arg_under_construction;
123
124 static void emit_call_1 (rtx, tree, tree, tree, HOST_WIDE_INT, HOST_WIDE_INT,
125                          HOST_WIDE_INT, rtx, rtx, int, rtx, int,
126                          CUMULATIVE_ARGS *);
127 static void precompute_register_parameters (int, struct arg_data *, int *);
128 static int store_one_arg (struct arg_data *, rtx, int, int, int);
129 static void store_unaligned_arguments_into_pseudos (struct arg_data *, int);
130 static int finalize_must_preallocate (int, int, struct arg_data *,
131                                       struct args_size *);
132 static void precompute_arguments (int, int, struct arg_data *);
133 static int compute_argument_block_size (int, struct args_size *, int);
134 static void initialize_argument_information (int, struct arg_data *,
135                                              struct args_size *, int, tree,
136                                              tree, CUMULATIVE_ARGS *, int,
137                                              rtx *, int *, int *, int *,
138                                              bool *, bool);
139 static void compute_argument_addresses (struct arg_data *, rtx, int);
140 static rtx rtx_for_function_call (tree, tree);
141 static void load_register_parameters (struct arg_data *, int, rtx *, int,
142                                       int, int *);
143 static rtx emit_library_call_value_1 (int, rtx, rtx, enum libcall_type,
144                                       enum machine_mode, int, va_list);
145 static int special_function_p (tree, int);
146 static int check_sibcall_argument_overlap_1 (rtx);
147 static int check_sibcall_argument_overlap (rtx, struct arg_data *, int);
148
149 static int combine_pending_stack_adjustment_and_call (int, struct args_size *,
150                                                       unsigned int);
151 static tree split_complex_values (tree);
152 static tree split_complex_types (tree);
153
154 #ifdef REG_PARM_STACK_SPACE
155 static rtx save_fixed_argument_area (int, rtx, int *, int *);
156 static void restore_fixed_argument_area (rtx, rtx, int, int);
157 #endif
158 \f
159 /* Force FUNEXP into a form suitable for the address of a CALL,
160    and return that as an rtx.  Also load the static chain register
161    if FNDECL is a nested function.
162
163    CALL_FUSAGE points to a variable holding the prospective
164    CALL_INSN_FUNCTION_USAGE information.  */
165
166 rtx
167 prepare_call_address (rtx funexp, rtx static_chain_value,
168                       rtx *call_fusage, int reg_parm_seen, int sibcallp)
169 {
170   /* Make a valid memory address and copy constants through pseudo-regs,
171      but not for a constant address if -fno-function-cse.  */
172   if (GET_CODE (funexp) != SYMBOL_REF)
173     /* If we are using registers for parameters, force the
174        function address into a register now.  */
175     funexp = ((SMALL_REGISTER_CLASSES && reg_parm_seen)
176               ? force_not_mem (memory_address (FUNCTION_MODE, funexp))
177               : memory_address (FUNCTION_MODE, funexp));
178   else if (! sibcallp)
179     {
180 #ifndef NO_FUNCTION_CSE
181       if (optimize && ! flag_no_function_cse)
182         funexp = force_reg (Pmode, funexp);
183 #endif
184     }
185
186   if (static_chain_value != 0)
187     {
188       static_chain_value = convert_memory_address (Pmode, static_chain_value);
189       emit_move_insn (static_chain_rtx, static_chain_value);
190
191       if (REG_P (static_chain_rtx))
192         use_reg (call_fusage, static_chain_rtx);
193     }
194
195   return funexp;
196 }
197
198 /* Generate instructions to call function FUNEXP,
199    and optionally pop the results.
200    The CALL_INSN is the first insn generated.
201
202    FNDECL is the declaration node of the function.  This is given to the
203    macro RETURN_POPS_ARGS to determine whether this function pops its own args.
204
205    FUNTYPE is the data type of the function.  This is given to the macro
206    RETURN_POPS_ARGS to determine whether this function pops its own args.
207    We used to allow an identifier for library functions, but that doesn't
208    work when the return type is an aggregate type and the calling convention
209    says that the pointer to this aggregate is to be popped by the callee.
210
211    STACK_SIZE is the number of bytes of arguments on the stack,
212    ROUNDED_STACK_SIZE is that number rounded up to
213    PREFERRED_STACK_BOUNDARY; zero if the size is variable.  This is
214    both to put into the call insn and to generate explicit popping
215    code if necessary.
216
217    STRUCT_VALUE_SIZE is the number of bytes wanted in a structure value.
218    It is zero if this call doesn't want a structure value.
219
220    NEXT_ARG_REG is the rtx that results from executing
221      FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1)
222    just after all the args have had their registers assigned.
223    This could be whatever you like, but normally it is the first
224    arg-register beyond those used for args in this call,
225    or 0 if all the arg-registers are used in this call.
226    It is passed on to `gen_call' so you can put this info in the call insn.
227
228    VALREG is a hard register in which a value is returned,
229    or 0 if the call does not return a value.
230
231    OLD_INHIBIT_DEFER_POP is the value that `inhibit_defer_pop' had before
232    the args to this call were processed.
233    We restore `inhibit_defer_pop' to that value.
234
235    CALL_FUSAGE is either empty or an EXPR_LIST of USE expressions that
236    denote registers used by the called function.  */
237
238 static void
239 emit_call_1 (rtx funexp, tree fntree, tree fndecl ATTRIBUTE_UNUSED,
240              tree funtype ATTRIBUTE_UNUSED,
241              HOST_WIDE_INT stack_size ATTRIBUTE_UNUSED,
242              HOST_WIDE_INT rounded_stack_size,
243              HOST_WIDE_INT struct_value_size ATTRIBUTE_UNUSED,
244              rtx next_arg_reg ATTRIBUTE_UNUSED, rtx valreg,
245              int old_inhibit_defer_pop, rtx call_fusage, int ecf_flags,
246              CUMULATIVE_ARGS *args_so_far ATTRIBUTE_UNUSED)
247 {
248   rtx rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
249   rtx call_insn;
250   int already_popped = 0;
251   HOST_WIDE_INT n_popped = RETURN_POPS_ARGS (fndecl, funtype, stack_size);
252 #if defined (HAVE_call) && defined (HAVE_call_value)
253   rtx struct_value_size_rtx;
254   struct_value_size_rtx = GEN_INT (struct_value_size);
255 #endif
256
257 #ifdef CALL_POPS_ARGS
258   n_popped += CALL_POPS_ARGS (* args_so_far);
259 #endif
260
261   /* Ensure address is valid.  SYMBOL_REF is already valid, so no need,
262      and we don't want to load it into a register as an optimization,
263      because prepare_call_address already did it if it should be done.  */
264   if (GET_CODE (funexp) != SYMBOL_REF)
265     funexp = memory_address (FUNCTION_MODE, funexp);
266
267 #if defined (HAVE_sibcall_pop) && defined (HAVE_sibcall_value_pop)
268   if ((ecf_flags & ECF_SIBCALL)
269       && HAVE_sibcall_pop && HAVE_sibcall_value_pop
270       && (n_popped > 0 || stack_size == 0))
271     {
272       rtx n_pop = GEN_INT (n_popped);
273       rtx pat;
274
275       /* If this subroutine pops its own args, record that in the call insn
276          if possible, for the sake of frame pointer elimination.  */
277
278       if (valreg)
279         pat = GEN_SIBCALL_VALUE_POP (valreg,
280                                      gen_rtx_MEM (FUNCTION_MODE, funexp),
281                                      rounded_stack_size_rtx, next_arg_reg,
282                                      n_pop);
283       else
284         pat = GEN_SIBCALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
285                                rounded_stack_size_rtx, next_arg_reg, n_pop);
286
287       emit_call_insn (pat);
288       already_popped = 1;
289     }
290   else
291 #endif
292
293 #if defined (HAVE_call_pop) && defined (HAVE_call_value_pop)
294   /* If the target has "call" or "call_value" insns, then prefer them
295      if no arguments are actually popped.  If the target does not have
296      "call" or "call_value" insns, then we must use the popping versions
297      even if the call has no arguments to pop.  */
298 #if defined (HAVE_call) && defined (HAVE_call_value)
299   if (HAVE_call && HAVE_call_value && HAVE_call_pop && HAVE_call_value_pop
300       && n_popped > 0 && ! (ecf_flags & ECF_SP_DEPRESSED))
301 #else
302   if (HAVE_call_pop && HAVE_call_value_pop)
303 #endif
304     {
305       rtx n_pop = GEN_INT (n_popped);
306       rtx pat;
307
308       /* If this subroutine pops its own args, record that in the call insn
309          if possible, for the sake of frame pointer elimination.  */
310
311       if (valreg)
312         pat = GEN_CALL_VALUE_POP (valreg,
313                                   gen_rtx_MEM (FUNCTION_MODE, funexp),
314                                   rounded_stack_size_rtx, next_arg_reg, n_pop);
315       else
316         pat = GEN_CALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
317                             rounded_stack_size_rtx, next_arg_reg, n_pop);
318
319       emit_call_insn (pat);
320       already_popped = 1;
321     }
322   else
323 #endif
324
325 #if defined (HAVE_sibcall) && defined (HAVE_sibcall_value)
326   if ((ecf_flags & ECF_SIBCALL)
327       && HAVE_sibcall && HAVE_sibcall_value)
328     {
329       if (valreg)
330         emit_call_insn (GEN_SIBCALL_VALUE (valreg,
331                                            gen_rtx_MEM (FUNCTION_MODE, funexp),
332                                            rounded_stack_size_rtx,
333                                            next_arg_reg, NULL_RTX));
334       else
335         emit_call_insn (GEN_SIBCALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
336                                      rounded_stack_size_rtx, next_arg_reg,
337                                      struct_value_size_rtx));
338     }
339   else
340 #endif
341
342 #if defined (HAVE_call) && defined (HAVE_call_value)
343   if (HAVE_call && HAVE_call_value)
344     {
345       if (valreg)
346         emit_call_insn (GEN_CALL_VALUE (valreg,
347                                         gen_rtx_MEM (FUNCTION_MODE, funexp),
348                                         rounded_stack_size_rtx, next_arg_reg,
349                                         NULL_RTX));
350       else
351         emit_call_insn (GEN_CALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
352                                   rounded_stack_size_rtx, next_arg_reg,
353                                   struct_value_size_rtx));
354     }
355   else
356 #endif
357     gcc_unreachable ();
358
359   /* Find the call we just emitted.  */
360   call_insn = last_call_insn ();
361
362   /* Mark memory as used for "pure" function call.  */
363   if (ecf_flags & ECF_PURE)
364     call_fusage
365       = gen_rtx_EXPR_LIST
366         (VOIDmode,
367          gen_rtx_USE (VOIDmode,
368                       gen_rtx_MEM (BLKmode, gen_rtx_SCRATCH (VOIDmode))),
369          call_fusage);
370
371   /* Put the register usage information there.  */
372   add_function_usage_to (call_insn, call_fusage);
373
374   /* If this is a const call, then set the insn's unchanging bit.  */
375   if (ecf_flags & (ECF_CONST | ECF_PURE))
376     CONST_OR_PURE_CALL_P (call_insn) = 1;
377
378   /* If this call can't throw, attach a REG_EH_REGION reg note to that
379      effect.  */
380   if (ecf_flags & ECF_NOTHROW)
381     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_EH_REGION, const0_rtx,
382                                                REG_NOTES (call_insn));
383   else
384     {
385       int rn = lookup_stmt_eh_region (fntree);
386
387       /* If rn < 0, then either (1) tree-ssa not used or (2) doesn't
388          throw, which we already took care of.  */
389       if (rn > 0)
390         REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_EH_REGION, GEN_INT (rn),
391                                                    REG_NOTES (call_insn));
392       note_current_region_may_contain_throw ();
393     }
394
395   if (ecf_flags & ECF_NORETURN)
396     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_NORETURN, const0_rtx,
397                                                REG_NOTES (call_insn));
398
399   if (ecf_flags & ECF_RETURNS_TWICE)
400     {
401       REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_SETJMP, const0_rtx,
402                                                  REG_NOTES (call_insn));
403       current_function_calls_setjmp = 1;
404     }
405
406   SIBLING_CALL_P (call_insn) = ((ecf_flags & ECF_SIBCALL) != 0);
407
408   /* Restore this now, so that we do defer pops for this call's args
409      if the context of the call as a whole permits.  */
410   inhibit_defer_pop = old_inhibit_defer_pop;
411
412   if (n_popped > 0)
413     {
414       if (!already_popped)
415         CALL_INSN_FUNCTION_USAGE (call_insn)
416           = gen_rtx_EXPR_LIST (VOIDmode,
417                                gen_rtx_CLOBBER (VOIDmode, stack_pointer_rtx),
418                                CALL_INSN_FUNCTION_USAGE (call_insn));
419       rounded_stack_size -= n_popped;
420       rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
421       stack_pointer_delta -= n_popped;
422     }
423
424   if (!ACCUMULATE_OUTGOING_ARGS)
425     {
426       /* If returning from the subroutine does not automatically pop the args,
427          we need an instruction to pop them sooner or later.
428          Perhaps do it now; perhaps just record how much space to pop later.
429
430          If returning from the subroutine does pop the args, indicate that the
431          stack pointer will be changed.  */
432
433       if (rounded_stack_size != 0)
434         {
435           if (ecf_flags & (ECF_SP_DEPRESSED | ECF_NORETURN))
436             /* Just pretend we did the pop.  */
437             stack_pointer_delta -= rounded_stack_size;
438           else if (flag_defer_pop && inhibit_defer_pop == 0
439               && ! (ecf_flags & (ECF_CONST | ECF_PURE)))
440             pending_stack_adjust += rounded_stack_size;
441           else
442             adjust_stack (rounded_stack_size_rtx);
443         }
444     }
445   /* When we accumulate outgoing args, we must avoid any stack manipulations.
446      Restore the stack pointer to its original value now.  Usually
447      ACCUMULATE_OUTGOING_ARGS targets don't get here, but there are exceptions.
448      On  i386 ACCUMULATE_OUTGOING_ARGS can be enabled on demand, and
449      popping variants of functions exist as well.
450
451      ??? We may optimize similar to defer_pop above, but it is
452      probably not worthwhile.
453
454      ??? It will be worthwhile to enable combine_stack_adjustments even for
455      such machines.  */
456   else if (n_popped)
457     anti_adjust_stack (GEN_INT (n_popped));
458 }
459
460 /* Determine if the function identified by NAME and FNDECL is one with
461    special properties we wish to know about.
462
463    For example, if the function might return more than one time (setjmp), then
464    set RETURNS_TWICE to a nonzero value.
465
466    Similarly set NORETURN if the function is in the longjmp family.
467
468    Set MAY_BE_ALLOCA for any memory allocation function that might allocate
469    space from the stack such as alloca.  */
470
471 static int
472 special_function_p (tree fndecl, int flags)
473 {
474   if (fndecl && DECL_NAME (fndecl)
475       && IDENTIFIER_LENGTH (DECL_NAME (fndecl)) <= 17
476       /* Exclude functions not at the file scope, or not `extern',
477          since they are not the magic functions we would otherwise
478          think they are.
479          FIXME: this should be handled with attributes, not with this
480          hacky imitation of DECL_ASSEMBLER_NAME.  It's (also) wrong
481          because you can declare fork() inside a function if you
482          wish.  */
483       && (DECL_CONTEXT (fndecl) == NULL_TREE
484           || TREE_CODE (DECL_CONTEXT (fndecl)) == TRANSLATION_UNIT_DECL)
485       && TREE_PUBLIC (fndecl))
486     {
487       const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
488       const char *tname = name;
489
490       /* We assume that alloca will always be called by name.  It
491          makes no sense to pass it as a pointer-to-function to
492          anything that does not understand its behavior.  */
493       if (((IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 6
494             && name[0] == 'a'
495             && ! strcmp (name, "alloca"))
496            || (IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 16
497                && name[0] == '_'
498                && ! strcmp (name, "__builtin_alloca"))))
499         flags |= ECF_MAY_BE_ALLOCA;
500
501       /* Disregard prefix _, __ or __x.  */
502       if (name[0] == '_')
503         {
504           if (name[1] == '_' && name[2] == 'x')
505             tname += 3;
506           else if (name[1] == '_')
507             tname += 2;
508           else
509             tname += 1;
510         }
511
512       if (tname[0] == 's')
513         {
514           if ((tname[1] == 'e'
515                && (! strcmp (tname, "setjmp")
516                    || ! strcmp (tname, "setjmp_syscall")))
517               || (tname[1] == 'i'
518                   && ! strcmp (tname, "sigsetjmp"))
519               || (tname[1] == 'a'
520                   && ! strcmp (tname, "savectx")))
521             flags |= ECF_RETURNS_TWICE;
522
523           if (tname[1] == 'i'
524               && ! strcmp (tname, "siglongjmp"))
525             flags |= ECF_NORETURN;
526         }
527       else if ((tname[0] == 'q' && tname[1] == 's'
528                 && ! strcmp (tname, "qsetjmp"))
529                || (tname[0] == 'v' && tname[1] == 'f'
530                    && ! strcmp (tname, "vfork"))
531                || (tname[0] == 'g' && tname[1] == 'e'
532                    && !strcmp (tname, "getcontext")))
533         flags |= ECF_RETURNS_TWICE;
534
535       else if (tname[0] == 'l' && tname[1] == 'o'
536                && ! strcmp (tname, "longjmp"))
537         flags |= ECF_NORETURN;
538     }
539
540   return flags;
541 }
542
543 /* Return nonzero when FNDECL represents a call to setjmp.  */
544
545 int
546 setjmp_call_p (tree fndecl)
547 {
548   return special_function_p (fndecl, 0) & ECF_RETURNS_TWICE;
549 }
550
551 /* Return true when exp contains alloca call.  */
552 bool
553 alloca_call_p (tree exp)
554 {
555   if (TREE_CODE (exp) == CALL_EXPR
556       && TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
557       && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
558           == FUNCTION_DECL)
559       && (special_function_p (TREE_OPERAND (TREE_OPERAND (exp, 0), 0),
560                               0) & ECF_MAY_BE_ALLOCA))
561     return true;
562   return false;
563 }
564
565 /* Detect flags (function attributes) from the function decl or type node.  */
566
567 int
568 flags_from_decl_or_type (tree exp)
569 {
570   int flags = 0;
571   tree type = exp;
572
573   if (DECL_P (exp))
574     {
575       type = TREE_TYPE (exp);
576
577       /* The function exp may have the `malloc' attribute.  */
578       if (DECL_IS_MALLOC (exp))
579         flags |= ECF_MALLOC;
580
581       /* The function exp may have the `returns_twice' attribute.  */
582       if (DECL_IS_RETURNS_TWICE (exp))
583         flags |= ECF_RETURNS_TWICE;
584
585       /* The function exp may have the `pure' attribute.  */
586       if (DECL_IS_PURE (exp))
587         flags |= ECF_PURE;
588
589       if (DECL_IS_NOVOPS (exp))
590         flags |= ECF_NOVOPS;
591
592       if (TREE_NOTHROW (exp))
593         flags |= ECF_NOTHROW;
594
595       if (TREE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
596         flags |= ECF_CONST;
597
598       flags = special_function_p (exp, flags);
599     }
600   else if (TYPE_P (exp) && TYPE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
601     flags |= ECF_CONST;
602
603   if (TREE_THIS_VOLATILE (exp))
604     flags |= ECF_NORETURN;
605
606   /* Mark if the function returns with the stack pointer depressed.   We
607      cannot consider it pure or constant in that case.  */
608   if (TREE_CODE (type) == FUNCTION_TYPE && TYPE_RETURNS_STACK_DEPRESSED (type))
609     {
610       flags |= ECF_SP_DEPRESSED;
611       flags &= ~(ECF_PURE | ECF_CONST);
612     }
613
614   return flags;
615 }
616
617 /* Detect flags from a CALL_EXPR.  */
618
619 int
620 call_expr_flags (tree t)
621 {
622   int flags;
623   tree decl = get_callee_fndecl (t);
624
625   if (decl)
626     flags = flags_from_decl_or_type (decl);
627   else
628     {
629       t = TREE_TYPE (TREE_OPERAND (t, 0));
630       if (t && TREE_CODE (t) == POINTER_TYPE)
631         flags = flags_from_decl_or_type (TREE_TYPE (t));
632       else
633         flags = 0;
634     }
635
636   return flags;
637 }
638
639 /* Precompute all register parameters as described by ARGS, storing values
640    into fields within the ARGS array.
641
642    NUM_ACTUALS indicates the total number elements in the ARGS array.
643
644    Set REG_PARM_SEEN if we encounter a register parameter.  */
645
646 static void
647 precompute_register_parameters (int num_actuals, struct arg_data *args,
648                                 int *reg_parm_seen)
649 {
650   int i;
651
652   *reg_parm_seen = 0;
653
654   for (i = 0; i < num_actuals; i++)
655     if (args[i].reg != 0 && ! args[i].pass_on_stack)
656       {
657         *reg_parm_seen = 1;
658
659         if (args[i].value == 0)
660           {
661             push_temp_slots ();
662             args[i].value = expand_normal (args[i].tree_value);
663             preserve_temp_slots (args[i].value);
664             pop_temp_slots ();
665           }
666
667         /* If the value is a non-legitimate constant, force it into a
668            pseudo now.  TLS symbols sometimes need a call to resolve.  */
669         if (CONSTANT_P (args[i].value)
670             && !LEGITIMATE_CONSTANT_P (args[i].value))
671           args[i].value = force_reg (args[i].mode, args[i].value);
672
673         /* If we are to promote the function arg to a wider mode,
674            do it now.  */
675
676         if (args[i].mode != TYPE_MODE (TREE_TYPE (args[i].tree_value)))
677           args[i].value
678             = convert_modes (args[i].mode,
679                              TYPE_MODE (TREE_TYPE (args[i].tree_value)),
680                              args[i].value, args[i].unsignedp);
681
682         /* If we're going to have to load the value by parts, pull the
683            parts into pseudos.  The part extraction process can involve
684            non-trivial computation.  */
685         if (GET_CODE (args[i].reg) == PARALLEL)
686           {
687             tree type = TREE_TYPE (args[i].tree_value);
688             args[i].parallel_value
689               = emit_group_load_into_temps (args[i].reg, args[i].value,
690                                             type, int_size_in_bytes (type));
691           }
692
693         /* If the value is expensive, and we are inside an appropriately
694            short loop, put the value into a pseudo and then put the pseudo
695            into the hard reg.
696
697            For small register classes, also do this if this call uses
698            register parameters.  This is to avoid reload conflicts while
699            loading the parameters registers.  */
700
701         else if ((! (REG_P (args[i].value)
702                      || (GET_CODE (args[i].value) == SUBREG
703                          && REG_P (SUBREG_REG (args[i].value)))))
704                  && args[i].mode != BLKmode
705                  && rtx_cost (args[i].value, SET) > COSTS_N_INSNS (1)
706                  && ((SMALL_REGISTER_CLASSES && *reg_parm_seen)
707                      || optimize))
708           args[i].value = copy_to_mode_reg (args[i].mode, args[i].value);
709       }
710 }
711
712 #ifdef REG_PARM_STACK_SPACE
713
714   /* The argument list is the property of the called routine and it
715      may clobber it.  If the fixed area has been used for previous
716      parameters, we must save and restore it.  */
717
718 static rtx
719 save_fixed_argument_area (int reg_parm_stack_space, rtx argblock, int *low_to_save, int *high_to_save)
720 {
721   int low;
722   int high;
723
724   /* Compute the boundary of the area that needs to be saved, if any.  */
725   high = reg_parm_stack_space;
726 #ifdef ARGS_GROW_DOWNWARD
727   high += 1;
728 #endif
729   if (high > highest_outgoing_arg_in_use)
730     high = highest_outgoing_arg_in_use;
731
732   for (low = 0; low < high; low++)
733     if (stack_usage_map[low] != 0)
734       {
735         int num_to_save;
736         enum machine_mode save_mode;
737         int delta;
738         rtx stack_area;
739         rtx save_area;
740
741         while (stack_usage_map[--high] == 0)
742           ;
743
744         *low_to_save = low;
745         *high_to_save = high;
746
747         num_to_save = high - low + 1;
748         save_mode = mode_for_size (num_to_save * BITS_PER_UNIT, MODE_INT, 1);
749
750         /* If we don't have the required alignment, must do this
751            in BLKmode.  */
752         if ((low & (MIN (GET_MODE_SIZE (save_mode),
753                          BIGGEST_ALIGNMENT / UNITS_PER_WORD) - 1)))
754           save_mode = BLKmode;
755
756 #ifdef ARGS_GROW_DOWNWARD
757         delta = -high;
758 #else
759         delta = low;
760 #endif
761         stack_area = gen_rtx_MEM (save_mode,
762                                   memory_address (save_mode,
763                                                   plus_constant (argblock,
764                                                                  delta)));
765
766         set_mem_align (stack_area, PARM_BOUNDARY);
767         if (save_mode == BLKmode)
768           {
769             save_area = assign_stack_temp (BLKmode, num_to_save, 0);
770             emit_block_move (validize_mem (save_area), stack_area,
771                              GEN_INT (num_to_save), BLOCK_OP_CALL_PARM);
772           }
773         else
774           {
775             save_area = gen_reg_rtx (save_mode);
776             emit_move_insn (save_area, stack_area);
777           }
778
779         return save_area;
780       }
781
782   return NULL_RTX;
783 }
784
785 static void
786 restore_fixed_argument_area (rtx save_area, rtx argblock, int high_to_save, int low_to_save)
787 {
788   enum machine_mode save_mode = GET_MODE (save_area);
789   int delta;
790   rtx stack_area;
791
792 #ifdef ARGS_GROW_DOWNWARD
793   delta = -high_to_save;
794 #else
795   delta = low_to_save;
796 #endif
797   stack_area = gen_rtx_MEM (save_mode,
798                             memory_address (save_mode,
799                                             plus_constant (argblock, delta)));
800   set_mem_align (stack_area, PARM_BOUNDARY);
801
802   if (save_mode != BLKmode)
803     emit_move_insn (stack_area, save_area);
804   else
805     emit_block_move (stack_area, validize_mem (save_area),
806                      GEN_INT (high_to_save - low_to_save + 1),
807                      BLOCK_OP_CALL_PARM);
808 }
809 #endif /* REG_PARM_STACK_SPACE */
810
811 /* If any elements in ARGS refer to parameters that are to be passed in
812    registers, but not in memory, and whose alignment does not permit a
813    direct copy into registers.  Copy the values into a group of pseudos
814    which we will later copy into the appropriate hard registers.
815
816    Pseudos for each unaligned argument will be stored into the array
817    args[argnum].aligned_regs.  The caller is responsible for deallocating
818    the aligned_regs array if it is nonzero.  */
819
820 static void
821 store_unaligned_arguments_into_pseudos (struct arg_data *args, int num_actuals)
822 {
823   int i, j;
824
825   for (i = 0; i < num_actuals; i++)
826     if (args[i].reg != 0 && ! args[i].pass_on_stack
827         && args[i].mode == BLKmode
828         && (TYPE_ALIGN (TREE_TYPE (args[i].tree_value))
829             < (unsigned int) MIN (BIGGEST_ALIGNMENT, BITS_PER_WORD)))
830       {
831         int bytes = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
832         int endian_correction = 0;
833
834         if (args[i].partial)
835           {
836             gcc_assert (args[i].partial % UNITS_PER_WORD == 0);
837             args[i].n_aligned_regs = args[i].partial / UNITS_PER_WORD;
838           }
839         else
840           {
841             args[i].n_aligned_regs
842               = (bytes + UNITS_PER_WORD - 1) / UNITS_PER_WORD;
843           }
844
845         args[i].aligned_regs = XNEWVEC (rtx, args[i].n_aligned_regs);
846
847         /* Structures smaller than a word are normally aligned to the
848            least significant byte.  On a BYTES_BIG_ENDIAN machine,
849            this means we must skip the empty high order bytes when
850            calculating the bit offset.  */
851         if (bytes < UNITS_PER_WORD
852 #ifdef BLOCK_REG_PADDING
853             && (BLOCK_REG_PADDING (args[i].mode,
854                                    TREE_TYPE (args[i].tree_value), 1)
855                 == downward)
856 #else
857             && BYTES_BIG_ENDIAN
858 #endif
859             )
860           endian_correction = BITS_PER_WORD - bytes * BITS_PER_UNIT;
861
862         for (j = 0; j < args[i].n_aligned_regs; j++)
863           {
864             rtx reg = gen_reg_rtx (word_mode);
865             rtx word = operand_subword_force (args[i].value, j, BLKmode);
866             int bitsize = MIN (bytes * BITS_PER_UNIT, BITS_PER_WORD);
867
868             args[i].aligned_regs[j] = reg;
869             word = extract_bit_field (word, bitsize, 0, 1, NULL_RTX,
870                                       word_mode, word_mode);
871
872             /* There is no need to restrict this code to loading items
873                in TYPE_ALIGN sized hunks.  The bitfield instructions can
874                load up entire word sized registers efficiently.
875
876                ??? This may not be needed anymore.
877                We use to emit a clobber here but that doesn't let later
878                passes optimize the instructions we emit.  By storing 0 into
879                the register later passes know the first AND to zero out the
880                bitfield being set in the register is unnecessary.  The store
881                of 0 will be deleted as will at least the first AND.  */
882
883             emit_move_insn (reg, const0_rtx);
884
885             bytes -= bitsize / BITS_PER_UNIT;
886             store_bit_field (reg, bitsize, endian_correction, word_mode,
887                              word);
888           }
889       }
890 }
891
892 /* Fill in ARGS_SIZE and ARGS array based on the parameters found in
893    ACTPARMS.
894
895    NUM_ACTUALS is the total number of parameters.
896
897    N_NAMED_ARGS is the total number of named arguments.
898
899    FNDECL is the tree code for the target of this call (if known)
900
901    ARGS_SO_FAR holds state needed by the target to know where to place
902    the next argument.
903
904    REG_PARM_STACK_SPACE is the number of bytes of stack space reserved
905    for arguments which are passed in registers.
906
907    OLD_STACK_LEVEL is a pointer to an rtx which olds the old stack level
908    and may be modified by this routine.
909
910    OLD_PENDING_ADJ, MUST_PREALLOCATE and FLAGS are pointers to integer
911    flags which may may be modified by this routine.
912
913    MAY_TAILCALL is cleared if we encounter an invisible pass-by-reference
914    that requires allocation of stack space.
915
916    CALL_FROM_THUNK_P is true if this call is the jump from a thunk to
917    the thunked-to function.  */
918
919 static void
920 initialize_argument_information (int num_actuals ATTRIBUTE_UNUSED,
921                                  struct arg_data *args,
922                                  struct args_size *args_size,
923                                  int n_named_args ATTRIBUTE_UNUSED,
924                                  tree actparms, tree fndecl,
925                                  CUMULATIVE_ARGS *args_so_far,
926                                  int reg_parm_stack_space,
927                                  rtx *old_stack_level, int *old_pending_adj,
928                                  int *must_preallocate, int *ecf_flags,
929                                  bool *may_tailcall, bool call_from_thunk_p)
930 {
931   /* 1 if scanning parms front to back, -1 if scanning back to front.  */
932   int inc;
933
934   /* Count arg position in order args appear.  */
935   int argpos;
936
937   int i;
938   tree p;
939
940   args_size->constant = 0;
941   args_size->var = 0;
942
943   /* In this loop, we consider args in the order they are written.
944      We fill up ARGS from the front or from the back if necessary
945      so that in any case the first arg to be pushed ends up at the front.  */
946
947   if (PUSH_ARGS_REVERSED)
948     {
949       i = num_actuals - 1, inc = -1;
950       /* In this case, must reverse order of args
951          so that we compute and push the last arg first.  */
952     }
953   else
954     {
955       i = 0, inc = 1;
956     }
957
958   /* I counts args in order (to be) pushed; ARGPOS counts in order written.  */
959   for (p = actparms, argpos = 0; p; p = TREE_CHAIN (p), i += inc, argpos++)
960     {
961       tree type = TREE_TYPE (TREE_VALUE (p));
962       int unsignedp;
963       enum machine_mode mode;
964
965       args[i].tree_value = TREE_VALUE (p);
966
967       /* Replace erroneous argument with constant zero.  */
968       if (type == error_mark_node || !COMPLETE_TYPE_P (type))
969         args[i].tree_value = integer_zero_node, type = integer_type_node;
970
971       /* If TYPE is a transparent union, pass things the way we would
972          pass the first field of the union.  We have already verified that
973          the modes are the same.  */
974       if (TREE_CODE (type) == UNION_TYPE && TYPE_TRANSPARENT_UNION (type))
975         type = TREE_TYPE (TYPE_FIELDS (type));
976
977       /* Decide where to pass this arg.
978
979          args[i].reg is nonzero if all or part is passed in registers.
980
981          args[i].partial is nonzero if part but not all is passed in registers,
982          and the exact value says how many bytes are passed in registers.
983
984          args[i].pass_on_stack is nonzero if the argument must at least be
985          computed on the stack.  It may then be loaded back into registers
986          if args[i].reg is nonzero.
987
988          These decisions are driven by the FUNCTION_... macros and must agree
989          with those made by function.c.  */
990
991       /* See if this argument should be passed by invisible reference.  */
992       if (pass_by_reference (args_so_far, TYPE_MODE (type),
993                              type, argpos < n_named_args))
994         {
995           bool callee_copies;
996           tree base;
997
998           callee_copies
999             = reference_callee_copied (args_so_far, TYPE_MODE (type),
1000                                        type, argpos < n_named_args);
1001
1002           /* If we're compiling a thunk, pass through invisible references
1003              instead of making a copy.  */
1004           if (call_from_thunk_p
1005               || (callee_copies
1006                   && !TREE_ADDRESSABLE (type)
1007                   && (base = get_base_address (args[i].tree_value))
1008                   && (!DECL_P (base) || MEM_P (DECL_RTL (base)))))
1009             {
1010               /* We can't use sibcalls if a callee-copied argument is
1011                  stored in the current function's frame.  */
1012               if (!call_from_thunk_p && DECL_P (base) && !TREE_STATIC (base))
1013                 *may_tailcall = false;
1014
1015               args[i].tree_value = build_fold_addr_expr (args[i].tree_value);
1016               type = TREE_TYPE (args[i].tree_value);
1017
1018               *ecf_flags &= ~(ECF_CONST | ECF_LIBCALL_BLOCK);
1019             }
1020           else
1021             {
1022               /* We make a copy of the object and pass the address to the
1023                  function being called.  */
1024               rtx copy;
1025
1026               if (!COMPLETE_TYPE_P (type)
1027                   || TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST
1028                   || (flag_stack_check && ! STACK_CHECK_BUILTIN
1029                       && (0 < compare_tree_int (TYPE_SIZE_UNIT (type),
1030                                                 STACK_CHECK_MAX_VAR_SIZE))))
1031                 {
1032                   /* This is a variable-sized object.  Make space on the stack
1033                      for it.  */
1034                   rtx size_rtx = expr_size (TREE_VALUE (p));
1035
1036                   if (*old_stack_level == 0)
1037                     {
1038                       emit_stack_save (SAVE_BLOCK, old_stack_level, NULL_RTX);
1039                       *old_pending_adj = pending_stack_adjust;
1040                       pending_stack_adjust = 0;
1041                     }
1042
1043                   copy = gen_rtx_MEM (BLKmode,
1044                                       allocate_dynamic_stack_space
1045                                       (size_rtx, NULL_RTX, TYPE_ALIGN (type)));
1046                   set_mem_attributes (copy, type, 1);
1047                 }
1048               else
1049                 copy = assign_temp (type, 0, 1, 0);
1050
1051               store_expr (args[i].tree_value, copy, 0);
1052
1053               if (callee_copies)
1054                 *ecf_flags &= ~(ECF_CONST | ECF_LIBCALL_BLOCK);
1055               else
1056                 *ecf_flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
1057
1058               args[i].tree_value
1059                 = build_fold_addr_expr (make_tree (type, copy));
1060               type = TREE_TYPE (args[i].tree_value);
1061               *may_tailcall = false;
1062             }
1063         }
1064
1065       mode = TYPE_MODE (type);
1066       unsignedp = TYPE_UNSIGNED (type);
1067
1068       if (targetm.calls.promote_function_args (fndecl ? TREE_TYPE (fndecl) : 0))
1069         mode = promote_mode (type, mode, &unsignedp, 1);
1070
1071       args[i].unsignedp = unsignedp;
1072       args[i].mode = mode;
1073
1074       args[i].reg = FUNCTION_ARG (*args_so_far, mode, type,
1075                                   argpos < n_named_args);
1076 #ifdef FUNCTION_INCOMING_ARG
1077       /* If this is a sibling call and the machine has register windows, the
1078          register window has to be unwinded before calling the routine, so
1079          arguments have to go into the incoming registers.  */
1080       args[i].tail_call_reg = FUNCTION_INCOMING_ARG (*args_so_far, mode, type,
1081                                                      argpos < n_named_args);
1082 #else
1083       args[i].tail_call_reg = args[i].reg;
1084 #endif
1085
1086       if (args[i].reg)
1087         args[i].partial
1088           = targetm.calls.arg_partial_bytes (args_so_far, mode, type,
1089                                              argpos < n_named_args);
1090
1091       args[i].pass_on_stack = targetm.calls.must_pass_in_stack (mode, type);
1092
1093       /* If FUNCTION_ARG returned a (parallel [(expr_list (nil) ...) ...]),
1094          it means that we are to pass this arg in the register(s) designated
1095          by the PARALLEL, but also to pass it in the stack.  */
1096       if (args[i].reg && GET_CODE (args[i].reg) == PARALLEL
1097           && XEXP (XVECEXP (args[i].reg, 0, 0), 0) == 0)
1098         args[i].pass_on_stack = 1;
1099
1100       /* If this is an addressable type, we must preallocate the stack
1101          since we must evaluate the object into its final location.
1102
1103          If this is to be passed in both registers and the stack, it is simpler
1104          to preallocate.  */
1105       if (TREE_ADDRESSABLE (type)
1106           || (args[i].pass_on_stack && args[i].reg != 0))
1107         *must_preallocate = 1;
1108
1109       /* If this is an addressable type, we cannot pre-evaluate it.  Thus,
1110          we cannot consider this function call constant.  */
1111       if (TREE_ADDRESSABLE (type))
1112         *ecf_flags &= ~ECF_LIBCALL_BLOCK;
1113
1114       /* Compute the stack-size of this argument.  */
1115       if (args[i].reg == 0 || args[i].partial != 0
1116           || reg_parm_stack_space > 0
1117           || args[i].pass_on_stack)
1118         locate_and_pad_parm (mode, type,
1119 #ifdef STACK_PARMS_IN_REG_PARM_AREA
1120                              1,
1121 #else
1122                              args[i].reg != 0,
1123 #endif
1124                              args[i].pass_on_stack ? 0 : args[i].partial,
1125                              fndecl, args_size, &args[i].locate);
1126 #ifdef BLOCK_REG_PADDING
1127       else
1128         /* The argument is passed entirely in registers.  See at which
1129            end it should be padded.  */
1130         args[i].locate.where_pad =
1131           BLOCK_REG_PADDING (mode, type,
1132                              int_size_in_bytes (type) <= UNITS_PER_WORD);
1133 #endif
1134
1135       /* Update ARGS_SIZE, the total stack space for args so far.  */
1136
1137       args_size->constant += args[i].locate.size.constant;
1138       if (args[i].locate.size.var)
1139         ADD_PARM_SIZE (*args_size, args[i].locate.size.var);
1140
1141       /* Increment ARGS_SO_FAR, which has info about which arg-registers
1142          have been used, etc.  */
1143
1144       FUNCTION_ARG_ADVANCE (*args_so_far, TYPE_MODE (type), type,
1145                             argpos < n_named_args);
1146     }
1147 }
1148
1149 /* Update ARGS_SIZE to contain the total size for the argument block.
1150    Return the original constant component of the argument block's size.
1151
1152    REG_PARM_STACK_SPACE holds the number of bytes of stack space reserved
1153    for arguments passed in registers.  */
1154
1155 static int
1156 compute_argument_block_size (int reg_parm_stack_space,
1157                              struct args_size *args_size,
1158                              int preferred_stack_boundary ATTRIBUTE_UNUSED)
1159 {
1160   int unadjusted_args_size = args_size->constant;
1161
1162   /* For accumulate outgoing args mode we don't need to align, since the frame
1163      will be already aligned.  Align to STACK_BOUNDARY in order to prevent
1164      backends from generating misaligned frame sizes.  */
1165   if (ACCUMULATE_OUTGOING_ARGS && preferred_stack_boundary > STACK_BOUNDARY)
1166     preferred_stack_boundary = STACK_BOUNDARY;
1167
1168   /* Compute the actual size of the argument block required.  The variable
1169      and constant sizes must be combined, the size may have to be rounded,
1170      and there may be a minimum required size.  */
1171
1172   if (args_size->var)
1173     {
1174       args_size->var = ARGS_SIZE_TREE (*args_size);
1175       args_size->constant = 0;
1176
1177       preferred_stack_boundary /= BITS_PER_UNIT;
1178       if (preferred_stack_boundary > 1)
1179         {
1180           /* We don't handle this case yet.  To handle it correctly we have
1181              to add the delta, round and subtract the delta.
1182              Currently no machine description requires this support.  */
1183           gcc_assert (!(stack_pointer_delta & (preferred_stack_boundary - 1)));
1184           args_size->var = round_up (args_size->var, preferred_stack_boundary);
1185         }
1186
1187       if (reg_parm_stack_space > 0)
1188         {
1189           args_size->var
1190             = size_binop (MAX_EXPR, args_size->var,
1191                           ssize_int (reg_parm_stack_space));
1192
1193 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1194           /* The area corresponding to register parameters is not to count in
1195              the size of the block we need.  So make the adjustment.  */
1196           args_size->var
1197             = size_binop (MINUS_EXPR, args_size->var,
1198                           ssize_int (reg_parm_stack_space));
1199 #endif
1200         }
1201     }
1202   else
1203     {
1204       preferred_stack_boundary /= BITS_PER_UNIT;
1205       if (preferred_stack_boundary < 1)
1206         preferred_stack_boundary = 1;
1207       args_size->constant = (((args_size->constant
1208                                + stack_pointer_delta
1209                                + preferred_stack_boundary - 1)
1210                               / preferred_stack_boundary
1211                               * preferred_stack_boundary)
1212                              - stack_pointer_delta);
1213
1214       args_size->constant = MAX (args_size->constant,
1215                                  reg_parm_stack_space);
1216
1217 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1218       args_size->constant -= reg_parm_stack_space;
1219 #endif
1220     }
1221   return unadjusted_args_size;
1222 }
1223
1224 /* Precompute parameters as needed for a function call.
1225
1226    FLAGS is mask of ECF_* constants.
1227
1228    NUM_ACTUALS is the number of arguments.
1229
1230    ARGS is an array containing information for each argument; this
1231    routine fills in the INITIAL_VALUE and VALUE fields for each
1232    precomputed argument.  */
1233
1234 static void
1235 precompute_arguments (int flags, int num_actuals, struct arg_data *args)
1236 {
1237   int i;
1238
1239   /* If this is a libcall, then precompute all arguments so that we do not
1240      get extraneous instructions emitted as part of the libcall sequence.  */
1241   if ((flags & ECF_LIBCALL_BLOCK) == 0)
1242     return;
1243
1244   for (i = 0; i < num_actuals; i++)
1245     {
1246       enum machine_mode mode;
1247
1248       /* If this is an addressable type, we cannot pre-evaluate it.  */
1249       gcc_assert (!TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value)));
1250
1251       args[i].initial_value = args[i].value
1252         = expand_normal (args[i].tree_value);
1253
1254       mode = TYPE_MODE (TREE_TYPE (args[i].tree_value));
1255       if (mode != args[i].mode)
1256         {
1257           args[i].value
1258             = convert_modes (args[i].mode, mode,
1259                              args[i].value, args[i].unsignedp);
1260 #if defined(PROMOTE_FUNCTION_MODE) && !defined(PROMOTE_MODE)
1261           /* CSE will replace this only if it contains args[i].value
1262              pseudo, so convert it down to the declared mode using
1263              a SUBREG.  */
1264           if (REG_P (args[i].value)
1265               && GET_MODE_CLASS (args[i].mode) == MODE_INT)
1266             {
1267               args[i].initial_value
1268                 = gen_lowpart_SUBREG (mode, args[i].value);
1269               SUBREG_PROMOTED_VAR_P (args[i].initial_value) = 1;
1270               SUBREG_PROMOTED_UNSIGNED_SET (args[i].initial_value,
1271                                             args[i].unsignedp);
1272             }
1273 #endif
1274         }
1275     }
1276 }
1277
1278 /* Given the current state of MUST_PREALLOCATE and information about
1279    arguments to a function call in NUM_ACTUALS, ARGS and ARGS_SIZE,
1280    compute and return the final value for MUST_PREALLOCATE.  */
1281
1282 static int
1283 finalize_must_preallocate (int must_preallocate, int num_actuals, struct arg_data *args, struct args_size *args_size)
1284 {
1285   /* See if we have or want to preallocate stack space.
1286
1287      If we would have to push a partially-in-regs parm
1288      before other stack parms, preallocate stack space instead.
1289
1290      If the size of some parm is not a multiple of the required stack
1291      alignment, we must preallocate.
1292
1293      If the total size of arguments that would otherwise create a copy in
1294      a temporary (such as a CALL) is more than half the total argument list
1295      size, preallocation is faster.
1296
1297      Another reason to preallocate is if we have a machine (like the m88k)
1298      where stack alignment is required to be maintained between every
1299      pair of insns, not just when the call is made.  However, we assume here
1300      that such machines either do not have push insns (and hence preallocation
1301      would occur anyway) or the problem is taken care of with
1302      PUSH_ROUNDING.  */
1303
1304   if (! must_preallocate)
1305     {
1306       int partial_seen = 0;
1307       int copy_to_evaluate_size = 0;
1308       int i;
1309
1310       for (i = 0; i < num_actuals && ! must_preallocate; i++)
1311         {
1312           if (args[i].partial > 0 && ! args[i].pass_on_stack)
1313             partial_seen = 1;
1314           else if (partial_seen && args[i].reg == 0)
1315             must_preallocate = 1;
1316
1317           if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode
1318               && (TREE_CODE (args[i].tree_value) == CALL_EXPR
1319                   || TREE_CODE (args[i].tree_value) == TARGET_EXPR
1320                   || TREE_CODE (args[i].tree_value) == COND_EXPR
1321                   || TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value))))
1322             copy_to_evaluate_size
1323               += int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1324         }
1325
1326       if (copy_to_evaluate_size * 2 >= args_size->constant
1327           && args_size->constant > 0)
1328         must_preallocate = 1;
1329     }
1330   return must_preallocate;
1331 }
1332
1333 /* If we preallocated stack space, compute the address of each argument
1334    and store it into the ARGS array.
1335
1336    We need not ensure it is a valid memory address here; it will be
1337    validized when it is used.
1338
1339    ARGBLOCK is an rtx for the address of the outgoing arguments.  */
1340
1341 static void
1342 compute_argument_addresses (struct arg_data *args, rtx argblock, int num_actuals)
1343 {
1344   if (argblock)
1345     {
1346       rtx arg_reg = argblock;
1347       int i, arg_offset = 0;
1348
1349       if (GET_CODE (argblock) == PLUS)
1350         arg_reg = XEXP (argblock, 0), arg_offset = INTVAL (XEXP (argblock, 1));
1351
1352       for (i = 0; i < num_actuals; i++)
1353         {
1354           rtx offset = ARGS_SIZE_RTX (args[i].locate.offset);
1355           rtx slot_offset = ARGS_SIZE_RTX (args[i].locate.slot_offset);
1356           rtx addr;
1357           unsigned int align, boundary;
1358           unsigned int units_on_stack = 0;
1359           enum machine_mode partial_mode = VOIDmode;
1360
1361           /* Skip this parm if it will not be passed on the stack.  */
1362           if (! args[i].pass_on_stack
1363               && args[i].reg != 0
1364               && args[i].partial == 0)
1365             continue;
1366
1367           if (GET_CODE (offset) == CONST_INT)
1368             addr = plus_constant (arg_reg, INTVAL (offset));
1369           else
1370             addr = gen_rtx_PLUS (Pmode, arg_reg, offset);
1371
1372           addr = plus_constant (addr, arg_offset);
1373
1374           if (args[i].partial != 0)
1375             {
1376               /* Only part of the parameter is being passed on the stack.
1377                  Generate a simple memory reference of the correct size.  */
1378               units_on_stack = args[i].locate.size.constant;
1379               partial_mode = mode_for_size (units_on_stack * BITS_PER_UNIT,
1380                                             MODE_INT, 1);
1381               args[i].stack = gen_rtx_MEM (partial_mode, addr);
1382               set_mem_size (args[i].stack, GEN_INT (units_on_stack));
1383             }
1384           else
1385             {
1386               args[i].stack = gen_rtx_MEM (args[i].mode, addr);
1387               set_mem_attributes (args[i].stack,
1388                                   TREE_TYPE (args[i].tree_value), 1);
1389             }
1390           align = BITS_PER_UNIT;
1391           boundary = args[i].locate.boundary;
1392           if (args[i].locate.where_pad != downward)
1393             align = boundary;
1394           else if (GET_CODE (offset) == CONST_INT)
1395             {
1396               align = INTVAL (offset) * BITS_PER_UNIT | boundary;
1397               align = align & -align;
1398             }
1399           set_mem_align (args[i].stack, align);
1400
1401           if (GET_CODE (slot_offset) == CONST_INT)
1402             addr = plus_constant (arg_reg, INTVAL (slot_offset));
1403           else
1404             addr = gen_rtx_PLUS (Pmode, arg_reg, slot_offset);
1405
1406           addr = plus_constant (addr, arg_offset);
1407
1408           if (args[i].partial != 0)
1409             {
1410               /* Only part of the parameter is being passed on the stack.
1411                  Generate a simple memory reference of the correct size.
1412                */
1413               args[i].stack_slot = gen_rtx_MEM (partial_mode, addr);
1414               set_mem_size (args[i].stack_slot, GEN_INT (units_on_stack));
1415             }
1416           else
1417             {
1418               args[i].stack_slot = gen_rtx_MEM (args[i].mode, addr);
1419               set_mem_attributes (args[i].stack_slot,
1420                                   TREE_TYPE (args[i].tree_value), 1);
1421             }
1422           set_mem_align (args[i].stack_slot, args[i].locate.boundary);
1423
1424           /* Function incoming arguments may overlap with sibling call
1425              outgoing arguments and we cannot allow reordering of reads
1426              from function arguments with stores to outgoing arguments
1427              of sibling calls.  */
1428           set_mem_alias_set (args[i].stack, 0);
1429           set_mem_alias_set (args[i].stack_slot, 0);
1430         }
1431     }
1432 }
1433
1434 /* Given a FNDECL and EXP, return an rtx suitable for use as a target address
1435    in a call instruction.
1436
1437    FNDECL is the tree node for the target function.  For an indirect call
1438    FNDECL will be NULL_TREE.
1439
1440    ADDR is the operand 0 of CALL_EXPR for this call.  */
1441
1442 static rtx
1443 rtx_for_function_call (tree fndecl, tree addr)
1444 {
1445   rtx funexp;
1446
1447   /* Get the function to call, in the form of RTL.  */
1448   if (fndecl)
1449     {
1450       /* If this is the first use of the function, see if we need to
1451          make an external definition for it.  */
1452       if (! TREE_USED (fndecl))
1453         {
1454           assemble_external (fndecl);
1455           TREE_USED (fndecl) = 1;
1456         }
1457
1458       /* Get a SYMBOL_REF rtx for the function address.  */
1459       funexp = XEXP (DECL_RTL (fndecl), 0);
1460     }
1461   else
1462     /* Generate an rtx (probably a pseudo-register) for the address.  */
1463     {
1464       push_temp_slots ();
1465       funexp = expand_normal (addr);
1466       pop_temp_slots ();        /* FUNEXP can't be BLKmode.  */
1467     }
1468   return funexp;
1469 }
1470
1471 /* Return true if and only if SIZE storage units (usually bytes)
1472    starting from address ADDR overlap with already clobbered argument
1473    area.  This function is used to determine if we should give up a
1474    sibcall.  */
1475
1476 static bool
1477 mem_overlaps_already_clobbered_arg_p (rtx addr, unsigned HOST_WIDE_INT size)
1478 {
1479   HOST_WIDE_INT i;
1480
1481   if (addr == current_function_internal_arg_pointer)
1482     i = 0;
1483   else if (GET_CODE (addr) == PLUS
1484            && (XEXP (addr, 0)
1485                == current_function_internal_arg_pointer)
1486            && GET_CODE (XEXP (addr, 1)) == CONST_INT)
1487     i = INTVAL (XEXP (addr, 1));
1488   else
1489     return false;
1490
1491 #ifdef ARGS_GROW_DOWNWARD
1492   i = -i - size;
1493 #endif
1494   if (size > 0)
1495     {
1496       unsigned HOST_WIDE_INT k;
1497
1498       for (k = 0; k < size; k++)
1499         if (i + k < stored_args_map->n_bits
1500             && TEST_BIT (stored_args_map, i + k))
1501           return true;
1502     }
1503
1504   return false;
1505 }
1506
1507 /* Do the register loads required for any wholly-register parms or any
1508    parms which are passed both on the stack and in a register.  Their
1509    expressions were already evaluated.
1510
1511    Mark all register-parms as living through the call, putting these USE
1512    insns in the CALL_INSN_FUNCTION_USAGE field.
1513
1514    When IS_SIBCALL, perform the check_sibcall_argument_overlap
1515    checking, setting *SIBCALL_FAILURE if appropriate.  */
1516
1517 static void
1518 load_register_parameters (struct arg_data *args, int num_actuals,
1519                           rtx *call_fusage, int flags, int is_sibcall,
1520                           int *sibcall_failure)
1521 {
1522   int i, j;
1523
1524   for (i = 0; i < num_actuals; i++)
1525     {
1526       rtx reg = ((flags & ECF_SIBCALL)
1527                  ? args[i].tail_call_reg : args[i].reg);
1528       if (reg)
1529         {
1530           int partial = args[i].partial;
1531           int nregs;
1532           int size = 0;
1533           rtx before_arg = get_last_insn ();
1534           /* Set non-negative if we must move a word at a time, even if
1535              just one word (e.g, partial == 4 && mode == DFmode).  Set
1536              to -1 if we just use a normal move insn.  This value can be
1537              zero if the argument is a zero size structure.  */
1538           nregs = -1;
1539           if (GET_CODE (reg) == PARALLEL)
1540             ;
1541           else if (partial)
1542             {
1543               gcc_assert (partial % UNITS_PER_WORD == 0);
1544               nregs = partial / UNITS_PER_WORD;
1545             }
1546           else if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode)
1547             {
1548               size = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1549               nregs = (size + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD;
1550             }
1551           else
1552             size = GET_MODE_SIZE (args[i].mode);
1553
1554           /* Handle calls that pass values in multiple non-contiguous
1555              locations.  The Irix 6 ABI has examples of this.  */
1556
1557           if (GET_CODE (reg) == PARALLEL)
1558             emit_group_move (reg, args[i].parallel_value);
1559
1560           /* If simple case, just do move.  If normal partial, store_one_arg
1561              has already loaded the register for us.  In all other cases,
1562              load the register(s) from memory.  */
1563
1564           else if (nregs == -1)
1565             {
1566               emit_move_insn (reg, args[i].value);
1567 #ifdef BLOCK_REG_PADDING
1568               /* Handle case where we have a value that needs shifting
1569                  up to the msb.  eg. a QImode value and we're padding
1570                  upward on a BYTES_BIG_ENDIAN machine.  */
1571               if (size < UNITS_PER_WORD
1572                   && (args[i].locate.where_pad
1573                       == (BYTES_BIG_ENDIAN ? upward : downward)))
1574                 {
1575                   rtx x;
1576                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1577
1578                   /* Assigning REG here rather than a temp makes CALL_FUSAGE
1579                      report the whole reg as used.  Strictly speaking, the
1580                      call only uses SIZE bytes at the msb end, but it doesn't
1581                      seem worth generating rtl to say that.  */
1582                   reg = gen_rtx_REG (word_mode, REGNO (reg));
1583                   x = expand_shift (LSHIFT_EXPR, word_mode, reg,
1584                                     build_int_cst (NULL_TREE, shift),
1585                                     reg, 1);
1586                   if (x != reg)
1587                     emit_move_insn (reg, x);
1588                 }
1589 #endif
1590             }
1591
1592           /* If we have pre-computed the values to put in the registers in
1593              the case of non-aligned structures, copy them in now.  */
1594
1595           else if (args[i].n_aligned_regs != 0)
1596             for (j = 0; j < args[i].n_aligned_regs; j++)
1597               emit_move_insn (gen_rtx_REG (word_mode, REGNO (reg) + j),
1598                               args[i].aligned_regs[j]);
1599
1600           else if (partial == 0 || args[i].pass_on_stack)
1601             {
1602               rtx mem = validize_mem (args[i].value);
1603
1604               /* Check for overlap with already clobbered argument area.  */
1605               if (is_sibcall
1606                   && mem_overlaps_already_clobbered_arg_p (XEXP (args[i].value, 0),
1607                                                            size))
1608                 *sibcall_failure = 1;
1609
1610               /* Handle a BLKmode that needs shifting.  */
1611               if (nregs == 1 && size < UNITS_PER_WORD
1612 #ifdef BLOCK_REG_PADDING
1613                   && args[i].locate.where_pad == downward
1614 #else
1615                   && BYTES_BIG_ENDIAN
1616 #endif
1617                  )
1618                 {
1619                   rtx tem = operand_subword_force (mem, 0, args[i].mode);
1620                   rtx ri = gen_rtx_REG (word_mode, REGNO (reg));
1621                   rtx x = gen_reg_rtx (word_mode);
1622                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1623                   enum tree_code dir = BYTES_BIG_ENDIAN ? RSHIFT_EXPR
1624                                                         : LSHIFT_EXPR;
1625
1626                   emit_move_insn (x, tem);
1627                   x = expand_shift (dir, word_mode, x,
1628                                     build_int_cst (NULL_TREE, shift),
1629                                     ri, 1);
1630                   if (x != ri)
1631                     emit_move_insn (ri, x);
1632                 }
1633               else
1634                 move_block_to_reg (REGNO (reg), mem, nregs, args[i].mode);
1635             }
1636
1637           /* When a parameter is a block, and perhaps in other cases, it is
1638              possible that it did a load from an argument slot that was
1639              already clobbered.  */
1640           if (is_sibcall
1641               && check_sibcall_argument_overlap (before_arg, &args[i], 0))
1642             *sibcall_failure = 1;
1643
1644           /* Handle calls that pass values in multiple non-contiguous
1645              locations.  The Irix 6 ABI has examples of this.  */
1646           if (GET_CODE (reg) == PARALLEL)
1647             use_group_regs (call_fusage, reg);
1648           else if (nregs == -1)
1649             use_reg (call_fusage, reg);
1650           else if (nregs > 0)
1651             use_regs (call_fusage, REGNO (reg), nregs);
1652         }
1653     }
1654 }
1655
1656 /* We need to pop PENDING_STACK_ADJUST bytes.  But, if the arguments
1657    wouldn't fill up an even multiple of PREFERRED_UNIT_STACK_BOUNDARY
1658    bytes, then we would need to push some additional bytes to pad the
1659    arguments.  So, we compute an adjust to the stack pointer for an
1660    amount that will leave the stack under-aligned by UNADJUSTED_ARGS_SIZE
1661    bytes.  Then, when the arguments are pushed the stack will be perfectly
1662    aligned.  ARGS_SIZE->CONSTANT is set to the number of bytes that should
1663    be popped after the call.  Returns the adjustment.  */
1664
1665 static int
1666 combine_pending_stack_adjustment_and_call (int unadjusted_args_size,
1667                                            struct args_size *args_size,
1668                                            unsigned int preferred_unit_stack_boundary)
1669 {
1670   /* The number of bytes to pop so that the stack will be
1671      under-aligned by UNADJUSTED_ARGS_SIZE bytes.  */
1672   HOST_WIDE_INT adjustment;
1673   /* The alignment of the stack after the arguments are pushed, if we
1674      just pushed the arguments without adjust the stack here.  */
1675   unsigned HOST_WIDE_INT unadjusted_alignment;
1676
1677   unadjusted_alignment
1678     = ((stack_pointer_delta + unadjusted_args_size)
1679        % preferred_unit_stack_boundary);
1680
1681   /* We want to get rid of as many of the PENDING_STACK_ADJUST bytes
1682      as possible -- leaving just enough left to cancel out the
1683      UNADJUSTED_ALIGNMENT.  In other words, we want to ensure that the
1684      PENDING_STACK_ADJUST is non-negative, and congruent to
1685      -UNADJUSTED_ALIGNMENT modulo the PREFERRED_UNIT_STACK_BOUNDARY.  */
1686
1687   /* Begin by trying to pop all the bytes.  */
1688   unadjusted_alignment
1689     = (unadjusted_alignment
1690        - (pending_stack_adjust % preferred_unit_stack_boundary));
1691   adjustment = pending_stack_adjust;
1692   /* Push enough additional bytes that the stack will be aligned
1693      after the arguments are pushed.  */
1694   if (preferred_unit_stack_boundary > 1)
1695     {
1696       if (unadjusted_alignment > 0)
1697         adjustment -= preferred_unit_stack_boundary - unadjusted_alignment;
1698       else
1699         adjustment += unadjusted_alignment;
1700     }
1701
1702   /* Now, sets ARGS_SIZE->CONSTANT so that we pop the right number of
1703      bytes after the call.  The right number is the entire
1704      PENDING_STACK_ADJUST less our ADJUSTMENT plus the amount required
1705      by the arguments in the first place.  */
1706   args_size->constant
1707     = pending_stack_adjust - adjustment + unadjusted_args_size;
1708
1709   return adjustment;
1710 }
1711
1712 /* Scan X expression if it does not dereference any argument slots
1713    we already clobbered by tail call arguments (as noted in stored_args_map
1714    bitmap).
1715    Return nonzero if X expression dereferences such argument slots,
1716    zero otherwise.  */
1717
1718 static int
1719 check_sibcall_argument_overlap_1 (rtx x)
1720 {
1721   RTX_CODE code;
1722   int i, j;
1723   const char *fmt;
1724
1725   if (x == NULL_RTX)
1726     return 0;
1727
1728   code = GET_CODE (x);
1729
1730   if (code == MEM)
1731     return mem_overlaps_already_clobbered_arg_p (XEXP (x, 0),
1732                                                  GET_MODE_SIZE (GET_MODE (x)));
1733
1734   /* Scan all subexpressions.  */
1735   fmt = GET_RTX_FORMAT (code);
1736   for (i = 0; i < GET_RTX_LENGTH (code); i++, fmt++)
1737     {
1738       if (*fmt == 'e')
1739         {
1740           if (check_sibcall_argument_overlap_1 (XEXP (x, i)))
1741             return 1;
1742         }
1743       else if (*fmt == 'E')
1744         {
1745           for (j = 0; j < XVECLEN (x, i); j++)
1746             if (check_sibcall_argument_overlap_1 (XVECEXP (x, i, j)))
1747               return 1;
1748         }
1749     }
1750   return 0;
1751 }
1752
1753 /* Scan sequence after INSN if it does not dereference any argument slots
1754    we already clobbered by tail call arguments (as noted in stored_args_map
1755    bitmap).  If MARK_STORED_ARGS_MAP, add stack slots for ARG to
1756    stored_args_map bitmap afterwards (when ARG is a register MARK_STORED_ARGS_MAP
1757    should be 0).  Return nonzero if sequence after INSN dereferences such argument
1758    slots, zero otherwise.  */
1759
1760 static int
1761 check_sibcall_argument_overlap (rtx insn, struct arg_data *arg, int mark_stored_args_map)
1762 {
1763   int low, high;
1764
1765   if (insn == NULL_RTX)
1766     insn = get_insns ();
1767   else
1768     insn = NEXT_INSN (insn);
1769
1770   for (; insn; insn = NEXT_INSN (insn))
1771     if (INSN_P (insn)
1772         && check_sibcall_argument_overlap_1 (PATTERN (insn)))
1773       break;
1774
1775   if (mark_stored_args_map)
1776     {
1777 #ifdef ARGS_GROW_DOWNWARD
1778       low = -arg->locate.slot_offset.constant - arg->locate.size.constant;
1779 #else
1780       low = arg->locate.slot_offset.constant;
1781 #endif
1782
1783       for (high = low + arg->locate.size.constant; low < high; low++)
1784         SET_BIT (stored_args_map, low);
1785     }
1786   return insn != NULL_RTX;
1787 }
1788
1789 /* Given that a function returns a value of mode MODE at the most
1790    significant end of hard register VALUE, shift VALUE left or right
1791    as specified by LEFT_P.  Return true if some action was needed.  */
1792
1793 bool
1794 shift_return_value (enum machine_mode mode, bool left_p, rtx value)
1795 {
1796   HOST_WIDE_INT shift;
1797
1798   gcc_assert (REG_P (value) && HARD_REGISTER_P (value));
1799   shift = GET_MODE_BITSIZE (GET_MODE (value)) - GET_MODE_BITSIZE (mode);
1800   if (shift == 0)
1801     return false;
1802
1803   /* Use ashr rather than lshr for right shifts.  This is for the benefit
1804      of the MIPS port, which requires SImode values to be sign-extended
1805      when stored in 64-bit registers.  */
1806   if (!force_expand_binop (GET_MODE (value), left_p ? ashl_optab : ashr_optab,
1807                            value, GEN_INT (shift), value, 1, OPTAB_WIDEN))
1808     gcc_unreachable ();
1809   return true;
1810 }
1811
1812 /* Generate all the code for a function call
1813    and return an rtx for its value.
1814    Store the value in TARGET (specified as an rtx) if convenient.
1815    If the value is stored in TARGET then TARGET is returned.
1816    If IGNORE is nonzero, then we ignore the value of the function call.  */
1817
1818 rtx
1819 expand_call (tree exp, rtx target, int ignore)
1820 {
1821   /* Nonzero if we are currently expanding a call.  */
1822   static int currently_expanding_call = 0;
1823
1824   /* List of actual parameters.  */
1825   tree actparms = TREE_OPERAND (exp, 1);
1826   /* RTX for the function to be called.  */
1827   rtx funexp;
1828   /* Sequence of insns to perform a normal "call".  */
1829   rtx normal_call_insns = NULL_RTX;
1830   /* Sequence of insns to perform a tail "call".  */
1831   rtx tail_call_insns = NULL_RTX;
1832   /* Data type of the function.  */
1833   tree funtype;
1834   tree type_arg_types;
1835   /* Declaration of the function being called,
1836      or 0 if the function is computed (not known by name).  */
1837   tree fndecl = 0;
1838   /* The type of the function being called.  */
1839   tree fntype;
1840   bool try_tail_call = CALL_EXPR_TAILCALL (exp);
1841   int pass;
1842
1843   /* Register in which non-BLKmode value will be returned,
1844      or 0 if no value or if value is BLKmode.  */
1845   rtx valreg;
1846   /* Address where we should return a BLKmode value;
1847      0 if value not BLKmode.  */
1848   rtx structure_value_addr = 0;
1849   /* Nonzero if that address is being passed by treating it as
1850      an extra, implicit first parameter.  Otherwise,
1851      it is passed by being copied directly into struct_value_rtx.  */
1852   int structure_value_addr_parm = 0;
1853   /* Size of aggregate value wanted, or zero if none wanted
1854      or if we are using the non-reentrant PCC calling convention
1855      or expecting the value in registers.  */
1856   HOST_WIDE_INT struct_value_size = 0;
1857   /* Nonzero if called function returns an aggregate in memory PCC style,
1858      by returning the address of where to find it.  */
1859   int pcc_struct_value = 0;
1860   rtx struct_value = 0;
1861
1862   /* Number of actual parameters in this call, including struct value addr.  */
1863   int num_actuals;
1864   /* Number of named args.  Args after this are anonymous ones
1865      and they must all go on the stack.  */
1866   int n_named_args;
1867
1868   /* Vector of information about each argument.
1869      Arguments are numbered in the order they will be pushed,
1870      not the order they are written.  */
1871   struct arg_data *args;
1872
1873   /* Total size in bytes of all the stack-parms scanned so far.  */
1874   struct args_size args_size;
1875   struct args_size adjusted_args_size;
1876   /* Size of arguments before any adjustments (such as rounding).  */
1877   int unadjusted_args_size;
1878   /* Data on reg parms scanned so far.  */
1879   CUMULATIVE_ARGS args_so_far;
1880   /* Nonzero if a reg parm has been scanned.  */
1881   int reg_parm_seen;
1882   /* Nonzero if this is an indirect function call.  */
1883
1884   /* Nonzero if we must avoid push-insns in the args for this call.
1885      If stack space is allocated for register parameters, but not by the
1886      caller, then it is preallocated in the fixed part of the stack frame.
1887      So the entire argument block must then be preallocated (i.e., we
1888      ignore PUSH_ROUNDING in that case).  */
1889
1890   int must_preallocate = !PUSH_ARGS;
1891
1892   /* Size of the stack reserved for parameter registers.  */
1893   int reg_parm_stack_space = 0;
1894
1895   /* Address of space preallocated for stack parms
1896      (on machines that lack push insns), or 0 if space not preallocated.  */
1897   rtx argblock = 0;
1898
1899   /* Mask of ECF_ flags.  */
1900   int flags = 0;
1901 #ifdef REG_PARM_STACK_SPACE
1902   /* Define the boundary of the register parm stack space that needs to be
1903      saved, if any.  */
1904   int low_to_save, high_to_save;
1905   rtx save_area = 0;            /* Place that it is saved */
1906 #endif
1907
1908   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
1909   char *initial_stack_usage_map = stack_usage_map;
1910   char *stack_usage_map_buf = NULL;
1911
1912   int old_stack_allocated;
1913
1914   /* State variables to track stack modifications.  */
1915   rtx old_stack_level = 0;
1916   int old_stack_arg_under_construction = 0;
1917   int old_pending_adj = 0;
1918   int old_inhibit_defer_pop = inhibit_defer_pop;
1919
1920   /* Some stack pointer alterations we make are performed via
1921      allocate_dynamic_stack_space. This modifies the stack_pointer_delta,
1922      which we then also need to save/restore along the way.  */
1923   int old_stack_pointer_delta = 0;
1924
1925   rtx call_fusage;
1926   tree p = TREE_OPERAND (exp, 0);
1927   tree addr = TREE_OPERAND (exp, 0);
1928   int i;
1929   /* The alignment of the stack, in bits.  */
1930   unsigned HOST_WIDE_INT preferred_stack_boundary;
1931   /* The alignment of the stack, in bytes.  */
1932   unsigned HOST_WIDE_INT preferred_unit_stack_boundary;
1933   /* The static chain value to use for this call.  */
1934   rtx static_chain_value;
1935   /* See if this is "nothrow" function call.  */
1936   if (TREE_NOTHROW (exp))
1937     flags |= ECF_NOTHROW;
1938
1939   /* See if we can find a DECL-node for the actual function, and get the
1940      function attributes (flags) from the function decl or type node.  */
1941   fndecl = get_callee_fndecl (exp);
1942   if (fndecl)
1943     {
1944       fntype = TREE_TYPE (fndecl);
1945       flags |= flags_from_decl_or_type (fndecl);
1946     }
1947   else
1948     {
1949       fntype = TREE_TYPE (TREE_TYPE (p));
1950       flags |= flags_from_decl_or_type (fntype);
1951     }
1952
1953   struct_value = targetm.calls.struct_value_rtx (fntype, 0);
1954
1955   /* Warn if this value is an aggregate type,
1956      regardless of which calling convention we are using for it.  */
1957   if (AGGREGATE_TYPE_P (TREE_TYPE (exp)))
1958     warning (OPT_Waggregate_return, "function call has aggregate value");
1959
1960   /* If the result of a pure or const function call is ignored (or void),
1961      and none of its arguments are volatile, we can avoid expanding the
1962      call and just evaluate the arguments for side-effects.  */
1963   if ((flags & (ECF_CONST | ECF_PURE))
1964       && (ignore || target == const0_rtx
1965           || TYPE_MODE (TREE_TYPE (exp)) == VOIDmode))
1966     {
1967       bool volatilep = false;
1968       tree arg;
1969
1970       for (arg = actparms; arg; arg = TREE_CHAIN (arg))
1971         if (TREE_THIS_VOLATILE (TREE_VALUE (arg)))
1972           {
1973             volatilep = true;
1974             break;
1975           }
1976
1977       if (! volatilep)
1978         {
1979           for (arg = actparms; arg; arg = TREE_CHAIN (arg))
1980             expand_expr (TREE_VALUE (arg), const0_rtx,
1981                          VOIDmode, EXPAND_NORMAL);
1982           return const0_rtx;
1983         }
1984     }
1985
1986 #ifdef REG_PARM_STACK_SPACE
1987   reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
1988 #endif
1989
1990 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1991   if (reg_parm_stack_space > 0 && PUSH_ARGS)
1992     must_preallocate = 1;
1993 #endif
1994
1995   /* Set up a place to return a structure.  */
1996
1997   /* Cater to broken compilers.  */
1998   if (aggregate_value_p (exp, fndecl))
1999     {
2000       /* This call returns a big structure.  */
2001       flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
2002
2003 #ifdef PCC_STATIC_STRUCT_RETURN
2004       {
2005         pcc_struct_value = 1;
2006       }
2007 #else /* not PCC_STATIC_STRUCT_RETURN */
2008       {
2009         struct_value_size = int_size_in_bytes (TREE_TYPE (exp));
2010
2011         if (target && MEM_P (target) && CALL_EXPR_RETURN_SLOT_OPT (exp))
2012           structure_value_addr = XEXP (target, 0);
2013         else
2014           {
2015             /* For variable-sized objects, we must be called with a target
2016                specified.  If we were to allocate space on the stack here,
2017                we would have no way of knowing when to free it.  */
2018             rtx d = assign_temp (TREE_TYPE (exp), 0, 1, 1);
2019
2020             mark_temp_addr_taken (d);
2021             structure_value_addr = XEXP (d, 0);
2022             target = 0;
2023           }
2024       }
2025 #endif /* not PCC_STATIC_STRUCT_RETURN */
2026     }
2027
2028   /* Figure out the amount to which the stack should be aligned.  */
2029   preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
2030   if (fndecl)
2031     {
2032       struct cgraph_rtl_info *i = cgraph_rtl_info (fndecl);
2033       if (i && i->preferred_incoming_stack_boundary)
2034         preferred_stack_boundary = i->preferred_incoming_stack_boundary;
2035     }
2036
2037   /* Operand 0 is a pointer-to-function; get the type of the function.  */
2038   funtype = TREE_TYPE (addr);
2039   gcc_assert (POINTER_TYPE_P (funtype));
2040   funtype = TREE_TYPE (funtype);
2041
2042   /* Munge the tree to split complex arguments into their imaginary
2043      and real parts.  */
2044   if (targetm.calls.split_complex_arg)
2045     {
2046       type_arg_types = split_complex_types (TYPE_ARG_TYPES (funtype));
2047       actparms = split_complex_values (actparms);
2048     }
2049   else
2050     type_arg_types = TYPE_ARG_TYPES (funtype);
2051
2052   if (flags & ECF_MAY_BE_ALLOCA)
2053     current_function_calls_alloca = 1;
2054
2055   /* If struct_value_rtx is 0, it means pass the address
2056      as if it were an extra parameter.  */
2057   if (structure_value_addr && struct_value == 0)
2058     {
2059       /* If structure_value_addr is a REG other than
2060          virtual_outgoing_args_rtx, we can use always use it.  If it
2061          is not a REG, we must always copy it into a register.
2062          If it is virtual_outgoing_args_rtx, we must copy it to another
2063          register in some cases.  */
2064       rtx temp = (!REG_P (structure_value_addr)
2065                   || (ACCUMULATE_OUTGOING_ARGS
2066                       && stack_arg_under_construction
2067                       && structure_value_addr == virtual_outgoing_args_rtx)
2068                   ? copy_addr_to_reg (convert_memory_address
2069                                       (Pmode, structure_value_addr))
2070                   : structure_value_addr);
2071
2072       actparms
2073         = tree_cons (error_mark_node,
2074                      make_tree (build_pointer_type (TREE_TYPE (funtype)),
2075                                 temp),
2076                      actparms);
2077       structure_value_addr_parm = 1;
2078     }
2079
2080   /* Count the arguments and set NUM_ACTUALS.  */
2081   for (p = actparms, num_actuals = 0; p; p = TREE_CHAIN (p))
2082     num_actuals++;
2083
2084   /* Compute number of named args.
2085      First, do a raw count of the args for INIT_CUMULATIVE_ARGS.  */
2086
2087   if (type_arg_types != 0)
2088     n_named_args
2089       = (list_length (type_arg_types)
2090          /* Count the struct value address, if it is passed as a parm.  */
2091          + structure_value_addr_parm);
2092   else
2093     /* If we know nothing, treat all args as named.  */
2094     n_named_args = num_actuals;
2095
2096   /* Start updating where the next arg would go.
2097
2098      On some machines (such as the PA) indirect calls have a different
2099      calling convention than normal calls.  The fourth argument in
2100      INIT_CUMULATIVE_ARGS tells the backend if this is an indirect call
2101      or not.  */
2102   INIT_CUMULATIVE_ARGS (args_so_far, funtype, NULL_RTX, fndecl, n_named_args);
2103
2104   /* Now possibly adjust the number of named args.
2105      Normally, don't include the last named arg if anonymous args follow.
2106      We do include the last named arg if
2107      targetm.calls.strict_argument_naming() returns nonzero.
2108      (If no anonymous args follow, the result of list_length is actually
2109      one too large.  This is harmless.)
2110
2111      If targetm.calls.pretend_outgoing_varargs_named() returns
2112      nonzero, and targetm.calls.strict_argument_naming() returns zero,
2113      this machine will be able to place unnamed args that were passed
2114      in registers into the stack.  So treat all args as named.  This
2115      allows the insns emitting for a specific argument list to be
2116      independent of the function declaration.
2117
2118      If targetm.calls.pretend_outgoing_varargs_named() returns zero,
2119      we do not have any reliable way to pass unnamed args in
2120      registers, so we must force them into memory.  */
2121
2122   if (type_arg_types != 0
2123       && targetm.calls.strict_argument_naming (&args_so_far))
2124     ;
2125   else if (type_arg_types != 0
2126            && ! targetm.calls.pretend_outgoing_varargs_named (&args_so_far))
2127     /* Don't include the last named arg.  */
2128     --n_named_args;
2129   else
2130     /* Treat all args as named.  */
2131     n_named_args = num_actuals;
2132
2133   /* Make a vector to hold all the information about each arg.  */
2134   args = alloca (num_actuals * sizeof (struct arg_data));
2135   memset (args, 0, num_actuals * sizeof (struct arg_data));
2136
2137   /* Build up entries in the ARGS array, compute the size of the
2138      arguments into ARGS_SIZE, etc.  */
2139   initialize_argument_information (num_actuals, args, &args_size,
2140                                    n_named_args, actparms, fndecl,
2141                                    &args_so_far, reg_parm_stack_space,
2142                                    &old_stack_level, &old_pending_adj,
2143                                    &must_preallocate, &flags,
2144                                    &try_tail_call, CALL_FROM_THUNK_P (exp));
2145
2146   if (args_size.var)
2147     {
2148       /* If this function requires a variable-sized argument list, don't
2149          try to make a cse'able block for this call.  We may be able to
2150          do this eventually, but it is too complicated to keep track of
2151          what insns go in the cse'able block and which don't.  */
2152
2153       flags &= ~ECF_LIBCALL_BLOCK;
2154       must_preallocate = 1;
2155     }
2156
2157   /* Now make final decision about preallocating stack space.  */
2158   must_preallocate = finalize_must_preallocate (must_preallocate,
2159                                                 num_actuals, args,
2160                                                 &args_size);
2161
2162   /* If the structure value address will reference the stack pointer, we
2163      must stabilize it.  We don't need to do this if we know that we are
2164      not going to adjust the stack pointer in processing this call.  */
2165
2166   if (structure_value_addr
2167       && (reg_mentioned_p (virtual_stack_dynamic_rtx, structure_value_addr)
2168           || reg_mentioned_p (virtual_outgoing_args_rtx,
2169                               structure_value_addr))
2170       && (args_size.var
2171           || (!ACCUMULATE_OUTGOING_ARGS && args_size.constant)))
2172     structure_value_addr = copy_to_reg (structure_value_addr);
2173
2174   /* Tail calls can make things harder to debug, and we've traditionally
2175      pushed these optimizations into -O2.  Don't try if we're already
2176      expanding a call, as that means we're an argument.  Don't try if
2177      there's cleanups, as we know there's code to follow the call.  */
2178
2179   if (currently_expanding_call++ != 0
2180       || !flag_optimize_sibling_calls
2181       || args_size.var
2182       || lookup_stmt_eh_region (exp) >= 0)
2183     try_tail_call = 0;
2184
2185   /*  Rest of purposes for tail call optimizations to fail.  */
2186   if (
2187 #ifdef HAVE_sibcall_epilogue
2188       !HAVE_sibcall_epilogue
2189 #else
2190       1
2191 #endif
2192       || !try_tail_call
2193       /* Doing sibling call optimization needs some work, since
2194          structure_value_addr can be allocated on the stack.
2195          It does not seem worth the effort since few optimizable
2196          sibling calls will return a structure.  */
2197       || structure_value_addr != NULL_RTX
2198       /* Check whether the target is able to optimize the call
2199          into a sibcall.  */
2200       || !targetm.function_ok_for_sibcall (fndecl, exp)
2201       /* Functions that do not return exactly once may not be sibcall
2202          optimized.  */
2203       || (flags & (ECF_RETURNS_TWICE | ECF_NORETURN))
2204       || TYPE_VOLATILE (TREE_TYPE (TREE_TYPE (addr)))
2205       /* If the called function is nested in the current one, it might access
2206          some of the caller's arguments, but could clobber them beforehand if
2207          the argument areas are shared.  */
2208       || (fndecl && decl_function_context (fndecl) == current_function_decl)
2209       /* If this function requires more stack slots than the current
2210          function, we cannot change it into a sibling call.
2211          current_function_pretend_args_size is not part of the
2212          stack allocated by our caller.  */
2213       || args_size.constant > (current_function_args_size
2214                                - current_function_pretend_args_size)
2215       /* If the callee pops its own arguments, then it must pop exactly
2216          the same number of arguments as the current function.  */
2217       || (RETURN_POPS_ARGS (fndecl, funtype, args_size.constant)
2218           != RETURN_POPS_ARGS (current_function_decl,
2219                                TREE_TYPE (current_function_decl),
2220                                current_function_args_size))
2221       || !lang_hooks.decls.ok_for_sibcall (fndecl))
2222     try_tail_call = 0;
2223
2224   /* Ensure current function's preferred stack boundary is at least
2225      what we need.  We don't have to increase alignment for recursive
2226      functions.  */
2227   if (cfun->preferred_stack_boundary < preferred_stack_boundary
2228       && fndecl != current_function_decl)
2229     cfun->preferred_stack_boundary = preferred_stack_boundary;
2230   if (fndecl == current_function_decl)
2231     cfun->recursive_call_emit = true;
2232
2233   preferred_unit_stack_boundary = preferred_stack_boundary / BITS_PER_UNIT;
2234
2235   /* We want to make two insn chains; one for a sibling call, the other
2236      for a normal call.  We will select one of the two chains after
2237      initial RTL generation is complete.  */
2238   for (pass = try_tail_call ? 0 : 1; pass < 2; pass++)
2239     {
2240       int sibcall_failure = 0;
2241       /* We want to emit any pending stack adjustments before the tail
2242          recursion "call".  That way we know any adjustment after the tail
2243          recursion call can be ignored if we indeed use the tail
2244          call expansion.  */
2245       int save_pending_stack_adjust = 0;
2246       int save_stack_pointer_delta = 0;
2247       rtx insns;
2248       rtx before_call, next_arg_reg;
2249
2250       if (pass == 0)
2251         {
2252           /* State variables we need to save and restore between
2253              iterations.  */
2254           save_pending_stack_adjust = pending_stack_adjust;
2255           save_stack_pointer_delta = stack_pointer_delta;
2256         }
2257       if (pass)
2258         flags &= ~ECF_SIBCALL;
2259       else
2260         flags |= ECF_SIBCALL;
2261
2262       /* Other state variables that we must reinitialize each time
2263          through the loop (that are not initialized by the loop itself).  */
2264       argblock = 0;
2265       call_fusage = 0;
2266
2267       /* Start a new sequence for the normal call case.
2268
2269          From this point on, if the sibling call fails, we want to set
2270          sibcall_failure instead of continuing the loop.  */
2271       start_sequence ();
2272
2273       /* Don't let pending stack adjusts add up to too much.
2274          Also, do all pending adjustments now if there is any chance
2275          this might be a call to alloca or if we are expanding a sibling
2276          call sequence or if we are calling a function that is to return
2277          with stack pointer depressed.
2278          Also do the adjustments before a throwing call, otherwise
2279          exception handling can fail; PR 19225. */
2280       if (pending_stack_adjust >= 32
2281           || (pending_stack_adjust > 0
2282               && (flags & (ECF_MAY_BE_ALLOCA | ECF_SP_DEPRESSED)))
2283           || (pending_stack_adjust > 0
2284               && flag_exceptions && !(flags & ECF_NOTHROW))
2285           || pass == 0)
2286         do_pending_stack_adjust ();
2287
2288       /* When calling a const function, we must pop the stack args right away,
2289          so that the pop is deleted or moved with the call.  */
2290       if (pass && (flags & ECF_LIBCALL_BLOCK))
2291         NO_DEFER_POP;
2292
2293       /* Precompute any arguments as needed.  */
2294       if (pass)
2295         precompute_arguments (flags, num_actuals, args);
2296
2297       /* Now we are about to start emitting insns that can be deleted
2298          if a libcall is deleted.  */
2299       if (pass && (flags & (ECF_LIBCALL_BLOCK | ECF_MALLOC)))
2300         start_sequence ();
2301
2302       if (pass == 0 && cfun->stack_protect_guard)
2303         stack_protect_epilogue ();
2304
2305       adjusted_args_size = args_size;
2306       /* Compute the actual size of the argument block required.  The variable
2307          and constant sizes must be combined, the size may have to be rounded,
2308          and there may be a minimum required size.  When generating a sibcall
2309          pattern, do not round up, since we'll be re-using whatever space our
2310          caller provided.  */
2311       unadjusted_args_size
2312         = compute_argument_block_size (reg_parm_stack_space,
2313                                        &adjusted_args_size,
2314                                        (pass == 0 ? 0
2315                                         : preferred_stack_boundary));
2316
2317       old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
2318
2319       /* The argument block when performing a sibling call is the
2320          incoming argument block.  */
2321       if (pass == 0)
2322         {
2323           argblock = virtual_incoming_args_rtx;
2324           argblock
2325 #ifdef STACK_GROWS_DOWNWARD
2326             = plus_constant (argblock, current_function_pretend_args_size);
2327 #else
2328             = plus_constant (argblock, -current_function_pretend_args_size);
2329 #endif
2330           stored_args_map = sbitmap_alloc (args_size.constant);
2331           sbitmap_zero (stored_args_map);
2332         }
2333
2334       /* If we have no actual push instructions, or shouldn't use them,
2335          make space for all args right now.  */
2336       else if (adjusted_args_size.var != 0)
2337         {
2338           if (old_stack_level == 0)
2339             {
2340               emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
2341               old_stack_pointer_delta = stack_pointer_delta;
2342               old_pending_adj = pending_stack_adjust;
2343               pending_stack_adjust = 0;
2344               /* stack_arg_under_construction says whether a stack arg is
2345                  being constructed at the old stack level.  Pushing the stack
2346                  gets a clean outgoing argument block.  */
2347               old_stack_arg_under_construction = stack_arg_under_construction;
2348               stack_arg_under_construction = 0;
2349             }
2350           argblock = push_block (ARGS_SIZE_RTX (adjusted_args_size), 0, 0);
2351         }
2352       else
2353         {
2354           /* Note that we must go through the motions of allocating an argument
2355              block even if the size is zero because we may be storing args
2356              in the area reserved for register arguments, which may be part of
2357              the stack frame.  */
2358
2359           int needed = adjusted_args_size.constant;
2360
2361           /* Store the maximum argument space used.  It will be pushed by
2362              the prologue (if ACCUMULATE_OUTGOING_ARGS, or stack overflow
2363              checking).  */
2364
2365           if (needed > current_function_outgoing_args_size)
2366             current_function_outgoing_args_size = needed;
2367
2368           if (must_preallocate)
2369             {
2370               if (ACCUMULATE_OUTGOING_ARGS)
2371                 {
2372                   /* Since the stack pointer will never be pushed, it is
2373                      possible for the evaluation of a parm to clobber
2374                      something we have already written to the stack.
2375                      Since most function calls on RISC machines do not use
2376                      the stack, this is uncommon, but must work correctly.
2377
2378                      Therefore, we save any area of the stack that was already
2379                      written and that we are using.  Here we set up to do this
2380                      by making a new stack usage map from the old one.  The
2381                      actual save will be done by store_one_arg.
2382
2383                      Another approach might be to try to reorder the argument
2384                      evaluations to avoid this conflicting stack usage.  */
2385
2386 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2387                   /* Since we will be writing into the entire argument area,
2388                      the map must be allocated for its entire size, not just
2389                      the part that is the responsibility of the caller.  */
2390                   needed += reg_parm_stack_space;
2391 #endif
2392
2393 #ifdef ARGS_GROW_DOWNWARD
2394                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2395                                                      needed + 1);
2396 #else
2397                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2398                                                      needed);
2399 #endif
2400                   if (stack_usage_map_buf)
2401                     free (stack_usage_map_buf);
2402                   stack_usage_map_buf = XNEWVEC (char, highest_outgoing_arg_in_use);
2403                   stack_usage_map = stack_usage_map_buf;
2404
2405                   if (initial_highest_arg_in_use)
2406                     memcpy (stack_usage_map, initial_stack_usage_map,
2407                             initial_highest_arg_in_use);
2408
2409                   if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
2410                     memset (&stack_usage_map[initial_highest_arg_in_use], 0,
2411                            (highest_outgoing_arg_in_use
2412                             - initial_highest_arg_in_use));
2413                   needed = 0;
2414
2415                   /* The address of the outgoing argument list must not be
2416                      copied to a register here, because argblock would be left
2417                      pointing to the wrong place after the call to
2418                      allocate_dynamic_stack_space below.  */
2419
2420                   argblock = virtual_outgoing_args_rtx;
2421                 }
2422               else
2423                 {
2424                   if (inhibit_defer_pop == 0)
2425                     {
2426                       /* Try to reuse some or all of the pending_stack_adjust
2427                          to get this space.  */
2428                       needed
2429                         = (combine_pending_stack_adjustment_and_call
2430                            (unadjusted_args_size,
2431                             &adjusted_args_size,
2432                             preferred_unit_stack_boundary));
2433
2434                       /* combine_pending_stack_adjustment_and_call computes
2435                          an adjustment before the arguments are allocated.
2436                          Account for them and see whether or not the stack
2437                          needs to go up or down.  */
2438                       needed = unadjusted_args_size - needed;
2439
2440                       if (needed < 0)
2441                         {
2442                           /* We're releasing stack space.  */
2443                           /* ??? We can avoid any adjustment at all if we're
2444                              already aligned.  FIXME.  */
2445                           pending_stack_adjust = -needed;
2446                           do_pending_stack_adjust ();
2447                           needed = 0;
2448                         }
2449                       else
2450                         /* We need to allocate space.  We'll do that in
2451                            push_block below.  */
2452                         pending_stack_adjust = 0;
2453                     }
2454
2455                   /* Special case this because overhead of `push_block' in
2456                      this case is non-trivial.  */
2457                   if (needed == 0)
2458                     argblock = virtual_outgoing_args_rtx;
2459                   else
2460                     {
2461                       argblock = push_block (GEN_INT (needed), 0, 0);
2462 #ifdef ARGS_GROW_DOWNWARD
2463                       argblock = plus_constant (argblock, needed);
2464 #endif
2465                     }
2466
2467                   /* We only really need to call `copy_to_reg' in the case
2468                      where push insns are going to be used to pass ARGBLOCK
2469                      to a function call in ARGS.  In that case, the stack
2470                      pointer changes value from the allocation point to the
2471                      call point, and hence the value of
2472                      VIRTUAL_OUTGOING_ARGS_RTX changes as well.  But might
2473                      as well always do it.  */
2474                   argblock = copy_to_reg (argblock);
2475                 }
2476             }
2477         }
2478
2479       if (ACCUMULATE_OUTGOING_ARGS)
2480         {
2481           /* The save/restore code in store_one_arg handles all
2482              cases except one: a constructor call (including a C
2483              function returning a BLKmode struct) to initialize
2484              an argument.  */
2485           if (stack_arg_under_construction)
2486             {
2487 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2488               rtx push_size = GEN_INT (reg_parm_stack_space
2489                                        + adjusted_args_size.constant);
2490 #else
2491               rtx push_size = GEN_INT (adjusted_args_size.constant);
2492 #endif
2493               if (old_stack_level == 0)
2494                 {
2495                   emit_stack_save (SAVE_BLOCK, &old_stack_level,
2496                                    NULL_RTX);
2497                   old_stack_pointer_delta = stack_pointer_delta;
2498                   old_pending_adj = pending_stack_adjust;
2499                   pending_stack_adjust = 0;
2500                   /* stack_arg_under_construction says whether a stack
2501                      arg is being constructed at the old stack level.
2502                      Pushing the stack gets a clean outgoing argument
2503                      block.  */
2504                   old_stack_arg_under_construction
2505                     = stack_arg_under_construction;
2506                   stack_arg_under_construction = 0;
2507                   /* Make a new map for the new argument list.  */
2508                   if (stack_usage_map_buf)
2509                     free (stack_usage_map_buf);
2510                   stack_usage_map_buf = XCNEWVEC (char, highest_outgoing_arg_in_use);
2511                   stack_usage_map = stack_usage_map_buf;
2512                   highest_outgoing_arg_in_use = 0;
2513                 }
2514               allocate_dynamic_stack_space (push_size, NULL_RTX,
2515                                             BITS_PER_UNIT);
2516             }
2517
2518           /* If argument evaluation might modify the stack pointer,
2519              copy the address of the argument list to a register.  */
2520           for (i = 0; i < num_actuals; i++)
2521             if (args[i].pass_on_stack)
2522               {
2523                 argblock = copy_addr_to_reg (argblock);
2524                 break;
2525               }
2526         }
2527
2528       compute_argument_addresses (args, argblock, num_actuals);
2529
2530       /* If we push args individually in reverse order, perform stack alignment
2531          before the first push (the last arg).  */
2532       if (PUSH_ARGS_REVERSED && argblock == 0
2533           && adjusted_args_size.constant != unadjusted_args_size)
2534         {
2535           /* When the stack adjustment is pending, we get better code
2536              by combining the adjustments.  */
2537           if (pending_stack_adjust
2538               && ! (flags & ECF_LIBCALL_BLOCK)
2539               && ! inhibit_defer_pop)
2540             {
2541               pending_stack_adjust
2542                 = (combine_pending_stack_adjustment_and_call
2543                    (unadjusted_args_size,
2544                     &adjusted_args_size,
2545                     preferred_unit_stack_boundary));
2546               do_pending_stack_adjust ();
2547             }
2548           else if (argblock == 0)
2549             anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2550                                         - unadjusted_args_size));
2551         }
2552       /* Now that the stack is properly aligned, pops can't safely
2553          be deferred during the evaluation of the arguments.  */
2554       NO_DEFER_POP;
2555
2556       funexp = rtx_for_function_call (fndecl, addr);
2557
2558       /* Figure out the register where the value, if any, will come back.  */
2559       valreg = 0;
2560       if (TYPE_MODE (TREE_TYPE (exp)) != VOIDmode
2561           && ! structure_value_addr)
2562         {
2563           if (pcc_struct_value)
2564             valreg = hard_function_value (build_pointer_type (TREE_TYPE (exp)),
2565                                           fndecl, NULL, (pass == 0));
2566           else
2567             valreg = hard_function_value (TREE_TYPE (exp), fndecl, fntype,
2568                                           (pass == 0));
2569
2570           /* If VALREG is a PARALLEL whose first member has a zero
2571              offset, use that.  This is for targets such as m68k that
2572              return the same value in multiple places.  */
2573           if (GET_CODE (valreg) == PARALLEL)
2574             {
2575               rtx elem = XVECEXP (valreg, 0, 0);
2576               rtx where = XEXP (elem, 0);
2577               rtx offset = XEXP (elem, 1);
2578               if (offset == const0_rtx
2579                   && GET_MODE (where) == GET_MODE (valreg))
2580                 valreg = where;
2581             }
2582         }
2583
2584       /* Precompute all register parameters.  It isn't safe to compute anything
2585          once we have started filling any specific hard regs.  */
2586       precompute_register_parameters (num_actuals, args, &reg_parm_seen);
2587
2588       if (TREE_OPERAND (exp, 2))
2589         static_chain_value = expand_normal (TREE_OPERAND (exp, 2));
2590       else
2591         static_chain_value = 0;
2592
2593 #ifdef REG_PARM_STACK_SPACE
2594       /* Save the fixed argument area if it's part of the caller's frame and
2595          is clobbered by argument setup for this call.  */
2596       if (ACCUMULATE_OUTGOING_ARGS && pass)
2597         save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
2598                                               &low_to_save, &high_to_save);
2599 #endif
2600
2601       /* Now store (and compute if necessary) all non-register parms.
2602          These come before register parms, since they can require block-moves,
2603          which could clobber the registers used for register parms.
2604          Parms which have partial registers are not stored here,
2605          but we do preallocate space here if they want that.  */
2606
2607       for (i = 0; i < num_actuals; i++)
2608         if (args[i].reg == 0 || args[i].pass_on_stack)
2609           {
2610             rtx before_arg = get_last_insn ();
2611
2612             if (store_one_arg (&args[i], argblock, flags,
2613                                adjusted_args_size.var != 0,
2614                                reg_parm_stack_space)
2615                 || (pass == 0
2616                     && check_sibcall_argument_overlap (before_arg,
2617                                                        &args[i], 1)))
2618               sibcall_failure = 1;
2619
2620             if (flags & ECF_CONST
2621                 && args[i].stack
2622                 && args[i].value == args[i].stack)
2623               call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
2624                                                gen_rtx_USE (VOIDmode,
2625                                                             args[i].value),
2626                                                call_fusage);
2627           }
2628
2629       /* If we have a parm that is passed in registers but not in memory
2630          and whose alignment does not permit a direct copy into registers,
2631          make a group of pseudos that correspond to each register that we
2632          will later fill.  */
2633       if (STRICT_ALIGNMENT)
2634         store_unaligned_arguments_into_pseudos (args, num_actuals);
2635
2636       /* Now store any partially-in-registers parm.
2637          This is the last place a block-move can happen.  */
2638       if (reg_parm_seen)
2639         for (i = 0; i < num_actuals; i++)
2640           if (args[i].partial != 0 && ! args[i].pass_on_stack)
2641             {
2642               rtx before_arg = get_last_insn ();
2643
2644               if (store_one_arg (&args[i], argblock, flags,
2645                                  adjusted_args_size.var != 0,
2646                                  reg_parm_stack_space)
2647                   || (pass == 0
2648                       && check_sibcall_argument_overlap (before_arg,
2649                                                          &args[i], 1)))
2650                 sibcall_failure = 1;
2651             }
2652
2653       /* If we pushed args in forward order, perform stack alignment
2654          after pushing the last arg.  */
2655       if (!PUSH_ARGS_REVERSED && argblock == 0)
2656         anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2657                                     - unadjusted_args_size));
2658
2659       /* If register arguments require space on the stack and stack space
2660          was not preallocated, allocate stack space here for arguments
2661          passed in registers.  */
2662 #ifdef OUTGOING_REG_PARM_STACK_SPACE
2663       if (!ACCUMULATE_OUTGOING_ARGS
2664           && must_preallocate == 0 && reg_parm_stack_space > 0)
2665         anti_adjust_stack (GEN_INT (reg_parm_stack_space));
2666 #endif
2667
2668       /* Pass the function the address in which to return a
2669          structure value.  */
2670       if (pass != 0 && structure_value_addr && ! structure_value_addr_parm)
2671         {
2672           structure_value_addr
2673             = convert_memory_address (Pmode, structure_value_addr);
2674           emit_move_insn (struct_value,
2675                           force_reg (Pmode,
2676                                      force_operand (structure_value_addr,
2677                                                     NULL_RTX)));
2678
2679           if (REG_P (struct_value))
2680             use_reg (&call_fusage, struct_value);
2681         }
2682
2683       funexp = prepare_call_address (funexp, static_chain_value,
2684                                      &call_fusage, reg_parm_seen, pass == 0);
2685
2686       load_register_parameters (args, num_actuals, &call_fusage, flags,
2687                                 pass == 0, &sibcall_failure);
2688
2689       /* Save a pointer to the last insn before the call, so that we can
2690          later safely search backwards to find the CALL_INSN.  */
2691       before_call = get_last_insn ();
2692
2693       /* Set up next argument register.  For sibling calls on machines
2694          with register windows this should be the incoming register.  */
2695 #ifdef FUNCTION_INCOMING_ARG
2696       if (pass == 0)
2697         next_arg_reg = FUNCTION_INCOMING_ARG (args_so_far, VOIDmode,
2698                                               void_type_node, 1);
2699       else
2700 #endif
2701         next_arg_reg = FUNCTION_ARG (args_so_far, VOIDmode,
2702                                      void_type_node, 1);
2703
2704       /* All arguments and registers used for the call must be set up by
2705          now!  */
2706
2707       /* Stack must be properly aligned now.  */
2708       gcc_assert (!pass
2709                   || !(stack_pointer_delta % preferred_unit_stack_boundary));
2710
2711       /* Generate the actual call instruction.  */
2712       emit_call_1 (funexp, exp, fndecl, funtype, unadjusted_args_size,
2713                    adjusted_args_size.constant, struct_value_size,
2714                    next_arg_reg, valreg, old_inhibit_defer_pop, call_fusage,
2715                    flags, & args_so_far);
2716
2717       /* If a non-BLKmode value is returned at the most significant end
2718          of a register, shift the register right by the appropriate amount
2719          and update VALREG accordingly.  BLKmode values are handled by the
2720          group load/store machinery below.  */
2721       if (!structure_value_addr
2722           && !pcc_struct_value
2723           && TYPE_MODE (TREE_TYPE (exp)) != BLKmode
2724           && targetm.calls.return_in_msb (TREE_TYPE (exp)))
2725         {
2726           if (shift_return_value (TYPE_MODE (TREE_TYPE (exp)), false, valreg))
2727             sibcall_failure = 1;
2728           valreg = gen_rtx_REG (TYPE_MODE (TREE_TYPE (exp)), REGNO (valreg));
2729         }
2730
2731       /* If call is cse'able, make appropriate pair of reg-notes around it.
2732          Test valreg so we don't crash; may safely ignore `const'
2733          if return type is void.  Disable for PARALLEL return values, because
2734          we have no way to move such values into a pseudo register.  */
2735       if (pass && (flags & ECF_LIBCALL_BLOCK))
2736         {
2737           rtx insns;
2738           rtx insn;
2739           bool failed = valreg == 0 || GET_CODE (valreg) == PARALLEL;
2740
2741           insns = get_insns ();
2742
2743           /* Expansion of block moves possibly introduced a loop that may
2744              not appear inside libcall block.  */
2745           for (insn = insns; insn; insn = NEXT_INSN (insn))
2746             if (JUMP_P (insn))
2747               failed = true;
2748
2749           if (failed)
2750             {
2751               end_sequence ();
2752               emit_insn (insns);
2753             }
2754           else
2755             {
2756               rtx note = 0;
2757               rtx temp = gen_reg_rtx (GET_MODE (valreg));
2758
2759               /* Mark the return value as a pointer if needed.  */
2760               if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
2761                 mark_reg_pointer (temp,
2762                                   TYPE_ALIGN (TREE_TYPE (TREE_TYPE (exp))));
2763
2764               end_sequence ();
2765               if (flag_unsafe_math_optimizations
2766                   && fndecl
2767                   && DECL_BUILT_IN_CLASS (fndecl) == BUILT_IN_NORMAL
2768                   && (DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRT
2769                       || DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRTF
2770                       || DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRTL))
2771                 note = gen_rtx_fmt_e (SQRT,
2772                                       GET_MODE (temp),
2773                                       args[0].initial_value);
2774               else
2775                 {
2776                   /* Construct an "equal form" for the value which
2777                      mentions all the arguments in order as well as
2778                      the function name.  */
2779                   for (i = 0; i < num_actuals; i++)
2780                     note = gen_rtx_EXPR_LIST (VOIDmode,
2781                                               args[i].initial_value, note);
2782                   note = gen_rtx_EXPR_LIST (VOIDmode, funexp, note);
2783
2784                   if (flags & ECF_PURE)
2785                     note = gen_rtx_EXPR_LIST (VOIDmode,
2786                         gen_rtx_USE (VOIDmode,
2787                                      gen_rtx_MEM (BLKmode,
2788                                                   gen_rtx_SCRATCH (VOIDmode))),
2789                         note);
2790                 }
2791               emit_libcall_block (insns, temp, valreg, note);
2792
2793               valreg = temp;
2794             }
2795         }
2796       else if (pass && (flags & ECF_MALLOC))
2797         {
2798           rtx temp = gen_reg_rtx (GET_MODE (valreg));
2799           rtx last, insns;
2800
2801           /* The return value from a malloc-like function is a pointer.  */
2802           if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
2803             mark_reg_pointer (temp, BIGGEST_ALIGNMENT);
2804
2805           emit_move_insn (temp, valreg);
2806
2807           /* The return value from a malloc-like function can not alias
2808              anything else.  */
2809           last = get_last_insn ();
2810           REG_NOTES (last) =
2811             gen_rtx_EXPR_LIST (REG_NOALIAS, temp, REG_NOTES (last));
2812
2813           /* Write out the sequence.  */
2814           insns = get_insns ();
2815           end_sequence ();
2816           emit_insn (insns);
2817           valreg = temp;
2818         }
2819
2820       /* For calls to `setjmp', etc., inform flow.c it should complain
2821          if nonvolatile values are live.  For functions that cannot return,
2822          inform flow that control does not fall through.  */
2823
2824       if ((flags & ECF_NORETURN) || pass == 0)
2825         {
2826           /* The barrier must be emitted
2827              immediately after the CALL_INSN.  Some ports emit more
2828              than just a CALL_INSN above, so we must search for it here.  */
2829
2830           rtx last = get_last_insn ();
2831           while (!CALL_P (last))
2832             {
2833               last = PREV_INSN (last);
2834               /* There was no CALL_INSN?  */
2835               gcc_assert (last != before_call);
2836             }
2837
2838           emit_barrier_after (last);
2839
2840           /* Stack adjustments after a noreturn call are dead code.
2841              However when NO_DEFER_POP is in effect, we must preserve
2842              stack_pointer_delta.  */
2843           if (inhibit_defer_pop == 0)
2844             {
2845               stack_pointer_delta = old_stack_allocated;
2846               pending_stack_adjust = 0;
2847             }
2848         }
2849
2850       /* If value type not void, return an rtx for the value.  */
2851
2852       if (TYPE_MODE (TREE_TYPE (exp)) == VOIDmode
2853           || ignore)
2854         target = const0_rtx;
2855       else if (structure_value_addr)
2856         {
2857           if (target == 0 || !MEM_P (target))
2858             {
2859               target
2860                 = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
2861                                memory_address (TYPE_MODE (TREE_TYPE (exp)),
2862                                                structure_value_addr));
2863               set_mem_attributes (target, exp, 1);
2864             }
2865         }
2866       else if (pcc_struct_value)
2867         {
2868           /* This is the special C++ case where we need to
2869              know what the true target was.  We take care to
2870              never use this value more than once in one expression.  */
2871           target = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
2872                                 copy_to_reg (valreg));
2873           set_mem_attributes (target, exp, 1);
2874         }
2875       /* Handle calls that return values in multiple non-contiguous locations.
2876          The Irix 6 ABI has examples of this.  */
2877       else if (GET_CODE (valreg) == PARALLEL)
2878         {
2879           if (target == 0)
2880             {
2881               /* This will only be assigned once, so it can be readonly.  */
2882               tree nt = build_qualified_type (TREE_TYPE (exp),
2883                                               (TYPE_QUALS (TREE_TYPE (exp))
2884                                                | TYPE_QUAL_CONST));
2885
2886               target = assign_temp (nt, 0, 1, 1);
2887             }
2888
2889           if (! rtx_equal_p (target, valreg))
2890             emit_group_store (target, valreg, TREE_TYPE (exp),
2891                               int_size_in_bytes (TREE_TYPE (exp)));
2892
2893           /* We can not support sibling calls for this case.  */
2894           sibcall_failure = 1;
2895         }
2896       else if (target
2897                && GET_MODE (target) == TYPE_MODE (TREE_TYPE (exp))
2898                && GET_MODE (target) == GET_MODE (valreg))
2899         {
2900           bool may_overlap = false;
2901
2902           /* We have to copy a return value in a CLASS_LIKELY_SPILLED hard
2903              reg to a plain register.  */
2904           if (REG_P (valreg)
2905               && HARD_REGISTER_P (valreg)
2906               && CLASS_LIKELY_SPILLED_P (REGNO_REG_CLASS (REGNO (valreg)))
2907               && !(REG_P (target) && !HARD_REGISTER_P (target)))
2908             valreg = copy_to_reg (valreg);
2909
2910           /* If TARGET is a MEM in the argument area, and we have
2911              saved part of the argument area, then we can't store
2912              directly into TARGET as it may get overwritten when we
2913              restore the argument save area below.  Don't work too
2914              hard though and simply force TARGET to a register if it
2915              is a MEM; the optimizer is quite likely to sort it out.  */
2916           if (ACCUMULATE_OUTGOING_ARGS && pass && MEM_P (target))
2917             for (i = 0; i < num_actuals; i++)
2918               if (args[i].save_area)
2919                 {
2920                   may_overlap = true;
2921                   break;
2922                 }
2923
2924           if (may_overlap)
2925             target = copy_to_reg (valreg);
2926           else
2927             {
2928               /* TARGET and VALREG cannot be equal at this point
2929                  because the latter would not have
2930                  REG_FUNCTION_VALUE_P true, while the former would if
2931                  it were referring to the same register.
2932
2933                  If they refer to the same register, this move will be
2934                  a no-op, except when function inlining is being
2935                  done.  */
2936               emit_move_insn (target, valreg);
2937
2938               /* If we are setting a MEM, this code must be executed.
2939                  Since it is emitted after the call insn, sibcall
2940                  optimization cannot be performed in that case.  */
2941               if (MEM_P (target))
2942                 sibcall_failure = 1;
2943             }
2944         }
2945       else if (TYPE_MODE (TREE_TYPE (exp)) == BLKmode)
2946         {
2947           target = copy_blkmode_from_reg (target, valreg, TREE_TYPE (exp));
2948
2949           /* We can not support sibling calls for this case.  */
2950           sibcall_failure = 1;
2951         }
2952       else
2953         target = copy_to_reg (valreg);
2954
2955       if (targetm.calls.promote_function_return(funtype))
2956         {
2957           /* If we promoted this return value, make the proper SUBREG.
2958              TARGET might be const0_rtx here, so be careful.  */
2959           if (REG_P (target)
2960               && TYPE_MODE (TREE_TYPE (exp)) != BLKmode
2961               && GET_MODE (target) != TYPE_MODE (TREE_TYPE (exp)))
2962             {
2963               tree type = TREE_TYPE (exp);
2964               int unsignedp = TYPE_UNSIGNED (type);
2965               int offset = 0;
2966               enum machine_mode pmode;
2967
2968               pmode = promote_mode (type, TYPE_MODE (type), &unsignedp, 1);
2969               /* If we don't promote as expected, something is wrong.  */
2970               gcc_assert (GET_MODE (target) == pmode);
2971
2972               if ((WORDS_BIG_ENDIAN || BYTES_BIG_ENDIAN)
2973                   && (GET_MODE_SIZE (GET_MODE (target))
2974                       > GET_MODE_SIZE (TYPE_MODE (type))))
2975                 {
2976                   offset = GET_MODE_SIZE (GET_MODE (target))
2977                     - GET_MODE_SIZE (TYPE_MODE (type));
2978                   if (! BYTES_BIG_ENDIAN)
2979                     offset = (offset / UNITS_PER_WORD) * UNITS_PER_WORD;
2980                   else if (! WORDS_BIG_ENDIAN)
2981                     offset %= UNITS_PER_WORD;
2982                 }
2983               target = gen_rtx_SUBREG (TYPE_MODE (type), target, offset);
2984               SUBREG_PROMOTED_VAR_P (target) = 1;
2985               SUBREG_PROMOTED_UNSIGNED_SET (target, unsignedp);
2986             }
2987         }
2988
2989       /* If size of args is variable or this was a constructor call for a stack
2990          argument, restore saved stack-pointer value.  */
2991
2992       if (old_stack_level && ! (flags & ECF_SP_DEPRESSED))
2993         {
2994           emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
2995           stack_pointer_delta = old_stack_pointer_delta;
2996           pending_stack_adjust = old_pending_adj;
2997           old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
2998           stack_arg_under_construction = old_stack_arg_under_construction;
2999           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3000           stack_usage_map = initial_stack_usage_map;
3001           sibcall_failure = 1;
3002         }
3003       else if (ACCUMULATE_OUTGOING_ARGS && pass)
3004         {
3005 #ifdef REG_PARM_STACK_SPACE
3006           if (save_area)
3007             restore_fixed_argument_area (save_area, argblock,
3008                                          high_to_save, low_to_save);
3009 #endif
3010
3011           /* If we saved any argument areas, restore them.  */
3012           for (i = 0; i < num_actuals; i++)
3013             if (args[i].save_area)
3014               {
3015                 enum machine_mode save_mode = GET_MODE (args[i].save_area);
3016                 rtx stack_area
3017                   = gen_rtx_MEM (save_mode,
3018                                  memory_address (save_mode,
3019                                                  XEXP (args[i].stack_slot, 0)));
3020
3021                 if (save_mode != BLKmode)
3022                   emit_move_insn (stack_area, args[i].save_area);
3023                 else
3024                   emit_block_move (stack_area, args[i].save_area,
3025                                    GEN_INT (args[i].locate.size.constant),
3026                                    BLOCK_OP_CALL_PARM);
3027               }
3028
3029           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3030           stack_usage_map = initial_stack_usage_map;
3031         }
3032
3033       /* If this was alloca, record the new stack level for nonlocal gotos.
3034          Check for the handler slots since we might not have a save area
3035          for non-local gotos.  */
3036
3037       if ((flags & ECF_MAY_BE_ALLOCA) && cfun->nonlocal_goto_save_area != 0)
3038         update_nonlocal_goto_save_area ();
3039
3040       /* Free up storage we no longer need.  */
3041       for (i = 0; i < num_actuals; ++i)
3042         if (args[i].aligned_regs)
3043           free (args[i].aligned_regs);
3044
3045       insns = get_insns ();
3046       end_sequence ();
3047
3048       if (pass == 0)
3049         {
3050           tail_call_insns = insns;
3051
3052           /* Restore the pending stack adjustment now that we have
3053              finished generating the sibling call sequence.  */
3054
3055           pending_stack_adjust = save_pending_stack_adjust;
3056           stack_pointer_delta = save_stack_pointer_delta;
3057
3058           /* Prepare arg structure for next iteration.  */
3059           for (i = 0; i < num_actuals; i++)
3060             {
3061               args[i].value = 0;
3062               args[i].aligned_regs = 0;
3063               args[i].stack = 0;
3064             }
3065
3066           sbitmap_free (stored_args_map);
3067         }
3068       else
3069         {
3070           normal_call_insns = insns;
3071
3072           /* Verify that we've deallocated all the stack we used.  */
3073           gcc_assert ((flags & ECF_NORETURN)
3074                       || (old_stack_allocated
3075                           == stack_pointer_delta - pending_stack_adjust));
3076         }
3077
3078       /* If something prevents making this a sibling call,
3079          zero out the sequence.  */
3080       if (sibcall_failure)
3081         tail_call_insns = NULL_RTX;
3082       else
3083         break;
3084     }
3085
3086   /* If tail call production succeeded, we need to remove REG_EQUIV notes on
3087      arguments too, as argument area is now clobbered by the call.  */
3088   if (tail_call_insns)
3089     {
3090       emit_insn (tail_call_insns);
3091       cfun->tail_call_emit = true;
3092     }
3093   else
3094     emit_insn (normal_call_insns);
3095
3096   currently_expanding_call--;
3097
3098   /* If this function returns with the stack pointer depressed, ensure
3099      this block saves and restores the stack pointer, show it was
3100      changed, and adjust for any outgoing arg space.  */
3101   if (flags & ECF_SP_DEPRESSED)
3102     {
3103       clear_pending_stack_adjust ();
3104       emit_insn (gen_rtx_CLOBBER (VOIDmode, stack_pointer_rtx));
3105       emit_move_insn (virtual_stack_dynamic_rtx, stack_pointer_rtx);
3106     }
3107
3108   if (stack_usage_map_buf)
3109     free (stack_usage_map_buf);
3110
3111   return target;
3112 }
3113
3114 /* A sibling call sequence invalidates any REG_EQUIV notes made for
3115    this function's incoming arguments.
3116
3117    At the start of RTL generation we know the only REG_EQUIV notes
3118    in the rtl chain are those for incoming arguments, so we can look
3119    for REG_EQUIV notes between the start of the function and the
3120    NOTE_INSN_FUNCTION_BEG.
3121
3122    This is (slight) overkill.  We could keep track of the highest
3123    argument we clobber and be more selective in removing notes, but it
3124    does not seem to be worth the effort.  */
3125
3126 void
3127 fixup_tail_calls (void)
3128 {
3129   rtx insn;
3130
3131   for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
3132     {
3133       rtx note;
3134
3135       /* There are never REG_EQUIV notes for the incoming arguments
3136          after the NOTE_INSN_FUNCTION_BEG note, so stop if we see it.  */
3137       if (NOTE_P (insn)
3138           && NOTE_LINE_NUMBER (insn) == NOTE_INSN_FUNCTION_BEG)
3139         break;
3140
3141       note = find_reg_note (insn, REG_EQUIV, 0);
3142       if (note)
3143         remove_note (insn, note);
3144       note = find_reg_note (insn, REG_EQUIV, 0);
3145       gcc_assert (!note);
3146     }
3147 }
3148
3149 /* Traverse an argument list in VALUES and expand all complex
3150    arguments into their components.  */
3151 static tree
3152 split_complex_values (tree values)
3153 {
3154   tree p;
3155
3156   /* Before allocating memory, check for the common case of no complex.  */
3157   for (p = values; p; p = TREE_CHAIN (p))
3158     {
3159       tree type = TREE_TYPE (TREE_VALUE (p));
3160       if (type && TREE_CODE (type) == COMPLEX_TYPE
3161           && targetm.calls.split_complex_arg (type))
3162         goto found;
3163     }
3164   return values;
3165
3166  found:
3167   values = copy_list (values);
3168
3169   for (p = values; p; p = TREE_CHAIN (p))
3170     {
3171       tree complex_value = TREE_VALUE (p);
3172       tree complex_type;
3173
3174       complex_type = TREE_TYPE (complex_value);
3175       if (!complex_type)
3176         continue;
3177
3178       if (TREE_CODE (complex_type) == COMPLEX_TYPE
3179           && targetm.calls.split_complex_arg (complex_type))
3180         {
3181           tree subtype;
3182           tree real, imag, next;
3183
3184           subtype = TREE_TYPE (complex_type);
3185           complex_value = save_expr (complex_value);
3186           real = build1 (REALPART_EXPR, subtype, complex_value);
3187           imag = build1 (IMAGPART_EXPR, subtype, complex_value);
3188
3189           TREE_VALUE (p) = real;
3190           next = TREE_CHAIN (p);
3191           imag = build_tree_list (NULL_TREE, imag);
3192           TREE_CHAIN (p) = imag;
3193           TREE_CHAIN (imag) = next;
3194
3195           /* Skip the newly created node.  */
3196           p = TREE_CHAIN (p);
3197         }
3198     }
3199
3200   return values;
3201 }
3202
3203 /* Traverse a list of TYPES and expand all complex types into their
3204    components.  */
3205 static tree
3206 split_complex_types (tree types)
3207 {
3208   tree p;
3209
3210   /* Before allocating memory, check for the common case of no complex.  */
3211   for (p = types; p; p = TREE_CHAIN (p))
3212     {
3213       tree type = TREE_VALUE (p);
3214       if (TREE_CODE (type) == COMPLEX_TYPE
3215           && targetm.calls.split_complex_arg (type))
3216         goto found;
3217     }
3218   return types;
3219
3220  found:
3221   types = copy_list (types);
3222
3223   for (p = types; p; p = TREE_CHAIN (p))
3224     {
3225       tree complex_type = TREE_VALUE (p);
3226
3227       if (TREE_CODE (complex_type) == COMPLEX_TYPE
3228           && targetm.calls.split_complex_arg (complex_type))
3229         {
3230           tree next, imag;
3231
3232           /* Rewrite complex type with component type.  */
3233           TREE_VALUE (p) = TREE_TYPE (complex_type);
3234           next = TREE_CHAIN (p);
3235
3236           /* Add another component type for the imaginary part.  */
3237           imag = build_tree_list (NULL_TREE, TREE_VALUE (p));
3238           TREE_CHAIN (p) = imag;
3239           TREE_CHAIN (imag) = next;
3240
3241           /* Skip the newly created node.  */
3242           p = TREE_CHAIN (p);
3243         }
3244     }
3245
3246   return types;
3247 }
3248 \f
3249 /* Output a library call to function FUN (a SYMBOL_REF rtx).
3250    The RETVAL parameter specifies whether return value needs to be saved, other
3251    parameters are documented in the emit_library_call function below.  */
3252
3253 static rtx
3254 emit_library_call_value_1 (int retval, rtx orgfun, rtx value,
3255                            enum libcall_type fn_type,
3256                            enum machine_mode outmode, int nargs, va_list p)
3257 {
3258   /* Total size in bytes of all the stack-parms scanned so far.  */
3259   struct args_size args_size;
3260   /* Size of arguments before any adjustments (such as rounding).  */
3261   struct args_size original_args_size;
3262   int argnum;
3263   rtx fun;
3264   int inc;
3265   int count;
3266   rtx argblock = 0;
3267   CUMULATIVE_ARGS args_so_far;
3268   struct arg
3269   {
3270     rtx value;
3271     enum machine_mode mode;
3272     rtx reg;
3273     int partial;
3274     struct locate_and_pad_arg_data locate;
3275     rtx save_area;
3276   };
3277   struct arg *argvec;
3278   int old_inhibit_defer_pop = inhibit_defer_pop;
3279   rtx call_fusage = 0;
3280   rtx mem_value = 0;
3281   rtx valreg;
3282   int pcc_struct_value = 0;
3283   int struct_value_size = 0;
3284   int flags;
3285   int reg_parm_stack_space = 0;
3286   int needed;
3287   rtx before_call;
3288   tree tfom;                    /* type_for_mode (outmode, 0) */
3289
3290 #ifdef REG_PARM_STACK_SPACE
3291   /* Define the boundary of the register parm stack space that needs to be
3292      save, if any.  */
3293   int low_to_save, high_to_save;
3294   rtx save_area = 0;            /* Place that it is saved.  */
3295 #endif
3296
3297   /* Size of the stack reserved for parameter registers.  */
3298   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
3299   char *initial_stack_usage_map = stack_usage_map;
3300   char *stack_usage_map_buf = NULL;
3301
3302   rtx struct_value = targetm.calls.struct_value_rtx (0, 0);
3303
3304 #ifdef REG_PARM_STACK_SPACE
3305   reg_parm_stack_space = REG_PARM_STACK_SPACE ((tree) 0);
3306 #endif
3307
3308   /* By default, library functions can not throw.  */
3309   flags = ECF_NOTHROW;
3310
3311   switch (fn_type)
3312     {
3313     case LCT_NORMAL:
3314       break;
3315     case LCT_CONST:
3316       flags |= ECF_CONST;
3317       break;
3318     case LCT_PURE:
3319       flags |= ECF_PURE;
3320       break;
3321     case LCT_CONST_MAKE_BLOCK:
3322       flags |= ECF_CONST | ECF_LIBCALL_BLOCK;
3323       break;
3324     case LCT_PURE_MAKE_BLOCK:
3325       flags |= ECF_PURE | ECF_LIBCALL_BLOCK;
3326       break;
3327     case LCT_NORETURN:
3328       flags |= ECF_NORETURN;
3329       break;
3330     case LCT_THROW:
3331       flags = ECF_NORETURN;
3332       break;
3333     case LCT_RETURNS_TWICE:
3334       flags = ECF_RETURNS_TWICE;
3335       break;
3336     }
3337   fun = orgfun;
3338
3339   /* Ensure current function's preferred stack boundary is at least
3340      what we need.  */
3341   if (cfun->preferred_stack_boundary < PREFERRED_STACK_BOUNDARY)
3342     cfun->preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
3343
3344   /* If this kind of value comes back in memory,
3345      decide where in memory it should come back.  */
3346   if (outmode != VOIDmode)
3347     {
3348       tfom = lang_hooks.types.type_for_mode (outmode, 0);
3349       if (aggregate_value_p (tfom, 0))
3350         {
3351 #ifdef PCC_STATIC_STRUCT_RETURN
3352           rtx pointer_reg
3353             = hard_function_value (build_pointer_type (tfom), 0, 0, 0);
3354           mem_value = gen_rtx_MEM (outmode, pointer_reg);
3355           pcc_struct_value = 1;
3356           if (value == 0)
3357             value = gen_reg_rtx (outmode);
3358 #else /* not PCC_STATIC_STRUCT_RETURN */
3359           struct_value_size = GET_MODE_SIZE (outmode);
3360           if (value != 0 && MEM_P (value))
3361             mem_value = value;
3362           else
3363             mem_value = assign_temp (tfom, 0, 1, 1);
3364 #endif
3365           /* This call returns a big structure.  */
3366           flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
3367         }
3368     }
3369   else
3370     tfom = void_type_node;
3371
3372   /* ??? Unfinished: must pass the memory address as an argument.  */
3373
3374   /* Copy all the libcall-arguments out of the varargs data
3375      and into a vector ARGVEC.
3376
3377      Compute how to pass each argument.  We only support a very small subset
3378      of the full argument passing conventions to limit complexity here since
3379      library functions shouldn't have many args.  */
3380
3381   argvec = alloca ((nargs + 1) * sizeof (struct arg));
3382   memset (argvec, 0, (nargs + 1) * sizeof (struct arg));
3383
3384 #ifdef INIT_CUMULATIVE_LIBCALL_ARGS
3385   INIT_CUMULATIVE_LIBCALL_ARGS (args_so_far, outmode, fun);
3386 #else
3387   INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun, 0, nargs);
3388 #endif
3389
3390   args_size.constant = 0;
3391   args_size.var = 0;
3392
3393   count = 0;
3394
3395   /* Now we are about to start emitting insns that can be deleted
3396      if a libcall is deleted.  */
3397   if (flags & ECF_LIBCALL_BLOCK)
3398     start_sequence ();
3399
3400   push_temp_slots ();
3401
3402   /* If there's a structure value address to be passed,
3403      either pass it in the special place, or pass it as an extra argument.  */
3404   if (mem_value && struct_value == 0 && ! pcc_struct_value)
3405     {
3406       rtx addr = XEXP (mem_value, 0);
3407
3408       nargs++;
3409
3410       /* Make sure it is a reasonable operand for a move or push insn.  */
3411       if (!REG_P (addr) && !MEM_P (addr)
3412           && ! (CONSTANT_P (addr) && LEGITIMATE_CONSTANT_P (addr)))
3413         addr = force_operand (addr, NULL_RTX);
3414
3415       argvec[count].value = addr;
3416       argvec[count].mode = Pmode;
3417       argvec[count].partial = 0;
3418
3419       argvec[count].reg = FUNCTION_ARG (args_so_far, Pmode, NULL_TREE, 1);
3420       gcc_assert (targetm.calls.arg_partial_bytes (&args_so_far, Pmode,
3421                                                    NULL_TREE, 1) == 0);
3422
3423       locate_and_pad_parm (Pmode, NULL_TREE,
3424 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3425                            1,
3426 #else
3427                            argvec[count].reg != 0,
3428 #endif
3429                            0, NULL_TREE, &args_size, &argvec[count].locate);
3430
3431       if (argvec[count].reg == 0 || argvec[count].partial != 0
3432           || reg_parm_stack_space > 0)
3433         args_size.constant += argvec[count].locate.size.constant;
3434
3435       FUNCTION_ARG_ADVANCE (args_so_far, Pmode, (tree) 0, 1);
3436
3437       count++;
3438     }
3439
3440   for (; count < nargs; count++)
3441     {
3442       rtx val = va_arg (p, rtx);
3443       enum machine_mode mode = va_arg (p, enum machine_mode);
3444
3445       /* We cannot convert the arg value to the mode the library wants here;
3446          must do it earlier where we know the signedness of the arg.  */
3447       gcc_assert (mode != BLKmode
3448                   && (GET_MODE (val) == mode || GET_MODE (val) == VOIDmode));
3449
3450       /* Make sure it is a reasonable operand for a move or push insn.  */
3451       if (!REG_P (val) && !MEM_P (val)
3452           && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
3453         val = force_operand (val, NULL_RTX);
3454
3455       if (pass_by_reference (&args_so_far, mode, NULL_TREE, 1))
3456         {
3457           rtx slot;
3458           int must_copy
3459             = !reference_callee_copied (&args_so_far, mode, NULL_TREE, 1);
3460
3461           /* loop.c won't look at CALL_INSN_FUNCTION_USAGE of const/pure
3462              functions, so we have to pretend this isn't such a function.  */
3463           if (flags & ECF_LIBCALL_BLOCK)
3464             {
3465               rtx insns = get_insns ();
3466               end_sequence ();
3467               emit_insn (insns);
3468             }
3469           flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
3470
3471           /* If this was a CONST function, it is now PURE since
3472              it now reads memory.  */
3473           if (flags & ECF_CONST)
3474             {
3475               flags &= ~ECF_CONST;
3476               flags |= ECF_PURE;
3477             }
3478
3479           if (GET_MODE (val) == MEM && !must_copy)
3480             slot = val;
3481           else
3482             {
3483               slot = assign_temp (lang_hooks.types.type_for_mode (mode, 0),
3484                                   0, 1, 1);
3485               emit_move_insn (slot, val);
3486             }
3487
3488           call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3489                                            gen_rtx_USE (VOIDmode, slot),
3490                                            call_fusage);
3491           if (must_copy)
3492             call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3493                                              gen_rtx_CLOBBER (VOIDmode,
3494                                                               slot),
3495                                              call_fusage);
3496
3497           mode = Pmode;
3498           val = force_operand (XEXP (slot, 0), NULL_RTX);
3499         }
3500
3501       argvec[count].value = val;
3502       argvec[count].mode = mode;
3503
3504       argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
3505
3506       argvec[count].partial
3507         = targetm.calls.arg_partial_bytes (&args_so_far, mode, NULL_TREE, 1);
3508
3509       locate_and_pad_parm (mode, NULL_TREE,
3510 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3511                            1,
3512 #else
3513                            argvec[count].reg != 0,
3514 #endif
3515                            argvec[count].partial,
3516                            NULL_TREE, &args_size, &argvec[count].locate);
3517
3518       gcc_assert (!argvec[count].locate.size.var);
3519
3520       if (argvec[count].reg == 0 || argvec[count].partial != 0
3521           || reg_parm_stack_space > 0)
3522         args_size.constant += argvec[count].locate.size.constant;
3523
3524       FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree) 0, 1);
3525     }
3526
3527   /* If this machine requires an external definition for library
3528      functions, write one out.  */
3529   assemble_external_libcall (fun);
3530
3531   original_args_size = args_size;
3532   args_size.constant = (((args_size.constant
3533                           + stack_pointer_delta
3534                           + STACK_BYTES - 1)
3535                           / STACK_BYTES
3536                           * STACK_BYTES)
3537                          - stack_pointer_delta);
3538
3539   args_size.constant = MAX (args_size.constant,
3540                             reg_parm_stack_space);
3541
3542 #ifndef OUTGOING_REG_PARM_STACK_SPACE
3543   args_size.constant -= reg_parm_stack_space;
3544 #endif
3545
3546   if (args_size.constant > current_function_outgoing_args_size)
3547     current_function_outgoing_args_size = args_size.constant;
3548
3549   if (ACCUMULATE_OUTGOING_ARGS)
3550     {
3551       /* Since the stack pointer will never be pushed, it is possible for
3552          the evaluation of a parm to clobber something we have already
3553          written to the stack.  Since most function calls on RISC machines
3554          do not use the stack, this is uncommon, but must work correctly.
3555
3556          Therefore, we save any area of the stack that was already written
3557          and that we are using.  Here we set up to do this by making a new
3558          stack usage map from the old one.
3559
3560          Another approach might be to try to reorder the argument
3561          evaluations to avoid this conflicting stack usage.  */
3562
3563       needed = args_size.constant;
3564
3565 #ifndef OUTGOING_REG_PARM_STACK_SPACE
3566       /* Since we will be writing into the entire argument area, the
3567          map must be allocated for its entire size, not just the part that
3568          is the responsibility of the caller.  */
3569       needed += reg_parm_stack_space;
3570 #endif
3571
3572 #ifdef ARGS_GROW_DOWNWARD
3573       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3574                                          needed + 1);
3575 #else
3576       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3577                                          needed);
3578 #endif
3579       stack_usage_map_buf = XNEWVEC (char, highest_outgoing_arg_in_use);
3580       stack_usage_map = stack_usage_map_buf;
3581
3582       if (initial_highest_arg_in_use)
3583         memcpy (stack_usage_map, initial_stack_usage_map,
3584                 initial_highest_arg_in_use);
3585
3586       if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
3587         memset (&stack_usage_map[initial_highest_arg_in_use], 0,
3588                highest_outgoing_arg_in_use - initial_highest_arg_in_use);
3589       needed = 0;
3590
3591       /* We must be careful to use virtual regs before they're instantiated,
3592          and real regs afterwards.  Loop optimization, for example, can create
3593          new libcalls after we've instantiated the virtual regs, and if we
3594          use virtuals anyway, they won't match the rtl patterns.  */
3595
3596       if (virtuals_instantiated)
3597         argblock = plus_constant (stack_pointer_rtx, STACK_POINTER_OFFSET);
3598       else
3599         argblock = virtual_outgoing_args_rtx;
3600     }
3601   else
3602     {
3603       if (!PUSH_ARGS)
3604         argblock = push_block (GEN_INT (args_size.constant), 0, 0);
3605     }
3606
3607   /* If we push args individually in reverse order, perform stack alignment
3608      before the first push (the last arg).  */
3609   if (argblock == 0 && PUSH_ARGS_REVERSED)
3610     anti_adjust_stack (GEN_INT (args_size.constant
3611                                 - original_args_size.constant));
3612
3613   if (PUSH_ARGS_REVERSED)
3614     {
3615       inc = -1;
3616       argnum = nargs - 1;
3617     }
3618   else
3619     {
3620       inc = 1;
3621       argnum = 0;
3622     }
3623
3624 #ifdef REG_PARM_STACK_SPACE
3625   if (ACCUMULATE_OUTGOING_ARGS)
3626     {
3627       /* The argument list is the property of the called routine and it
3628          may clobber it.  If the fixed area has been used for previous
3629          parameters, we must save and restore it.  */
3630       save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
3631                                             &low_to_save, &high_to_save);
3632     }
3633 #endif
3634
3635   /* Push the args that need to be pushed.  */
3636
3637   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
3638      are to be pushed.  */
3639   for (count = 0; count < nargs; count++, argnum += inc)
3640     {
3641       enum machine_mode mode = argvec[argnum].mode;
3642       rtx val = argvec[argnum].value;
3643       rtx reg = argvec[argnum].reg;
3644       int partial = argvec[argnum].partial;
3645       int lower_bound = 0, upper_bound = 0, i;
3646
3647       if (! (reg != 0 && partial == 0))
3648         {
3649           if (ACCUMULATE_OUTGOING_ARGS)
3650             {
3651               /* If this is being stored into a pre-allocated, fixed-size,
3652                  stack area, save any previous data at that location.  */
3653
3654 #ifdef ARGS_GROW_DOWNWARD
3655               /* stack_slot is negative, but we want to index stack_usage_map
3656                  with positive values.  */
3657               upper_bound = -argvec[argnum].locate.offset.constant + 1;
3658               lower_bound = upper_bound - argvec[argnum].locate.size.constant;
3659 #else
3660               lower_bound = argvec[argnum].locate.offset.constant;
3661               upper_bound = lower_bound + argvec[argnum].locate.size.constant;
3662 #endif
3663
3664               i = lower_bound;
3665               /* Don't worry about things in the fixed argument area;
3666                  it has already been saved.  */
3667               if (i < reg_parm_stack_space)
3668                 i = reg_parm_stack_space;
3669               while (i < upper_bound && stack_usage_map[i] == 0)
3670                 i++;
3671
3672               if (i < upper_bound)
3673                 {
3674                   /* We need to make a save area.  */
3675                   unsigned int size
3676                     = argvec[argnum].locate.size.constant * BITS_PER_UNIT;
3677                   enum machine_mode save_mode
3678                     = mode_for_size (size, MODE_INT, 1);
3679                   rtx adr
3680                     = plus_constant (argblock,
3681                                      argvec[argnum].locate.offset.constant);
3682                   rtx stack_area
3683                     = gen_rtx_MEM (save_mode, memory_address (save_mode, adr));
3684
3685                   if (save_mode == BLKmode)
3686                     {
3687                       argvec[argnum].save_area
3688                         = assign_stack_temp (BLKmode,
3689                                              argvec[argnum].locate.size.constant,
3690                                              0);
3691
3692                       emit_block_move (validize_mem (argvec[argnum].save_area),
3693                                        stack_area,
3694                                        GEN_INT (argvec[argnum].locate.size.constant),
3695                                        BLOCK_OP_CALL_PARM);
3696                     }
3697                   else
3698                     {
3699                       argvec[argnum].save_area = gen_reg_rtx (save_mode);
3700
3701                       emit_move_insn (argvec[argnum].save_area, stack_area);
3702                     }
3703                 }
3704             }
3705
3706           emit_push_insn (val, mode, NULL_TREE, NULL_RTX, PARM_BOUNDARY,
3707                           partial, reg, 0, argblock,
3708                           GEN_INT (argvec[argnum].locate.offset.constant),
3709                           reg_parm_stack_space,
3710                           ARGS_SIZE_RTX (argvec[argnum].locate.alignment_pad));
3711
3712           /* Now mark the segment we just used.  */
3713           if (ACCUMULATE_OUTGOING_ARGS)
3714             for (i = lower_bound; i < upper_bound; i++)
3715               stack_usage_map[i] = 1;
3716
3717           NO_DEFER_POP;
3718
3719           if (flags & ECF_CONST)
3720             {
3721               rtx use;
3722
3723               /* Indicate argument access so that alias.c knows that these
3724                  values are live.  */
3725               if (argblock)
3726                 use = plus_constant (argblock,
3727                                      argvec[argnum].locate.offset.constant);
3728               else
3729                 /* When arguments are pushed, trying to tell alias.c where
3730                    exactly this argument is won't work, because the
3731                    auto-increment causes confusion.  So we merely indicate
3732                    that we access something with a known mode somewhere on
3733                    the stack.  */
3734                 use = gen_rtx_PLUS (Pmode, virtual_outgoing_args_rtx,
3735                                     gen_rtx_SCRATCH (Pmode));
3736               use = gen_rtx_MEM (argvec[argnum].mode, use);
3737               use = gen_rtx_USE (VOIDmode, use);
3738               call_fusage = gen_rtx_EXPR_LIST (VOIDmode, use, call_fusage);
3739             }
3740         }
3741     }
3742
3743   /* If we pushed args in forward order, perform stack alignment
3744      after pushing the last arg.  */
3745   if (argblock == 0 && !PUSH_ARGS_REVERSED)
3746     anti_adjust_stack (GEN_INT (args_size.constant
3747                                 - original_args_size.constant));
3748
3749   if (PUSH_ARGS_REVERSED)
3750     argnum = nargs - 1;
3751   else
3752     argnum = 0;
3753
3754   fun = prepare_call_address (fun, NULL, &call_fusage, 0, 0);
3755
3756   /* Now load any reg parms into their regs.  */
3757
3758   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
3759      are to be pushed.  */
3760   for (count = 0; count < nargs; count++, argnum += inc)
3761     {
3762       enum machine_mode mode = argvec[argnum].mode;
3763       rtx val = argvec[argnum].value;
3764       rtx reg = argvec[argnum].reg;
3765       int partial = argvec[argnum].partial;
3766
3767       /* Handle calls that pass values in multiple non-contiguous
3768          locations.  The PA64 has examples of this for library calls.  */
3769       if (reg != 0 && GET_CODE (reg) == PARALLEL)
3770         emit_group_load (reg, val, NULL_TREE, GET_MODE_SIZE (mode));
3771       else if (reg != 0 && partial == 0)
3772         emit_move_insn (reg, val);
3773
3774       NO_DEFER_POP;
3775     }
3776
3777   /* Any regs containing parms remain in use through the call.  */
3778   for (count = 0; count < nargs; count++)
3779     {
3780       rtx reg = argvec[count].reg;
3781       if (reg != 0 && GET_CODE (reg) == PARALLEL)
3782         use_group_regs (&call_fusage, reg);
3783       else if (reg != 0)
3784         use_reg (&call_fusage, reg);
3785     }
3786
3787   /* Pass the function the address in which to return a structure value.  */
3788   if (mem_value != 0 && struct_value != 0 && ! pcc_struct_value)
3789     {
3790       emit_move_insn (struct_value,
3791                       force_reg (Pmode,
3792                                  force_operand (XEXP (mem_value, 0),
3793                                                 NULL_RTX)));
3794       if (REG_P (struct_value))
3795         use_reg (&call_fusage, struct_value);
3796     }
3797
3798   /* Don't allow popping to be deferred, since then
3799      cse'ing of library calls could delete a call and leave the pop.  */
3800   NO_DEFER_POP;
3801   valreg = (mem_value == 0 && outmode != VOIDmode
3802             ? hard_libcall_value (outmode) : NULL_RTX);
3803
3804   /* Stack must be properly aligned now.  */
3805   gcc_assert (!(stack_pointer_delta
3806                 & (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT - 1)));
3807
3808   before_call = get_last_insn ();
3809
3810   /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
3811      will set inhibit_defer_pop to that value.  */
3812   /* The return type is needed to decide how many bytes the function pops.
3813      Signedness plays no role in that, so for simplicity, we pretend it's
3814      always signed.  We also assume that the list of arguments passed has
3815      no impact, so we pretend it is unknown.  */
3816
3817   emit_call_1 (fun, NULL,
3818                get_identifier (XSTR (orgfun, 0)),
3819                build_function_type (tfom, NULL_TREE),
3820                original_args_size.constant, args_size.constant,
3821                struct_value_size,
3822                FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
3823                valreg,
3824                old_inhibit_defer_pop + 1, call_fusage, flags, & args_so_far);
3825
3826   /* For calls to `setjmp', etc., inform flow.c it should complain
3827      if nonvolatile values are live.  For functions that cannot return,
3828      inform flow that control does not fall through.  */
3829
3830   if (flags & ECF_NORETURN)
3831     {
3832       /* The barrier note must be emitted
3833          immediately after the CALL_INSN.  Some ports emit more than
3834          just a CALL_INSN above, so we must search for it here.  */
3835
3836       rtx last = get_last_insn ();
3837       while (!CALL_P (last))
3838         {
3839           last = PREV_INSN (last);
3840           /* There was no CALL_INSN?  */
3841           gcc_assert (last != before_call);
3842         }
3843
3844       emit_barrier_after (last);
3845     }
3846
3847   /* Now restore inhibit_defer_pop to its actual original value.  */
3848   OK_DEFER_POP;
3849
3850   /* If call is cse'able, make appropriate pair of reg-notes around it.
3851      Test valreg so we don't crash; may safely ignore `const'
3852      if return type is void.  Disable for PARALLEL return values, because
3853      we have no way to move such values into a pseudo register.  */
3854   if (flags & ECF_LIBCALL_BLOCK)
3855     {
3856       rtx insns;
3857
3858       if (valreg == 0)
3859         {
3860           insns = get_insns ();
3861           end_sequence ();
3862           emit_insn (insns);
3863         }
3864       else
3865         {
3866           rtx note = 0;
3867           rtx temp;
3868           int i;
3869
3870           if (GET_CODE (valreg) == PARALLEL)
3871             {
3872               temp = gen_reg_rtx (outmode);
3873               emit_group_store (temp, valreg, NULL_TREE,
3874                                 GET_MODE_SIZE (outmode));
3875               valreg = temp;
3876             }
3877
3878           temp = gen_reg_rtx (GET_MODE (valreg));
3879
3880           /* Construct an "equal form" for the value which mentions all the
3881              arguments in order as well as the function name.  */
3882           for (i = 0; i < nargs; i++)
3883             note = gen_rtx_EXPR_LIST (VOIDmode, argvec[i].value, note);
3884           note = gen_rtx_EXPR_LIST (VOIDmode, fun, note);
3885
3886           insns = get_insns ();
3887           end_sequence ();
3888
3889           if (flags & ECF_PURE)
3890             note = gen_rtx_EXPR_LIST (VOIDmode,
3891                         gen_rtx_USE (VOIDmode,
3892                                      gen_rtx_MEM (BLKmode,
3893                                                   gen_rtx_SCRATCH (VOIDmode))),
3894                         note);
3895
3896           emit_libcall_block (insns, temp, valreg, note);
3897
3898           valreg = temp;
3899         }
3900     }
3901   pop_temp_slots ();
3902
3903   /* Copy the value to the right place.  */
3904   if (outmode != VOIDmode && retval)
3905     {
3906       if (mem_value)
3907         {
3908           if (value == 0)
3909             value = mem_value;
3910           if (value != mem_value)
3911             emit_move_insn (value, mem_value);
3912         }
3913       else if (GET_CODE (valreg) == PARALLEL)
3914         {
3915           if (value == 0)
3916             value = gen_reg_rtx (outmode);
3917           emit_group_store (value, valreg, NULL_TREE, GET_MODE_SIZE (outmode));
3918         }
3919       else
3920         {
3921           /* Convert to the proper mode if PROMOTE_MODE has been active.  */
3922           if (GET_MODE (valreg) != outmode)
3923             {
3924               int unsignedp = TYPE_UNSIGNED (tfom);
3925
3926               gcc_assert (targetm.calls.promote_function_return (tfom));
3927               gcc_assert (promote_mode (tfom, outmode, &unsignedp, 0)
3928                           == GET_MODE (valreg));
3929
3930               valreg = convert_modes (outmode, GET_MODE (valreg), valreg, 0);
3931             }
3932
3933           if (value != 0)
3934             emit_move_insn (value, valreg);
3935           else
3936             value = valreg;
3937         }
3938     }
3939
3940   if (ACCUMULATE_OUTGOING_ARGS)
3941     {
3942 #ifdef REG_PARM_STACK_SPACE
3943       if (save_area)
3944         restore_fixed_argument_area (save_area, argblock,
3945                                      high_to_save, low_to_save);
3946 #endif
3947
3948       /* If we saved any argument areas, restore them.  */
3949       for (count = 0; count < nargs; count++)
3950         if (argvec[count].save_area)
3951           {
3952             enum machine_mode save_mode = GET_MODE (argvec[count].save_area);
3953             rtx adr = plus_constant (argblock,
3954                                      argvec[count].locate.offset.constant);
3955             rtx stack_area = gen_rtx_MEM (save_mode,
3956                                           memory_address (save_mode, adr));
3957
3958             if (save_mode == BLKmode)
3959               emit_block_move (stack_area,
3960                                validize_mem (argvec[count].save_area),
3961                                GEN_INT (argvec[count].locate.size.constant),
3962                                BLOCK_OP_CALL_PARM);
3963             else
3964               emit_move_insn (stack_area, argvec[count].save_area);
3965           }
3966
3967       highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3968       stack_usage_map = initial_stack_usage_map;
3969     }
3970
3971   if (stack_usage_map_buf)
3972     free (stack_usage_map_buf);
3973
3974   return value;
3975
3976 }
3977 \f
3978 /* Output a library call to function FUN (a SYMBOL_REF rtx)
3979    (emitting the queue unless NO_QUEUE is nonzero),
3980    for a value of mode OUTMODE,
3981    with NARGS different arguments, passed as alternating rtx values
3982    and machine_modes to convert them to.
3983
3984    FN_TYPE should be LCT_NORMAL for `normal' calls, LCT_CONST for `const'
3985    calls, LCT_PURE for `pure' calls, LCT_CONST_MAKE_BLOCK for `const' calls
3986    which should be enclosed in REG_LIBCALL/REG_RETVAL notes,
3987    LCT_PURE_MAKE_BLOCK for `purep' calls which should be enclosed in
3988    REG_LIBCALL/REG_RETVAL notes with extra (use (memory (scratch)),
3989    or other LCT_ value for other types of library calls.  */
3990
3991 void
3992 emit_library_call (rtx orgfun, enum libcall_type fn_type,
3993                    enum machine_mode outmode, int nargs, ...)
3994 {
3995   va_list p;
3996
3997   va_start (p, nargs);
3998   emit_library_call_value_1 (0, orgfun, NULL_RTX, fn_type, outmode, nargs, p);
3999   va_end (p);
4000 }
4001 \f
4002 /* Like emit_library_call except that an extra argument, VALUE,
4003    comes second and says where to store the result.
4004    (If VALUE is zero, this function chooses a convenient way
4005    to return the value.
4006
4007    This function returns an rtx for where the value is to be found.
4008    If VALUE is nonzero, VALUE is returned.  */
4009
4010 rtx
4011 emit_library_call_value (rtx orgfun, rtx value,
4012                          enum libcall_type fn_type,
4013                          enum machine_mode outmode, int nargs, ...)
4014 {
4015   rtx result;
4016   va_list p;
4017
4018   va_start (p, nargs);
4019   result = emit_library_call_value_1 (1, orgfun, value, fn_type, outmode,
4020                                       nargs, p);
4021   va_end (p);
4022
4023   return result;
4024 }
4025 \f
4026 /* Store a single argument for a function call
4027    into the register or memory area where it must be passed.
4028    *ARG describes the argument value and where to pass it.
4029
4030    ARGBLOCK is the address of the stack-block for all the arguments,
4031    or 0 on a machine where arguments are pushed individually.
4032
4033    MAY_BE_ALLOCA nonzero says this could be a call to `alloca'
4034    so must be careful about how the stack is used.
4035
4036    VARIABLE_SIZE nonzero says that this was a variable-sized outgoing
4037    argument stack.  This is used if ACCUMULATE_OUTGOING_ARGS to indicate
4038    that we need not worry about saving and restoring the stack.
4039
4040    FNDECL is the declaration of the function we are calling.
4041
4042    Return nonzero if this arg should cause sibcall failure,
4043    zero otherwise.  */
4044
4045 static int
4046 store_one_arg (struct arg_data *arg, rtx argblock, int flags,
4047                int variable_size ATTRIBUTE_UNUSED, int reg_parm_stack_space)
4048 {
4049   tree pval = arg->tree_value;
4050   rtx reg = 0;
4051   int partial = 0;
4052   int used = 0;
4053   int i, lower_bound = 0, upper_bound = 0;
4054   int sibcall_failure = 0;
4055
4056   if (TREE_CODE (pval) == ERROR_MARK)
4057     return 1;
4058
4059   /* Push a new temporary level for any temporaries we make for
4060      this argument.  */
4061   push_temp_slots ();
4062
4063   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL))
4064     {
4065       /* If this is being stored into a pre-allocated, fixed-size, stack area,
4066          save any previous data at that location.  */
4067       if (argblock && ! variable_size && arg->stack)
4068         {
4069 #ifdef ARGS_GROW_DOWNWARD
4070           /* stack_slot is negative, but we want to index stack_usage_map
4071              with positive values.  */
4072           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4073             upper_bound = -INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1)) + 1;
4074           else
4075             upper_bound = 0;
4076
4077           lower_bound = upper_bound - arg->locate.size.constant;
4078 #else
4079           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4080             lower_bound = INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1));
4081           else
4082             lower_bound = 0;
4083
4084           upper_bound = lower_bound + arg->locate.size.constant;
4085 #endif
4086
4087           i = lower_bound;
4088           /* Don't worry about things in the fixed argument area;
4089              it has already been saved.  */
4090           if (i < reg_parm_stack_space)
4091             i = reg_parm_stack_space;
4092           while (i < upper_bound && stack_usage_map[i] == 0)
4093             i++;
4094
4095           if (i < upper_bound)
4096             {
4097               /* We need to make a save area.  */
4098               unsigned int size = arg->locate.size.constant * BITS_PER_UNIT;
4099               enum machine_mode save_mode = mode_for_size (size, MODE_INT, 1);
4100               rtx adr = memory_address (save_mode, XEXP (arg->stack_slot, 0));
4101               rtx stack_area = gen_rtx_MEM (save_mode, adr);
4102
4103               if (save_mode == BLKmode)
4104                 {
4105                   tree ot = TREE_TYPE (arg->tree_value);
4106                   tree nt = build_qualified_type (ot, (TYPE_QUALS (ot)
4107                                                        | TYPE_QUAL_CONST));
4108
4109                   arg->save_area = assign_temp (nt, 0, 1, 1);
4110                   preserve_temp_slots (arg->save_area);
4111                   emit_block_move (validize_mem (arg->save_area), stack_area,
4112                                    GEN_INT (arg->locate.size.constant),
4113                                    BLOCK_OP_CALL_PARM);
4114                 }
4115               else
4116                 {
4117                   arg->save_area = gen_reg_rtx (save_mode);
4118                   emit_move_insn (arg->save_area, stack_area);
4119                 }
4120             }
4121         }
4122     }
4123
4124   /* If this isn't going to be placed on both the stack and in registers,
4125      set up the register and number of words.  */
4126   if (! arg->pass_on_stack)
4127     {
4128       if (flags & ECF_SIBCALL)
4129         reg = arg->tail_call_reg;
4130       else
4131         reg = arg->reg;
4132       partial = arg->partial;
4133     }
4134
4135   /* Being passed entirely in a register.  We shouldn't be called in
4136      this case.  */
4137   gcc_assert (reg == 0 || partial != 0);
4138
4139   /* If this arg needs special alignment, don't load the registers
4140      here.  */
4141   if (arg->n_aligned_regs != 0)
4142     reg = 0;
4143
4144   /* If this is being passed partially in a register, we can't evaluate
4145      it directly into its stack slot.  Otherwise, we can.  */
4146   if (arg->value == 0)
4147     {
4148       /* stack_arg_under_construction is nonzero if a function argument is
4149          being evaluated directly into the outgoing argument list and
4150          expand_call must take special action to preserve the argument list
4151          if it is called recursively.
4152
4153          For scalar function arguments stack_usage_map is sufficient to
4154          determine which stack slots must be saved and restored.  Scalar
4155          arguments in general have pass_on_stack == 0.
4156
4157          If this argument is initialized by a function which takes the
4158          address of the argument (a C++ constructor or a C function
4159          returning a BLKmode structure), then stack_usage_map is
4160          insufficient and expand_call must push the stack around the
4161          function call.  Such arguments have pass_on_stack == 1.
4162
4163          Note that it is always safe to set stack_arg_under_construction,
4164          but this generates suboptimal code if set when not needed.  */
4165
4166       if (arg->pass_on_stack)
4167         stack_arg_under_construction++;
4168
4169       arg->value = expand_expr (pval,
4170                                 (partial
4171                                  || TYPE_MODE (TREE_TYPE (pval)) != arg->mode)
4172                                 ? NULL_RTX : arg->stack,
4173                                 VOIDmode, EXPAND_STACK_PARM);
4174
4175       /* If we are promoting object (or for any other reason) the mode
4176          doesn't agree, convert the mode.  */
4177
4178       if (arg->mode != TYPE_MODE (TREE_TYPE (pval)))
4179         arg->value = convert_modes (arg->mode, TYPE_MODE (TREE_TYPE (pval)),
4180                                     arg->value, arg->unsignedp);
4181
4182       if (arg->pass_on_stack)
4183         stack_arg_under_construction--;
4184     }
4185
4186   /* Check for overlap with already clobbered argument area.  */
4187   if ((flags & ECF_SIBCALL)
4188       && MEM_P (arg->value)
4189       && mem_overlaps_already_clobbered_arg_p (XEXP (arg->value, 0),
4190                                                arg->locate.size.constant))
4191     sibcall_failure = 1;
4192
4193   /* Don't allow anything left on stack from computation
4194      of argument to alloca.  */
4195   if (flags & ECF_MAY_BE_ALLOCA)
4196     do_pending_stack_adjust ();
4197
4198   if (arg->value == arg->stack)
4199     /* If the value is already in the stack slot, we are done.  */
4200     ;
4201   else if (arg->mode != BLKmode)
4202     {
4203       int size;
4204       unsigned int parm_align;
4205
4206       /* Argument is a scalar, not entirely passed in registers.
4207          (If part is passed in registers, arg->partial says how much
4208          and emit_push_insn will take care of putting it there.)
4209
4210          Push it, and if its size is less than the
4211          amount of space allocated to it,
4212          also bump stack pointer by the additional space.
4213          Note that in C the default argument promotions
4214          will prevent such mismatches.  */
4215
4216       size = GET_MODE_SIZE (arg->mode);
4217       /* Compute how much space the push instruction will push.
4218          On many machines, pushing a byte will advance the stack
4219          pointer by a halfword.  */
4220 #ifdef PUSH_ROUNDING
4221       size = PUSH_ROUNDING (size);
4222 #endif
4223       used = size;
4224
4225       /* Compute how much space the argument should get:
4226          round up to a multiple of the alignment for arguments.  */
4227       if (none != FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)))
4228         used = (((size + PARM_BOUNDARY / BITS_PER_UNIT - 1)
4229                  / (PARM_BOUNDARY / BITS_PER_UNIT))
4230                 * (PARM_BOUNDARY / BITS_PER_UNIT));
4231
4232       /* Compute the alignment of the pushed argument.  */
4233       parm_align = arg->locate.boundary;
4234       if (FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)) == downward)
4235         {
4236           int pad = used - size;
4237           if (pad)
4238             {
4239               unsigned int pad_align = (pad & -pad) * BITS_PER_UNIT;
4240               parm_align = MIN (parm_align, pad_align);
4241             }
4242         }
4243
4244       /* This isn't already where we want it on the stack, so put it there.
4245          This can either be done with push or copy insns.  */
4246       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), NULL_RTX,
4247                       parm_align, partial, reg, used - size, argblock,
4248                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4249                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4250
4251       /* Unless this is a partially-in-register argument, the argument is now
4252          in the stack.  */
4253       if (partial == 0)
4254         arg->value = arg->stack;
4255     }
4256   else
4257     {
4258       /* BLKmode, at least partly to be pushed.  */
4259
4260       unsigned int parm_align;
4261       int excess;
4262       rtx size_rtx;
4263
4264       /* Pushing a nonscalar.
4265          If part is passed in registers, PARTIAL says how much
4266          and emit_push_insn will take care of putting it there.  */
4267
4268       /* Round its size up to a multiple
4269          of the allocation unit for arguments.  */
4270
4271       if (arg->locate.size.var != 0)
4272         {
4273           excess = 0;
4274           size_rtx = ARGS_SIZE_RTX (arg->locate.size);
4275         }
4276       else
4277         {
4278           /* PUSH_ROUNDING has no effect on us, because emit_push_insn
4279              for BLKmode is careful to avoid it.  */
4280           excess = (arg->locate.size.constant
4281                     - int_size_in_bytes (TREE_TYPE (pval))
4282                     + partial);
4283           size_rtx = expand_expr (size_in_bytes (TREE_TYPE (pval)),
4284                                   NULL_RTX, TYPE_MODE (sizetype), 0);
4285         }
4286
4287       parm_align = arg->locate.boundary;
4288
4289       /* When an argument is padded down, the block is aligned to
4290          PARM_BOUNDARY, but the actual argument isn't.  */
4291       if (FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)) == downward)
4292         {
4293           if (arg->locate.size.var)
4294             parm_align = BITS_PER_UNIT;
4295           else if (excess)
4296             {
4297               unsigned int excess_align = (excess & -excess) * BITS_PER_UNIT;
4298               parm_align = MIN (parm_align, excess_align);
4299             }
4300         }
4301
4302       if ((flags & ECF_SIBCALL) && MEM_P (arg->value))
4303         {
4304           /* emit_push_insn might not work properly if arg->value and
4305              argblock + arg->locate.offset areas overlap.  */
4306           rtx x = arg->value;
4307           int i = 0;
4308
4309           if (XEXP (x, 0) == current_function_internal_arg_pointer
4310               || (GET_CODE (XEXP (x, 0)) == PLUS
4311                   && XEXP (XEXP (x, 0), 0) ==
4312                      current_function_internal_arg_pointer
4313                   && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT))
4314             {
4315               if (XEXP (x, 0) != current_function_internal_arg_pointer)
4316                 i = INTVAL (XEXP (XEXP (x, 0), 1));
4317
4318               /* expand_call should ensure this.  */
4319               gcc_assert (!arg->locate.offset.var
4320                           && GET_CODE (size_rtx) == CONST_INT);
4321
4322               if (arg->locate.offset.constant > i)
4323                 {
4324                   if (arg->locate.offset.constant < i + INTVAL (size_rtx))
4325                     sibcall_failure = 1;
4326                 }
4327               else if (arg->locate.offset.constant < i)
4328                 {
4329                   if (i < arg->locate.offset.constant + INTVAL (size_rtx))
4330                     sibcall_failure = 1;
4331                 }
4332             }
4333         }
4334
4335       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx,
4336                       parm_align, partial, reg, excess, argblock,
4337                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4338                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4339
4340       /* Unless this is a partially-in-register argument, the argument is now
4341          in the stack.
4342
4343          ??? Unlike the case above, in which we want the actual
4344          address of the data, so that we can load it directly into a
4345          register, here we want the address of the stack slot, so that
4346          it's properly aligned for word-by-word copying or something
4347          like that.  It's not clear that this is always correct.  */
4348       if (partial == 0)
4349         arg->value = arg->stack_slot;
4350     }
4351
4352   if (arg->reg && GET_CODE (arg->reg) == PARALLEL)
4353     {
4354       tree type = TREE_TYPE (arg->tree_value);
4355       arg->parallel_value
4356         = emit_group_load_into_temps (arg->reg, arg->value, type,
4357                                       int_size_in_bytes (type));
4358     }
4359
4360   /* Mark all slots this store used.  */
4361   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL)
4362       && argblock && ! variable_size && arg->stack)
4363     for (i = lower_bound; i < upper_bound; i++)
4364       stack_usage_map[i] = 1;
4365
4366   /* Once we have pushed something, pops can't safely
4367      be deferred during the rest of the arguments.  */
4368   NO_DEFER_POP;
4369
4370   /* Free any temporary slots made in processing this argument.  Show
4371      that we might have taken the address of something and pushed that
4372      as an operand.  */
4373   preserve_temp_slots (NULL_RTX);
4374   free_temp_slots ();
4375   pop_temp_slots ();
4376
4377   return sibcall_failure;
4378 }
4379
4380 /* Nonzero if we do not know how to pass TYPE solely in registers.  */
4381
4382 bool
4383 must_pass_in_stack_var_size (enum machine_mode mode ATTRIBUTE_UNUSED,
4384                              tree type)
4385 {
4386   if (!type)
4387     return false;
4388
4389   /* If the type has variable size...  */
4390   if (TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
4391     return true;
4392
4393   /* If the type is marked as addressable (it is required
4394      to be constructed into the stack)...  */
4395   if (TREE_ADDRESSABLE (type))
4396     return true;
4397
4398   return false;
4399 }
4400
4401 /* Another version of the TARGET_MUST_PASS_IN_STACK hook.  This one
4402    takes trailing padding of a structure into account.  */
4403 /* ??? Should be able to merge these two by examining BLOCK_REG_PADDING.  */
4404
4405 bool
4406 must_pass_in_stack_var_size_or_pad (enum machine_mode mode, tree type)
4407 {
4408   if (!type)
4409     return false;
4410
4411   /* If the type has variable size...  */
4412   if (TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
4413     return true;
4414
4415   /* If the type is marked as addressable (it is required
4416      to be constructed into the stack)...  */
4417   if (TREE_ADDRESSABLE (type))
4418     return true;
4419
4420   /* If the padding and mode of the type is such that a copy into
4421      a register would put it into the wrong part of the register.  */
4422   if (mode == BLKmode
4423       && int_size_in_bytes (type) % (PARM_BOUNDARY / BITS_PER_UNIT)
4424       && (FUNCTION_ARG_PADDING (mode, type)
4425           == (BYTES_BIG_ENDIAN ? upward : downward)))
4426     return true;
4427
4428   return false;
4429 }