OSDN Git Service

PR c++/43621
[pf3gnuchains/gcc-fork.git] / gcc / calls.c
1 /* Convert function calls to rtl insns, for GNU C compiler.
2    Copyright (C) 1989, 1992, 1993, 1994, 1995, 1996, 1997, 1998,
3    1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010
4    Free Software Foundation, Inc.
5
6 This file is part of GCC.
7
8 GCC is free software; you can redistribute it and/or modify it under
9 the terms of the GNU General Public License as published by the Free
10 Software Foundation; either version 3, or (at your option) any later
11 version.
12
13 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
14 WARRANTY; without even the implied warranty of MERCHANTABILITY or
15 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
16 for more details.
17
18 You should have received a copy of the GNU General Public License
19 along with GCC; see the file COPYING3.  If not see
20 <http://www.gnu.org/licenses/>.  */
21
22 #include "config.h"
23 #include "system.h"
24 #include "coretypes.h"
25 #include "tm.h"
26 #include "rtl.h"
27 #include "tree.h"
28 #include "gimple.h"
29 #include "flags.h"
30 #include "expr.h"
31 #include "optabs.h"
32 #include "libfuncs.h"
33 #include "function.h"
34 #include "regs.h"
35 #include "toplev.h"
36 #include "output.h"
37 #include "tm_p.h"
38 #include "timevar.h"
39 #include "sbitmap.h"
40 #include "langhooks.h"
41 #include "target.h"
42 #include "debug.h"
43 #include "cgraph.h"
44 #include "except.h"
45 #include "dbgcnt.h"
46 #include "tree-flow.h"
47
48 /* Like PREFERRED_STACK_BOUNDARY but in units of bytes, not bits.  */
49 #define STACK_BYTES (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT)
50
51 /* Data structure and subroutines used within expand_call.  */
52
53 struct arg_data
54 {
55   /* Tree node for this argument.  */
56   tree tree_value;
57   /* Mode for value; TYPE_MODE unless promoted.  */
58   enum machine_mode mode;
59   /* Current RTL value for argument, or 0 if it isn't precomputed.  */
60   rtx value;
61   /* Initially-compute RTL value for argument; only for const functions.  */
62   rtx initial_value;
63   /* Register to pass this argument in, 0 if passed on stack, or an
64      PARALLEL if the arg is to be copied into multiple non-contiguous
65      registers.  */
66   rtx reg;
67   /* Register to pass this argument in when generating tail call sequence.
68      This is not the same register as for normal calls on machines with
69      register windows.  */
70   rtx tail_call_reg;
71   /* If REG is a PARALLEL, this is a copy of VALUE pulled into the correct
72      form for emit_group_move.  */
73   rtx parallel_value;
74   /* If REG was promoted from the actual mode of the argument expression,
75      indicates whether the promotion is sign- or zero-extended.  */
76   int unsignedp;
77   /* Number of bytes to put in registers.  0 means put the whole arg
78      in registers.  Also 0 if not passed in registers.  */
79   int partial;
80   /* Nonzero if argument must be passed on stack.
81      Note that some arguments may be passed on the stack
82      even though pass_on_stack is zero, just because FUNCTION_ARG says so.
83      pass_on_stack identifies arguments that *cannot* go in registers.  */
84   int pass_on_stack;
85   /* Some fields packaged up for locate_and_pad_parm.  */
86   struct locate_and_pad_arg_data locate;
87   /* Location on the stack at which parameter should be stored.  The store
88      has already been done if STACK == VALUE.  */
89   rtx stack;
90   /* Location on the stack of the start of this argument slot.  This can
91      differ from STACK if this arg pads downward.  This location is known
92      to be aligned to FUNCTION_ARG_BOUNDARY.  */
93   rtx stack_slot;
94   /* Place that this stack area has been saved, if needed.  */
95   rtx save_area;
96   /* If an argument's alignment does not permit direct copying into registers,
97      copy in smaller-sized pieces into pseudos.  These are stored in a
98      block pointed to by this field.  The next field says how many
99      word-sized pseudos we made.  */
100   rtx *aligned_regs;
101   int n_aligned_regs;
102 };
103
104 /* A vector of one char per byte of stack space.  A byte if nonzero if
105    the corresponding stack location has been used.
106    This vector is used to prevent a function call within an argument from
107    clobbering any stack already set up.  */
108 static char *stack_usage_map;
109
110 /* Size of STACK_USAGE_MAP.  */
111 static int highest_outgoing_arg_in_use;
112
113 /* A bitmap of virtual-incoming stack space.  Bit is set if the corresponding
114    stack location's tail call argument has been already stored into the stack.
115    This bitmap is used to prevent sibling call optimization if function tries
116    to use parent's incoming argument slots when they have been already
117    overwritten with tail call arguments.  */
118 static sbitmap stored_args_map;
119
120 /* stack_arg_under_construction is nonzero when an argument may be
121    initialized with a constructor call (including a C function that
122    returns a BLKmode struct) and expand_call must take special action
123    to make sure the object being constructed does not overlap the
124    argument list for the constructor call.  */
125 static int stack_arg_under_construction;
126
127 static void emit_call_1 (rtx, tree, tree, tree, HOST_WIDE_INT, HOST_WIDE_INT,
128                          HOST_WIDE_INT, rtx, rtx, int, rtx, int,
129                          CUMULATIVE_ARGS *);
130 static void precompute_register_parameters (int, struct arg_data *, int *);
131 static int store_one_arg (struct arg_data *, rtx, int, int, int);
132 static void store_unaligned_arguments_into_pseudos (struct arg_data *, int);
133 static int finalize_must_preallocate (int, int, struct arg_data *,
134                                       struct args_size *);
135 static void precompute_arguments (int, struct arg_data *);
136 static int compute_argument_block_size (int, struct args_size *, tree, tree, int);
137 static void initialize_argument_information (int, struct arg_data *,
138                                              struct args_size *, int,
139                                              tree, tree,
140                                              tree, tree, CUMULATIVE_ARGS *, int,
141                                              rtx *, int *, int *, int *,
142                                              bool *, bool);
143 static void compute_argument_addresses (struct arg_data *, rtx, int);
144 static rtx rtx_for_function_call (tree, tree);
145 static void load_register_parameters (struct arg_data *, int, rtx *, int,
146                                       int, int *);
147 static rtx emit_library_call_value_1 (int, rtx, rtx, enum libcall_type,
148                                       enum machine_mode, int, va_list);
149 static int special_function_p (const_tree, int);
150 static int check_sibcall_argument_overlap_1 (rtx);
151 static int check_sibcall_argument_overlap (rtx, struct arg_data *, int);
152
153 static int combine_pending_stack_adjustment_and_call (int, struct args_size *,
154                                                       unsigned int);
155 static tree split_complex_types (tree);
156
157 #ifdef REG_PARM_STACK_SPACE
158 static rtx save_fixed_argument_area (int, rtx, int *, int *);
159 static void restore_fixed_argument_area (rtx, rtx, int, int);
160 #endif
161 \f
162 /* Force FUNEXP into a form suitable for the address of a CALL,
163    and return that as an rtx.  Also load the static chain register
164    if FNDECL is a nested function.
165
166    CALL_FUSAGE points to a variable holding the prospective
167    CALL_INSN_FUNCTION_USAGE information.  */
168
169 rtx
170 prepare_call_address (tree fndecl, rtx funexp, rtx static_chain_value,
171                       rtx *call_fusage, int reg_parm_seen, int sibcallp)
172 {
173   /* Make a valid memory address and copy constants through pseudo-regs,
174      but not for a constant address if -fno-function-cse.  */
175   if (GET_CODE (funexp) != SYMBOL_REF)
176     /* If we are using registers for parameters, force the
177        function address into a register now.  */
178     funexp = ((reg_parm_seen
179                && targetm.small_register_classes_for_mode_p (FUNCTION_MODE))
180               ? force_not_mem (memory_address (FUNCTION_MODE, funexp))
181               : memory_address (FUNCTION_MODE, funexp));
182   else if (! sibcallp)
183     {
184 #ifndef NO_FUNCTION_CSE
185       if (optimize && ! flag_no_function_cse)
186         funexp = force_reg (Pmode, funexp);
187 #endif
188     }
189
190   if (static_chain_value != 0)
191     {
192       rtx chain;
193
194       gcc_assert (fndecl);
195       chain = targetm.calls.static_chain (fndecl, false);
196       static_chain_value = convert_memory_address (Pmode, static_chain_value);
197
198       emit_move_insn (chain, static_chain_value);
199       if (REG_P (chain))
200         use_reg (call_fusage, chain);
201     }
202
203   return funexp;
204 }
205
206 /* Generate instructions to call function FUNEXP,
207    and optionally pop the results.
208    The CALL_INSN is the first insn generated.
209
210    FNDECL is the declaration node of the function.  This is given to the
211    macro RETURN_POPS_ARGS to determine whether this function pops its own args.
212
213    FUNTYPE is the data type of the function.  This is given to the macro
214    RETURN_POPS_ARGS to determine whether this function pops its own args.
215    We used to allow an identifier for library functions, but that doesn't
216    work when the return type is an aggregate type and the calling convention
217    says that the pointer to this aggregate is to be popped by the callee.
218
219    STACK_SIZE is the number of bytes of arguments on the stack,
220    ROUNDED_STACK_SIZE is that number rounded up to
221    PREFERRED_STACK_BOUNDARY; zero if the size is variable.  This is
222    both to put into the call insn and to generate explicit popping
223    code if necessary.
224
225    STRUCT_VALUE_SIZE is the number of bytes wanted in a structure value.
226    It is zero if this call doesn't want a structure value.
227
228    NEXT_ARG_REG is the rtx that results from executing
229      FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1)
230    just after all the args have had their registers assigned.
231    This could be whatever you like, but normally it is the first
232    arg-register beyond those used for args in this call,
233    or 0 if all the arg-registers are used in this call.
234    It is passed on to `gen_call' so you can put this info in the call insn.
235
236    VALREG is a hard register in which a value is returned,
237    or 0 if the call does not return a value.
238
239    OLD_INHIBIT_DEFER_POP is the value that `inhibit_defer_pop' had before
240    the args to this call were processed.
241    We restore `inhibit_defer_pop' to that value.
242
243    CALL_FUSAGE is either empty or an EXPR_LIST of USE expressions that
244    denote registers used by the called function.  */
245
246 static void
247 emit_call_1 (rtx funexp, tree fntree ATTRIBUTE_UNUSED, tree fndecl ATTRIBUTE_UNUSED,
248              tree funtype ATTRIBUTE_UNUSED,
249              HOST_WIDE_INT stack_size ATTRIBUTE_UNUSED,
250              HOST_WIDE_INT rounded_stack_size,
251              HOST_WIDE_INT struct_value_size ATTRIBUTE_UNUSED,
252              rtx next_arg_reg ATTRIBUTE_UNUSED, rtx valreg,
253              int old_inhibit_defer_pop, rtx call_fusage, int ecf_flags,
254              CUMULATIVE_ARGS *args_so_far ATTRIBUTE_UNUSED)
255 {
256   rtx rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
257   rtx call_insn;
258   int already_popped = 0;
259   HOST_WIDE_INT n_popped = RETURN_POPS_ARGS (fndecl, funtype, stack_size);
260
261 #ifdef CALL_POPS_ARGS
262   n_popped += CALL_POPS_ARGS (* args_so_far);
263 #endif
264
265   /* Ensure address is valid.  SYMBOL_REF is already valid, so no need,
266      and we don't want to load it into a register as an optimization,
267      because prepare_call_address already did it if it should be done.  */
268   if (GET_CODE (funexp) != SYMBOL_REF)
269     funexp = memory_address (FUNCTION_MODE, funexp);
270
271 #if defined (HAVE_sibcall_pop) && defined (HAVE_sibcall_value_pop)
272   if ((ecf_flags & ECF_SIBCALL)
273       && HAVE_sibcall_pop && HAVE_sibcall_value_pop
274       && (n_popped > 0 || stack_size == 0))
275     {
276       rtx n_pop = GEN_INT (n_popped);
277       rtx pat;
278
279       /* If this subroutine pops its own args, record that in the call insn
280          if possible, for the sake of frame pointer elimination.  */
281
282       if (valreg)
283         pat = GEN_SIBCALL_VALUE_POP (valreg,
284                                      gen_rtx_MEM (FUNCTION_MODE, funexp),
285                                      rounded_stack_size_rtx, next_arg_reg,
286                                      n_pop);
287       else
288         pat = GEN_SIBCALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
289                                rounded_stack_size_rtx, next_arg_reg, n_pop);
290
291       emit_call_insn (pat);
292       already_popped = 1;
293     }
294   else
295 #endif
296
297 #if defined (HAVE_call_pop) && defined (HAVE_call_value_pop)
298   /* If the target has "call" or "call_value" insns, then prefer them
299      if no arguments are actually popped.  If the target does not have
300      "call" or "call_value" insns, then we must use the popping versions
301      even if the call has no arguments to pop.  */
302 #if defined (HAVE_call) && defined (HAVE_call_value)
303   if (HAVE_call && HAVE_call_value && HAVE_call_pop && HAVE_call_value_pop
304       && n_popped > 0)
305 #else
306   if (HAVE_call_pop && HAVE_call_value_pop)
307 #endif
308     {
309       rtx n_pop = GEN_INT (n_popped);
310       rtx pat;
311
312       /* If this subroutine pops its own args, record that in the call insn
313          if possible, for the sake of frame pointer elimination.  */
314
315       if (valreg)
316         pat = GEN_CALL_VALUE_POP (valreg,
317                                   gen_rtx_MEM (FUNCTION_MODE, funexp),
318                                   rounded_stack_size_rtx, next_arg_reg, n_pop);
319       else
320         pat = GEN_CALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
321                             rounded_stack_size_rtx, next_arg_reg, n_pop);
322
323       emit_call_insn (pat);
324       already_popped = 1;
325     }
326   else
327 #endif
328
329 #if defined (HAVE_sibcall) && defined (HAVE_sibcall_value)
330   if ((ecf_flags & ECF_SIBCALL)
331       && HAVE_sibcall && HAVE_sibcall_value)
332     {
333       if (valreg)
334         emit_call_insn (GEN_SIBCALL_VALUE (valreg,
335                                            gen_rtx_MEM (FUNCTION_MODE, funexp),
336                                            rounded_stack_size_rtx,
337                                            next_arg_reg, NULL_RTX));
338       else
339         emit_call_insn (GEN_SIBCALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
340                                      rounded_stack_size_rtx, next_arg_reg,
341                                      GEN_INT (struct_value_size)));
342     }
343   else
344 #endif
345
346 #if defined (HAVE_call) && defined (HAVE_call_value)
347   if (HAVE_call && HAVE_call_value)
348     {
349       if (valreg)
350         emit_call_insn (GEN_CALL_VALUE (valreg,
351                                         gen_rtx_MEM (FUNCTION_MODE, funexp),
352                                         rounded_stack_size_rtx, next_arg_reg,
353                                         NULL_RTX));
354       else
355         emit_call_insn (GEN_CALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
356                                   rounded_stack_size_rtx, next_arg_reg,
357                                   GEN_INT (struct_value_size)));
358     }
359   else
360 #endif
361     gcc_unreachable ();
362
363   /* Find the call we just emitted.  */
364   call_insn = last_call_insn ();
365
366   /* Put the register usage information there.  */
367   add_function_usage_to (call_insn, call_fusage);
368
369   /* If this is a const call, then set the insn's unchanging bit.  */
370   if (ecf_flags & ECF_CONST)
371     RTL_CONST_CALL_P (call_insn) = 1;
372
373   /* If this is a pure call, then set the insn's unchanging bit.  */
374   if (ecf_flags & ECF_PURE)
375     RTL_PURE_CALL_P (call_insn) = 1;
376
377   /* If this is a const call, then set the insn's unchanging bit.  */
378   if (ecf_flags & ECF_LOOPING_CONST_OR_PURE)
379     RTL_LOOPING_CONST_OR_PURE_CALL_P (call_insn) = 1;
380
381   /* Create a nothrow REG_EH_REGION note, if needed.  */
382   make_reg_eh_region_note (call_insn, ecf_flags, 0);
383
384   if (ecf_flags & ECF_NORETURN)
385     add_reg_note (call_insn, REG_NORETURN, const0_rtx);
386
387   if (ecf_flags & ECF_RETURNS_TWICE)
388     {
389       add_reg_note (call_insn, REG_SETJMP, const0_rtx);
390       cfun->calls_setjmp = 1;
391     }
392
393   SIBLING_CALL_P (call_insn) = ((ecf_flags & ECF_SIBCALL) != 0);
394
395   /* Record debug information for virtual calls.  */
396   if (flag_enable_icf_debug && fndecl == NULL)
397     (*debug_hooks->virtual_call_token) (CALL_EXPR_FN (fntree),
398                                         INSN_UID (call_insn));
399
400   /* Restore this now, so that we do defer pops for this call's args
401      if the context of the call as a whole permits.  */
402   inhibit_defer_pop = old_inhibit_defer_pop;
403
404   if (n_popped > 0)
405     {
406       if (!already_popped)
407         CALL_INSN_FUNCTION_USAGE (call_insn)
408           = gen_rtx_EXPR_LIST (VOIDmode,
409                                gen_rtx_CLOBBER (VOIDmode, stack_pointer_rtx),
410                                CALL_INSN_FUNCTION_USAGE (call_insn));
411       rounded_stack_size -= n_popped;
412       rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
413       stack_pointer_delta -= n_popped;
414
415       /* If popup is needed, stack realign must use DRAP  */
416       if (SUPPORTS_STACK_ALIGNMENT)
417         crtl->need_drap = true;
418     }
419
420   if (!ACCUMULATE_OUTGOING_ARGS)
421     {
422       /* If returning from the subroutine does not automatically pop the args,
423          we need an instruction to pop them sooner or later.
424          Perhaps do it now; perhaps just record how much space to pop later.
425
426          If returning from the subroutine does pop the args, indicate that the
427          stack pointer will be changed.  */
428
429       if (rounded_stack_size != 0)
430         {
431           if (ecf_flags & ECF_NORETURN)
432             /* Just pretend we did the pop.  */
433             stack_pointer_delta -= rounded_stack_size;
434           else if (flag_defer_pop && inhibit_defer_pop == 0
435               && ! (ecf_flags & (ECF_CONST | ECF_PURE)))
436             pending_stack_adjust += rounded_stack_size;
437           else
438             adjust_stack (rounded_stack_size_rtx);
439         }
440     }
441   /* When we accumulate outgoing args, we must avoid any stack manipulations.
442      Restore the stack pointer to its original value now.  Usually
443      ACCUMULATE_OUTGOING_ARGS targets don't get here, but there are exceptions.
444      On  i386 ACCUMULATE_OUTGOING_ARGS can be enabled on demand, and
445      popping variants of functions exist as well.
446
447      ??? We may optimize similar to defer_pop above, but it is
448      probably not worthwhile.
449
450      ??? It will be worthwhile to enable combine_stack_adjustments even for
451      such machines.  */
452   else if (n_popped)
453     anti_adjust_stack (GEN_INT (n_popped));
454 }
455
456 /* Determine if the function identified by NAME and FNDECL is one with
457    special properties we wish to know about.
458
459    For example, if the function might return more than one time (setjmp), then
460    set RETURNS_TWICE to a nonzero value.
461
462    Similarly set NORETURN if the function is in the longjmp family.
463
464    Set MAY_BE_ALLOCA for any memory allocation function that might allocate
465    space from the stack such as alloca.  */
466
467 static int
468 special_function_p (const_tree fndecl, int flags)
469 {
470   if (fndecl && DECL_NAME (fndecl)
471       && IDENTIFIER_LENGTH (DECL_NAME (fndecl)) <= 17
472       /* Exclude functions not at the file scope, or not `extern',
473          since they are not the magic functions we would otherwise
474          think they are.
475          FIXME: this should be handled with attributes, not with this
476          hacky imitation of DECL_ASSEMBLER_NAME.  It's (also) wrong
477          because you can declare fork() inside a function if you
478          wish.  */
479       && (DECL_CONTEXT (fndecl) == NULL_TREE
480           || TREE_CODE (DECL_CONTEXT (fndecl)) == TRANSLATION_UNIT_DECL)
481       && TREE_PUBLIC (fndecl))
482     {
483       const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
484       const char *tname = name;
485
486       /* We assume that alloca will always be called by name.  It
487          makes no sense to pass it as a pointer-to-function to
488          anything that does not understand its behavior.  */
489       if (((IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 6
490             && name[0] == 'a'
491             && ! strcmp (name, "alloca"))
492            || (IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 16
493                && name[0] == '_'
494                && ! strcmp (name, "__builtin_alloca"))))
495         flags |= ECF_MAY_BE_ALLOCA;
496
497       /* Disregard prefix _, __, __x or __builtin_.  */
498       if (name[0] == '_')
499         {
500           if (name[1] == '_'
501               && name[2] == 'b'
502               && !strncmp (name + 3, "uiltin_", 7))
503             tname += 10;
504           else if (name[1] == '_' && name[2] == 'x')
505             tname += 3;
506           else if (name[1] == '_')
507             tname += 2;
508           else
509             tname += 1;
510         }
511
512       if (tname[0] == 's')
513         {
514           if ((tname[1] == 'e'
515                && (! strcmp (tname, "setjmp")
516                    || ! strcmp (tname, "setjmp_syscall")))
517               || (tname[1] == 'i'
518                   && ! strcmp (tname, "sigsetjmp"))
519               || (tname[1] == 'a'
520                   && ! strcmp (tname, "savectx")))
521             flags |= ECF_RETURNS_TWICE;
522
523           if (tname[1] == 'i'
524               && ! strcmp (tname, "siglongjmp"))
525             flags |= ECF_NORETURN;
526         }
527       else if ((tname[0] == 'q' && tname[1] == 's'
528                 && ! strcmp (tname, "qsetjmp"))
529                || (tname[0] == 'v' && tname[1] == 'f'
530                    && ! strcmp (tname, "vfork"))
531                || (tname[0] == 'g' && tname[1] == 'e'
532                    && !strcmp (tname, "getcontext")))
533         flags |= ECF_RETURNS_TWICE;
534
535       else if (tname[0] == 'l' && tname[1] == 'o'
536                && ! strcmp (tname, "longjmp"))
537         flags |= ECF_NORETURN;
538     }
539
540   return flags;
541 }
542
543 /* Return nonzero when FNDECL represents a call to setjmp.  */
544
545 int
546 setjmp_call_p (const_tree fndecl)
547 {
548   return special_function_p (fndecl, 0) & ECF_RETURNS_TWICE;
549 }
550
551
552 /* Return true if STMT is an alloca call.  */
553
554 bool
555 gimple_alloca_call_p (const_gimple stmt)
556 {
557   tree fndecl;
558
559   if (!is_gimple_call (stmt))
560     return false;
561
562   fndecl = gimple_call_fndecl (stmt);
563   if (fndecl && (special_function_p (fndecl, 0) & ECF_MAY_BE_ALLOCA))
564     return true;
565
566   return false;
567 }
568
569 /* Return true when exp contains alloca call.  */
570
571 bool
572 alloca_call_p (const_tree exp)
573 {
574   if (TREE_CODE (exp) == CALL_EXPR
575       && TREE_CODE (CALL_EXPR_FN (exp)) == ADDR_EXPR
576       && (TREE_CODE (TREE_OPERAND (CALL_EXPR_FN (exp), 0)) == FUNCTION_DECL)
577       && (special_function_p (TREE_OPERAND (CALL_EXPR_FN (exp), 0), 0)
578           & ECF_MAY_BE_ALLOCA))
579     return true;
580   return false;
581 }
582
583 /* Detect flags (function attributes) from the function decl or type node.  */
584
585 int
586 flags_from_decl_or_type (const_tree exp)
587 {
588   int flags = 0;
589
590   if (DECL_P (exp))
591     {
592       /* The function exp may have the `malloc' attribute.  */
593       if (DECL_IS_MALLOC (exp))
594         flags |= ECF_MALLOC;
595
596       /* The function exp may have the `returns_twice' attribute.  */
597       if (DECL_IS_RETURNS_TWICE (exp))
598         flags |= ECF_RETURNS_TWICE;
599
600       /* Process the pure and const attributes.  */
601       if (TREE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
602         flags |= ECF_CONST;
603       if (DECL_PURE_P (exp))
604         flags |= ECF_PURE;
605       if (DECL_LOOPING_CONST_OR_PURE_P (exp))
606         flags |= ECF_LOOPING_CONST_OR_PURE;
607
608       if (DECL_IS_NOVOPS (exp))
609         flags |= ECF_NOVOPS;
610
611       if (TREE_NOTHROW (exp))
612         flags |= ECF_NOTHROW;
613
614       flags = special_function_p (exp, flags);
615     }
616   else if (TYPE_P (exp) && TYPE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
617     flags |= ECF_CONST;
618
619   if (TREE_THIS_VOLATILE (exp))
620     flags |= ECF_NORETURN;
621
622   return flags;
623 }
624
625 /* Detect flags from a CALL_EXPR.  */
626
627 int
628 call_expr_flags (const_tree t)
629 {
630   int flags;
631   tree decl = get_callee_fndecl (t);
632
633   if (decl)
634     flags = flags_from_decl_or_type (decl);
635   else
636     {
637       t = TREE_TYPE (CALL_EXPR_FN (t));
638       if (t && TREE_CODE (t) == POINTER_TYPE)
639         flags = flags_from_decl_or_type (TREE_TYPE (t));
640       else
641         flags = 0;
642     }
643
644   return flags;
645 }
646
647 /* Precompute all register parameters as described by ARGS, storing values
648    into fields within the ARGS array.
649
650    NUM_ACTUALS indicates the total number elements in the ARGS array.
651
652    Set REG_PARM_SEEN if we encounter a register parameter.  */
653
654 static void
655 precompute_register_parameters (int num_actuals, struct arg_data *args,
656                                 int *reg_parm_seen)
657 {
658   int i;
659
660   *reg_parm_seen = 0;
661
662   for (i = 0; i < num_actuals; i++)
663     if (args[i].reg != 0 && ! args[i].pass_on_stack)
664       {
665         *reg_parm_seen = 1;
666
667         if (args[i].value == 0)
668           {
669             push_temp_slots ();
670             args[i].value = expand_normal (args[i].tree_value);
671             preserve_temp_slots (args[i].value);
672             pop_temp_slots ();
673           }
674
675         /* If the value is a non-legitimate constant, force it into a
676            pseudo now.  TLS symbols sometimes need a call to resolve.  */
677         if (CONSTANT_P (args[i].value)
678             && !LEGITIMATE_CONSTANT_P (args[i].value))
679           args[i].value = force_reg (args[i].mode, args[i].value);
680
681         /* If we are to promote the function arg to a wider mode,
682            do it now.  */
683
684         if (args[i].mode != TYPE_MODE (TREE_TYPE (args[i].tree_value)))
685           args[i].value
686             = convert_modes (args[i].mode,
687                              TYPE_MODE (TREE_TYPE (args[i].tree_value)),
688                              args[i].value, args[i].unsignedp);
689
690         /* If we're going to have to load the value by parts, pull the
691            parts into pseudos.  The part extraction process can involve
692            non-trivial computation.  */
693         if (GET_CODE (args[i].reg) == PARALLEL)
694           {
695             tree type = TREE_TYPE (args[i].tree_value);
696             args[i].parallel_value
697               = emit_group_load_into_temps (args[i].reg, args[i].value,
698                                             type, int_size_in_bytes (type));
699           }
700
701         /* If the value is expensive, and we are inside an appropriately
702            short loop, put the value into a pseudo and then put the pseudo
703            into the hard reg.
704
705            For small register classes, also do this if this call uses
706            register parameters.  This is to avoid reload conflicts while
707            loading the parameters registers.  */
708
709         else if ((! (REG_P (args[i].value)
710                      || (GET_CODE (args[i].value) == SUBREG
711                          && REG_P (SUBREG_REG (args[i].value)))))
712                  && args[i].mode != BLKmode
713                  && rtx_cost (args[i].value, SET, optimize_insn_for_speed_p ())
714                     > COSTS_N_INSNS (1)
715                  && ((*reg_parm_seen
716                       && targetm.small_register_classes_for_mode_p (args[i].mode))
717                      || optimize))
718           args[i].value = copy_to_mode_reg (args[i].mode, args[i].value);
719       }
720 }
721
722 #ifdef REG_PARM_STACK_SPACE
723
724   /* The argument list is the property of the called routine and it
725      may clobber it.  If the fixed area has been used for previous
726      parameters, we must save and restore it.  */
727
728 static rtx
729 save_fixed_argument_area (int reg_parm_stack_space, rtx argblock, int *low_to_save, int *high_to_save)
730 {
731   int low;
732   int high;
733
734   /* Compute the boundary of the area that needs to be saved, if any.  */
735   high = reg_parm_stack_space;
736 #ifdef ARGS_GROW_DOWNWARD
737   high += 1;
738 #endif
739   if (high > highest_outgoing_arg_in_use)
740     high = highest_outgoing_arg_in_use;
741
742   for (low = 0; low < high; low++)
743     if (stack_usage_map[low] != 0)
744       {
745         int num_to_save;
746         enum machine_mode save_mode;
747         int delta;
748         rtx stack_area;
749         rtx save_area;
750
751         while (stack_usage_map[--high] == 0)
752           ;
753
754         *low_to_save = low;
755         *high_to_save = high;
756
757         num_to_save = high - low + 1;
758         save_mode = mode_for_size (num_to_save * BITS_PER_UNIT, MODE_INT, 1);
759
760         /* If we don't have the required alignment, must do this
761            in BLKmode.  */
762         if ((low & (MIN (GET_MODE_SIZE (save_mode),
763                          BIGGEST_ALIGNMENT / UNITS_PER_WORD) - 1)))
764           save_mode = BLKmode;
765
766 #ifdef ARGS_GROW_DOWNWARD
767         delta = -high;
768 #else
769         delta = low;
770 #endif
771         stack_area = gen_rtx_MEM (save_mode,
772                                   memory_address (save_mode,
773                                                   plus_constant (argblock,
774                                                                  delta)));
775
776         set_mem_align (stack_area, PARM_BOUNDARY);
777         if (save_mode == BLKmode)
778           {
779             save_area = assign_stack_temp (BLKmode, num_to_save, 0);
780             emit_block_move (validize_mem (save_area), stack_area,
781                              GEN_INT (num_to_save), BLOCK_OP_CALL_PARM);
782           }
783         else
784           {
785             save_area = gen_reg_rtx (save_mode);
786             emit_move_insn (save_area, stack_area);
787           }
788
789         return save_area;
790       }
791
792   return NULL_RTX;
793 }
794
795 static void
796 restore_fixed_argument_area (rtx save_area, rtx argblock, int high_to_save, int low_to_save)
797 {
798   enum machine_mode save_mode = GET_MODE (save_area);
799   int delta;
800   rtx stack_area;
801
802 #ifdef ARGS_GROW_DOWNWARD
803   delta = -high_to_save;
804 #else
805   delta = low_to_save;
806 #endif
807   stack_area = gen_rtx_MEM (save_mode,
808                             memory_address (save_mode,
809                                             plus_constant (argblock, delta)));
810   set_mem_align (stack_area, PARM_BOUNDARY);
811
812   if (save_mode != BLKmode)
813     emit_move_insn (stack_area, save_area);
814   else
815     emit_block_move (stack_area, validize_mem (save_area),
816                      GEN_INT (high_to_save - low_to_save + 1),
817                      BLOCK_OP_CALL_PARM);
818 }
819 #endif /* REG_PARM_STACK_SPACE */
820
821 /* If any elements in ARGS refer to parameters that are to be passed in
822    registers, but not in memory, and whose alignment does not permit a
823    direct copy into registers.  Copy the values into a group of pseudos
824    which we will later copy into the appropriate hard registers.
825
826    Pseudos for each unaligned argument will be stored into the array
827    args[argnum].aligned_regs.  The caller is responsible for deallocating
828    the aligned_regs array if it is nonzero.  */
829
830 static void
831 store_unaligned_arguments_into_pseudos (struct arg_data *args, int num_actuals)
832 {
833   int i, j;
834
835   for (i = 0; i < num_actuals; i++)
836     if (args[i].reg != 0 && ! args[i].pass_on_stack
837         && args[i].mode == BLKmode
838         && MEM_P (args[i].value)
839         && (MEM_ALIGN (args[i].value)
840             < (unsigned int) MIN (BIGGEST_ALIGNMENT, BITS_PER_WORD)))
841       {
842         int bytes = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
843         int endian_correction = 0;
844
845         if (args[i].partial)
846           {
847             gcc_assert (args[i].partial % UNITS_PER_WORD == 0);
848             args[i].n_aligned_regs = args[i].partial / UNITS_PER_WORD;
849           }
850         else
851           {
852             args[i].n_aligned_regs
853               = (bytes + UNITS_PER_WORD - 1) / UNITS_PER_WORD;
854           }
855
856         args[i].aligned_regs = XNEWVEC (rtx, args[i].n_aligned_regs);
857
858         /* Structures smaller than a word are normally aligned to the
859            least significant byte.  On a BYTES_BIG_ENDIAN machine,
860            this means we must skip the empty high order bytes when
861            calculating the bit offset.  */
862         if (bytes < UNITS_PER_WORD
863 #ifdef BLOCK_REG_PADDING
864             && (BLOCK_REG_PADDING (args[i].mode,
865                                    TREE_TYPE (args[i].tree_value), 1)
866                 == downward)
867 #else
868             && BYTES_BIG_ENDIAN
869 #endif
870             )
871           endian_correction = BITS_PER_WORD - bytes * BITS_PER_UNIT;
872
873         for (j = 0; j < args[i].n_aligned_regs; j++)
874           {
875             rtx reg = gen_reg_rtx (word_mode);
876             rtx word = operand_subword_force (args[i].value, j, BLKmode);
877             int bitsize = MIN (bytes * BITS_PER_UNIT, BITS_PER_WORD);
878
879             args[i].aligned_regs[j] = reg;
880             word = extract_bit_field (word, bitsize, 0, 1, NULL_RTX,
881                                       word_mode, word_mode);
882
883             /* There is no need to restrict this code to loading items
884                in TYPE_ALIGN sized hunks.  The bitfield instructions can
885                load up entire word sized registers efficiently.
886
887                ??? This may not be needed anymore.
888                We use to emit a clobber here but that doesn't let later
889                passes optimize the instructions we emit.  By storing 0 into
890                the register later passes know the first AND to zero out the
891                bitfield being set in the register is unnecessary.  The store
892                of 0 will be deleted as will at least the first AND.  */
893
894             emit_move_insn (reg, const0_rtx);
895
896             bytes -= bitsize / BITS_PER_UNIT;
897             store_bit_field (reg, bitsize, endian_correction, word_mode,
898                              word);
899           }
900       }
901 }
902
903 /* Fill in ARGS_SIZE and ARGS array based on the parameters found in
904    CALL_EXPR EXP.
905
906    NUM_ACTUALS is the total number of parameters.
907
908    N_NAMED_ARGS is the total number of named arguments.
909
910    STRUCT_VALUE_ADDR_VALUE is the implicit argument for a struct return
911    value, or null.
912
913    FNDECL is the tree code for the target of this call (if known)
914
915    ARGS_SO_FAR holds state needed by the target to know where to place
916    the next argument.
917
918    REG_PARM_STACK_SPACE is the number of bytes of stack space reserved
919    for arguments which are passed in registers.
920
921    OLD_STACK_LEVEL is a pointer to an rtx which olds the old stack level
922    and may be modified by this routine.
923
924    OLD_PENDING_ADJ, MUST_PREALLOCATE and FLAGS are pointers to integer
925    flags which may may be modified by this routine.
926
927    MAY_TAILCALL is cleared if we encounter an invisible pass-by-reference
928    that requires allocation of stack space.
929
930    CALL_FROM_THUNK_P is true if this call is the jump from a thunk to
931    the thunked-to function.  */
932
933 static void
934 initialize_argument_information (int num_actuals ATTRIBUTE_UNUSED,
935                                  struct arg_data *args,
936                                  struct args_size *args_size,
937                                  int n_named_args ATTRIBUTE_UNUSED,
938                                  tree exp, tree struct_value_addr_value,
939                                  tree fndecl, tree fntype,
940                                  CUMULATIVE_ARGS *args_so_far,
941                                  int reg_parm_stack_space,
942                                  rtx *old_stack_level, int *old_pending_adj,
943                                  int *must_preallocate, int *ecf_flags,
944                                  bool *may_tailcall, bool call_from_thunk_p)
945 {
946   location_t loc = EXPR_LOCATION (exp);
947   /* 1 if scanning parms front to back, -1 if scanning back to front.  */
948   int inc;
949
950   /* Count arg position in order args appear.  */
951   int argpos;
952
953   int i;
954
955   args_size->constant = 0;
956   args_size->var = 0;
957
958   /* In this loop, we consider args in the order they are written.
959      We fill up ARGS from the front or from the back if necessary
960      so that in any case the first arg to be pushed ends up at the front.  */
961
962   if (PUSH_ARGS_REVERSED)
963     {
964       i = num_actuals - 1, inc = -1;
965       /* In this case, must reverse order of args
966          so that we compute and push the last arg first.  */
967     }
968   else
969     {
970       i = 0, inc = 1;
971     }
972
973   /* First fill in the actual arguments in the ARGS array, splitting
974      complex arguments if necessary.  */
975   {
976     int j = i;
977     call_expr_arg_iterator iter;
978     tree arg;
979
980     if (struct_value_addr_value)
981       {
982         args[j].tree_value = struct_value_addr_value;
983         j += inc;
984       }
985     FOR_EACH_CALL_EXPR_ARG (arg, iter, exp)
986       {
987         tree argtype = TREE_TYPE (arg);
988         if (targetm.calls.split_complex_arg
989             && argtype
990             && TREE_CODE (argtype) == COMPLEX_TYPE
991             && targetm.calls.split_complex_arg (argtype))
992           {
993             tree subtype = TREE_TYPE (argtype);
994             args[j].tree_value = build1 (REALPART_EXPR, subtype, arg);
995             j += inc;
996             args[j].tree_value = build1 (IMAGPART_EXPR, subtype, arg);
997           }
998         else
999           args[j].tree_value = arg;
1000         j += inc;
1001       }
1002   }
1003
1004   /* I counts args in order (to be) pushed; ARGPOS counts in order written.  */
1005   for (argpos = 0; argpos < num_actuals; i += inc, argpos++)
1006     {
1007       tree type = TREE_TYPE (args[i].tree_value);
1008       int unsignedp;
1009       enum machine_mode mode;
1010
1011       /* Replace erroneous argument with constant zero.  */
1012       if (type == error_mark_node || !COMPLETE_TYPE_P (type))
1013         args[i].tree_value = integer_zero_node, type = integer_type_node;
1014
1015       /* If TYPE is a transparent union or record, pass things the way
1016          we would pass the first field of the union or record.  We have
1017          already verified that the modes are the same.  */
1018       if ((TREE_CODE (type) == UNION_TYPE || TREE_CODE (type) == RECORD_TYPE)
1019            && TYPE_TRANSPARENT_AGGR (type))
1020         type = TREE_TYPE (first_field (type));
1021
1022       /* Decide where to pass this arg.
1023
1024          args[i].reg is nonzero if all or part is passed in registers.
1025
1026          args[i].partial is nonzero if part but not all is passed in registers,
1027          and the exact value says how many bytes are passed in registers.
1028
1029          args[i].pass_on_stack is nonzero if the argument must at least be
1030          computed on the stack.  It may then be loaded back into registers
1031          if args[i].reg is nonzero.
1032
1033          These decisions are driven by the FUNCTION_... macros and must agree
1034          with those made by function.c.  */
1035
1036       /* See if this argument should be passed by invisible reference.  */
1037       if (pass_by_reference (args_so_far, TYPE_MODE (type),
1038                              type, argpos < n_named_args))
1039         {
1040           bool callee_copies;
1041           tree base;
1042
1043           callee_copies
1044             = reference_callee_copied (args_so_far, TYPE_MODE (type),
1045                                        type, argpos < n_named_args);
1046
1047           /* If we're compiling a thunk, pass through invisible references
1048              instead of making a copy.  */
1049           if (call_from_thunk_p
1050               || (callee_copies
1051                   && !TREE_ADDRESSABLE (type)
1052                   && (base = get_base_address (args[i].tree_value))
1053                   && TREE_CODE (base) != SSA_NAME
1054                   && (!DECL_P (base) || MEM_P (DECL_RTL (base)))))
1055             {
1056               /* We can't use sibcalls if a callee-copied argument is
1057                  stored in the current function's frame.  */
1058               if (!call_from_thunk_p && DECL_P (base) && !TREE_STATIC (base))
1059                 *may_tailcall = false;
1060
1061               args[i].tree_value = build_fold_addr_expr_loc (loc,
1062                                                          args[i].tree_value);
1063               type = TREE_TYPE (args[i].tree_value);
1064
1065               if (*ecf_flags & ECF_CONST)
1066                 *ecf_flags &= ~(ECF_CONST | ECF_LOOPING_CONST_OR_PURE);
1067             }
1068           else
1069             {
1070               /* We make a copy of the object and pass the address to the
1071                  function being called.  */
1072               rtx copy;
1073
1074               if (!COMPLETE_TYPE_P (type)
1075                   || TREE_CODE (TYPE_SIZE_UNIT (type)) != INTEGER_CST
1076                   || (flag_stack_check == GENERIC_STACK_CHECK
1077                       && compare_tree_int (TYPE_SIZE_UNIT (type),
1078                                            STACK_CHECK_MAX_VAR_SIZE) > 0))
1079                 {
1080                   /* This is a variable-sized object.  Make space on the stack
1081                      for it.  */
1082                   rtx size_rtx = expr_size (args[i].tree_value);
1083
1084                   if (*old_stack_level == 0)
1085                     {
1086                       emit_stack_save (SAVE_BLOCK, old_stack_level, NULL_RTX);
1087                       *old_pending_adj = pending_stack_adjust;
1088                       pending_stack_adjust = 0;
1089                     }
1090
1091                   copy = gen_rtx_MEM (BLKmode,
1092                                       allocate_dynamic_stack_space
1093                                       (size_rtx, NULL_RTX, TYPE_ALIGN (type)));
1094                   set_mem_attributes (copy, type, 1);
1095                 }
1096               else
1097                 copy = assign_temp (type, 0, 1, 0);
1098
1099               store_expr (args[i].tree_value, copy, 0, false);
1100
1101               /* Just change the const function to pure and then let
1102                  the next test clear the pure based on
1103                  callee_copies.  */
1104               if (*ecf_flags & ECF_CONST)
1105                 {
1106                   *ecf_flags &= ~ECF_CONST;
1107                   *ecf_flags |= ECF_PURE;
1108                 }
1109
1110               if (!callee_copies && *ecf_flags & ECF_PURE)
1111                 *ecf_flags &= ~(ECF_PURE | ECF_LOOPING_CONST_OR_PURE);
1112
1113               args[i].tree_value
1114                 = build_fold_addr_expr_loc (loc, make_tree (type, copy));
1115               type = TREE_TYPE (args[i].tree_value);
1116               *may_tailcall = false;
1117             }
1118         }
1119
1120       unsignedp = TYPE_UNSIGNED (type);
1121       mode = promote_function_mode (type, TYPE_MODE (type), &unsignedp,
1122                                     fndecl ? TREE_TYPE (fndecl) : fntype, 0);
1123
1124       args[i].unsignedp = unsignedp;
1125       args[i].mode = mode;
1126
1127       args[i].reg = FUNCTION_ARG (*args_so_far, mode, type,
1128                                   argpos < n_named_args);
1129 #ifdef FUNCTION_INCOMING_ARG
1130       /* If this is a sibling call and the machine has register windows, the
1131          register window has to be unwinded before calling the routine, so
1132          arguments have to go into the incoming registers.  */
1133       args[i].tail_call_reg = FUNCTION_INCOMING_ARG (*args_so_far, mode, type,
1134                                                      argpos < n_named_args);
1135 #else
1136       args[i].tail_call_reg = args[i].reg;
1137 #endif
1138
1139       if (args[i].reg)
1140         args[i].partial
1141           = targetm.calls.arg_partial_bytes (args_so_far, mode, type,
1142                                              argpos < n_named_args);
1143
1144       args[i].pass_on_stack = targetm.calls.must_pass_in_stack (mode, type);
1145
1146       /* If FUNCTION_ARG returned a (parallel [(expr_list (nil) ...) ...]),
1147          it means that we are to pass this arg in the register(s) designated
1148          by the PARALLEL, but also to pass it in the stack.  */
1149       if (args[i].reg && GET_CODE (args[i].reg) == PARALLEL
1150           && XEXP (XVECEXP (args[i].reg, 0, 0), 0) == 0)
1151         args[i].pass_on_stack = 1;
1152
1153       /* If this is an addressable type, we must preallocate the stack
1154          since we must evaluate the object into its final location.
1155
1156          If this is to be passed in both registers and the stack, it is simpler
1157          to preallocate.  */
1158       if (TREE_ADDRESSABLE (type)
1159           || (args[i].pass_on_stack && args[i].reg != 0))
1160         *must_preallocate = 1;
1161
1162       /* Compute the stack-size of this argument.  */
1163       if (args[i].reg == 0 || args[i].partial != 0
1164           || reg_parm_stack_space > 0
1165           || args[i].pass_on_stack)
1166         locate_and_pad_parm (mode, type,
1167 #ifdef STACK_PARMS_IN_REG_PARM_AREA
1168                              1,
1169 #else
1170                              args[i].reg != 0,
1171 #endif
1172                              args[i].pass_on_stack ? 0 : args[i].partial,
1173                              fndecl, args_size, &args[i].locate);
1174 #ifdef BLOCK_REG_PADDING
1175       else
1176         /* The argument is passed entirely in registers.  See at which
1177            end it should be padded.  */
1178         args[i].locate.where_pad =
1179           BLOCK_REG_PADDING (mode, type,
1180                              int_size_in_bytes (type) <= UNITS_PER_WORD);
1181 #endif
1182
1183       /* Update ARGS_SIZE, the total stack space for args so far.  */
1184
1185       args_size->constant += args[i].locate.size.constant;
1186       if (args[i].locate.size.var)
1187         ADD_PARM_SIZE (*args_size, args[i].locate.size.var);
1188
1189       /* Increment ARGS_SO_FAR, which has info about which arg-registers
1190          have been used, etc.  */
1191
1192       FUNCTION_ARG_ADVANCE (*args_so_far, TYPE_MODE (type), type,
1193                             argpos < n_named_args);
1194     }
1195 }
1196
1197 /* Update ARGS_SIZE to contain the total size for the argument block.
1198    Return the original constant component of the argument block's size.
1199
1200    REG_PARM_STACK_SPACE holds the number of bytes of stack space reserved
1201    for arguments passed in registers.  */
1202
1203 static int
1204 compute_argument_block_size (int reg_parm_stack_space,
1205                              struct args_size *args_size,
1206                              tree fndecl ATTRIBUTE_UNUSED,
1207                              tree fntype ATTRIBUTE_UNUSED,
1208                              int preferred_stack_boundary ATTRIBUTE_UNUSED)
1209 {
1210   int unadjusted_args_size = args_size->constant;
1211
1212   /* For accumulate outgoing args mode we don't need to align, since the frame
1213      will be already aligned.  Align to STACK_BOUNDARY in order to prevent
1214      backends from generating misaligned frame sizes.  */
1215   if (ACCUMULATE_OUTGOING_ARGS && preferred_stack_boundary > STACK_BOUNDARY)
1216     preferred_stack_boundary = STACK_BOUNDARY;
1217
1218   /* Compute the actual size of the argument block required.  The variable
1219      and constant sizes must be combined, the size may have to be rounded,
1220      and there may be a minimum required size.  */
1221
1222   if (args_size->var)
1223     {
1224       args_size->var = ARGS_SIZE_TREE (*args_size);
1225       args_size->constant = 0;
1226
1227       preferred_stack_boundary /= BITS_PER_UNIT;
1228       if (preferred_stack_boundary > 1)
1229         {
1230           /* We don't handle this case yet.  To handle it correctly we have
1231              to add the delta, round and subtract the delta.
1232              Currently no machine description requires this support.  */
1233           gcc_assert (!(stack_pointer_delta & (preferred_stack_boundary - 1)));
1234           args_size->var = round_up (args_size->var, preferred_stack_boundary);
1235         }
1236
1237       if (reg_parm_stack_space > 0)
1238         {
1239           args_size->var
1240             = size_binop (MAX_EXPR, args_size->var,
1241                           ssize_int (reg_parm_stack_space));
1242
1243           /* The area corresponding to register parameters is not to count in
1244              the size of the block we need.  So make the adjustment.  */
1245           if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl))))
1246             args_size->var
1247               = size_binop (MINUS_EXPR, args_size->var,
1248                             ssize_int (reg_parm_stack_space));
1249         }
1250     }
1251   else
1252     {
1253       preferred_stack_boundary /= BITS_PER_UNIT;
1254       if (preferred_stack_boundary < 1)
1255         preferred_stack_boundary = 1;
1256       args_size->constant = (((args_size->constant
1257                                + stack_pointer_delta
1258                                + preferred_stack_boundary - 1)
1259                               / preferred_stack_boundary
1260                               * preferred_stack_boundary)
1261                              - stack_pointer_delta);
1262
1263       args_size->constant = MAX (args_size->constant,
1264                                  reg_parm_stack_space);
1265
1266       if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl))))
1267         args_size->constant -= reg_parm_stack_space;
1268     }
1269   return unadjusted_args_size;
1270 }
1271
1272 /* Precompute parameters as needed for a function call.
1273
1274    FLAGS is mask of ECF_* constants.
1275
1276    NUM_ACTUALS is the number of arguments.
1277
1278    ARGS is an array containing information for each argument; this
1279    routine fills in the INITIAL_VALUE and VALUE fields for each
1280    precomputed argument.  */
1281
1282 static void
1283 precompute_arguments (int num_actuals, struct arg_data *args)
1284 {
1285   int i;
1286
1287   /* If this is a libcall, then precompute all arguments so that we do not
1288      get extraneous instructions emitted as part of the libcall sequence.  */
1289
1290   /* If we preallocated the stack space, and some arguments must be passed
1291      on the stack, then we must precompute any parameter which contains a
1292      function call which will store arguments on the stack.
1293      Otherwise, evaluating the parameter may clobber previous parameters
1294      which have already been stored into the stack.  (we have code to avoid
1295      such case by saving the outgoing stack arguments, but it results in
1296      worse code)  */
1297   if (!ACCUMULATE_OUTGOING_ARGS)
1298     return;
1299
1300   for (i = 0; i < num_actuals; i++)
1301     {
1302       tree type;
1303       enum machine_mode mode;
1304
1305       if (TREE_CODE (args[i].tree_value) != CALL_EXPR)
1306         continue;
1307
1308       /* If this is an addressable type, we cannot pre-evaluate it.  */
1309       type = TREE_TYPE (args[i].tree_value);
1310       gcc_assert (!TREE_ADDRESSABLE (type));
1311
1312       args[i].initial_value = args[i].value
1313         = expand_normal (args[i].tree_value);
1314
1315       mode = TYPE_MODE (type);
1316       if (mode != args[i].mode)
1317         {
1318           int unsignedp = args[i].unsignedp;
1319           args[i].value
1320             = convert_modes (args[i].mode, mode,
1321                              args[i].value, args[i].unsignedp);
1322
1323           /* CSE will replace this only if it contains args[i].value
1324              pseudo, so convert it down to the declared mode using
1325              a SUBREG.  */
1326           if (REG_P (args[i].value)
1327               && GET_MODE_CLASS (args[i].mode) == MODE_INT
1328               && promote_mode (type, mode, &unsignedp) != args[i].mode)
1329             {
1330               args[i].initial_value
1331                 = gen_lowpart_SUBREG (mode, args[i].value);
1332               SUBREG_PROMOTED_VAR_P (args[i].initial_value) = 1;
1333               SUBREG_PROMOTED_UNSIGNED_SET (args[i].initial_value,
1334                                             args[i].unsignedp);
1335             }
1336         }
1337     }
1338 }
1339
1340 /* Given the current state of MUST_PREALLOCATE and information about
1341    arguments to a function call in NUM_ACTUALS, ARGS and ARGS_SIZE,
1342    compute and return the final value for MUST_PREALLOCATE.  */
1343
1344 static int
1345 finalize_must_preallocate (int must_preallocate, int num_actuals,
1346                            struct arg_data *args, struct args_size *args_size)
1347 {
1348   /* See if we have or want to preallocate stack space.
1349
1350      If we would have to push a partially-in-regs parm
1351      before other stack parms, preallocate stack space instead.
1352
1353      If the size of some parm is not a multiple of the required stack
1354      alignment, we must preallocate.
1355
1356      If the total size of arguments that would otherwise create a copy in
1357      a temporary (such as a CALL) is more than half the total argument list
1358      size, preallocation is faster.
1359
1360      Another reason to preallocate is if we have a machine (like the m88k)
1361      where stack alignment is required to be maintained between every
1362      pair of insns, not just when the call is made.  However, we assume here
1363      that such machines either do not have push insns (and hence preallocation
1364      would occur anyway) or the problem is taken care of with
1365      PUSH_ROUNDING.  */
1366
1367   if (! must_preallocate)
1368     {
1369       int partial_seen = 0;
1370       int copy_to_evaluate_size = 0;
1371       int i;
1372
1373       for (i = 0; i < num_actuals && ! must_preallocate; i++)
1374         {
1375           if (args[i].partial > 0 && ! args[i].pass_on_stack)
1376             partial_seen = 1;
1377           else if (partial_seen && args[i].reg == 0)
1378             must_preallocate = 1;
1379
1380           if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode
1381               && (TREE_CODE (args[i].tree_value) == CALL_EXPR
1382                   || TREE_CODE (args[i].tree_value) == TARGET_EXPR
1383                   || TREE_CODE (args[i].tree_value) == COND_EXPR
1384                   || TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value))))
1385             copy_to_evaluate_size
1386               += int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1387         }
1388
1389       if (copy_to_evaluate_size * 2 >= args_size->constant
1390           && args_size->constant > 0)
1391         must_preallocate = 1;
1392     }
1393   return must_preallocate;
1394 }
1395
1396 /* If we preallocated stack space, compute the address of each argument
1397    and store it into the ARGS array.
1398
1399    We need not ensure it is a valid memory address here; it will be
1400    validized when it is used.
1401
1402    ARGBLOCK is an rtx for the address of the outgoing arguments.  */
1403
1404 static void
1405 compute_argument_addresses (struct arg_data *args, rtx argblock, int num_actuals)
1406 {
1407   if (argblock)
1408     {
1409       rtx arg_reg = argblock;
1410       int i, arg_offset = 0;
1411
1412       if (GET_CODE (argblock) == PLUS)
1413         arg_reg = XEXP (argblock, 0), arg_offset = INTVAL (XEXP (argblock, 1));
1414
1415       for (i = 0; i < num_actuals; i++)
1416         {
1417           rtx offset = ARGS_SIZE_RTX (args[i].locate.offset);
1418           rtx slot_offset = ARGS_SIZE_RTX (args[i].locate.slot_offset);
1419           rtx addr;
1420           unsigned int align, boundary;
1421           unsigned int units_on_stack = 0;
1422           enum machine_mode partial_mode = VOIDmode;
1423
1424           /* Skip this parm if it will not be passed on the stack.  */
1425           if (! args[i].pass_on_stack
1426               && args[i].reg != 0
1427               && args[i].partial == 0)
1428             continue;
1429
1430           if (CONST_INT_P (offset))
1431             addr = plus_constant (arg_reg, INTVAL (offset));
1432           else
1433             addr = gen_rtx_PLUS (Pmode, arg_reg, offset);
1434
1435           addr = plus_constant (addr, arg_offset);
1436
1437           if (args[i].partial != 0)
1438             {
1439               /* Only part of the parameter is being passed on the stack.
1440                  Generate a simple memory reference of the correct size.  */
1441               units_on_stack = args[i].locate.size.constant;
1442               partial_mode = mode_for_size (units_on_stack * BITS_PER_UNIT,
1443                                             MODE_INT, 1);
1444               args[i].stack = gen_rtx_MEM (partial_mode, addr);
1445               set_mem_size (args[i].stack, GEN_INT (units_on_stack));
1446             }
1447           else
1448             {
1449               args[i].stack = gen_rtx_MEM (args[i].mode, addr);
1450               set_mem_attributes (args[i].stack,
1451                                   TREE_TYPE (args[i].tree_value), 1);
1452             }
1453           align = BITS_PER_UNIT;
1454           boundary = args[i].locate.boundary;
1455           if (args[i].locate.where_pad != downward)
1456             align = boundary;
1457           else if (CONST_INT_P (offset))
1458             {
1459               align = INTVAL (offset) * BITS_PER_UNIT | boundary;
1460               align = align & -align;
1461             }
1462           set_mem_align (args[i].stack, align);
1463
1464           if (CONST_INT_P (slot_offset))
1465             addr = plus_constant (arg_reg, INTVAL (slot_offset));
1466           else
1467             addr = gen_rtx_PLUS (Pmode, arg_reg, slot_offset);
1468
1469           addr = plus_constant (addr, arg_offset);
1470
1471           if (args[i].partial != 0)
1472             {
1473               /* Only part of the parameter is being passed on the stack.
1474                  Generate a simple memory reference of the correct size.
1475                */
1476               args[i].stack_slot = gen_rtx_MEM (partial_mode, addr);
1477               set_mem_size (args[i].stack_slot, GEN_INT (units_on_stack));
1478             }
1479           else
1480             {
1481               args[i].stack_slot = gen_rtx_MEM (args[i].mode, addr);
1482               set_mem_attributes (args[i].stack_slot,
1483                                   TREE_TYPE (args[i].tree_value), 1);
1484             }
1485           set_mem_align (args[i].stack_slot, args[i].locate.boundary);
1486
1487           /* Function incoming arguments may overlap with sibling call
1488              outgoing arguments and we cannot allow reordering of reads
1489              from function arguments with stores to outgoing arguments
1490              of sibling calls.  */
1491           set_mem_alias_set (args[i].stack, 0);
1492           set_mem_alias_set (args[i].stack_slot, 0);
1493         }
1494     }
1495 }
1496
1497 /* Given a FNDECL and EXP, return an rtx suitable for use as a target address
1498    in a call instruction.
1499
1500    FNDECL is the tree node for the target function.  For an indirect call
1501    FNDECL will be NULL_TREE.
1502
1503    ADDR is the operand 0 of CALL_EXPR for this call.  */
1504
1505 static rtx
1506 rtx_for_function_call (tree fndecl, tree addr)
1507 {
1508   rtx funexp;
1509
1510   /* Get the function to call, in the form of RTL.  */
1511   if (fndecl)
1512     {
1513       /* If this is the first use of the function, see if we need to
1514          make an external definition for it.  */
1515       if (!TREE_USED (fndecl) && fndecl != current_function_decl)
1516         {
1517           assemble_external (fndecl);
1518           TREE_USED (fndecl) = 1;
1519         }
1520
1521       /* Get a SYMBOL_REF rtx for the function address.  */
1522       funexp = XEXP (DECL_RTL (fndecl), 0);
1523     }
1524   else
1525     /* Generate an rtx (probably a pseudo-register) for the address.  */
1526     {
1527       push_temp_slots ();
1528       funexp = expand_normal (addr);
1529       pop_temp_slots ();        /* FUNEXP can't be BLKmode.  */
1530     }
1531   return funexp;
1532 }
1533
1534 /* Return true if and only if SIZE storage units (usually bytes)
1535    starting from address ADDR overlap with already clobbered argument
1536    area.  This function is used to determine if we should give up a
1537    sibcall.  */
1538
1539 static bool
1540 mem_overlaps_already_clobbered_arg_p (rtx addr, unsigned HOST_WIDE_INT size)
1541 {
1542   HOST_WIDE_INT i;
1543
1544   if (addr == crtl->args.internal_arg_pointer)
1545     i = 0;
1546   else if (GET_CODE (addr) == PLUS
1547            && XEXP (addr, 0) == crtl->args.internal_arg_pointer
1548            && CONST_INT_P (XEXP (addr, 1)))
1549     i = INTVAL (XEXP (addr, 1));
1550   /* Return true for arg pointer based indexed addressing.  */
1551   else if (GET_CODE (addr) == PLUS
1552            && (XEXP (addr, 0) == crtl->args.internal_arg_pointer
1553                || XEXP (addr, 1) == crtl->args.internal_arg_pointer))
1554     return true;
1555   else
1556     return false;
1557
1558 #ifdef ARGS_GROW_DOWNWARD
1559   i = -i - size;
1560 #endif
1561   if (size > 0)
1562     {
1563       unsigned HOST_WIDE_INT k;
1564
1565       for (k = 0; k < size; k++)
1566         if (i + k < stored_args_map->n_bits
1567             && TEST_BIT (stored_args_map, i + k))
1568           return true;
1569     }
1570
1571   return false;
1572 }
1573
1574 /* Do the register loads required for any wholly-register parms or any
1575    parms which are passed both on the stack and in a register.  Their
1576    expressions were already evaluated.
1577
1578    Mark all register-parms as living through the call, putting these USE
1579    insns in the CALL_INSN_FUNCTION_USAGE field.
1580
1581    When IS_SIBCALL, perform the check_sibcall_argument_overlap
1582    checking, setting *SIBCALL_FAILURE if appropriate.  */
1583
1584 static void
1585 load_register_parameters (struct arg_data *args, int num_actuals,
1586                           rtx *call_fusage, int flags, int is_sibcall,
1587                           int *sibcall_failure)
1588 {
1589   int i, j;
1590
1591   for (i = 0; i < num_actuals; i++)
1592     {
1593       rtx reg = ((flags & ECF_SIBCALL)
1594                  ? args[i].tail_call_reg : args[i].reg);
1595       if (reg)
1596         {
1597           int partial = args[i].partial;
1598           int nregs;
1599           int size = 0;
1600           rtx before_arg = get_last_insn ();
1601           /* Set non-negative if we must move a word at a time, even if
1602              just one word (e.g, partial == 4 && mode == DFmode).  Set
1603              to -1 if we just use a normal move insn.  This value can be
1604              zero if the argument is a zero size structure.  */
1605           nregs = -1;
1606           if (GET_CODE (reg) == PARALLEL)
1607             ;
1608           else if (partial)
1609             {
1610               gcc_assert (partial % UNITS_PER_WORD == 0);
1611               nregs = partial / UNITS_PER_WORD;
1612             }
1613           else if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode)
1614             {
1615               size = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1616               nregs = (size + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD;
1617             }
1618           else
1619             size = GET_MODE_SIZE (args[i].mode);
1620
1621           /* Handle calls that pass values in multiple non-contiguous
1622              locations.  The Irix 6 ABI has examples of this.  */
1623
1624           if (GET_CODE (reg) == PARALLEL)
1625             emit_group_move (reg, args[i].parallel_value);
1626
1627           /* If simple case, just do move.  If normal partial, store_one_arg
1628              has already loaded the register for us.  In all other cases,
1629              load the register(s) from memory.  */
1630
1631           else if (nregs == -1)
1632             {
1633               emit_move_insn (reg, args[i].value);
1634 #ifdef BLOCK_REG_PADDING
1635               /* Handle case where we have a value that needs shifting
1636                  up to the msb.  eg. a QImode value and we're padding
1637                  upward on a BYTES_BIG_ENDIAN machine.  */
1638               if (size < UNITS_PER_WORD
1639                   && (args[i].locate.where_pad
1640                       == (BYTES_BIG_ENDIAN ? upward : downward)))
1641                 {
1642                   rtx x;
1643                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1644
1645                   /* Assigning REG here rather than a temp makes CALL_FUSAGE
1646                      report the whole reg as used.  Strictly speaking, the
1647                      call only uses SIZE bytes at the msb end, but it doesn't
1648                      seem worth generating rtl to say that.  */
1649                   reg = gen_rtx_REG (word_mode, REGNO (reg));
1650                   x = expand_shift (LSHIFT_EXPR, word_mode, reg,
1651                                     build_int_cst (NULL_TREE, shift),
1652                                     reg, 1);
1653                   if (x != reg)
1654                     emit_move_insn (reg, x);
1655                 }
1656 #endif
1657             }
1658
1659           /* If we have pre-computed the values to put in the registers in
1660              the case of non-aligned structures, copy them in now.  */
1661
1662           else if (args[i].n_aligned_regs != 0)
1663             for (j = 0; j < args[i].n_aligned_regs; j++)
1664               emit_move_insn (gen_rtx_REG (word_mode, REGNO (reg) + j),
1665                               args[i].aligned_regs[j]);
1666
1667           else if (partial == 0 || args[i].pass_on_stack)
1668             {
1669               rtx mem = validize_mem (args[i].value);
1670
1671               /* Check for overlap with already clobbered argument area.  */
1672               if (is_sibcall
1673                   && mem_overlaps_already_clobbered_arg_p (XEXP (args[i].value, 0),
1674                                                            size))
1675                 *sibcall_failure = 1;
1676
1677               /* Handle a BLKmode that needs shifting.  */
1678               if (nregs == 1 && size < UNITS_PER_WORD
1679 #ifdef BLOCK_REG_PADDING
1680                   && args[i].locate.where_pad == downward
1681 #else
1682                   && BYTES_BIG_ENDIAN
1683 #endif
1684                  )
1685                 {
1686                   rtx tem = operand_subword_force (mem, 0, args[i].mode);
1687                   rtx ri = gen_rtx_REG (word_mode, REGNO (reg));
1688                   rtx x = gen_reg_rtx (word_mode);
1689                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1690                   enum tree_code dir = BYTES_BIG_ENDIAN ? RSHIFT_EXPR
1691                                                         : LSHIFT_EXPR;
1692
1693                   emit_move_insn (x, tem);
1694                   x = expand_shift (dir, word_mode, x,
1695                                     build_int_cst (NULL_TREE, shift),
1696                                     ri, 1);
1697                   if (x != ri)
1698                     emit_move_insn (ri, x);
1699                 }
1700               else
1701                 move_block_to_reg (REGNO (reg), mem, nregs, args[i].mode);
1702             }
1703
1704           /* When a parameter is a block, and perhaps in other cases, it is
1705              possible that it did a load from an argument slot that was
1706              already clobbered.  */
1707           if (is_sibcall
1708               && check_sibcall_argument_overlap (before_arg, &args[i], 0))
1709             *sibcall_failure = 1;
1710
1711           /* Handle calls that pass values in multiple non-contiguous
1712              locations.  The Irix 6 ABI has examples of this.  */
1713           if (GET_CODE (reg) == PARALLEL)
1714             use_group_regs (call_fusage, reg);
1715           else if (nregs == -1)
1716             use_reg (call_fusage, reg);
1717           else if (nregs > 0)
1718             use_regs (call_fusage, REGNO (reg), nregs);
1719         }
1720     }
1721 }
1722
1723 /* We need to pop PENDING_STACK_ADJUST bytes.  But, if the arguments
1724    wouldn't fill up an even multiple of PREFERRED_UNIT_STACK_BOUNDARY
1725    bytes, then we would need to push some additional bytes to pad the
1726    arguments.  So, we compute an adjust to the stack pointer for an
1727    amount that will leave the stack under-aligned by UNADJUSTED_ARGS_SIZE
1728    bytes.  Then, when the arguments are pushed the stack will be perfectly
1729    aligned.  ARGS_SIZE->CONSTANT is set to the number of bytes that should
1730    be popped after the call.  Returns the adjustment.  */
1731
1732 static int
1733 combine_pending_stack_adjustment_and_call (int unadjusted_args_size,
1734                                            struct args_size *args_size,
1735                                            unsigned int preferred_unit_stack_boundary)
1736 {
1737   /* The number of bytes to pop so that the stack will be
1738      under-aligned by UNADJUSTED_ARGS_SIZE bytes.  */
1739   HOST_WIDE_INT adjustment;
1740   /* The alignment of the stack after the arguments are pushed, if we
1741      just pushed the arguments without adjust the stack here.  */
1742   unsigned HOST_WIDE_INT unadjusted_alignment;
1743
1744   unadjusted_alignment
1745     = ((stack_pointer_delta + unadjusted_args_size)
1746        % preferred_unit_stack_boundary);
1747
1748   /* We want to get rid of as many of the PENDING_STACK_ADJUST bytes
1749      as possible -- leaving just enough left to cancel out the
1750      UNADJUSTED_ALIGNMENT.  In other words, we want to ensure that the
1751      PENDING_STACK_ADJUST is non-negative, and congruent to
1752      -UNADJUSTED_ALIGNMENT modulo the PREFERRED_UNIT_STACK_BOUNDARY.  */
1753
1754   /* Begin by trying to pop all the bytes.  */
1755   unadjusted_alignment
1756     = (unadjusted_alignment
1757        - (pending_stack_adjust % preferred_unit_stack_boundary));
1758   adjustment = pending_stack_adjust;
1759   /* Push enough additional bytes that the stack will be aligned
1760      after the arguments are pushed.  */
1761   if (preferred_unit_stack_boundary > 1)
1762     {
1763       if (unadjusted_alignment > 0)
1764         adjustment -= preferred_unit_stack_boundary - unadjusted_alignment;
1765       else
1766         adjustment += unadjusted_alignment;
1767     }
1768
1769   /* Now, sets ARGS_SIZE->CONSTANT so that we pop the right number of
1770      bytes after the call.  The right number is the entire
1771      PENDING_STACK_ADJUST less our ADJUSTMENT plus the amount required
1772      by the arguments in the first place.  */
1773   args_size->constant
1774     = pending_stack_adjust - adjustment + unadjusted_args_size;
1775
1776   return adjustment;
1777 }
1778
1779 /* Scan X expression if it does not dereference any argument slots
1780    we already clobbered by tail call arguments (as noted in stored_args_map
1781    bitmap).
1782    Return nonzero if X expression dereferences such argument slots,
1783    zero otherwise.  */
1784
1785 static int
1786 check_sibcall_argument_overlap_1 (rtx x)
1787 {
1788   RTX_CODE code;
1789   int i, j;
1790   const char *fmt;
1791
1792   if (x == NULL_RTX)
1793     return 0;
1794
1795   code = GET_CODE (x);
1796
1797   if (code == MEM)
1798     return mem_overlaps_already_clobbered_arg_p (XEXP (x, 0),
1799                                                  GET_MODE_SIZE (GET_MODE (x)));
1800
1801   /* Scan all subexpressions.  */
1802   fmt = GET_RTX_FORMAT (code);
1803   for (i = 0; i < GET_RTX_LENGTH (code); i++, fmt++)
1804     {
1805       if (*fmt == 'e')
1806         {
1807           if (check_sibcall_argument_overlap_1 (XEXP (x, i)))
1808             return 1;
1809         }
1810       else if (*fmt == 'E')
1811         {
1812           for (j = 0; j < XVECLEN (x, i); j++)
1813             if (check_sibcall_argument_overlap_1 (XVECEXP (x, i, j)))
1814               return 1;
1815         }
1816     }
1817   return 0;
1818 }
1819
1820 /* Scan sequence after INSN if it does not dereference any argument slots
1821    we already clobbered by tail call arguments (as noted in stored_args_map
1822    bitmap).  If MARK_STORED_ARGS_MAP, add stack slots for ARG to
1823    stored_args_map bitmap afterwards (when ARG is a register MARK_STORED_ARGS_MAP
1824    should be 0).  Return nonzero if sequence after INSN dereferences such argument
1825    slots, zero otherwise.  */
1826
1827 static int
1828 check_sibcall_argument_overlap (rtx insn, struct arg_data *arg, int mark_stored_args_map)
1829 {
1830   int low, high;
1831
1832   if (insn == NULL_RTX)
1833     insn = get_insns ();
1834   else
1835     insn = NEXT_INSN (insn);
1836
1837   for (; insn; insn = NEXT_INSN (insn))
1838     if (INSN_P (insn)
1839         && check_sibcall_argument_overlap_1 (PATTERN (insn)))
1840       break;
1841
1842   if (mark_stored_args_map)
1843     {
1844 #ifdef ARGS_GROW_DOWNWARD
1845       low = -arg->locate.slot_offset.constant - arg->locate.size.constant;
1846 #else
1847       low = arg->locate.slot_offset.constant;
1848 #endif
1849
1850       for (high = low + arg->locate.size.constant; low < high; low++)
1851         SET_BIT (stored_args_map, low);
1852     }
1853   return insn != NULL_RTX;
1854 }
1855
1856 /* Given that a function returns a value of mode MODE at the most
1857    significant end of hard register VALUE, shift VALUE left or right
1858    as specified by LEFT_P.  Return true if some action was needed.  */
1859
1860 bool
1861 shift_return_value (enum machine_mode mode, bool left_p, rtx value)
1862 {
1863   HOST_WIDE_INT shift;
1864
1865   gcc_assert (REG_P (value) && HARD_REGISTER_P (value));
1866   shift = GET_MODE_BITSIZE (GET_MODE (value)) - GET_MODE_BITSIZE (mode);
1867   if (shift == 0)
1868     return false;
1869
1870   /* Use ashr rather than lshr for right shifts.  This is for the benefit
1871      of the MIPS port, which requires SImode values to be sign-extended
1872      when stored in 64-bit registers.  */
1873   if (!force_expand_binop (GET_MODE (value), left_p ? ashl_optab : ashr_optab,
1874                            value, GEN_INT (shift), value, 1, OPTAB_WIDEN))
1875     gcc_unreachable ();
1876   return true;
1877 }
1878
1879 /* If X is a likely-spilled register value, copy it to a pseudo
1880    register and return that register.  Return X otherwise.  */
1881
1882 static rtx
1883 avoid_likely_spilled_reg (rtx x)
1884 {
1885   rtx new_rtx;
1886
1887   if (REG_P (x)
1888       && HARD_REGISTER_P (x)
1889       && CLASS_LIKELY_SPILLED_P (REGNO_REG_CLASS (REGNO (x))))
1890     {
1891       /* Make sure that we generate a REG rather than a CONCAT.
1892          Moves into CONCATs can need nontrivial instructions,
1893          and the whole point of this function is to avoid
1894          using the hard register directly in such a situation.  */
1895       generating_concat_p = 0;
1896       new_rtx = gen_reg_rtx (GET_MODE (x));
1897       generating_concat_p = 1;
1898       emit_move_insn (new_rtx, x);
1899       return new_rtx;
1900     }
1901   return x;
1902 }
1903
1904 /* Generate all the code for a CALL_EXPR exp
1905    and return an rtx for its value.
1906    Store the value in TARGET (specified as an rtx) if convenient.
1907    If the value is stored in TARGET then TARGET is returned.
1908    If IGNORE is nonzero, then we ignore the value of the function call.  */
1909
1910 rtx
1911 expand_call (tree exp, rtx target, int ignore)
1912 {
1913   /* Nonzero if we are currently expanding a call.  */
1914   static int currently_expanding_call = 0;
1915
1916   /* RTX for the function to be called.  */
1917   rtx funexp;
1918   /* Sequence of insns to perform a normal "call".  */
1919   rtx normal_call_insns = NULL_RTX;
1920   /* Sequence of insns to perform a tail "call".  */
1921   rtx tail_call_insns = NULL_RTX;
1922   /* Data type of the function.  */
1923   tree funtype;
1924   tree type_arg_types;
1925   tree rettype;
1926   /* Declaration of the function being called,
1927      or 0 if the function is computed (not known by name).  */
1928   tree fndecl = 0;
1929   /* The type of the function being called.  */
1930   tree fntype;
1931   bool try_tail_call = CALL_EXPR_TAILCALL (exp);
1932   int pass;
1933
1934   /* Register in which non-BLKmode value will be returned,
1935      or 0 if no value or if value is BLKmode.  */
1936   rtx valreg;
1937   /* Address where we should return a BLKmode value;
1938      0 if value not BLKmode.  */
1939   rtx structure_value_addr = 0;
1940   /* Nonzero if that address is being passed by treating it as
1941      an extra, implicit first parameter.  Otherwise,
1942      it is passed by being copied directly into struct_value_rtx.  */
1943   int structure_value_addr_parm = 0;
1944   /* Holds the value of implicit argument for the struct value.  */
1945   tree structure_value_addr_value = NULL_TREE;
1946   /* Size of aggregate value wanted, or zero if none wanted
1947      or if we are using the non-reentrant PCC calling convention
1948      or expecting the value in registers.  */
1949   HOST_WIDE_INT struct_value_size = 0;
1950   /* Nonzero if called function returns an aggregate in memory PCC style,
1951      by returning the address of where to find it.  */
1952   int pcc_struct_value = 0;
1953   rtx struct_value = 0;
1954
1955   /* Number of actual parameters in this call, including struct value addr.  */
1956   int num_actuals;
1957   /* Number of named args.  Args after this are anonymous ones
1958      and they must all go on the stack.  */
1959   int n_named_args;
1960   /* Number of complex actual arguments that need to be split.  */
1961   int num_complex_actuals = 0;
1962
1963   /* Vector of information about each argument.
1964      Arguments are numbered in the order they will be pushed,
1965      not the order they are written.  */
1966   struct arg_data *args;
1967
1968   /* Total size in bytes of all the stack-parms scanned so far.  */
1969   struct args_size args_size;
1970   struct args_size adjusted_args_size;
1971   /* Size of arguments before any adjustments (such as rounding).  */
1972   int unadjusted_args_size;
1973   /* Data on reg parms scanned so far.  */
1974   CUMULATIVE_ARGS args_so_far;
1975   /* Nonzero if a reg parm has been scanned.  */
1976   int reg_parm_seen;
1977   /* Nonzero if this is an indirect function call.  */
1978
1979   /* Nonzero if we must avoid push-insns in the args for this call.
1980      If stack space is allocated for register parameters, but not by the
1981      caller, then it is preallocated in the fixed part of the stack frame.
1982      So the entire argument block must then be preallocated (i.e., we
1983      ignore PUSH_ROUNDING in that case).  */
1984
1985   int must_preallocate = !PUSH_ARGS;
1986
1987   /* Size of the stack reserved for parameter registers.  */
1988   int reg_parm_stack_space = 0;
1989
1990   /* Address of space preallocated for stack parms
1991      (on machines that lack push insns), or 0 if space not preallocated.  */
1992   rtx argblock = 0;
1993
1994   /* Mask of ECF_ flags.  */
1995   int flags = 0;
1996 #ifdef REG_PARM_STACK_SPACE
1997   /* Define the boundary of the register parm stack space that needs to be
1998      saved, if any.  */
1999   int low_to_save, high_to_save;
2000   rtx save_area = 0;            /* Place that it is saved */
2001 #endif
2002
2003   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
2004   char *initial_stack_usage_map = stack_usage_map;
2005   char *stack_usage_map_buf = NULL;
2006
2007   int old_stack_allocated;
2008
2009   /* State variables to track stack modifications.  */
2010   rtx old_stack_level = 0;
2011   int old_stack_arg_under_construction = 0;
2012   int old_pending_adj = 0;
2013   int old_inhibit_defer_pop = inhibit_defer_pop;
2014
2015   /* Some stack pointer alterations we make are performed via
2016      allocate_dynamic_stack_space. This modifies the stack_pointer_delta,
2017      which we then also need to save/restore along the way.  */
2018   int old_stack_pointer_delta = 0;
2019
2020   rtx call_fusage;
2021   tree addr = CALL_EXPR_FN (exp);
2022   int i;
2023   /* The alignment of the stack, in bits.  */
2024   unsigned HOST_WIDE_INT preferred_stack_boundary;
2025   /* The alignment of the stack, in bytes.  */
2026   unsigned HOST_WIDE_INT preferred_unit_stack_boundary;
2027   /* The static chain value to use for this call.  */
2028   rtx static_chain_value;
2029   /* See if this is "nothrow" function call.  */
2030   if (TREE_NOTHROW (exp))
2031     flags |= ECF_NOTHROW;
2032
2033   /* See if we can find a DECL-node for the actual function, and get the
2034      function attributes (flags) from the function decl or type node.  */
2035   fndecl = get_callee_fndecl (exp);
2036   if (fndecl)
2037     {
2038       fntype = TREE_TYPE (fndecl);
2039       flags |= flags_from_decl_or_type (fndecl);
2040     }
2041   else
2042     {
2043       fntype = TREE_TYPE (TREE_TYPE (addr));
2044       flags |= flags_from_decl_or_type (fntype);
2045     }
2046   rettype = TREE_TYPE (exp);
2047
2048   struct_value = targetm.calls.struct_value_rtx (fntype, 0);
2049
2050   /* Warn if this value is an aggregate type,
2051      regardless of which calling convention we are using for it.  */
2052   if (AGGREGATE_TYPE_P (rettype))
2053     warning (OPT_Waggregate_return, "function call has aggregate value");
2054
2055   /* If the result of a non looping pure or const function call is
2056      ignored (or void), and none of its arguments are volatile, we can
2057      avoid expanding the call and just evaluate the arguments for
2058      side-effects.  */
2059   if ((flags & (ECF_CONST | ECF_PURE))
2060       && (!(flags & ECF_LOOPING_CONST_OR_PURE))
2061       && (ignore || target == const0_rtx
2062           || TYPE_MODE (rettype) == VOIDmode))
2063     {
2064       bool volatilep = false;
2065       tree arg;
2066       call_expr_arg_iterator iter;
2067
2068       FOR_EACH_CALL_EXPR_ARG (arg, iter, exp)
2069         if (TREE_THIS_VOLATILE (arg))
2070           {
2071             volatilep = true;
2072             break;
2073           }
2074
2075       if (! volatilep)
2076         {
2077           FOR_EACH_CALL_EXPR_ARG (arg, iter, exp)
2078             expand_expr (arg, const0_rtx, VOIDmode, EXPAND_NORMAL);
2079           return const0_rtx;
2080         }
2081     }
2082
2083 #ifdef REG_PARM_STACK_SPACE
2084   reg_parm_stack_space = REG_PARM_STACK_SPACE (!fndecl ? fntype : fndecl);
2085 #endif
2086
2087   if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl)))
2088       && reg_parm_stack_space > 0 && PUSH_ARGS)
2089     must_preallocate = 1;
2090
2091   /* Set up a place to return a structure.  */
2092
2093   /* Cater to broken compilers.  */
2094   if (aggregate_value_p (exp, fntype))
2095     {
2096       /* This call returns a big structure.  */
2097       flags &= ~(ECF_CONST | ECF_PURE | ECF_LOOPING_CONST_OR_PURE);
2098
2099 #ifdef PCC_STATIC_STRUCT_RETURN
2100       {
2101         pcc_struct_value = 1;
2102       }
2103 #else /* not PCC_STATIC_STRUCT_RETURN */
2104       {
2105         struct_value_size = int_size_in_bytes (rettype);
2106
2107         if (target && MEM_P (target) && CALL_EXPR_RETURN_SLOT_OPT (exp))
2108           structure_value_addr = XEXP (target, 0);
2109         else
2110           {
2111             /* For variable-sized objects, we must be called with a target
2112                specified.  If we were to allocate space on the stack here,
2113                we would have no way of knowing when to free it.  */
2114             rtx d = assign_temp (rettype, 0, 1, 1);
2115
2116             mark_temp_addr_taken (d);
2117             structure_value_addr = XEXP (d, 0);
2118             target = 0;
2119           }
2120       }
2121 #endif /* not PCC_STATIC_STRUCT_RETURN */
2122     }
2123
2124   /* Figure out the amount to which the stack should be aligned.  */
2125   preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
2126   if (fndecl)
2127     {
2128       struct cgraph_rtl_info *i = cgraph_rtl_info (fndecl);
2129       /* Without automatic stack alignment, we can't increase preferred
2130          stack boundary.  With automatic stack alignment, it is
2131          unnecessary since unless we can guarantee that all callers will
2132          align the outgoing stack properly, callee has to align its
2133          stack anyway.  */
2134       if (i
2135           && i->preferred_incoming_stack_boundary
2136           && i->preferred_incoming_stack_boundary < preferred_stack_boundary)
2137         preferred_stack_boundary = i->preferred_incoming_stack_boundary;
2138     }
2139
2140   /* Operand 0 is a pointer-to-function; get the type of the function.  */
2141   funtype = TREE_TYPE (addr);
2142   gcc_assert (POINTER_TYPE_P (funtype));
2143   funtype = TREE_TYPE (funtype);
2144
2145   /* Count whether there are actual complex arguments that need to be split
2146      into their real and imaginary parts.  Munge the type_arg_types
2147      appropriately here as well.  */
2148   if (targetm.calls.split_complex_arg)
2149     {
2150       call_expr_arg_iterator iter;
2151       tree arg;
2152       FOR_EACH_CALL_EXPR_ARG (arg, iter, exp)
2153         {
2154           tree type = TREE_TYPE (arg);
2155           if (type && TREE_CODE (type) == COMPLEX_TYPE
2156               && targetm.calls.split_complex_arg (type))
2157             num_complex_actuals++;
2158         }
2159       type_arg_types = split_complex_types (TYPE_ARG_TYPES (funtype));
2160     }
2161   else
2162     type_arg_types = TYPE_ARG_TYPES (funtype);
2163
2164   if (flags & ECF_MAY_BE_ALLOCA)
2165     cfun->calls_alloca = 1;
2166
2167   /* If struct_value_rtx is 0, it means pass the address
2168      as if it were an extra parameter.  Put the argument expression
2169      in structure_value_addr_value.  */
2170   if (structure_value_addr && struct_value == 0)
2171     {
2172       /* If structure_value_addr is a REG other than
2173          virtual_outgoing_args_rtx, we can use always use it.  If it
2174          is not a REG, we must always copy it into a register.
2175          If it is virtual_outgoing_args_rtx, we must copy it to another
2176          register in some cases.  */
2177       rtx temp = (!REG_P (structure_value_addr)
2178                   || (ACCUMULATE_OUTGOING_ARGS
2179                       && stack_arg_under_construction
2180                       && structure_value_addr == virtual_outgoing_args_rtx)
2181                   ? copy_addr_to_reg (convert_memory_address
2182                                       (Pmode, structure_value_addr))
2183                   : structure_value_addr);
2184
2185       structure_value_addr_value =
2186         make_tree (build_pointer_type (TREE_TYPE (funtype)), temp);
2187       structure_value_addr_parm = 1;
2188     }
2189
2190   /* Count the arguments and set NUM_ACTUALS.  */
2191   num_actuals =
2192     call_expr_nargs (exp) + num_complex_actuals + structure_value_addr_parm;
2193
2194   /* Compute number of named args.
2195      First, do a raw count of the args for INIT_CUMULATIVE_ARGS.  */
2196
2197   if (type_arg_types != 0)
2198     n_named_args
2199       = (list_length (type_arg_types)
2200          /* Count the struct value address, if it is passed as a parm.  */
2201          + structure_value_addr_parm);
2202   else
2203     /* If we know nothing, treat all args as named.  */
2204     n_named_args = num_actuals;
2205
2206   /* Start updating where the next arg would go.
2207
2208      On some machines (such as the PA) indirect calls have a different
2209      calling convention than normal calls.  The fourth argument in
2210      INIT_CUMULATIVE_ARGS tells the backend if this is an indirect call
2211      or not.  */
2212   INIT_CUMULATIVE_ARGS (args_so_far, funtype, NULL_RTX, fndecl, n_named_args);
2213
2214   /* Now possibly adjust the number of named args.
2215      Normally, don't include the last named arg if anonymous args follow.
2216      We do include the last named arg if
2217      targetm.calls.strict_argument_naming() returns nonzero.
2218      (If no anonymous args follow, the result of list_length is actually
2219      one too large.  This is harmless.)
2220
2221      If targetm.calls.pretend_outgoing_varargs_named() returns
2222      nonzero, and targetm.calls.strict_argument_naming() returns zero,
2223      this machine will be able to place unnamed args that were passed
2224      in registers into the stack.  So treat all args as named.  This
2225      allows the insns emitting for a specific argument list to be
2226      independent of the function declaration.
2227
2228      If targetm.calls.pretend_outgoing_varargs_named() returns zero,
2229      we do not have any reliable way to pass unnamed args in
2230      registers, so we must force them into memory.  */
2231
2232   if (type_arg_types != 0
2233       && targetm.calls.strict_argument_naming (&args_so_far))
2234     ;
2235   else if (type_arg_types != 0
2236            && ! targetm.calls.pretend_outgoing_varargs_named (&args_so_far))
2237     /* Don't include the last named arg.  */
2238     --n_named_args;
2239   else
2240     /* Treat all args as named.  */
2241     n_named_args = num_actuals;
2242
2243   /* Make a vector to hold all the information about each arg.  */
2244   args = XALLOCAVEC (struct arg_data, num_actuals);
2245   memset (args, 0, num_actuals * sizeof (struct arg_data));
2246
2247   /* Build up entries in the ARGS array, compute the size of the
2248      arguments into ARGS_SIZE, etc.  */
2249   initialize_argument_information (num_actuals, args, &args_size,
2250                                    n_named_args, exp,
2251                                    structure_value_addr_value, fndecl, fntype,
2252                                    &args_so_far, reg_parm_stack_space,
2253                                    &old_stack_level, &old_pending_adj,
2254                                    &must_preallocate, &flags,
2255                                    &try_tail_call, CALL_FROM_THUNK_P (exp));
2256
2257   if (args_size.var)
2258     must_preallocate = 1;
2259
2260   /* Now make final decision about preallocating stack space.  */
2261   must_preallocate = finalize_must_preallocate (must_preallocate,
2262                                                 num_actuals, args,
2263                                                 &args_size);
2264
2265   /* If the structure value address will reference the stack pointer, we
2266      must stabilize it.  We don't need to do this if we know that we are
2267      not going to adjust the stack pointer in processing this call.  */
2268
2269   if (structure_value_addr
2270       && (reg_mentioned_p (virtual_stack_dynamic_rtx, structure_value_addr)
2271           || reg_mentioned_p (virtual_outgoing_args_rtx,
2272                               structure_value_addr))
2273       && (args_size.var
2274           || (!ACCUMULATE_OUTGOING_ARGS && args_size.constant)))
2275     structure_value_addr = copy_to_reg (structure_value_addr);
2276
2277   /* Tail calls can make things harder to debug, and we've traditionally
2278      pushed these optimizations into -O2.  Don't try if we're already
2279      expanding a call, as that means we're an argument.  Don't try if
2280      there's cleanups, as we know there's code to follow the call.  */
2281
2282   if (currently_expanding_call++ != 0
2283       || !flag_optimize_sibling_calls
2284       || args_size.var
2285       || dbg_cnt (tail_call) == false)
2286     try_tail_call = 0;
2287
2288   /*  Rest of purposes for tail call optimizations to fail.  */
2289   if (
2290 #ifdef HAVE_sibcall_epilogue
2291       !HAVE_sibcall_epilogue
2292 #else
2293       1
2294 #endif
2295       || !try_tail_call
2296       /* Doing sibling call optimization needs some work, since
2297          structure_value_addr can be allocated on the stack.
2298          It does not seem worth the effort since few optimizable
2299          sibling calls will return a structure.  */
2300       || structure_value_addr != NULL_RTX
2301 #ifdef REG_PARM_STACK_SPACE
2302       /* If outgoing reg parm stack space changes, we can not do sibcall.  */
2303       || (OUTGOING_REG_PARM_STACK_SPACE (funtype)
2304           != OUTGOING_REG_PARM_STACK_SPACE (TREE_TYPE (current_function_decl)))
2305       || (reg_parm_stack_space != REG_PARM_STACK_SPACE (fndecl))
2306 #endif
2307       /* Check whether the target is able to optimize the call
2308          into a sibcall.  */
2309       || !targetm.function_ok_for_sibcall (fndecl, exp)
2310       /* Functions that do not return exactly once may not be sibcall
2311          optimized.  */
2312       || (flags & (ECF_RETURNS_TWICE | ECF_NORETURN))
2313       || TYPE_VOLATILE (TREE_TYPE (TREE_TYPE (addr)))
2314       /* If the called function is nested in the current one, it might access
2315          some of the caller's arguments, but could clobber them beforehand if
2316          the argument areas are shared.  */
2317       || (fndecl && decl_function_context (fndecl) == current_function_decl)
2318       /* If this function requires more stack slots than the current
2319          function, we cannot change it into a sibling call.
2320          crtl->args.pretend_args_size is not part of the
2321          stack allocated by our caller.  */
2322       || args_size.constant > (crtl->args.size
2323                                - crtl->args.pretend_args_size)
2324       /* If the callee pops its own arguments, then it must pop exactly
2325          the same number of arguments as the current function.  */
2326       || (RETURN_POPS_ARGS (fndecl, funtype, args_size.constant)
2327           != RETURN_POPS_ARGS (current_function_decl,
2328                                TREE_TYPE (current_function_decl),
2329                                crtl->args.size))
2330       || !lang_hooks.decls.ok_for_sibcall (fndecl))
2331     try_tail_call = 0;
2332
2333   /* Check if caller and callee disagree in promotion of function
2334      return value.  */
2335   if (try_tail_call)
2336     {
2337       enum machine_mode caller_mode, caller_promoted_mode;
2338       enum machine_mode callee_mode, callee_promoted_mode;
2339       int caller_unsignedp, callee_unsignedp;
2340       tree caller_res = DECL_RESULT (current_function_decl);
2341
2342       caller_unsignedp = TYPE_UNSIGNED (TREE_TYPE (caller_res));
2343       caller_mode = DECL_MODE (caller_res);
2344       callee_unsignedp = TYPE_UNSIGNED (TREE_TYPE (funtype));
2345       callee_mode = TYPE_MODE (TREE_TYPE (funtype));
2346       caller_promoted_mode
2347         = promote_function_mode (TREE_TYPE (caller_res), caller_mode,
2348                                  &caller_unsignedp,
2349                                  TREE_TYPE (current_function_decl), 1);
2350       callee_promoted_mode
2351         = promote_function_mode (TREE_TYPE (funtype), callee_mode,
2352                                  &callee_unsignedp,
2353                                  funtype, 1);
2354       if (caller_mode != VOIDmode
2355           && (caller_promoted_mode != callee_promoted_mode
2356               || ((caller_mode != caller_promoted_mode
2357                    || callee_mode != callee_promoted_mode)
2358                   && (caller_unsignedp != callee_unsignedp
2359                       || GET_MODE_BITSIZE (caller_mode)
2360                          < GET_MODE_BITSIZE (callee_mode)))))
2361         try_tail_call = 0;
2362     }
2363
2364   /* Ensure current function's preferred stack boundary is at least
2365      what we need.  Stack alignment may also increase preferred stack
2366      boundary.  */
2367   if (crtl->preferred_stack_boundary < preferred_stack_boundary)
2368     crtl->preferred_stack_boundary = preferred_stack_boundary;
2369   else
2370     preferred_stack_boundary = crtl->preferred_stack_boundary;
2371
2372   preferred_unit_stack_boundary = preferred_stack_boundary / BITS_PER_UNIT;
2373
2374   /* We want to make two insn chains; one for a sibling call, the other
2375      for a normal call.  We will select one of the two chains after
2376      initial RTL generation is complete.  */
2377   for (pass = try_tail_call ? 0 : 1; pass < 2; pass++)
2378     {
2379       int sibcall_failure = 0;
2380       /* We want to emit any pending stack adjustments before the tail
2381          recursion "call".  That way we know any adjustment after the tail
2382          recursion call can be ignored if we indeed use the tail
2383          call expansion.  */
2384       int save_pending_stack_adjust = 0;
2385       int save_stack_pointer_delta = 0;
2386       rtx insns;
2387       rtx before_call, next_arg_reg, after_args;
2388
2389       if (pass == 0)
2390         {
2391           /* State variables we need to save and restore between
2392              iterations.  */
2393           save_pending_stack_adjust = pending_stack_adjust;
2394           save_stack_pointer_delta = stack_pointer_delta;
2395         }
2396       if (pass)
2397         flags &= ~ECF_SIBCALL;
2398       else
2399         flags |= ECF_SIBCALL;
2400
2401       /* Other state variables that we must reinitialize each time
2402          through the loop (that are not initialized by the loop itself).  */
2403       argblock = 0;
2404       call_fusage = 0;
2405
2406       /* Start a new sequence for the normal call case.
2407
2408          From this point on, if the sibling call fails, we want to set
2409          sibcall_failure instead of continuing the loop.  */
2410       start_sequence ();
2411
2412       /* Don't let pending stack adjusts add up to too much.
2413          Also, do all pending adjustments now if there is any chance
2414          this might be a call to alloca or if we are expanding a sibling
2415          call sequence.
2416          Also do the adjustments before a throwing call, otherwise
2417          exception handling can fail; PR 19225. */
2418       if (pending_stack_adjust >= 32
2419           || (pending_stack_adjust > 0
2420               && (flags & ECF_MAY_BE_ALLOCA))
2421           || (pending_stack_adjust > 0
2422               && flag_exceptions && !(flags & ECF_NOTHROW))
2423           || pass == 0)
2424         do_pending_stack_adjust ();
2425
2426       /* Precompute any arguments as needed.  */
2427       if (pass)
2428         precompute_arguments (num_actuals, args);
2429
2430       /* Now we are about to start emitting insns that can be deleted
2431          if a libcall is deleted.  */
2432       if (pass && (flags & ECF_MALLOC))
2433         start_sequence ();
2434
2435       if (pass == 0 && crtl->stack_protect_guard)
2436         stack_protect_epilogue ();
2437
2438       adjusted_args_size = args_size;
2439       /* Compute the actual size of the argument block required.  The variable
2440          and constant sizes must be combined, the size may have to be rounded,
2441          and there may be a minimum required size.  When generating a sibcall
2442          pattern, do not round up, since we'll be re-using whatever space our
2443          caller provided.  */
2444       unadjusted_args_size
2445         = compute_argument_block_size (reg_parm_stack_space,
2446                                        &adjusted_args_size,
2447                                        fndecl, fntype,
2448                                        (pass == 0 ? 0
2449                                         : preferred_stack_boundary));
2450
2451       old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
2452
2453       /* The argument block when performing a sibling call is the
2454          incoming argument block.  */
2455       if (pass == 0)
2456         {
2457           argblock = crtl->args.internal_arg_pointer;
2458           argblock
2459 #ifdef STACK_GROWS_DOWNWARD
2460             = plus_constant (argblock, crtl->args.pretend_args_size);
2461 #else
2462             = plus_constant (argblock, -crtl->args.pretend_args_size);
2463 #endif
2464           stored_args_map = sbitmap_alloc (args_size.constant);
2465           sbitmap_zero (stored_args_map);
2466         }
2467
2468       /* If we have no actual push instructions, or shouldn't use them,
2469          make space for all args right now.  */
2470       else if (adjusted_args_size.var != 0)
2471         {
2472           if (old_stack_level == 0)
2473             {
2474               emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
2475               old_stack_pointer_delta = stack_pointer_delta;
2476               old_pending_adj = pending_stack_adjust;
2477               pending_stack_adjust = 0;
2478               /* stack_arg_under_construction says whether a stack arg is
2479                  being constructed at the old stack level.  Pushing the stack
2480                  gets a clean outgoing argument block.  */
2481               old_stack_arg_under_construction = stack_arg_under_construction;
2482               stack_arg_under_construction = 0;
2483             }
2484           argblock = push_block (ARGS_SIZE_RTX (adjusted_args_size), 0, 0);
2485         }
2486       else
2487         {
2488           /* Note that we must go through the motions of allocating an argument
2489              block even if the size is zero because we may be storing args
2490              in the area reserved for register arguments, which may be part of
2491              the stack frame.  */
2492
2493           int needed = adjusted_args_size.constant;
2494
2495           /* Store the maximum argument space used.  It will be pushed by
2496              the prologue (if ACCUMULATE_OUTGOING_ARGS, or stack overflow
2497              checking).  */
2498
2499           if (needed > crtl->outgoing_args_size)
2500             crtl->outgoing_args_size = needed;
2501
2502           if (must_preallocate)
2503             {
2504               if (ACCUMULATE_OUTGOING_ARGS)
2505                 {
2506                   /* Since the stack pointer will never be pushed, it is
2507                      possible for the evaluation of a parm to clobber
2508                      something we have already written to the stack.
2509                      Since most function calls on RISC machines do not use
2510                      the stack, this is uncommon, but must work correctly.
2511
2512                      Therefore, we save any area of the stack that was already
2513                      written and that we are using.  Here we set up to do this
2514                      by making a new stack usage map from the old one.  The
2515                      actual save will be done by store_one_arg.
2516
2517                      Another approach might be to try to reorder the argument
2518                      evaluations to avoid this conflicting stack usage.  */
2519
2520                   /* Since we will be writing into the entire argument area,
2521                      the map must be allocated for its entire size, not just
2522                      the part that is the responsibility of the caller.  */
2523                   if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl))))
2524                     needed += reg_parm_stack_space;
2525
2526 #ifdef ARGS_GROW_DOWNWARD
2527                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2528                                                      needed + 1);
2529 #else
2530                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2531                                                      needed);
2532 #endif
2533                   if (stack_usage_map_buf)
2534                     free (stack_usage_map_buf);
2535                   stack_usage_map_buf = XNEWVEC (char, highest_outgoing_arg_in_use);
2536                   stack_usage_map = stack_usage_map_buf;
2537
2538                   if (initial_highest_arg_in_use)
2539                     memcpy (stack_usage_map, initial_stack_usage_map,
2540                             initial_highest_arg_in_use);
2541
2542                   if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
2543                     memset (&stack_usage_map[initial_highest_arg_in_use], 0,
2544                            (highest_outgoing_arg_in_use
2545                             - initial_highest_arg_in_use));
2546                   needed = 0;
2547
2548                   /* The address of the outgoing argument list must not be
2549                      copied to a register here, because argblock would be left
2550                      pointing to the wrong place after the call to
2551                      allocate_dynamic_stack_space below.  */
2552
2553                   argblock = virtual_outgoing_args_rtx;
2554                 }
2555               else
2556                 {
2557                   if (inhibit_defer_pop == 0)
2558                     {
2559                       /* Try to reuse some or all of the pending_stack_adjust
2560                          to get this space.  */
2561                       needed
2562                         = (combine_pending_stack_adjustment_and_call
2563                            (unadjusted_args_size,
2564                             &adjusted_args_size,
2565                             preferred_unit_stack_boundary));
2566
2567                       /* combine_pending_stack_adjustment_and_call computes
2568                          an adjustment before the arguments are allocated.
2569                          Account for them and see whether or not the stack
2570                          needs to go up or down.  */
2571                       needed = unadjusted_args_size - needed;
2572
2573                       if (needed < 0)
2574                         {
2575                           /* We're releasing stack space.  */
2576                           /* ??? We can avoid any adjustment at all if we're
2577                              already aligned.  FIXME.  */
2578                           pending_stack_adjust = -needed;
2579                           do_pending_stack_adjust ();
2580                           needed = 0;
2581                         }
2582                       else
2583                         /* We need to allocate space.  We'll do that in
2584                            push_block below.  */
2585                         pending_stack_adjust = 0;
2586                     }
2587
2588                   /* Special case this because overhead of `push_block' in
2589                      this case is non-trivial.  */
2590                   if (needed == 0)
2591                     argblock = virtual_outgoing_args_rtx;
2592                   else
2593                     {
2594                       argblock = push_block (GEN_INT (needed), 0, 0);
2595 #ifdef ARGS_GROW_DOWNWARD
2596                       argblock = plus_constant (argblock, needed);
2597 #endif
2598                     }
2599
2600                   /* We only really need to call `copy_to_reg' in the case
2601                      where push insns are going to be used to pass ARGBLOCK
2602                      to a function call in ARGS.  In that case, the stack
2603                      pointer changes value from the allocation point to the
2604                      call point, and hence the value of
2605                      VIRTUAL_OUTGOING_ARGS_RTX changes as well.  But might
2606                      as well always do it.  */
2607                   argblock = copy_to_reg (argblock);
2608                 }
2609             }
2610         }
2611
2612       if (ACCUMULATE_OUTGOING_ARGS)
2613         {
2614           /* The save/restore code in store_one_arg handles all
2615              cases except one: a constructor call (including a C
2616              function returning a BLKmode struct) to initialize
2617              an argument.  */
2618           if (stack_arg_under_construction)
2619             {
2620               rtx push_size
2621                 = GEN_INT (adjusted_args_size.constant
2622                            + (OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype
2623                                                                       : TREE_TYPE (fndecl))) ? 0
2624                               : reg_parm_stack_space));
2625               if (old_stack_level == 0)
2626                 {
2627                   emit_stack_save (SAVE_BLOCK, &old_stack_level,
2628                                    NULL_RTX);
2629                   old_stack_pointer_delta = stack_pointer_delta;
2630                   old_pending_adj = pending_stack_adjust;
2631                   pending_stack_adjust = 0;
2632                   /* stack_arg_under_construction says whether a stack
2633                      arg is being constructed at the old stack level.
2634                      Pushing the stack gets a clean outgoing argument
2635                      block.  */
2636                   old_stack_arg_under_construction
2637                     = stack_arg_under_construction;
2638                   stack_arg_under_construction = 0;
2639                   /* Make a new map for the new argument list.  */
2640                   if (stack_usage_map_buf)
2641                     free (stack_usage_map_buf);
2642                   stack_usage_map_buf = XCNEWVEC (char, highest_outgoing_arg_in_use);
2643                   stack_usage_map = stack_usage_map_buf;
2644                   highest_outgoing_arg_in_use = 0;
2645                 }
2646               allocate_dynamic_stack_space (push_size, NULL_RTX,
2647                                             BITS_PER_UNIT);
2648             }
2649
2650           /* If argument evaluation might modify the stack pointer,
2651              copy the address of the argument list to a register.  */
2652           for (i = 0; i < num_actuals; i++)
2653             if (args[i].pass_on_stack)
2654               {
2655                 argblock = copy_addr_to_reg (argblock);
2656                 break;
2657               }
2658         }
2659
2660       compute_argument_addresses (args, argblock, num_actuals);
2661
2662       /* If we push args individually in reverse order, perform stack alignment
2663          before the first push (the last arg).  */
2664       if (PUSH_ARGS_REVERSED && argblock == 0
2665           && adjusted_args_size.constant != unadjusted_args_size)
2666         {
2667           /* When the stack adjustment is pending, we get better code
2668              by combining the adjustments.  */
2669           if (pending_stack_adjust
2670               && ! inhibit_defer_pop)
2671             {
2672               pending_stack_adjust
2673                 = (combine_pending_stack_adjustment_and_call
2674                    (unadjusted_args_size,
2675                     &adjusted_args_size,
2676                     preferred_unit_stack_boundary));
2677               do_pending_stack_adjust ();
2678             }
2679           else if (argblock == 0)
2680             anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2681                                         - unadjusted_args_size));
2682         }
2683       /* Now that the stack is properly aligned, pops can't safely
2684          be deferred during the evaluation of the arguments.  */
2685       NO_DEFER_POP;
2686
2687       funexp = rtx_for_function_call (fndecl, addr);
2688
2689       /* Figure out the register where the value, if any, will come back.  */
2690       valreg = 0;
2691       if (TYPE_MODE (rettype) != VOIDmode
2692           && ! structure_value_addr)
2693         {
2694           if (pcc_struct_value)
2695             valreg = hard_function_value (build_pointer_type (rettype),
2696                                           fndecl, NULL, (pass == 0));
2697           else
2698             valreg = hard_function_value (rettype, fndecl, fntype,
2699                                           (pass == 0));
2700
2701           /* If VALREG is a PARALLEL whose first member has a zero
2702              offset, use that.  This is for targets such as m68k that
2703              return the same value in multiple places.  */
2704           if (GET_CODE (valreg) == PARALLEL)
2705             {
2706               rtx elem = XVECEXP (valreg, 0, 0);
2707               rtx where = XEXP (elem, 0);
2708               rtx offset = XEXP (elem, 1);
2709               if (offset == const0_rtx
2710                   && GET_MODE (where) == GET_MODE (valreg))
2711                 valreg = where;
2712             }
2713         }
2714
2715       /* Precompute all register parameters.  It isn't safe to compute anything
2716          once we have started filling any specific hard regs.  */
2717       precompute_register_parameters (num_actuals, args, &reg_parm_seen);
2718
2719       if (CALL_EXPR_STATIC_CHAIN (exp))
2720         static_chain_value = expand_normal (CALL_EXPR_STATIC_CHAIN (exp));
2721       else
2722         static_chain_value = 0;
2723
2724 #ifdef REG_PARM_STACK_SPACE
2725       /* Save the fixed argument area if it's part of the caller's frame and
2726          is clobbered by argument setup for this call.  */
2727       if (ACCUMULATE_OUTGOING_ARGS && pass)
2728         save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
2729                                               &low_to_save, &high_to_save);
2730 #endif
2731
2732       /* Now store (and compute if necessary) all non-register parms.
2733          These come before register parms, since they can require block-moves,
2734          which could clobber the registers used for register parms.
2735          Parms which have partial registers are not stored here,
2736          but we do preallocate space here if they want that.  */
2737
2738       for (i = 0; i < num_actuals; i++)
2739         {
2740           if (args[i].reg == 0 || args[i].pass_on_stack)
2741             {
2742               rtx before_arg = get_last_insn ();
2743
2744               if (store_one_arg (&args[i], argblock, flags,
2745                                  adjusted_args_size.var != 0,
2746                                  reg_parm_stack_space)
2747                   || (pass == 0
2748                       && check_sibcall_argument_overlap (before_arg,
2749                                                          &args[i], 1)))
2750                 sibcall_failure = 1;
2751               }
2752
2753           if (((flags & ECF_CONST)
2754                || ((flags & ECF_PURE) && ACCUMULATE_OUTGOING_ARGS))
2755               && args[i].stack)
2756             call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
2757                                              gen_rtx_USE (VOIDmode,
2758                                                           args[i].stack),
2759                                              call_fusage);
2760         }
2761
2762       /* If we have a parm that is passed in registers but not in memory
2763          and whose alignment does not permit a direct copy into registers,
2764          make a group of pseudos that correspond to each register that we
2765          will later fill.  */
2766       if (STRICT_ALIGNMENT)
2767         store_unaligned_arguments_into_pseudos (args, num_actuals);
2768
2769       /* Now store any partially-in-registers parm.
2770          This is the last place a block-move can happen.  */
2771       if (reg_parm_seen)
2772         for (i = 0; i < num_actuals; i++)
2773           if (args[i].partial != 0 && ! args[i].pass_on_stack)
2774             {
2775               rtx before_arg = get_last_insn ();
2776
2777               if (store_one_arg (&args[i], argblock, flags,
2778                                  adjusted_args_size.var != 0,
2779                                  reg_parm_stack_space)
2780                   || (pass == 0
2781                       && check_sibcall_argument_overlap (before_arg,
2782                                                          &args[i], 1)))
2783                 sibcall_failure = 1;
2784             }
2785
2786       /* If we pushed args in forward order, perform stack alignment
2787          after pushing the last arg.  */
2788       if (!PUSH_ARGS_REVERSED && argblock == 0)
2789         anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2790                                     - unadjusted_args_size));
2791
2792       /* If register arguments require space on the stack and stack space
2793          was not preallocated, allocate stack space here for arguments
2794          passed in registers.  */
2795       if (OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl)))
2796           && !ACCUMULATE_OUTGOING_ARGS
2797           && must_preallocate == 0 && reg_parm_stack_space > 0)
2798         anti_adjust_stack (GEN_INT (reg_parm_stack_space));
2799
2800       /* Pass the function the address in which to return a
2801          structure value.  */
2802       if (pass != 0 && structure_value_addr && ! structure_value_addr_parm)
2803         {
2804           structure_value_addr
2805             = convert_memory_address (Pmode, structure_value_addr);
2806           emit_move_insn (struct_value,
2807                           force_reg (Pmode,
2808                                      force_operand (structure_value_addr,
2809                                                     NULL_RTX)));
2810
2811           if (REG_P (struct_value))
2812             use_reg (&call_fusage, struct_value);
2813         }
2814
2815       after_args = get_last_insn ();
2816       funexp = prepare_call_address (fndecl, funexp, static_chain_value,
2817                                      &call_fusage, reg_parm_seen, pass == 0);
2818
2819       load_register_parameters (args, num_actuals, &call_fusage, flags,
2820                                 pass == 0, &sibcall_failure);
2821
2822       /* Save a pointer to the last insn before the call, so that we can
2823          later safely search backwards to find the CALL_INSN.  */
2824       before_call = get_last_insn ();
2825
2826       /* Set up next argument register.  For sibling calls on machines
2827          with register windows this should be the incoming register.  */
2828 #ifdef FUNCTION_INCOMING_ARG
2829       if (pass == 0)
2830         next_arg_reg = FUNCTION_INCOMING_ARG (args_so_far, VOIDmode,
2831                                               void_type_node, 1);
2832       else
2833 #endif
2834         next_arg_reg = FUNCTION_ARG (args_so_far, VOIDmode,
2835                                      void_type_node, 1);
2836
2837       /* All arguments and registers used for the call must be set up by
2838          now!  */
2839
2840       /* Stack must be properly aligned now.  */
2841       gcc_assert (!pass
2842                   || !(stack_pointer_delta % preferred_unit_stack_boundary));
2843
2844       /* Generate the actual call instruction.  */
2845       emit_call_1 (funexp, exp, fndecl, funtype, unadjusted_args_size,
2846                    adjusted_args_size.constant, struct_value_size,
2847                    next_arg_reg, valreg, old_inhibit_defer_pop, call_fusage,
2848                    flags, & args_so_far);
2849
2850       /* If the call setup or the call itself overlaps with anything
2851          of the argument setup we probably clobbered our call address.
2852          In that case we can't do sibcalls.  */
2853       if (pass == 0
2854           && check_sibcall_argument_overlap (after_args, 0, 0))
2855         sibcall_failure = 1;
2856
2857       /* If a non-BLKmode value is returned at the most significant end
2858          of a register, shift the register right by the appropriate amount
2859          and update VALREG accordingly.  BLKmode values are handled by the
2860          group load/store machinery below.  */
2861       if (!structure_value_addr
2862           && !pcc_struct_value
2863           && TYPE_MODE (rettype) != BLKmode
2864           && targetm.calls.return_in_msb (rettype))
2865         {
2866           if (shift_return_value (TYPE_MODE (rettype), false, valreg))
2867             sibcall_failure = 1;
2868           valreg = gen_rtx_REG (TYPE_MODE (rettype), REGNO (valreg));
2869         }
2870
2871       if (pass && (flags & ECF_MALLOC))
2872         {
2873           rtx temp = gen_reg_rtx (GET_MODE (valreg));
2874           rtx last, insns;
2875
2876           /* The return value from a malloc-like function is a pointer.  */
2877           if (TREE_CODE (rettype) == POINTER_TYPE)
2878             mark_reg_pointer (temp, BIGGEST_ALIGNMENT);
2879
2880           emit_move_insn (temp, valreg);
2881
2882           /* The return value from a malloc-like function can not alias
2883              anything else.  */
2884           last = get_last_insn ();
2885           add_reg_note (last, REG_NOALIAS, temp);
2886
2887           /* Write out the sequence.  */
2888           insns = get_insns ();
2889           end_sequence ();
2890           emit_insn (insns);
2891           valreg = temp;
2892         }
2893
2894       /* For calls to `setjmp', etc., inform
2895          function.c:setjmp_warnings that it should complain if
2896          nonvolatile values are live.  For functions that cannot
2897          return, inform flow that control does not fall through.  */
2898
2899       if ((flags & ECF_NORETURN) || pass == 0)
2900         {
2901           /* The barrier must be emitted
2902              immediately after the CALL_INSN.  Some ports emit more
2903              than just a CALL_INSN above, so we must search for it here.  */
2904
2905           rtx last = get_last_insn ();
2906           while (!CALL_P (last))
2907             {
2908               last = PREV_INSN (last);
2909               /* There was no CALL_INSN?  */
2910               gcc_assert (last != before_call);
2911             }
2912
2913           emit_barrier_after (last);
2914
2915           /* Stack adjustments after a noreturn call are dead code.
2916              However when NO_DEFER_POP is in effect, we must preserve
2917              stack_pointer_delta.  */
2918           if (inhibit_defer_pop == 0)
2919             {
2920               stack_pointer_delta = old_stack_allocated;
2921               pending_stack_adjust = 0;
2922             }
2923         }
2924
2925       /* If value type not void, return an rtx for the value.  */
2926
2927       if (TYPE_MODE (rettype) == VOIDmode
2928           || ignore)
2929         target = const0_rtx;
2930       else if (structure_value_addr)
2931         {
2932           if (target == 0 || !MEM_P (target))
2933             {
2934               target
2935                 = gen_rtx_MEM (TYPE_MODE (rettype),
2936                                memory_address (TYPE_MODE (rettype),
2937                                                structure_value_addr));
2938               set_mem_attributes (target, rettype, 1);
2939             }
2940         }
2941       else if (pcc_struct_value)
2942         {
2943           /* This is the special C++ case where we need to
2944              know what the true target was.  We take care to
2945              never use this value more than once in one expression.  */
2946           target = gen_rtx_MEM (TYPE_MODE (rettype),
2947                                 copy_to_reg (valreg));
2948           set_mem_attributes (target, rettype, 1);
2949         }
2950       /* Handle calls that return values in multiple non-contiguous locations.
2951          The Irix 6 ABI has examples of this.  */
2952       else if (GET_CODE (valreg) == PARALLEL)
2953         {
2954           if (target == 0)
2955             {
2956               /* This will only be assigned once, so it can be readonly.  */
2957               tree nt = build_qualified_type (rettype,
2958                                               (TYPE_QUALS (rettype)
2959                                                | TYPE_QUAL_CONST));
2960
2961               target = assign_temp (nt, 0, 1, 1);
2962             }
2963
2964           if (! rtx_equal_p (target, valreg))
2965             emit_group_store (target, valreg, rettype,
2966                               int_size_in_bytes (rettype));
2967
2968           /* We can not support sibling calls for this case.  */
2969           sibcall_failure = 1;
2970         }
2971       else if (target
2972                && GET_MODE (target) == TYPE_MODE (rettype)
2973                && GET_MODE (target) == GET_MODE (valreg))
2974         {
2975           bool may_overlap = false;
2976
2977           /* We have to copy a return value in a CLASS_LIKELY_SPILLED hard
2978              reg to a plain register.  */
2979           if (!REG_P (target) || HARD_REGISTER_P (target))
2980             valreg = avoid_likely_spilled_reg (valreg);
2981
2982           /* If TARGET is a MEM in the argument area, and we have
2983              saved part of the argument area, then we can't store
2984              directly into TARGET as it may get overwritten when we
2985              restore the argument save area below.  Don't work too
2986              hard though and simply force TARGET to a register if it
2987              is a MEM; the optimizer is quite likely to sort it out.  */
2988           if (ACCUMULATE_OUTGOING_ARGS && pass && MEM_P (target))
2989             for (i = 0; i < num_actuals; i++)
2990               if (args[i].save_area)
2991                 {
2992                   may_overlap = true;
2993                   break;
2994                 }
2995
2996           if (may_overlap)
2997             target = copy_to_reg (valreg);
2998           else
2999             {
3000               /* TARGET and VALREG cannot be equal at this point
3001                  because the latter would not have
3002                  REG_FUNCTION_VALUE_P true, while the former would if
3003                  it were referring to the same register.
3004
3005                  If they refer to the same register, this move will be
3006                  a no-op, except when function inlining is being
3007                  done.  */
3008               emit_move_insn (target, valreg);
3009
3010               /* If we are setting a MEM, this code must be executed.
3011                  Since it is emitted after the call insn, sibcall
3012                  optimization cannot be performed in that case.  */
3013               if (MEM_P (target))
3014                 sibcall_failure = 1;
3015             }
3016         }
3017       else if (TYPE_MODE (rettype) == BLKmode)
3018         {
3019           rtx val = valreg;
3020           if (GET_MODE (val) != BLKmode)
3021             val = avoid_likely_spilled_reg (val);
3022           target = copy_blkmode_from_reg (target, val, rettype);
3023
3024           /* We can not support sibling calls for this case.  */
3025           sibcall_failure = 1;
3026         }
3027       else
3028         target = copy_to_reg (avoid_likely_spilled_reg (valreg));
3029
3030       /* If we promoted this return value, make the proper SUBREG.
3031          TARGET might be const0_rtx here, so be careful.  */
3032       if (REG_P (target)
3033           && TYPE_MODE (rettype) != BLKmode
3034           && GET_MODE (target) != TYPE_MODE (rettype))
3035         {
3036           tree type = rettype;
3037           int unsignedp = TYPE_UNSIGNED (type);
3038           int offset = 0;
3039           enum machine_mode pmode;
3040
3041           /* Ensure we promote as expected, and get the new unsignedness.  */
3042           pmode = promote_function_mode (type, TYPE_MODE (type), &unsignedp,
3043                                          funtype, 1);
3044           gcc_assert (GET_MODE (target) == pmode);
3045
3046           if ((WORDS_BIG_ENDIAN || BYTES_BIG_ENDIAN)
3047               && (GET_MODE_SIZE (GET_MODE (target))
3048                   > GET_MODE_SIZE (TYPE_MODE (type))))
3049             {
3050               offset = GET_MODE_SIZE (GET_MODE (target))
3051                 - GET_MODE_SIZE (TYPE_MODE (type));
3052               if (! BYTES_BIG_ENDIAN)
3053                 offset = (offset / UNITS_PER_WORD) * UNITS_PER_WORD;
3054               else if (! WORDS_BIG_ENDIAN)
3055                 offset %= UNITS_PER_WORD;
3056             }
3057
3058           target = gen_rtx_SUBREG (TYPE_MODE (type), target, offset);
3059           SUBREG_PROMOTED_VAR_P (target) = 1;
3060           SUBREG_PROMOTED_UNSIGNED_SET (target, unsignedp);
3061         }
3062
3063       /* If size of args is variable or this was a constructor call for a stack
3064          argument, restore saved stack-pointer value.  */
3065
3066       if (old_stack_level)
3067         {
3068           emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
3069           stack_pointer_delta = old_stack_pointer_delta;
3070           pending_stack_adjust = old_pending_adj;
3071           old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
3072           stack_arg_under_construction = old_stack_arg_under_construction;
3073           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3074           stack_usage_map = initial_stack_usage_map;
3075           sibcall_failure = 1;
3076         }
3077       else if (ACCUMULATE_OUTGOING_ARGS && pass)
3078         {
3079 #ifdef REG_PARM_STACK_SPACE
3080           if (save_area)
3081             restore_fixed_argument_area (save_area, argblock,
3082                                          high_to_save, low_to_save);
3083 #endif
3084
3085           /* If we saved any argument areas, restore them.  */
3086           for (i = 0; i < num_actuals; i++)
3087             if (args[i].save_area)
3088               {
3089                 enum machine_mode save_mode = GET_MODE (args[i].save_area);
3090                 rtx stack_area
3091                   = gen_rtx_MEM (save_mode,
3092                                  memory_address (save_mode,
3093                                                  XEXP (args[i].stack_slot, 0)));
3094
3095                 if (save_mode != BLKmode)
3096                   emit_move_insn (stack_area, args[i].save_area);
3097                 else
3098                   emit_block_move (stack_area, args[i].save_area,
3099                                    GEN_INT (args[i].locate.size.constant),
3100                                    BLOCK_OP_CALL_PARM);
3101               }
3102
3103           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3104           stack_usage_map = initial_stack_usage_map;
3105         }
3106
3107       /* If this was alloca, record the new stack level for nonlocal gotos.
3108          Check for the handler slots since we might not have a save area
3109          for non-local gotos.  */
3110
3111       if ((flags & ECF_MAY_BE_ALLOCA) && cfun->nonlocal_goto_save_area != 0)
3112         update_nonlocal_goto_save_area ();
3113
3114       /* Free up storage we no longer need.  */
3115       for (i = 0; i < num_actuals; ++i)
3116         if (args[i].aligned_regs)
3117           free (args[i].aligned_regs);
3118
3119       insns = get_insns ();
3120       end_sequence ();
3121
3122       if (pass == 0)
3123         {
3124           tail_call_insns = insns;
3125
3126           /* Restore the pending stack adjustment now that we have
3127              finished generating the sibling call sequence.  */
3128
3129           pending_stack_adjust = save_pending_stack_adjust;
3130           stack_pointer_delta = save_stack_pointer_delta;
3131
3132           /* Prepare arg structure for next iteration.  */
3133           for (i = 0; i < num_actuals; i++)
3134             {
3135               args[i].value = 0;
3136               args[i].aligned_regs = 0;
3137               args[i].stack = 0;
3138             }
3139
3140           sbitmap_free (stored_args_map);
3141         }
3142       else
3143         {
3144           normal_call_insns = insns;
3145
3146           /* Verify that we've deallocated all the stack we used.  */
3147           gcc_assert ((flags & ECF_NORETURN)
3148                       || (old_stack_allocated
3149                           == stack_pointer_delta - pending_stack_adjust));
3150         }
3151
3152       /* If something prevents making this a sibling call,
3153          zero out the sequence.  */
3154       if (sibcall_failure)
3155         tail_call_insns = NULL_RTX;
3156       else
3157         break;
3158     }
3159
3160   /* If tail call production succeeded, we need to remove REG_EQUIV notes on
3161      arguments too, as argument area is now clobbered by the call.  */
3162   if (tail_call_insns)
3163     {
3164       emit_insn (tail_call_insns);
3165       crtl->tail_call_emit = true;
3166     }
3167   else
3168     emit_insn (normal_call_insns);
3169
3170   currently_expanding_call--;
3171
3172   if (stack_usage_map_buf)
3173     free (stack_usage_map_buf);
3174
3175   return target;
3176 }
3177
3178 /* A sibling call sequence invalidates any REG_EQUIV notes made for
3179    this function's incoming arguments.
3180
3181    At the start of RTL generation we know the only REG_EQUIV notes
3182    in the rtl chain are those for incoming arguments, so we can look
3183    for REG_EQUIV notes between the start of the function and the
3184    NOTE_INSN_FUNCTION_BEG.
3185
3186    This is (slight) overkill.  We could keep track of the highest
3187    argument we clobber and be more selective in removing notes, but it
3188    does not seem to be worth the effort.  */
3189
3190 void
3191 fixup_tail_calls (void)
3192 {
3193   rtx insn;
3194
3195   for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
3196     {
3197       rtx note;
3198
3199       /* There are never REG_EQUIV notes for the incoming arguments
3200          after the NOTE_INSN_FUNCTION_BEG note, so stop if we see it.  */
3201       if (NOTE_P (insn)
3202           && NOTE_KIND (insn) == NOTE_INSN_FUNCTION_BEG)
3203         break;
3204
3205       note = find_reg_note (insn, REG_EQUIV, 0);
3206       if (note)
3207         remove_note (insn, note);
3208       note = find_reg_note (insn, REG_EQUIV, 0);
3209       gcc_assert (!note);
3210     }
3211 }
3212
3213 /* Traverse a list of TYPES and expand all complex types into their
3214    components.  */
3215 static tree
3216 split_complex_types (tree types)
3217 {
3218   tree p;
3219
3220   /* Before allocating memory, check for the common case of no complex.  */
3221   for (p = types; p; p = TREE_CHAIN (p))
3222     {
3223       tree type = TREE_VALUE (p);
3224       if (TREE_CODE (type) == COMPLEX_TYPE
3225           && targetm.calls.split_complex_arg (type))
3226         goto found;
3227     }
3228   return types;
3229
3230  found:
3231   types = copy_list (types);
3232
3233   for (p = types; p; p = TREE_CHAIN (p))
3234     {
3235       tree complex_type = TREE_VALUE (p);
3236
3237       if (TREE_CODE (complex_type) == COMPLEX_TYPE
3238           && targetm.calls.split_complex_arg (complex_type))
3239         {
3240           tree next, imag;
3241
3242           /* Rewrite complex type with component type.  */
3243           TREE_VALUE (p) = TREE_TYPE (complex_type);
3244           next = TREE_CHAIN (p);
3245
3246           /* Add another component type for the imaginary part.  */
3247           imag = build_tree_list (NULL_TREE, TREE_VALUE (p));
3248           TREE_CHAIN (p) = imag;
3249           TREE_CHAIN (imag) = next;
3250
3251           /* Skip the newly created node.  */
3252           p = TREE_CHAIN (p);
3253         }
3254     }
3255
3256   return types;
3257 }
3258 \f
3259 /* Output a library call to function FUN (a SYMBOL_REF rtx).
3260    The RETVAL parameter specifies whether return value needs to be saved, other
3261    parameters are documented in the emit_library_call function below.  */
3262
3263 static rtx
3264 emit_library_call_value_1 (int retval, rtx orgfun, rtx value,
3265                            enum libcall_type fn_type,
3266                            enum machine_mode outmode, int nargs, va_list p)
3267 {
3268   /* Total size in bytes of all the stack-parms scanned so far.  */
3269   struct args_size args_size;
3270   /* Size of arguments before any adjustments (such as rounding).  */
3271   struct args_size original_args_size;
3272   int argnum;
3273   rtx fun;
3274   /* Todo, choose the correct decl type of orgfun. Sadly this information
3275      isn't present here, so we default to native calling abi here.  */
3276   tree fndecl ATTRIBUTE_UNUSED = NULL_TREE; /* library calls default to host calling abi ? */
3277   tree fntype ATTRIBUTE_UNUSED = NULL_TREE; /* library calls default to host calling abi ? */
3278   int inc;
3279   int count;
3280   rtx argblock = 0;
3281   CUMULATIVE_ARGS args_so_far;
3282   struct arg
3283   {
3284     rtx value;
3285     enum machine_mode mode;
3286     rtx reg;
3287     int partial;
3288     struct locate_and_pad_arg_data locate;
3289     rtx save_area;
3290   };
3291   struct arg *argvec;
3292   int old_inhibit_defer_pop = inhibit_defer_pop;
3293   rtx call_fusage = 0;
3294   rtx mem_value = 0;
3295   rtx valreg;
3296   int pcc_struct_value = 0;
3297   int struct_value_size = 0;
3298   int flags;
3299   int reg_parm_stack_space = 0;
3300   int needed;
3301   rtx before_call;
3302   tree tfom;                    /* type_for_mode (outmode, 0) */
3303
3304 #ifdef REG_PARM_STACK_SPACE
3305   /* Define the boundary of the register parm stack space that needs to be
3306      save, if any.  */
3307   int low_to_save = 0, high_to_save = 0;
3308   rtx save_area = 0;            /* Place that it is saved.  */
3309 #endif
3310
3311   /* Size of the stack reserved for parameter registers.  */
3312   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
3313   char *initial_stack_usage_map = stack_usage_map;
3314   char *stack_usage_map_buf = NULL;
3315
3316   rtx struct_value = targetm.calls.struct_value_rtx (0, 0);
3317
3318 #ifdef REG_PARM_STACK_SPACE
3319   reg_parm_stack_space = REG_PARM_STACK_SPACE ((tree) 0);
3320 #endif
3321
3322   /* By default, library functions can not throw.  */
3323   flags = ECF_NOTHROW;
3324
3325   switch (fn_type)
3326     {
3327     case LCT_NORMAL:
3328       break;
3329     case LCT_CONST:
3330       flags |= ECF_CONST;
3331       break;
3332     case LCT_PURE:
3333       flags |= ECF_PURE;
3334       break;
3335     case LCT_NORETURN:
3336       flags |= ECF_NORETURN;
3337       break;
3338     case LCT_THROW:
3339       flags = ECF_NORETURN;
3340       break;
3341     case LCT_RETURNS_TWICE:
3342       flags = ECF_RETURNS_TWICE;
3343       break;
3344     }
3345   fun = orgfun;
3346
3347   /* Ensure current function's preferred stack boundary is at least
3348      what we need.  */
3349   if (crtl->preferred_stack_boundary < PREFERRED_STACK_BOUNDARY)
3350     crtl->preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
3351
3352   /* If this kind of value comes back in memory,
3353      decide where in memory it should come back.  */
3354   if (outmode != VOIDmode)
3355     {
3356       tfom = lang_hooks.types.type_for_mode (outmode, 0);
3357       if (aggregate_value_p (tfom, 0))
3358         {
3359 #ifdef PCC_STATIC_STRUCT_RETURN
3360           rtx pointer_reg
3361             = hard_function_value (build_pointer_type (tfom), 0, 0, 0);
3362           mem_value = gen_rtx_MEM (outmode, pointer_reg);
3363           pcc_struct_value = 1;
3364           if (value == 0)
3365             value = gen_reg_rtx (outmode);
3366 #else /* not PCC_STATIC_STRUCT_RETURN */
3367           struct_value_size = GET_MODE_SIZE (outmode);
3368           if (value != 0 && MEM_P (value))
3369             mem_value = value;
3370           else
3371             mem_value = assign_temp (tfom, 0, 1, 1);
3372 #endif
3373           /* This call returns a big structure.  */
3374           flags &= ~(ECF_CONST | ECF_PURE | ECF_LOOPING_CONST_OR_PURE);
3375         }
3376     }
3377   else
3378     tfom = void_type_node;
3379
3380   /* ??? Unfinished: must pass the memory address as an argument.  */
3381
3382   /* Copy all the libcall-arguments out of the varargs data
3383      and into a vector ARGVEC.
3384
3385      Compute how to pass each argument.  We only support a very small subset
3386      of the full argument passing conventions to limit complexity here since
3387      library functions shouldn't have many args.  */
3388
3389   argvec = XALLOCAVEC (struct arg, nargs + 1);
3390   memset (argvec, 0, (nargs + 1) * sizeof (struct arg));
3391
3392 #ifdef INIT_CUMULATIVE_LIBCALL_ARGS
3393   INIT_CUMULATIVE_LIBCALL_ARGS (args_so_far, outmode, fun);
3394 #else
3395   INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun, 0, nargs);
3396 #endif
3397
3398   args_size.constant = 0;
3399   args_size.var = 0;
3400
3401   count = 0;
3402
3403   push_temp_slots ();
3404
3405   /* If there's a structure value address to be passed,
3406      either pass it in the special place, or pass it as an extra argument.  */
3407   if (mem_value && struct_value == 0 && ! pcc_struct_value)
3408     {
3409       rtx addr = XEXP (mem_value, 0);
3410
3411       nargs++;
3412
3413       /* Make sure it is a reasonable operand for a move or push insn.  */
3414       if (!REG_P (addr) && !MEM_P (addr)
3415           && ! (CONSTANT_P (addr) && LEGITIMATE_CONSTANT_P (addr)))
3416         addr = force_operand (addr, NULL_RTX);
3417
3418       argvec[count].value = addr;
3419       argvec[count].mode = Pmode;
3420       argvec[count].partial = 0;
3421
3422       argvec[count].reg = FUNCTION_ARG (args_so_far, Pmode, NULL_TREE, 1);
3423       gcc_assert (targetm.calls.arg_partial_bytes (&args_so_far, Pmode,
3424                                                    NULL_TREE, 1) == 0);
3425
3426       locate_and_pad_parm (Pmode, NULL_TREE,
3427 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3428                            1,
3429 #else
3430                            argvec[count].reg != 0,
3431 #endif
3432                            0, NULL_TREE, &args_size, &argvec[count].locate);
3433
3434       if (argvec[count].reg == 0 || argvec[count].partial != 0
3435           || reg_parm_stack_space > 0)
3436         args_size.constant += argvec[count].locate.size.constant;
3437
3438       FUNCTION_ARG_ADVANCE (args_so_far, Pmode, (tree) 0, 1);
3439
3440       count++;
3441     }
3442
3443   for (; count < nargs; count++)
3444     {
3445       rtx val = va_arg (p, rtx);
3446       enum machine_mode mode = (enum machine_mode) va_arg (p, int);
3447
3448       /* We cannot convert the arg value to the mode the library wants here;
3449          must do it earlier where we know the signedness of the arg.  */
3450       gcc_assert (mode != BLKmode
3451                   && (GET_MODE (val) == mode || GET_MODE (val) == VOIDmode));
3452
3453       /* Make sure it is a reasonable operand for a move or push insn.  */
3454       if (!REG_P (val) && !MEM_P (val)
3455           && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
3456         val = force_operand (val, NULL_RTX);
3457
3458       if (pass_by_reference (&args_so_far, mode, NULL_TREE, 1))
3459         {
3460           rtx slot;
3461           int must_copy
3462             = !reference_callee_copied (&args_so_far, mode, NULL_TREE, 1);
3463
3464           /* If this was a CONST function, it is now PURE since it now
3465              reads memory.  */
3466           if (flags & ECF_CONST)
3467             {
3468               flags &= ~ECF_CONST;
3469               flags |= ECF_PURE;
3470             }
3471
3472           if (MEM_P (val) && !must_copy)
3473             slot = val;
3474           else
3475             {
3476               slot = assign_temp (lang_hooks.types.type_for_mode (mode, 0),
3477                                   0, 1, 1);
3478               emit_move_insn (slot, val);
3479             }
3480
3481           call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3482                                            gen_rtx_USE (VOIDmode, slot),
3483                                            call_fusage);
3484           if (must_copy)
3485             call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3486                                              gen_rtx_CLOBBER (VOIDmode,
3487                                                               slot),
3488                                              call_fusage);
3489
3490           mode = Pmode;
3491           val = force_operand (XEXP (slot, 0), NULL_RTX);
3492         }
3493
3494       argvec[count].value = val;
3495       argvec[count].mode = mode;
3496
3497       argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
3498
3499       argvec[count].partial
3500         = targetm.calls.arg_partial_bytes (&args_so_far, mode, NULL_TREE, 1);
3501
3502       locate_and_pad_parm (mode, NULL_TREE,
3503 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3504                            1,
3505 #else
3506                            argvec[count].reg != 0,
3507 #endif
3508                            argvec[count].partial,
3509                            NULL_TREE, &args_size, &argvec[count].locate);
3510
3511       gcc_assert (!argvec[count].locate.size.var);
3512
3513       if (argvec[count].reg == 0 || argvec[count].partial != 0
3514           || reg_parm_stack_space > 0)
3515         args_size.constant += argvec[count].locate.size.constant;
3516
3517       FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree) 0, 1);
3518     }
3519
3520   /* If this machine requires an external definition for library
3521      functions, write one out.  */
3522   assemble_external_libcall (fun);
3523
3524   original_args_size = args_size;
3525   args_size.constant = (((args_size.constant
3526                           + stack_pointer_delta
3527                           + STACK_BYTES - 1)
3528                           / STACK_BYTES
3529                           * STACK_BYTES)
3530                          - stack_pointer_delta);
3531
3532   args_size.constant = MAX (args_size.constant,
3533                             reg_parm_stack_space);
3534
3535   if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl))))
3536     args_size.constant -= reg_parm_stack_space;
3537
3538   if (args_size.constant > crtl->outgoing_args_size)
3539     crtl->outgoing_args_size = args_size.constant;
3540
3541   if (ACCUMULATE_OUTGOING_ARGS)
3542     {
3543       /* Since the stack pointer will never be pushed, it is possible for
3544          the evaluation of a parm to clobber something we have already
3545          written to the stack.  Since most function calls on RISC machines
3546          do not use the stack, this is uncommon, but must work correctly.
3547
3548          Therefore, we save any area of the stack that was already written
3549          and that we are using.  Here we set up to do this by making a new
3550          stack usage map from the old one.
3551
3552          Another approach might be to try to reorder the argument
3553          evaluations to avoid this conflicting stack usage.  */
3554
3555       needed = args_size.constant;
3556
3557       /* Since we will be writing into the entire argument area, the
3558          map must be allocated for its entire size, not just the part that
3559          is the responsibility of the caller.  */
3560       if (! OUTGOING_REG_PARM_STACK_SPACE ((!fndecl ? fntype : TREE_TYPE (fndecl))))
3561         needed += reg_parm_stack_space;
3562
3563 #ifdef ARGS_GROW_DOWNWARD
3564       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3565                                          needed + 1);
3566 #else
3567       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
3568                                          needed);
3569 #endif
3570       stack_usage_map_buf = XNEWVEC (char, highest_outgoing_arg_in_use);
3571       stack_usage_map = stack_usage_map_buf;
3572
3573       if (initial_highest_arg_in_use)
3574         memcpy (stack_usage_map, initial_stack_usage_map,
3575                 initial_highest_arg_in_use);
3576
3577       if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
3578         memset (&stack_usage_map[initial_highest_arg_in_use], 0,
3579                highest_outgoing_arg_in_use - initial_highest_arg_in_use);
3580       needed = 0;
3581
3582       /* We must be careful to use virtual regs before they're instantiated,
3583          and real regs afterwards.  Loop optimization, for example, can create
3584          new libcalls after we've instantiated the virtual regs, and if we
3585          use virtuals anyway, they won't match the rtl patterns.  */
3586
3587       if (virtuals_instantiated)
3588         argblock = plus_constant (stack_pointer_rtx, STACK_POINTER_OFFSET);
3589       else
3590         argblock = virtual_outgoing_args_rtx;
3591     }
3592   else
3593     {
3594       if (!PUSH_ARGS)
3595         argblock = push_block (GEN_INT (args_size.constant), 0, 0);
3596     }
3597
3598   /* If we push args individually in reverse order, perform stack alignment
3599      before the first push (the last arg).  */
3600   if (argblock == 0 && PUSH_ARGS_REVERSED)
3601     anti_adjust_stack (GEN_INT (args_size.constant
3602                                 - original_args_size.constant));
3603
3604   if (PUSH_ARGS_REVERSED)
3605     {
3606       inc = -1;
3607       argnum = nargs - 1;
3608     }
3609   else
3610     {
3611       inc = 1;
3612       argnum = 0;
3613     }
3614
3615 #ifdef REG_PARM_STACK_SPACE
3616   if (ACCUMULATE_OUTGOING_ARGS)
3617     {
3618       /* The argument list is the property of the called routine and it
3619          may clobber it.  If the fixed area has been used for previous
3620          parameters, we must save and restore it.  */
3621       save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
3622                                             &low_to_save, &high_to_save);
3623     }
3624 #endif
3625
3626   /* Push the args that need to be pushed.  */
3627
3628   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
3629      are to be pushed.  */
3630   for (count = 0; count < nargs; count++, argnum += inc)
3631     {
3632       enum machine_mode mode = argvec[argnum].mode;
3633       rtx val = argvec[argnum].value;
3634       rtx reg = argvec[argnum].reg;
3635       int partial = argvec[argnum].partial;
3636       unsigned int parm_align = argvec[argnum].locate.boundary;
3637       int lower_bound = 0, upper_bound = 0, i;
3638
3639       if (! (reg != 0 && partial == 0))
3640         {
3641           if (ACCUMULATE_OUTGOING_ARGS)
3642             {
3643               /* If this is being stored into a pre-allocated, fixed-size,
3644                  stack area, save any previous data at that location.  */
3645
3646 #ifdef ARGS_GROW_DOWNWARD
3647               /* stack_slot is negative, but we want to index stack_usage_map
3648                  with positive values.  */
3649               upper_bound = -argvec[argnum].locate.slot_offset.constant + 1;
3650               lower_bound = upper_bound - argvec[argnum].locate.size.constant;
3651 #else
3652               lower_bound = argvec[argnum].locate.slot_offset.constant;
3653               upper_bound = lower_bound + argvec[argnum].locate.size.constant;
3654 #endif
3655
3656               i = lower_bound;
3657               /* Don't worry about things in the fixed argument area;
3658                  it has already been saved.  */
3659               if (i < reg_parm_stack_space)
3660                 i = reg_parm_stack_space;
3661               while (i < upper_bound && stack_usage_map[i] == 0)
3662                 i++;
3663
3664               if (i < upper_bound)
3665                 {
3666                   /* We need to make a save area.  */
3667                   unsigned int size
3668                     = argvec[argnum].locate.size.constant * BITS_PER_UNIT;
3669                   enum machine_mode save_mode
3670                     = mode_for_size (size, MODE_INT, 1);
3671                   rtx adr
3672                     = plus_constant (argblock,
3673                                      argvec[argnum].locate.offset.constant);
3674                   rtx stack_area
3675                     = gen_rtx_MEM (save_mode, memory_address (save_mode, adr));
3676
3677                   if (save_mode == BLKmode)
3678                     {
3679                       argvec[argnum].save_area
3680                         = assign_stack_temp (BLKmode,
3681                                              argvec[argnum].locate.size.constant,
3682                                              0);
3683
3684                       emit_block_move (validize_mem (argvec[argnum].save_area),
3685                                        stack_area,
3686                                        GEN_INT (argvec[argnum].locate.size.constant),
3687                                        BLOCK_OP_CALL_PARM);
3688                     }
3689                   else
3690                     {
3691                       argvec[argnum].save_area = gen_reg_rtx (save_mode);
3692
3693                       emit_move_insn (argvec[argnum].save_area, stack_area);
3694                     }
3695                 }
3696             }
3697
3698           emit_push_insn (val, mode, NULL_TREE, NULL_RTX, parm_align,
3699                           partial, reg, 0, argblock,
3700                           GEN_INT (argvec[argnum].locate.offset.constant),
3701                           reg_parm_stack_space,
3702                           ARGS_SIZE_RTX (argvec[argnum].locate.alignment_pad));
3703
3704           /* Now mark the segment we just used.  */
3705           if (ACCUMULATE_OUTGOING_ARGS)
3706             for (i = lower_bound; i < upper_bound; i++)
3707               stack_usage_map[i] = 1;
3708
3709           NO_DEFER_POP;
3710
3711           if ((flags & ECF_CONST)
3712               || ((flags & ECF_PURE) && ACCUMULATE_OUTGOING_ARGS))
3713             {
3714               rtx use;
3715
3716               /* Indicate argument access so that alias.c knows that these
3717                  values are live.  */
3718               if (argblock)
3719                 use = plus_constant (argblock,
3720                                      argvec[argnum].locate.offset.constant);
3721               else
3722                 /* When arguments are pushed, trying to tell alias.c where
3723                    exactly this argument is won't work, because the
3724                    auto-increment causes confusion.  So we merely indicate
3725                    that we access something with a known mode somewhere on
3726                    the stack.  */
3727                 use = gen_rtx_PLUS (Pmode, virtual_outgoing_args_rtx,
3728                                     gen_rtx_SCRATCH (Pmode));
3729               use = gen_rtx_MEM (argvec[argnum].mode, use);
3730               use = gen_rtx_USE (VOIDmode, use);
3731               call_fusage = gen_rtx_EXPR_LIST (VOIDmode, use, call_fusage);
3732             }
3733         }
3734     }
3735
3736   /* If we pushed args in forward order, perform stack alignment
3737      after pushing the last arg.  */
3738   if (argblock == 0 && !PUSH_ARGS_REVERSED)
3739     anti_adjust_stack (GEN_INT (args_size.constant
3740                                 - original_args_size.constant));
3741
3742   if (PUSH_ARGS_REVERSED)
3743     argnum = nargs - 1;
3744   else
3745     argnum = 0;
3746
3747   fun = prepare_call_address (NULL, fun, NULL, &call_fusage, 0, 0);
3748
3749   /* Now load any reg parms into their regs.  */
3750
3751   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
3752      are to be pushed.  */
3753   for (count = 0; count < nargs; count++, argnum += inc)
3754     {
3755       enum machine_mode mode = argvec[argnum].mode;
3756       rtx val = argvec[argnum].value;
3757       rtx reg = argvec[argnum].reg;
3758       int partial = argvec[argnum].partial;
3759
3760       /* Handle calls that pass values in multiple non-contiguous
3761          locations.  The PA64 has examples of this for library calls.  */
3762       if (reg != 0 && GET_CODE (reg) == PARALLEL)
3763         emit_group_load (reg, val, NULL_TREE, GET_MODE_SIZE (mode));
3764       else if (reg != 0 && partial == 0)
3765         emit_move_insn (reg, val);
3766
3767       NO_DEFER_POP;
3768     }
3769
3770   /* Any regs containing parms remain in use through the call.  */
3771   for (count = 0; count < nargs; count++)
3772     {
3773       rtx reg = argvec[count].reg;
3774       if (reg != 0 && GET_CODE (reg) == PARALLEL)
3775         use_group_regs (&call_fusage, reg);
3776       else if (reg != 0)
3777         {
3778           int partial = argvec[count].partial;
3779           if (partial)
3780             {
3781               int nregs;
3782               gcc_assert (partial % UNITS_PER_WORD == 0);
3783               nregs = partial / UNITS_PER_WORD;
3784               use_regs (&call_fusage, REGNO (reg), nregs);
3785             }
3786           else
3787             use_reg (&call_fusage, reg);
3788         }
3789     }
3790
3791   /* Pass the function the address in which to return a structure value.  */
3792   if (mem_value != 0 && struct_value != 0 && ! pcc_struct_value)
3793     {
3794       emit_move_insn (struct_value,
3795                       force_reg (Pmode,
3796                                  force_operand (XEXP (mem_value, 0),
3797                                                 NULL_RTX)));
3798       if (REG_P (struct_value))
3799         use_reg (&call_fusage, struct_value);
3800     }
3801
3802   /* Don't allow popping to be deferred, since then
3803      cse'ing of library calls could delete a call and leave the pop.  */
3804   NO_DEFER_POP;
3805   valreg = (mem_value == 0 && outmode != VOIDmode
3806             ? hard_libcall_value (outmode, orgfun) : NULL_RTX);
3807
3808   /* Stack must be properly aligned now.  */
3809   gcc_assert (!(stack_pointer_delta
3810                 & (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT - 1)));
3811
3812   before_call = get_last_insn ();
3813
3814   /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
3815      will set inhibit_defer_pop to that value.  */
3816   /* The return type is needed to decide how many bytes the function pops.
3817      Signedness plays no role in that, so for simplicity, we pretend it's
3818      always signed.  We also assume that the list of arguments passed has
3819      no impact, so we pretend it is unknown.  */
3820
3821   emit_call_1 (fun, NULL,
3822                get_identifier (XSTR (orgfun, 0)),
3823                build_function_type (tfom, NULL_TREE),
3824                original_args_size.constant, args_size.constant,
3825                struct_value_size,
3826                FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
3827                valreg,
3828                old_inhibit_defer_pop + 1, call_fusage, flags, & args_so_far);
3829
3830   /* For calls to `setjmp', etc., inform function.c:setjmp_warnings
3831      that it should complain if nonvolatile values are live.  For
3832      functions that cannot return, inform flow that control does not
3833      fall through.  */
3834
3835   if (flags & ECF_NORETURN)
3836     {
3837       /* The barrier note must be emitted
3838          immediately after the CALL_INSN.  Some ports emit more than
3839          just a CALL_INSN above, so we must search for it here.  */
3840
3841       rtx last = get_last_insn ();
3842       while (!CALL_P (last))
3843         {
3844           last = PREV_INSN (last);
3845           /* There was no CALL_INSN?  */
3846           gcc_assert (last != before_call);
3847         }
3848
3849       emit_barrier_after (last);
3850     }
3851
3852   /* Now restore inhibit_defer_pop to its actual original value.  */
3853   OK_DEFER_POP;
3854
3855   pop_temp_slots ();
3856
3857   /* Copy the value to the right place.  */
3858   if (outmode != VOIDmode && retval)
3859     {
3860       if (mem_value)
3861         {
3862           if (value == 0)
3863             value = mem_value;
3864           if (value != mem_value)
3865             emit_move_insn (value, mem_value);
3866         }
3867       else if (GET_CODE (valreg) == PARALLEL)
3868         {
3869           if (value == 0)
3870             value = gen_reg_rtx (outmode);
3871           emit_group_store (value, valreg, NULL_TREE, GET_MODE_SIZE (outmode));
3872         }
3873       else
3874         {
3875           /* Convert to the proper mode if a promotion has been active.  */
3876           if (GET_MODE (valreg) != outmode)
3877             {
3878               int unsignedp = TYPE_UNSIGNED (tfom);
3879
3880               gcc_assert (promote_function_mode (tfom, outmode, &unsignedp,
3881                                                  fndecl ? TREE_TYPE (fndecl) : fntype, 1)
3882                           == GET_MODE (valreg));
3883               valreg = convert_modes (outmode, GET_MODE (valreg), valreg, 0);
3884             }
3885
3886           if (value != 0)
3887             emit_move_insn (value, valreg);
3888           else
3889             value = valreg;
3890         }
3891     }
3892
3893   if (ACCUMULATE_OUTGOING_ARGS)
3894     {
3895 #ifdef REG_PARM_STACK_SPACE
3896       if (save_area)
3897         restore_fixed_argument_area (save_area, argblock,
3898                                      high_to_save, low_to_save);
3899 #endif
3900
3901       /* If we saved any argument areas, restore them.  */
3902       for (count = 0; count < nargs; count++)
3903         if (argvec[count].save_area)
3904           {
3905             enum machine_mode save_mode = GET_MODE (argvec[count].save_area);
3906             rtx adr = plus_constant (argblock,
3907                                      argvec[count].locate.offset.constant);
3908             rtx stack_area = gen_rtx_MEM (save_mode,
3909                                           memory_address (save_mode, adr));
3910
3911             if (save_mode == BLKmode)
3912               emit_block_move (stack_area,
3913                                validize_mem (argvec[count].save_area),
3914                                GEN_INT (argvec[count].locate.size.constant),
3915                                BLOCK_OP_CALL_PARM);
3916             else
3917               emit_move_insn (stack_area, argvec[count].save_area);
3918           }
3919
3920       highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3921       stack_usage_map = initial_stack_usage_map;
3922     }
3923
3924   if (stack_usage_map_buf)
3925     free (stack_usage_map_buf);
3926
3927   return value;
3928
3929 }
3930 \f
3931 /* Output a library call to function FUN (a SYMBOL_REF rtx)
3932    (emitting the queue unless NO_QUEUE is nonzero),
3933    for a value of mode OUTMODE,
3934    with NARGS different arguments, passed as alternating rtx values
3935    and machine_modes to convert them to.
3936
3937    FN_TYPE should be LCT_NORMAL for `normal' calls, LCT_CONST for
3938    `const' calls, LCT_PURE for `pure' calls, or other LCT_ value for
3939    other types of library calls.  */
3940
3941 void
3942 emit_library_call (rtx orgfun, enum libcall_type fn_type,
3943                    enum machine_mode outmode, int nargs, ...)
3944 {
3945   va_list p;
3946
3947   va_start (p, nargs);
3948   emit_library_call_value_1 (0, orgfun, NULL_RTX, fn_type, outmode, nargs, p);
3949   va_end (p);
3950 }
3951 \f
3952 /* Like emit_library_call except that an extra argument, VALUE,
3953    comes second and says where to store the result.
3954    (If VALUE is zero, this function chooses a convenient way
3955    to return the value.
3956
3957    This function returns an rtx for where the value is to be found.
3958    If VALUE is nonzero, VALUE is returned.  */
3959
3960 rtx
3961 emit_library_call_value (rtx orgfun, rtx value,
3962                          enum libcall_type fn_type,
3963                          enum machine_mode outmode, int nargs, ...)
3964 {
3965   rtx result;
3966   va_list p;
3967
3968   va_start (p, nargs);
3969   result = emit_library_call_value_1 (1, orgfun, value, fn_type, outmode,
3970                                       nargs, p);
3971   va_end (p);
3972
3973   return result;
3974 }
3975 \f
3976 /* Store a single argument for a function call
3977    into the register or memory area where it must be passed.
3978    *ARG describes the argument value and where to pass it.
3979
3980    ARGBLOCK is the address of the stack-block for all the arguments,
3981    or 0 on a machine where arguments are pushed individually.
3982
3983    MAY_BE_ALLOCA nonzero says this could be a call to `alloca'
3984    so must be careful about how the stack is used.
3985
3986    VARIABLE_SIZE nonzero says that this was a variable-sized outgoing
3987    argument stack.  This is used if ACCUMULATE_OUTGOING_ARGS to indicate
3988    that we need not worry about saving and restoring the stack.
3989
3990    FNDECL is the declaration of the function we are calling.
3991
3992    Return nonzero if this arg should cause sibcall failure,
3993    zero otherwise.  */
3994
3995 static int
3996 store_one_arg (struct arg_data *arg, rtx argblock, int flags,
3997                int variable_size ATTRIBUTE_UNUSED, int reg_parm_stack_space)
3998 {
3999   tree pval = arg->tree_value;
4000   rtx reg = 0;
4001   int partial = 0;
4002   int used = 0;
4003   int i, lower_bound = 0, upper_bound = 0;
4004   int sibcall_failure = 0;
4005
4006   if (TREE_CODE (pval) == ERROR_MARK)
4007     return 1;
4008
4009   /* Push a new temporary level for any temporaries we make for
4010      this argument.  */
4011   push_temp_slots ();
4012
4013   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL))
4014     {
4015       /* If this is being stored into a pre-allocated, fixed-size, stack area,
4016          save any previous data at that location.  */
4017       if (argblock && ! variable_size && arg->stack)
4018         {
4019 #ifdef ARGS_GROW_DOWNWARD
4020           /* stack_slot is negative, but we want to index stack_usage_map
4021              with positive values.  */
4022           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4023             upper_bound = -INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1)) + 1;
4024           else
4025             upper_bound = 0;
4026
4027           lower_bound = upper_bound - arg->locate.size.constant;
4028 #else
4029           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4030             lower_bound = INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1));
4031           else
4032             lower_bound = 0;
4033
4034           upper_bound = lower_bound + arg->locate.size.constant;
4035 #endif
4036
4037           i = lower_bound;
4038           /* Don't worry about things in the fixed argument area;
4039              it has already been saved.  */
4040           if (i < reg_parm_stack_space)
4041             i = reg_parm_stack_space;
4042           while (i < upper_bound && stack_usage_map[i] == 0)
4043             i++;
4044
4045           if (i < upper_bound)
4046             {
4047               /* We need to make a save area.  */
4048               unsigned int size = arg->locate.size.constant * BITS_PER_UNIT;
4049               enum machine_mode save_mode = mode_for_size (size, MODE_INT, 1);
4050               rtx adr = memory_address (save_mode, XEXP (arg->stack_slot, 0));
4051               rtx stack_area = gen_rtx_MEM (save_mode, adr);
4052
4053               if (save_mode == BLKmode)
4054                 {
4055                   tree ot = TREE_TYPE (arg->tree_value);
4056                   tree nt = build_qualified_type (ot, (TYPE_QUALS (ot)
4057                                                        | TYPE_QUAL_CONST));
4058
4059                   arg->save_area = assign_temp (nt, 0, 1, 1);
4060                   preserve_temp_slots (arg->save_area);
4061                   emit_block_move (validize_mem (arg->save_area), stack_area,
4062                                    GEN_INT (arg->locate.size.constant),
4063                                    BLOCK_OP_CALL_PARM);
4064                 }
4065               else
4066                 {
4067                   arg->save_area = gen_reg_rtx (save_mode);
4068                   emit_move_insn (arg->save_area, stack_area);
4069                 }
4070             }
4071         }
4072     }
4073
4074   /* If this isn't going to be placed on both the stack and in registers,
4075      set up the register and number of words.  */
4076   if (! arg->pass_on_stack)
4077     {
4078       if (flags & ECF_SIBCALL)
4079         reg = arg->tail_call_reg;
4080       else
4081         reg = arg->reg;
4082       partial = arg->partial;
4083     }
4084
4085   /* Being passed entirely in a register.  We shouldn't be called in
4086      this case.  */
4087   gcc_assert (reg == 0 || partial != 0);
4088
4089   /* If this arg needs special alignment, don't load the registers
4090      here.  */
4091   if (arg->n_aligned_regs != 0)
4092     reg = 0;
4093
4094   /* If this is being passed partially in a register, we can't evaluate
4095      it directly into its stack slot.  Otherwise, we can.  */
4096   if (arg->value == 0)
4097     {
4098       /* stack_arg_under_construction is nonzero if a function argument is
4099          being evaluated directly into the outgoing argument list and
4100          expand_call must take special action to preserve the argument list
4101          if it is called recursively.
4102
4103          For scalar function arguments stack_usage_map is sufficient to
4104          determine which stack slots must be saved and restored.  Scalar
4105          arguments in general have pass_on_stack == 0.
4106
4107          If this argument is initialized by a function which takes the
4108          address of the argument (a C++ constructor or a C function
4109          returning a BLKmode structure), then stack_usage_map is
4110          insufficient and expand_call must push the stack around the
4111          function call.  Such arguments have pass_on_stack == 1.
4112
4113          Note that it is always safe to set stack_arg_under_construction,
4114          but this generates suboptimal code if set when not needed.  */
4115
4116       if (arg->pass_on_stack)
4117         stack_arg_under_construction++;
4118
4119       arg->value = expand_expr (pval,
4120                                 (partial
4121                                  || TYPE_MODE (TREE_TYPE (pval)) != arg->mode)
4122                                 ? NULL_RTX : arg->stack,
4123                                 VOIDmode, EXPAND_STACK_PARM);
4124
4125       /* If we are promoting object (or for any other reason) the mode
4126          doesn't agree, convert the mode.  */
4127
4128       if (arg->mode != TYPE_MODE (TREE_TYPE (pval)))
4129         arg->value = convert_modes (arg->mode, TYPE_MODE (TREE_TYPE (pval)),
4130                                     arg->value, arg->unsignedp);
4131
4132       if (arg->pass_on_stack)
4133         stack_arg_under_construction--;
4134     }
4135
4136   /* Check for overlap with already clobbered argument area.  */
4137   if ((flags & ECF_SIBCALL)
4138       && MEM_P (arg->value)
4139       && mem_overlaps_already_clobbered_arg_p (XEXP (arg->value, 0),
4140                                                arg->locate.size.constant))
4141     sibcall_failure = 1;
4142
4143   /* Don't allow anything left on stack from computation
4144      of argument to alloca.  */
4145   if (flags & ECF_MAY_BE_ALLOCA)
4146     do_pending_stack_adjust ();
4147
4148   if (arg->value == arg->stack)
4149     /* If the value is already in the stack slot, we are done.  */
4150     ;
4151   else if (arg->mode != BLKmode)
4152     {
4153       int size;
4154       unsigned int parm_align;
4155
4156       /* Argument is a scalar, not entirely passed in registers.
4157          (If part is passed in registers, arg->partial says how much
4158          and emit_push_insn will take care of putting it there.)
4159
4160          Push it, and if its size is less than the
4161          amount of space allocated to it,
4162          also bump stack pointer by the additional space.
4163          Note that in C the default argument promotions
4164          will prevent such mismatches.  */
4165
4166       size = GET_MODE_SIZE (arg->mode);
4167       /* Compute how much space the push instruction will push.
4168          On many machines, pushing a byte will advance the stack
4169          pointer by a halfword.  */
4170 #ifdef PUSH_ROUNDING
4171       size = PUSH_ROUNDING (size);
4172 #endif
4173       used = size;
4174
4175       /* Compute how much space the argument should get:
4176          round up to a multiple of the alignment for arguments.  */
4177       if (none != FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)))
4178         used = (((size + PARM_BOUNDARY / BITS_PER_UNIT - 1)
4179                  / (PARM_BOUNDARY / BITS_PER_UNIT))
4180                 * (PARM_BOUNDARY / BITS_PER_UNIT));
4181
4182       /* Compute the alignment of the pushed argument.  */
4183       parm_align = arg->locate.boundary;
4184       if (FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)) == downward)
4185         {
4186           int pad = used - size;
4187           if (pad)
4188             {
4189               unsigned int pad_align = (pad & -pad) * BITS_PER_UNIT;
4190               parm_align = MIN (parm_align, pad_align);
4191             }
4192         }
4193
4194       /* This isn't already where we want it on the stack, so put it there.
4195          This can either be done with push or copy insns.  */
4196       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), NULL_RTX,
4197                       parm_align, partial, reg, used - size, argblock,
4198                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4199                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4200
4201       /* Unless this is a partially-in-register argument, the argument is now
4202          in the stack.  */
4203       if (partial == 0)
4204         arg->value = arg->stack;
4205     }
4206   else
4207     {
4208       /* BLKmode, at least partly to be pushed.  */
4209
4210       unsigned int parm_align;
4211       int excess;
4212       rtx size_rtx;
4213
4214       /* Pushing a nonscalar.
4215          If part is passed in registers, PARTIAL says how much
4216          and emit_push_insn will take care of putting it there.  */
4217
4218       /* Round its size up to a multiple
4219          of the allocation unit for arguments.  */
4220
4221       if (arg->locate.size.var != 0)
4222         {
4223           excess = 0;
4224           size_rtx = ARGS_SIZE_RTX (arg->locate.size);
4225         }
4226       else
4227         {
4228           /* PUSH_ROUNDING has no effect on us, because emit_push_insn
4229              for BLKmode is careful to avoid it.  */
4230           excess = (arg->locate.size.constant
4231                     - int_size_in_bytes (TREE_TYPE (pval))
4232                     + partial);
4233           size_rtx = expand_expr (size_in_bytes (TREE_TYPE (pval)),
4234                                   NULL_RTX, TYPE_MODE (sizetype),
4235                                   EXPAND_NORMAL);
4236         }
4237
4238       parm_align = arg->locate.boundary;
4239
4240       /* When an argument is padded down, the block is aligned to
4241          PARM_BOUNDARY, but the actual argument isn't.  */
4242       if (FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)) == downward)
4243         {
4244           if (arg->locate.size.var)
4245             parm_align = BITS_PER_UNIT;
4246           else if (excess)
4247             {
4248               unsigned int excess_align = (excess & -excess) * BITS_PER_UNIT;
4249               parm_align = MIN (parm_align, excess_align);
4250             }
4251         }
4252
4253       if ((flags & ECF_SIBCALL) && MEM_P (arg->value))
4254         {
4255           /* emit_push_insn might not work properly if arg->value and
4256              argblock + arg->locate.offset areas overlap.  */
4257           rtx x = arg->value;
4258           int i = 0;
4259
4260           if (XEXP (x, 0) == crtl->args.internal_arg_pointer
4261               || (GET_CODE (XEXP (x, 0)) == PLUS
4262                   && XEXP (XEXP (x, 0), 0) ==
4263                      crtl->args.internal_arg_pointer
4264                   && CONST_INT_P (XEXP (XEXP (x, 0), 1))))
4265             {
4266               if (XEXP (x, 0) != crtl->args.internal_arg_pointer)
4267                 i = INTVAL (XEXP (XEXP (x, 0), 1));
4268
4269               /* expand_call should ensure this.  */
4270               gcc_assert (!arg->locate.offset.var
4271                           && arg->locate.size.var == 0
4272                           && CONST_INT_P (size_rtx));
4273
4274               if (arg->locate.offset.constant > i)
4275                 {
4276                   if (arg->locate.offset.constant < i + INTVAL (size_rtx))
4277                     sibcall_failure = 1;
4278                 }
4279               else if (arg->locate.offset.constant < i)
4280                 {
4281                   /* Use arg->locate.size.constant instead of size_rtx
4282                      because we only care about the part of the argument
4283                      on the stack.  */
4284                   if (i < (arg->locate.offset.constant
4285                            + arg->locate.size.constant))
4286                     sibcall_failure = 1;
4287                 }
4288               else
4289                 {
4290                   /* Even though they appear to be at the same location,
4291                      if part of the outgoing argument is in registers,
4292                      they aren't really at the same location.  Check for
4293                      this by making sure that the incoming size is the
4294                      same as the outgoing size.  */
4295                   if (arg->locate.size.constant != INTVAL (size_rtx))
4296                     sibcall_failure = 1;
4297                 }
4298             }
4299         }
4300
4301       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx,
4302                       parm_align, partial, reg, excess, argblock,
4303                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4304                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4305
4306       /* Unless this is a partially-in-register argument, the argument is now
4307          in the stack.
4308
4309          ??? Unlike the case above, in which we want the actual
4310          address of the data, so that we can load it directly into a
4311          register, here we want the address of the stack slot, so that
4312          it's properly aligned for word-by-word copying or something
4313          like that.  It's not clear that this is always correct.  */
4314       if (partial == 0)
4315         arg->value = arg->stack_slot;
4316     }
4317
4318   if (arg->reg && GET_CODE (arg->reg) == PARALLEL)
4319     {
4320       tree type = TREE_TYPE (arg->tree_value);
4321       arg->parallel_value
4322         = emit_group_load_into_temps (arg->reg, arg->value, type,
4323                                       int_size_in_bytes (type));
4324     }
4325
4326   /* Mark all slots this store used.  */
4327   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL)
4328       && argblock && ! variable_size && arg->stack)
4329     for (i = lower_bound; i < upper_bound; i++)
4330       stack_usage_map[i] = 1;
4331
4332   /* Once we have pushed something, pops can't safely
4333      be deferred during the rest of the arguments.  */
4334   NO_DEFER_POP;
4335
4336   /* Free any temporary slots made in processing this argument.  Show
4337      that we might have taken the address of something and pushed that
4338      as an operand.  */
4339   preserve_temp_slots (NULL_RTX);
4340   free_temp_slots ();
4341   pop_temp_slots ();
4342
4343   return sibcall_failure;
4344 }
4345
4346 /* Nonzero if we do not know how to pass TYPE solely in registers.  */
4347
4348 bool
4349 must_pass_in_stack_var_size (enum machine_mode mode ATTRIBUTE_UNUSED,
4350                              const_tree type)
4351 {
4352   if (!type)
4353     return false;
4354
4355   /* If the type has variable size...  */
4356   if (TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
4357     return true;
4358
4359   /* If the type is marked as addressable (it is required
4360      to be constructed into the stack)...  */
4361   if (TREE_ADDRESSABLE (type))
4362     return true;
4363
4364   return false;
4365 }
4366
4367 /* Another version of the TARGET_MUST_PASS_IN_STACK hook.  This one
4368    takes trailing padding of a structure into account.  */
4369 /* ??? Should be able to merge these two by examining BLOCK_REG_PADDING.  */
4370
4371 bool
4372 must_pass_in_stack_var_size_or_pad (enum machine_mode mode, const_tree type)
4373 {
4374   if (!type)
4375     return false;
4376
4377   /* If the type has variable size...  */
4378   if (TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
4379     return true;
4380
4381   /* If the type is marked as addressable (it is required
4382      to be constructed into the stack)...  */
4383   if (TREE_ADDRESSABLE (type))
4384     return true;
4385
4386   /* If the padding and mode of the type is such that a copy into
4387      a register would put it into the wrong part of the register.  */
4388   if (mode == BLKmode
4389       && int_size_in_bytes (type) % (PARM_BOUNDARY / BITS_PER_UNIT)
4390       && (FUNCTION_ARG_PADDING (mode, type)
4391           == (BYTES_BIG_ENDIAN ? upward : downward)))
4392     return true;
4393
4394   return false;
4395 }