OSDN Git Service

(call patterns): Use %. in cror.
[pf3gnuchains/gcc-fork.git] / gcc / calls.c
index 529c5bf..edb0dd0 100644 (file)
@@ -1,5 +1,5 @@
 /* Convert function calls to rtl insns, for GNU C compiler.
-   Copyright (C) 1989, 1992 Free Software Foundation, Inc.
+   Copyright (C) 1989, 1992, 1993 Free Software Foundation, Inc.
 
 This file is part of GNU CC.
 
@@ -22,15 +22,21 @@ the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
 #include "tree.h"
 #include "flags.h"
 #include "expr.h"
+#include "gvarargs.h"
 #include "insn-flags.h"
 
 /* Decide whether a function's arguments should be processed
-   from first to last or from last to first.  */
+   from first to last or from last to first.
+
+   They should if the stack and args grow in opposite directions, but
+   only if we have push insns.  */
 
-#ifdef STACK_GROWS_DOWNWARD
 #ifdef PUSH_ROUNDING
+
+#if defined (STACK_GROWS_DOWNWARD) != defined (ARGS_GROW_DOWNARD)
 #define PUSH_ARGS_REVERSED     /* If it's last to first */
 #endif
+
 #endif
 
 /* Like STACK_BOUNDARY but in units of bytes, not bits.  */
@@ -42,6 +48,8 @@ struct arg_data
 {
   /* Tree node for this argument.  */
   tree tree_value;
+  /* Mode for value; TYPE_MODE unless promoted.  */
+  enum machine_mode mode;
   /* Current RTL value for argument, or 0 if it isn't precomputed.  */
   rtx value;
   /* Initially-compute RTL value for argument; only for const functions.  */
@@ -50,10 +58,16 @@ struct arg_data
      EXPR_LIST if the arg is to be copied into multiple different
      registers.  */
   rtx reg;
+  /* If REG was promoted from the actual mode of the argument expression,
+     indicates whether the promotion is sign- or zero-extended.  */
+  int unsignedp;
   /* Number of registers to use.  0 means put the whole arg in registers.
      Also 0 if not passed in registers.  */
   int partial;
-  /* Non-zero if argument must be passed on stack.  */
+  /* Non-zero if argument must be passed on stack.
+     Note that some arguments may be passed on the stack
+     even though pass_on_stack is zero, just because FUNCTION_ARG says so.
+     pass_on_stack identifies arguments that *cannot* go in registers.  */
   int pass_on_stack;
   /* Offset of this argument from beginning of stack-args.  */
   struct args_size offset;
@@ -76,10 +90,18 @@ struct arg_data
   /* Place that this stack area has been saved, if needed.  */
   rtx save_area;
 #endif
+#ifdef STRICT_ALIGNMENT
+  /* If an argument's alignment does not permit direct copying into registers,
+     copy in smaller-sized pieces into pseudos.  These are stored in a
+     block pointed to by this field.  The next field says how many
+     word-sized pseudos we made.  */
+  rtx *aligned_regs;
+  int n_aligned_regs;
+#endif
 };
 
 #ifdef ACCUMULATE_OUTGOING_ARGS
-/* A vector of one char per word of stack space.  A byte if non-zero if
+/* A vector of one char per byte of stack space.  A byte if non-zero if
    the corresponding stack location has been used.
    This vector is used to prevent a function call within an argument from
    clobbering any stack already set up.  */
@@ -87,16 +109,48 @@ static char *stack_usage_map;
 
 /* Size of STACK_USAGE_MAP.  */
 static int highest_outgoing_arg_in_use;
+
+/* stack_arg_under_construction is nonzero when an argument may be
+   initialized with a constructor call (including a C function that
+   returns a BLKmode struct) and expand_call must take special action
+   to make sure the object being constructed does not overlap the
+   argument list for the constructor call.  */
+int stack_arg_under_construction;
 #endif
 
-static void store_one_arg ();
-extern enum machine_mode mode_for_size ();
+static int calls_function      PROTO((tree, int));
+static int calls_function_1    PROTO((tree, int));
+static void emit_call_1                PROTO((rtx, tree, int, int, rtx, rtx, int,
+                                      rtx, int));
+static void store_one_arg      PROTO ((struct arg_data *, rtx, int, int,
+                                       tree, int));
 \f
-/* Return 1 if EXP contains a call to the built-in function `alloca'.  */
+/* If WHICH is 1, return 1 if EXP contains a call to the built-in function
+   `alloca'.
+
+   If WHICH is 0, return 1 if EXP contains a call to any function.
+   Actually, we only need return 1 if evaluating EXP would require pushing
+   arguments on the stack, but that is too difficult to compute, so we just
+   assume any function call might require the stack.  */
+
+static tree calls_function_save_exprs;
 
 static int
-calls_alloca (exp)
+calls_function (exp, which)
      tree exp;
+     int which;
+{
+  int val;
+  calls_function_save_exprs = 0;
+  val = calls_function_1 (exp, which);
+  calls_function_save_exprs = 0;
+  return val;
+}
+
+static int
+calls_function_1 (exp, which)
+     tree exp;
+     int which;
 {
   register int i;
   int type = TREE_CODE_CLASS (TREE_CODE (exp));
@@ -104,18 +158,21 @@ calls_alloca (exp)
 
   /* Only expressions and references can contain calls.  */
 
-  if (type != 'e' && type != '<' && type != '1' && type != '2' && type != 'r')
+  if (type != 'e' && type != '<' && type != '1' && type != '2' && type != 'r'
+      && type != 'b')
     return 0;
 
   switch (TREE_CODE (exp))
     {
     case CALL_EXPR:
-      if (TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
-         && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
-             == FUNCTION_DECL)
-         && DECL_BUILT_IN (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
-         && (DECL_FUNCTION_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
-             == BUILT_IN_ALLOCA))
+      if (which == 0)
+       return 1;
+      else if (TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
+              && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
+                  == FUNCTION_DECL)
+              && DECL_BUILT_IN (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
+              && (DECL_FUNCTION_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
+                  == BUILT_IN_ALLOCA))
        return 1;
 
       /* Third operand is RTL.  */
@@ -125,13 +182,32 @@ calls_alloca (exp)
     case SAVE_EXPR:
       if (SAVE_EXPR_RTL (exp) != 0)
        return 0;
-      break;
+      if (value_member (exp, calls_function_save_exprs))
+       return 0;
+      calls_function_save_exprs = tree_cons (NULL_TREE, exp,
+                                            calls_function_save_exprs);
+      return (TREE_OPERAND (exp, 0) != 0
+             && calls_function_1 (TREE_OPERAND (exp, 0), which));
 
     case BLOCK:
-      /* Must not look at BLOCK_SUPERCONTEXT since it will point back to
-        us.  */
-      length = 3;
-      break;
+      {
+       register tree local;
+
+       for (local = BLOCK_VARS (exp); local; local = TREE_CHAIN (local))
+         if (DECL_INITIAL (local) != 0
+             && calls_function_1 (DECL_INITIAL (local), which))
+           return 1;
+      }
+      {
+       register tree subblock;
+
+       for (subblock = BLOCK_SUBBLOCKS (exp);
+            subblock;
+            subblock = TREE_CHAIN (subblock))
+         if (calls_function_1 (subblock, which))
+           return 1;
+      }
+      return 0;
 
     case METHOD_CALL_EXPR:
       length = 3;
@@ -147,7 +223,7 @@ calls_alloca (exp)
 
   for (i = 0; i < length; i++)
     if (TREE_OPERAND (exp, i) != 0
-       && calls_alloca (TREE_OPERAND (exp, i)))
+       && calls_function_1 (TREE_OPERAND (exp, i), which))
       return 1;
 
   return 0;
@@ -241,7 +317,7 @@ prepare_call_address (funexp, fndecl, use_insns)
 
    IS_CONST is true if this is a `const' call.  */
 
-void
+static void
 emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
             valreg, old_inhibit_defer_pop, use_insns, is_const)
      rtx funexp;
@@ -254,8 +330,8 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
      rtx use_insns;
      int is_const;
 {
-  rtx stack_size_rtx = gen_rtx (CONST_INT, VOIDmode, stack_size);
-  rtx struct_value_size_rtx = gen_rtx (CONST_INT, VOIDmode, struct_value_size);
+  rtx stack_size_rtx = GEN_INT (stack_size);
+  rtx struct_value_size_rtx = GEN_INT (struct_value_size);
   rtx call_insn;
   int already_popped = 0;
 
@@ -270,8 +346,7 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
   if (HAVE_call_pop && HAVE_call_value_pop
       && (RETURN_POPS_ARGS (funtype, stack_size) > 0 || stack_size == 0))
     {
-      rtx n_pop = gen_rtx (CONST_INT, VOIDmode, 
-                          RETURN_POPS_ARGS (funtype, stack_size));
+      rtx n_pop = GEN_INT (RETURN_POPS_ARGS (funtype, stack_size));
       rtx pat;
 
       /* If this subroutine pops its own args, record that in the call insn
@@ -297,7 +372,8 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
       if (valreg)
        emit_call_insn (gen_call_value (valreg,
                                        gen_rtx (MEM, FUNCTION_MODE, funexp),
-                                       stack_size_rtx, next_arg_reg));
+                                       stack_size_rtx, next_arg_reg,
+                                       NULL_RTX));
       else
        emit_call_insn (gen_call (gen_rtx (MEM, FUNCTION_MODE, funexp),
                                  stack_size_rtx, next_arg_reg,
@@ -323,6 +399,8 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
   if (is_const)
     CONST_CALL_P (call_insn) = 1;
 
+  /* Restore this now, so that we do defer pops for this call's args
+     if the context of the call as a whole permits.  */
   inhibit_defer_pop = old_inhibit_defer_pop;
 
 #ifndef ACCUMULATE_OUTGOING_ARGS
@@ -338,12 +416,12 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
       if (!already_popped)
        emit_insn (gen_rtx (CLOBBER, VOIDmode, stack_pointer_rtx));
       stack_size -= RETURN_POPS_ARGS (funtype, stack_size);
-      stack_size_rtx = gen_rtx (CONST_INT, VOIDmode, stack_size);
+      stack_size_rtx = GEN_INT (stack_size);
     }
 
   if (stack_size != 0)
     {
-      if (flag_defer_pop && inhibit_defer_pop == 0)
+      if (flag_defer_pop && inhibit_defer_pop == 0 && !is_const)
        pending_stack_adjust += stack_size;
       else
        adjust_stack (stack_size_rtx);
@@ -358,11 +436,10 @@ emit_call_1 (funexp, funtype, stack_size, struct_value_size, next_arg_reg,
    If IGNORE is nonzero, then we ignore the value of the function call.  */
 
 rtx
-expand_call (exp, target, ignore, modifier)
+expand_call (exp, target, ignore)
      tree exp;
      rtx target;
      int ignore;
-     enum expand_modifier modifier;
 {
   /* List of actual parameters.  */
   tree actparms = TREE_OPERAND (exp, 1);
@@ -416,6 +493,8 @@ expand_call (exp, target, ignore, modifier)
   CUMULATIVE_ARGS args_so_far;
   /* Nonzero if a reg parm has been scanned.  */
   int reg_parm_seen;
+  /* Nonzero if this is an indirect function call.  */
+  int current_call_is_indirect = 0;
 
   /* Nonzero if we must avoid push-insns in the args for this call. 
      If stack space is allocated for register parameters, but not by the
@@ -433,6 +512,9 @@ expand_call (exp, target, ignore, modifier)
 #endif
 #endif
 
+  /* Size of the stack reserved for parameter registers.  */
+  int reg_parm_stack_space = 0;
+
   /* 1 if scanning parms front to back, -1 if scanning back to front.  */
   int inc;
   /* Address of space preallocated for stack parms
@@ -447,8 +529,6 @@ expand_call (exp, target, ignore, modifier)
   int is_longjmp;
   /* Nonzero if this is a call to an inline function.  */
   int is_integrable = 0;
-  /* Nonzero if this is a call to __builtin_new.  */
-  int is_builtin_new;
   /* Nonzero if this is a call to a `const' function.
      Note that only explicitly named functions are handled as `const' here.  */
   int is_const = 0;
@@ -468,13 +548,14 @@ expand_call (exp, target, ignore, modifier)
 
   rtx old_stack_level = 0;
   int old_pending_adj;
+  int old_stack_arg_under_construction;
   int old_inhibit_defer_pop = inhibit_defer_pop;
   tree old_cleanups = cleanups_this_call;
 
   rtx use_insns = 0;
 
   register tree p;
-  register int i;
+  register int i, j;
 
   /* See if we can find a DECL-node for the actual function.
      As a result, decide whether this is a call to an integrable function.  */
@@ -498,12 +579,13 @@ expand_call (exp, target, ignore, modifier)
            is_integrable = 1;
          else if (! TREE_ADDRESSABLE (fndecl))
            {
-             /* In case this function later becomes inlineable,
+             /* In case this function later becomes inlinable,
                 record that there was already a non-inline call to it.
 
                 Use abstraction instead of setting TREE_ADDRESSABLE
                 directly.  */
-             if (TREE_INLINE (fndecl) && extra_warnings && !flag_no_inline)
+             if (DECL_INLINE (fndecl) && extra_warnings && warn_inline
+                 && !flag_no_inline)
                warning_with_decl (fndecl, "can't inline call to `%s' which was declared inline");
              mark_addressable (fndecl);
            }
@@ -516,11 +598,20 @@ expand_call (exp, target, ignore, modifier)
 
   is_volatile = TYPE_VOLATILE (TREE_TYPE (TREE_TYPE (p)));
 
+#ifdef REG_PARM_STACK_SPACE
+#ifdef MAYBE_REG_PARM_STACK_SPACE
+  reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
+#else
+  reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
+#endif
+#endif
+
   /* Warn if this value is an aggregate type,
      regardless of which calling convention we are using for it.  */
   if (warn_aggregate_return
       && (TREE_CODE (TREE_TYPE (exp)) == RECORD_TYPE
          || TREE_CODE (TREE_TYPE (exp)) == UNION_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == QUAL_UNION_TYPE
          || TREE_CODE (TREE_TYPE (exp)) == ARRAY_TYPE))
     warning ("function call has aggregate value");
 
@@ -533,34 +624,33 @@ expand_call (exp, target, ignore, modifier)
       is_const = 0;
 
 #ifdef PCC_STATIC_STRUCT_RETURN
-      if (flag_pcc_struct_return)
-       {
-         pcc_struct_value = 1;
-         is_integrable = 0;  /* Easier than making that case work right.  */
-       }
-      else
-#endif
-       {
-         struct_value_size = int_size_in_bytes (TREE_TYPE (exp));
+      {
+       pcc_struct_value = 1;
+       is_integrable = 0;  /* Easier than making that case work right.  */
+      }
+#else /* not PCC_STATIC_STRUCT_RETURN */
+      {
+       struct_value_size = int_size_in_bytes (TREE_TYPE (exp));
 
-         if (struct_value_size < 0)
-           abort ();
+       if (struct_value_size < 0)
+         abort ();
 
-         if (target && GET_CODE (target) == MEM)
-           structure_value_addr = XEXP (target, 0);
-         else
-           {
-             /* Assign a temporary on the stack to hold the value.  */
+       if (target && GET_CODE (target) == MEM)
+         structure_value_addr = XEXP (target, 0);
+       else
+         {
+           /* Assign a temporary on the stack to hold the value.  */
 
-             /* For variable-sized objects, we must be called with a target
-                specified.  If we were to allocate space on the stack here,
-                we would have no way of knowing when to free it.  */
+           /* For variable-sized objects, we must be called with a target
+              specified.  If we were to allocate space on the stack here,
+              we would have no way of knowing when to free it.  */
 
-             structure_value_addr
-               = XEXP (assign_stack_temp (BLKmode, struct_value_size, 1), 0);
-             target = 0;
-           }
-       }
+           structure_value_addr
+             = XEXP (assign_stack_temp (BLKmode, struct_value_size, 1), 0);
+           target = 0;
+         }
+      }
+#endif /* not PCC_STATIC_STRUCT_RETURN */
     }
 
   /* If called function is inline, try to integrate it.  */
@@ -568,13 +658,14 @@ expand_call (exp, target, ignore, modifier)
   if (is_integrable)
     {
       rtx temp;
+      rtx before_call = get_last_insn ();
 
       temp = expand_inline_function (fndecl, actparms, target,
                                     ignore, TREE_TYPE (exp),
                                     structure_value_addr);
 
       /* If inlining succeeded, return.  */
-      if ((int) temp != -1)
+      if ((HOST_WIDE_INT) temp != -1)
        {
          /* Perform all cleanups needed for the arguments of this call
             (i.e. destructors in C++).  It is ok if these destructors
@@ -583,6 +674,63 @@ expand_call (exp, target, ignore, modifier)
             care to never return that register directly.  */
          expand_cleanups_to (old_cleanups);
 
+#ifdef ACCUMULATE_OUTGOING_ARGS
+         /* If the outgoing argument list must be preserved, push
+            the stack before executing the inlined function if it
+            makes any calls.  */
+
+         for (i = reg_parm_stack_space - 1; i >= 0; i--)
+           if (i < highest_outgoing_arg_in_use && stack_usage_map[i] != 0)
+             break;
+
+         if (stack_arg_under_construction || i >= 0)
+           {
+             rtx insn = NEXT_INSN (before_call), seq;
+
+             /* Look for a call in the inline function code.
+                If OUTGOING_ARGS_SIZE (DECL_SAVED_INSNS (fndecl)) is
+                nonzero then there is a call and it is not necessary
+                to scan the insns.  */
+
+             if (OUTGOING_ARGS_SIZE (DECL_SAVED_INSNS (fndecl)) == 0)
+               for (; insn; insn = NEXT_INSN (insn))
+                 if (GET_CODE (insn) == CALL_INSN)
+                   break;
+
+             if (insn)
+               {
+                 /* Reserve enough stack space so that the largest
+                    argument list of any function call in the inline
+                    function does not overlap the argument list being
+                    evaluated.  This is usually an overestimate because
+                    allocate_dynamic_stack_space reserves space for an
+                    outgoing argument list in addition to the requested
+                    space, but there is no way to ask for stack space such
+                    that an argument list of a certain length can be
+                    safely constructed.  */
+
+                 int adjust = OUTGOING_ARGS_SIZE (DECL_SAVED_INSNS (fndecl));
+#ifdef REG_PARM_STACK_SPACE
+                 /* Add the stack space reserved for register arguments
+                    in the inline function.  What is really needed is the
+                    largest value of reg_parm_stack_space in the inline
+                    function, but that is not available.  Using the current
+                    value of reg_parm_stack_space is wrong, but gives
+                    correct results on all supported machines.  */
+                 adjust += reg_parm_stack_space;
+#endif
+                 start_sequence ();
+                 emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
+                 allocate_dynamic_stack_space (GEN_INT (adjust),
+                                               NULL_RTX, BITS_PER_UNIT);
+                 seq = get_insns ();
+                 end_sequence ();
+                 emit_insns_before (seq, NEXT_INSN (before_call));
+                 emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
+               }
+           }
+#endif
+
          /* If the result is equivalent to TARGET, return TARGET to simplify
             checks in store_expr.  They can be equivalent but not equal in the
             case of a function that returns BLKmode.  */
@@ -606,6 +754,15 @@ expand_call (exp, target, ignore, modifier)
   if (fndecl && DECL_NAME (fndecl))
     name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
 
+  /* On some machines (such as the PA) indirect calls have a different
+     calling convention than normal calls.  FUNCTION_ARG in the target
+     description can look at current_call_is_indirect to determine which
+     calling convention to use.  */
+  current_call_is_indirect = (fndecl == 0);
+#if 0
+    = TREE_CODE (TREE_OPERAND (exp, 0)) == NON_LVALUE_EXPR ? 1 : 0;
+#endif
+
 #if 0
   /* Unless it's a call to a specific function that isn't alloca,
      if it has one argument, we must assume it might be alloca.  */
@@ -665,11 +822,6 @@ expand_call (exp, target, ignore, modifier)
        is_longjmp = 1;
     }
 
-  is_builtin_new
-    = (name != 0
-       && IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 13
-       && (!strcmp (name, "__builtin_new")));
-
   if (may_be_alloca)
     current_function_calls_alloca = 1;
 
@@ -692,16 +844,26 @@ expand_call (exp, target, ignore, modifier)
   push_temp_slots ();
 
   /* Start updating where the next arg would go.  */
-  INIT_CUMULATIVE_ARGS (args_so_far, funtype, 0);
+  INIT_CUMULATIVE_ARGS (args_so_far, funtype, NULL_RTX);
 
   /* If struct_value_rtx is 0, it means pass the address
      as if it were an extra parameter.  */
   if (structure_value_addr && struct_value_rtx == 0)
     {
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      /* If the stack will be adjusted, make sure the structure address
+        does not refer to virtual_outgoing_args_rtx.  */
+      rtx temp = (stack_arg_under_construction
+                 ? copy_addr_to_reg (structure_value_addr)
+                 : force_reg (Pmode, structure_value_addr));
+#else
+      rtx temp = force_reg (Pmode, structure_value_addr);
+#endif
+
       actparms
        = tree_cons (error_mark_node,
                     make_tree (build_pointer_type (TREE_TYPE (funtype)),
-                               force_reg (Pmode, structure_value_addr)),
+                               temp),
                     actparms);
       structure_value_addr_parm = 1;
     }
@@ -757,6 +919,7 @@ expand_call (exp, target, ignore, modifier)
   for (p = actparms, argpos = 0; p; p = TREE_CHAIN (p), i += inc, argpos++)
     {
       tree type = TREE_TYPE (TREE_VALUE (p));
+      enum machine_mode mode;
 
       args[i].tree_value = TREE_VALUE (p);
 
@@ -783,49 +946,87 @@ expand_call (exp, target, ignore, modifier)
       if (FUNCTION_ARG_PASS_BY_REFERENCE (args_so_far, TYPE_MODE (type), type,
                                          argpos < n_named_args))
        {
-         /* We make a copy of the object and pass the address to the function
-            being called.  */
-         int size = int_size_in_bytes (type);
-         rtx copy;
-
-         if (size < 0)
+#ifdef FUNCTION_ARG_CALLEE_COPIES
+         if (FUNCTION_ARG_CALLEE_COPIES (args_so_far, TYPE_MODE (type), type,
+                                         argpos < n_named_args)
+             /* If it's in a register, we must make a copy of it too.  */
+             /* ??? Is this a sufficient test?  Is there a better one? */
+             && !(TREE_CODE (args[i].tree_value) == VAR_DECL
+                  && REG_P (DECL_RTL (args[i].tree_value))))
+           {
+             args[i].tree_value = build1 (ADDR_EXPR,
+                                          build_pointer_type (type),
+                                          args[i].tree_value);
+             type = build_pointer_type (type);
+           }
+         else
+#endif
            {
-             /* This is a variable-sized object.  Make space on the stack
-                for it.  */
-             rtx size_rtx = expand_expr (size_in_bytes (type), 0,
-                                         VOIDmode, 0);
+             /* We make a copy of the object and pass the address to the
+                function being called.  */
+             rtx copy;
 
-             if (old_stack_level == 0)
+             if (TYPE_SIZE (type) == 0
+                 || TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
                {
-                 old_stack_level = copy_to_mode_reg (Pmode, stack_pointer_rtx);
-                 old_pending_adj = pending_stack_adjust;
-                 pending_stack_adjust = 0;
+                 /* This is a variable-sized object.  Make space on the stack
+                    for it.  */
+                 rtx size_rtx = expr_size (TREE_VALUE (p));
+
+                 if (old_stack_level == 0)
+                   {
+                     emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
+                     old_pending_adj = pending_stack_adjust;
+                     pending_stack_adjust = 0;
+                   }
+
+                 copy = gen_rtx (MEM, BLKmode,
+                                 allocate_dynamic_stack_space (size_rtx,
+                                                               NULL_RTX,
+                                                               TYPE_ALIGN (type)));
+               }
+             else
+               {
+                 int size = int_size_in_bytes (type);
+                 copy = assign_stack_temp (TYPE_MODE (type), size, 1);
                }
 
-             copy = gen_rtx (MEM, BLKmode,
-                             allocate_dynamic_stack_space (size_rtx, 0));
+             store_expr (args[i].tree_value, copy, 0);
+
+             args[i].tree_value = build1 (ADDR_EXPR,
+                                          build_pointer_type (type),
+                                          make_tree (type, copy));
+             type = build_pointer_type (type);
            }
-         else
-           copy = assign_stack_temp (TYPE_MODE (type), size, 1);
+       }
+#endif /* FUNCTION_ARG_PASS_BY_REFERENCE */
 
-         store_expr (args[i].tree_value, copy, 0);
+      mode = TYPE_MODE (type);
 
-         args[i].tree_value = build1 (ADDR_EXPR, build_pointer_type (type),
-                                      make_tree (type, copy));
-         type = build_pointer_type (type);
+#ifdef PROMOTE_FUNCTION_ARGS
+      /* Compute the mode in which the arg is actually to be extended to.  */
+      if (TREE_CODE (type) == INTEGER_TYPE || TREE_CODE (type) == ENUMERAL_TYPE
+         || TREE_CODE (type) == BOOLEAN_TYPE || TREE_CODE (type) == CHAR_TYPE
+         || TREE_CODE (type) == REAL_TYPE || TREE_CODE (type) == POINTER_TYPE
+         || TREE_CODE (type) == OFFSET_TYPE)
+       {
+         int unsignedp = TREE_UNSIGNED (type);
+         PROMOTE_MODE (mode, unsignedp, type);
+         args[i].unsignedp = unsignedp;
        }
 #endif
 
-      args[i].reg = FUNCTION_ARG (args_so_far, TYPE_MODE (type), type,
+      args[i].mode = mode;
+      args[i].reg = FUNCTION_ARG (args_so_far, mode, type,
                                  argpos < n_named_args);
 #ifdef FUNCTION_ARG_PARTIAL_NREGS
       if (args[i].reg)
        args[i].partial
-         = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, TYPE_MODE (type), type,
+         = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, mode, type,
                                        argpos < n_named_args);
 #endif
 
-      args[i].pass_on_stack = MUST_PASS_IN_STACK (TYPE_MODE (type), type);
+      args[i].pass_on_stack = MUST_PASS_IN_STACK (mode, type);
 
       /* If FUNCTION_ARG returned an (expr_list (nil) FOO), it means that
         we are to pass this arg in the register(s) designated by FOO, but
@@ -851,10 +1052,10 @@ expand_call (exp, target, ignore, modifier)
       /* Compute the stack-size of this argument.  */
       if (args[i].reg == 0 || args[i].partial != 0
 #ifdef REG_PARM_STACK_SPACE
-         || REG_PARM_STACK_SPACE (fndecl) > 0
+         || reg_parm_stack_space > 0
 #endif
          || args[i].pass_on_stack)
-       locate_and_pad_parm (TYPE_MODE (type), type,
+       locate_and_pad_parm (mode, type,
 #ifdef STACK_PARMS_IN_REG_PARM_AREA
                             1,
 #else
@@ -903,6 +1104,11 @@ expand_call (exp, target, ignore, modifier)
                            argpos < n_named_args);
     }
 
+#ifdef FINAL_REG_PARM_STACK_SPACE
+  reg_parm_stack_space = FINAL_REG_PARM_STACK_SPACE (args_size.constant,
+                                                    args_size.var);
+#endif
+      
   /* Compute the actual size of the argument block required.  The variable
      and constant sizes must be combined, the size may have to be rounded,
      and there may be a minimum required size.  */
@@ -927,7 +1133,7 @@ expand_call (exp, target, ignore, modifier)
 #endif
 
 #ifdef REG_PARM_STACK_SPACE
-      if (REG_PARM_STACK_SPACE (fndecl) > 0)
+      if (reg_parm_stack_space > 0)
        {
          args_size.var
            = size_binop (MAX_EXPR, args_size.var,
@@ -938,7 +1144,7 @@ expand_call (exp, target, ignore, modifier)
             the size of the block we need.  So make the adjustment.  */
          args_size.var
            = size_binop (MINUS_EXPR, args_size.var,
-                         size_int (REG_PARM_STACK_SPACE (fndecl)));
+                         size_int (reg_parm_stack_space));
 #endif
        }
 #endif
@@ -952,9 +1158,13 @@ expand_call (exp, target, ignore, modifier)
 
 #ifdef REG_PARM_STACK_SPACE
       args_size.constant = MAX (args_size.constant,
-                               REG_PARM_STACK_SPACE (fndecl));
+                               reg_parm_stack_space);
+#ifdef MAYBE_REG_PARM_STACK_SPACE
+      if (reg_parm_stack_space == 0)
+       args_size.constant = 0;
+#endif
 #ifndef OUTGOING_REG_PARM_STACK_SPACE
-      args_size.constant -= REG_PARM_STACK_SPACE (fndecl);
+      args_size.constant -= reg_parm_stack_space;
 #endif
 #endif
     }
@@ -999,7 +1209,8 @@ expand_call (exp, target, ignore, modifier)
              += int_size_in_bytes (TREE_TYPE (args[i].tree_value));
        }
 
-      if (copy_to_evaluate_size >= args_size.constant / 2)
+      if (copy_to_evaluate_size * 2 >= args_size.constant
+         && args_size.constant > 0)
        must_preallocate = 1;
     }
 
@@ -1024,14 +1235,28 @@ expand_call (exp, target, ignore, modifier)
      If a parameter contains a call to alloca and this function uses the
      stack, precompute the parameter.  */
 
+  /* If we preallocated the stack space, and some arguments must be passed
+     on the stack, then we must precompute any parameter which contains a
+     function call which will store arguments on the stack.
+     Otherwise, evaluating the parameter may clobber previous parameters
+     which have already been stored into the stack.  */
+
   for (i = 0; i < num_actuals; i++)
     if (is_const
        || ((args_size.var != 0 || args_size.constant != 0)
-           && calls_alloca (args[i].tree_value)))
+           && calls_function (args[i].tree_value, 1))
+       || (must_preallocate && (args_size.var != 0 || args_size.constant != 0)
+           && calls_function (args[i].tree_value, 0)))
       {
        args[i].initial_value = args[i].value
-         = expand_expr (args[i].tree_value, 0, VOIDmode, 0);
+         = expand_expr (args[i].tree_value, NULL_RTX, VOIDmode, 0);
+
+       if (GET_MODE (args[i].value ) != VOIDmode
+           && GET_MODE (args[i].value) != args[i].mode)
+         args[i].value = convert_to_mode (args[i].mode, args[i].value,
+                                          args[i].unsignedp);
        preserve_temp_slots (args[i].value);
+
        free_temp_slots ();
 
        /* ANSI doesn't require a sequence point here,
@@ -1051,9 +1276,16 @@ expand_call (exp, target, ignore, modifier)
     {
       if (old_stack_level == 0)
        {
-         old_stack_level = copy_to_mode_reg (Pmode, stack_pointer_rtx);
+         emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
          old_pending_adj = pending_stack_adjust;
          pending_stack_adjust = 0;
+#ifdef ACCUMULATE_OUTGOING_ARGS
+         /* stack_arg_under_construction says whether a stack arg is
+            being constructed at the old stack level.  Pushing the stack
+            gets a clean outgoing argument block.  */
+         old_stack_arg_under_construction = stack_arg_under_construction;
+         stack_arg_under_construction = 0;
+#endif
        }
       argblock = push_block (ARGS_SIZE_RTX (args_size), 0, 0);
     }
@@ -1089,7 +1321,7 @@ expand_call (exp, target, ignore, modifier)
       /* Since we will be writing into the entire argument area, the
         map must be allocated for its entire size, not just the part that
         is the responsibility of the caller.  */
-      needed += REG_PARM_STACK_SPACE (fndecl);
+      needed += reg_parm_stack_space;
 #endif
 
 #ifdef ARGS_GROW_DOWNWARD
@@ -1108,10 +1340,13 @@ expand_call (exp, target, ignore, modifier)
        bzero (&stack_usage_map[initial_highest_arg_in_use],
               highest_outgoing_arg_in_use - initial_highest_arg_in_use);
       needed = 0;
-      /* No need to copy this virtual register; the space we're
-        using gets preallocated at the start of the function
-        so the stack pointer won't change here.  */
+
+      /* The address of the outgoing argument list must not be copied to a
+        register here, because argblock would be left pointing to the
+        wrong place after the call to allocate_dynamic_stack_space below. */
+
       argblock = virtual_outgoing_args_rtx;
+
 #else /* not ACCUMULATE_OUTGOING_ARGS */
       if (inhibit_defer_pop == 0)
        {
@@ -1133,7 +1368,7 @@ expand_call (exp, target, ignore, modifier)
       if (needed == 0)
        argblock = virtual_outgoing_args_rtx;
       else
-       argblock = push_block (gen_rtx (CONST_INT, VOIDmode, needed), 0, 0);
+       argblock = push_block (GEN_INT (needed), 0, 0);
 
       /* We only really need to call `copy_to_reg' in the case where push
         insns are going to be used to pass ARGBLOCK to a function
@@ -1145,6 +1380,46 @@ expand_call (exp, target, ignore, modifier)
 #endif /* not ACCUMULATE_OUTGOING_ARGS */
     }
 
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+  /* The save/restore code in store_one_arg handles all cases except one:
+     a constructor call (including a C function returning a BLKmode struct)
+     to initialize an argument.  */
+  if (stack_arg_under_construction)
+    {
+#if defined(REG_PARM_STACK_SPACE) && ! defined(OUTGOING_REG_PARM_STACK_SPACE)
+      rtx push_size = GEN_INT (reg_parm_stack_space + args_size.constant);
+#else
+      rtx push_size = GEN_INT (args_size.constant);
+#endif
+      if (old_stack_level == 0)
+       {
+         emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
+         old_pending_adj = pending_stack_adjust;
+         pending_stack_adjust = 0;
+         /* stack_arg_under_construction says whether a stack arg is
+            being constructed at the old stack level.  Pushing the stack
+            gets a clean outgoing argument block.  */
+         old_stack_arg_under_construction = stack_arg_under_construction;
+         stack_arg_under_construction = 0;
+         /* Make a new map for the new argument list.  */
+         stack_usage_map = (char *)alloca (highest_outgoing_arg_in_use);
+         bzero (stack_usage_map, highest_outgoing_arg_in_use);
+         highest_outgoing_arg_in_use = 0;
+       }
+      allocate_dynamic_stack_space (push_size, NULL_RTX, BITS_PER_UNIT);
+    }
+  /* If argument evaluation might modify the stack pointer, copy the
+     address of the argument list to a register.  */
+  for (i = 0; i < num_actuals; i++)
+    if (args[i].pass_on_stack)
+      {
+       argblock = copy_addr_to_reg (argblock);
+       break;
+      }
+#endif
+
+
   /* If we preallocated stack space, compute the address of each argument.
      We need not ensure it is a valid memory address here; it will be 
      validized when it is used.  */
@@ -1172,8 +1447,7 @@ expand_call (exp, target, ignore, modifier)
            addr = gen_rtx (PLUS, Pmode, arg_reg, offset);
 
          addr = plus_constant (addr, arg_offset);
-         args[i].stack
-           = gen_rtx (MEM, TYPE_MODE (TREE_TYPE (args[i].tree_value)), addr);
+         args[i].stack = gen_rtx (MEM, args[i].mode, addr);
 
          if (GET_CODE (slot_offset) == CONST_INT)
            addr = plus_constant (arg_reg, INTVAL (slot_offset));
@@ -1181,8 +1455,7 @@ expand_call (exp, target, ignore, modifier)
            addr = gen_rtx (PLUS, Pmode, arg_reg, slot_offset);
 
          addr = plus_constant (addr, arg_offset);
-         args[i].stack_slot
-           = gen_rtx (MEM, TYPE_MODE (TREE_TYPE (args[i].tree_value)), addr);
+         args[i].stack_slot = gen_rtx (MEM, args[i].mode, addr);
        }
     }
                                               
@@ -1191,9 +1464,8 @@ expand_call (exp, target, ignore, modifier)
   /* If we push args individually in reverse order, perform stack alignment
      before the first push (the last arg).  */
   if (argblock == 0)
-    anti_adjust_stack (gen_rtx (CONST_INT, VOIDmode,
-                               (args_size.constant
-                                - original_args_size.constant)));
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
 #endif
 #endif
 
@@ -1204,12 +1476,22 @@ expand_call (exp, target, ignore, modifier)
 
   /* Get the function to call, in the form of RTL.  */
   if (fndecl)
-    /* Get a SYMBOL_REF rtx for the function address.  */
-    funexp = XEXP (DECL_RTL (fndecl), 0);
+    {
+      /* If this is the first use of the function, see if we need to
+        make an external definition for it.  */
+      if (! TREE_USED (fndecl))
+       {
+         assemble_external (fndecl);
+         TREE_USED (fndecl) = 1;
+       }
+
+      /* Get a SYMBOL_REF rtx for the function address.  */
+      funexp = XEXP (DECL_RTL (fndecl), 0);
+    }
   else
     /* Generate an rtx (probably a pseudo-register) for the address.  */
     {
-      funexp = expand_expr (TREE_OPERAND (exp, 0), 0, VOIDmode, 0);
+      funexp = expand_expr (TREE_OPERAND (exp, 0), NULL_RTX, VOIDmode, 0);
       free_temp_slots ();      /* FUNEXP can't be BLKmode */
       emit_queue ();
     }
@@ -1236,7 +1518,8 @@ expand_call (exp, target, ignore, modifier)
 
        if (args[i].value == 0)
          {
-           args[i].value = expand_expr (args[i].tree_value, 0, VOIDmode, 0);
+           args[i].value = expand_expr (args[i].tree_value, NULL_RTX,
+                                        VOIDmode, 0);
            preserve_temp_slots (args[i].value);
            free_temp_slots ();
 
@@ -1244,6 +1527,14 @@ expand_call (exp, target, ignore, modifier)
               but PCC has one, so this will avoid some problems.  */
            emit_queue ();
          }
+
+       /* If we are to promote the function arg to a wider mode,
+          do it now.  */
+
+       if (GET_MODE (args[i].value) != VOIDmode
+           && GET_MODE (args[i].value) != args[i].mode)
+         args[i].value = convert_to_mode (args[i].mode, args[i].value,
+                                          args[i].unsignedp);
       }
 
 #if defined(ACCUMULATE_OUTGOING_ARGS) && defined(REG_PARM_STACK_SPACE)
@@ -1253,7 +1544,11 @@ expand_call (exp, target, ignore, modifier)
 
      Here we compute the boundary of the that needs to be saved, if any.  */
 
-  for (i = 0; i < REG_PARM_STACK_SPACE (fndecl); i++)
+#ifdef ARGS_GROW_DOWNWARD
+  for (i = 0; i < reg_parm_stack_space + 1; i++)
+#else
+  for (i = 0; i < reg_parm_stack_space; i++)
+#endif
     {
       if (i >=  highest_outgoing_arg_in_use
          || stack_usage_map[i] == 0)
@@ -1279,13 +1574,20 @@ expand_call (exp, target, ignore, modifier)
 
       stack_area = gen_rtx (MEM, save_mode,
                            memory_address (save_mode,
+                                           
+#ifdef ARGS_GROW_DOWNWARD
+                                           plus_constant (argblock,
+                                                          - high_to_save)
+#else
                                            plus_constant (argblock,
-                                                          low_to_save)));
+                                                          low_to_save)
+#endif
+                                           ));
       if (save_mode == BLKmode)
        {
          save_area = assign_stack_temp (BLKmode, num_to_save, 1);
          emit_block_move (validize_mem (save_area), stack_area,
-                          gen_rtx (CONST_INT, VOIDmode, num_to_save),
+                          GEN_INT (num_to_save),
                           PARM_BOUNDARY / BITS_PER_UNIT);
        }
       else
@@ -1306,7 +1608,64 @@ expand_call (exp, target, ignore, modifier)
   for (i = 0; i < num_actuals; i++)
     if (args[i].reg == 0 || args[i].pass_on_stack)
       store_one_arg (&args[i], argblock, may_be_alloca,
-                    args_size.var != 0, fndecl);
+                    args_size.var != 0, fndecl, reg_parm_stack_space);
+
+#ifdef STRICT_ALIGNMENT
+  /* If we have a parm that is passed in registers but not in memory
+     and whose alignment does not permit a direct copy into registers,
+     make a group of pseudos that correspond to each register that we
+     will later fill.  */
+
+  for (i = 0; i < num_actuals; i++)
+    if (args[i].reg != 0 && ! args[i].pass_on_stack
+       && args[i].mode == BLKmode
+       && (TYPE_ALIGN (TREE_TYPE (args[i].tree_value))
+           < MIN (BIGGEST_ALIGNMENT, BITS_PER_WORD)))
+      {
+       int bytes = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
+
+       args[i].n_aligned_regs
+         = args[i].partial ? args[i].partial
+           : (bytes + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD;
+
+       args[i].aligned_regs = (rtx *) alloca (sizeof (rtx)
+                                              * args[i].n_aligned_regs);
+
+       for (j = 0; j < args[i].n_aligned_regs; j++)
+         {
+           rtx reg = gen_reg_rtx (word_mode);
+           rtx word = operand_subword_force (args[i].value, j, BLKmode);
+           int bitsize = TYPE_ALIGN (TREE_TYPE (args[i].tree_value));
+           int bitpos;
+
+           args[i].aligned_regs[j] = reg;
+
+           /* Clobber REG and move each partword into it.  Ensure we don't
+              go past the end of the structure.  Note that the loop below
+              works because we've already verified that padding
+              and endianness are compatible.  */
+
+           emit_insn (gen_rtx (CLOBBER, VOIDmode, reg));
+
+           for (bitpos = 0;
+                bitpos < BITS_PER_WORD && bytes > 0;
+                bitpos += bitsize, bytes -= bitsize / BITS_PER_UNIT)
+             {
+               int xbitpos = (BYTES_BIG_ENDIAN
+                              ? BITS_PER_WORD - bitpos - bitsize
+                              : bitpos);
+
+               store_bit_field (reg, bitsize, xbitpos, word_mode,
+                                extract_bit_field (word, bitsize, xbitpos, 1,
+                                                   NULL_RTX, word_mode,
+                                                   word_mode,
+                                                   bitsize / BITS_PER_UNIT,
+                                                   BITS_PER_WORD),
+                                bitsize / BITS_PER_UNIT, BITS_PER_WORD);
+             }
+         }
+      }
+#endif
 
   /* Now store any partially-in-registers parm.
      This is the last place a block-move can happen.  */
@@ -1314,25 +1673,33 @@ expand_call (exp, target, ignore, modifier)
     for (i = 0; i < num_actuals; i++)
       if (args[i].partial != 0 && ! args[i].pass_on_stack)
        store_one_arg (&args[i], argblock, may_be_alloca,
-                      args_size.var != 0, fndecl);
+                      args_size.var != 0, fndecl, reg_parm_stack_space);
 
 #ifndef PUSH_ARGS_REVERSED
 #ifdef STACK_BOUNDARY
   /* If we pushed args in forward order, perform stack alignment
      after pushing the last arg.  */
   if (argblock == 0)
-    anti_adjust_stack (gen_rtx (CONST_INT, VOIDmode,
-                               (args_size.constant
-                                - original_args_size.constant)));
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
 #endif
 #endif
 
+  /* If register arguments require space on the stack and stack space
+     was not preallocated, allocate stack space here for arguments
+     passed in registers.  */
+#if ! defined(ACCUMULATE_OUTGOING_ARGS) && defined(OUTGOING_REG_PARM_STACK_SPACE)
+  if (must_preallocate == 0 && reg_parm_stack_space > 0)
+    anti_adjust_stack (GEN_INT (reg_parm_stack_space));
+#endif
+
   /* Pass the function the address in which to return a structure value.  */
   if (structure_value_addr && ! structure_value_addr_parm)
     {
       emit_move_insn (struct_value_rtx,
                      force_reg (Pmode,
-                                force_operand (structure_value_addr, 0)));
+                                force_operand (structure_value_addr,
+                                               NULL_RTX)));
       if (GET_CODE (struct_value_rtx) == REG)
        {
          push_to_sequence (use_insns);
@@ -1380,10 +1747,21 @@ expand_call (exp, target, ignore, modifier)
 
          if (nregs == 0)
            emit_move_insn (reg, args[i].value);
+
+#ifdef STRICT_ALIGNMENT
+         /* If we have pre-computed the values to put in the registers in
+            the case of non-aligned structures, copy them in now.  */
+
+         else if (args[i].n_aligned_regs != 0)
+           for (j = 0; j < args[i].n_aligned_regs; j++)
+             emit_move_insn (gen_rtx (REG, word_mode, REGNO (reg) + j),
+                             args[i].aligned_regs[j]);
+#endif
+
          else if (args[i].partial == 0 || args[i].pass_on_stack)
            move_block_to_reg (REGNO (reg),
                               validize_mem (args[i].value), nregs,
-                              TYPE_MODE (TREE_TYPE (args[i].tree_value)));
+                              args[i].mode);
        
          push_to_sequence (use_insns);
          if (nregs == 0)
@@ -1459,14 +1837,6 @@ expand_call (exp, target, ignore, modifier)
   if (is_volatile || is_longjmp)
     emit_barrier ();
 
-  /* For calls to __builtin_new, note that it can never return 0.
-     This is because a new handler will be called, and 0 it not
-     among the numbers it is supposed to return.  */
-#if 0
-  if (is_builtin_new)
-    emit_note (name, NOTE_INSN_BUILTIN_NEW);
-#endif
-
   /* If value type not void, return an rtx for the value.  */
 
   /* If there are cleanups to be called, don't use a hard reg as target.  */
@@ -1483,16 +1853,41 @@ expand_call (exp, target, ignore, modifier)
   else if (structure_value_addr)
     {
       if (target == 0 || GET_CODE (target) != MEM)
-       target = gen_rtx (MEM, TYPE_MODE (TREE_TYPE (exp)),
-                         memory_address (TYPE_MODE (TREE_TYPE (exp)),
-                                         structure_value_addr));
+       {
+         target = gen_rtx (MEM, TYPE_MODE (TREE_TYPE (exp)),
+                           memory_address (TYPE_MODE (TREE_TYPE (exp)),
+                                           structure_value_addr));
+         MEM_IN_STRUCT_P (target)
+           = (TREE_CODE (TREE_TYPE (exp)) == ARRAY_TYPE
+              || TREE_CODE (TREE_TYPE (exp)) == RECORD_TYPE
+              || TREE_CODE (TREE_TYPE (exp)) == UNION_TYPE
+              || TREE_CODE (TREE_TYPE (exp)) == QUAL_UNION_TYPE);
+       }
     }
   else if (pcc_struct_value)
     {
       if (target == 0)
-       target = gen_rtx (MEM, TYPE_MODE (TREE_TYPE (exp)),
-                         copy_to_reg (valreg));
-      else if (TYPE_MODE (TREE_TYPE (exp)) != BLKmode)
+       {
+         /* We used leave the value in the location that it is
+            returned in, but that causes problems if it is used more
+            than once in one expression.  Rather than trying to track
+            when a copy is required, we always copy when TARGET is
+            not specified.  This calling sequence is only used on
+            a few machines and TARGET is usually nonzero.  */
+         if (TYPE_MODE (TREE_TYPE (exp)) == BLKmode)
+           {
+             target = assign_stack_temp (BLKmode,
+                                         int_size_in_bytes (TREE_TYPE (exp)),
+                                         0);
+
+             /* Save this temp slot around the pop below.  */
+             preserve_temp_slots (target);
+           }
+         else
+           target = gen_reg_rtx (TYPE_MODE (TREE_TYPE (exp)));
+       }
+
+      if (TYPE_MODE (TREE_TYPE (exp)) != BLKmode)
        emit_move_insn (target, gen_rtx (MEM, TYPE_MODE (TREE_TYPE (exp)),
                                         copy_to_reg (valreg)));
       else
@@ -1500,7 +1895,8 @@ expand_call (exp, target, ignore, modifier)
                         expr_size (exp),
                         TYPE_ALIGN (TREE_TYPE (exp)) / BITS_PER_UNIT);
     }
-  else if (target && GET_MODE (target) == TYPE_MODE (TREE_TYPE (exp)))
+  else if (target && GET_MODE (target) == TYPE_MODE (TREE_TYPE (exp))
+          && GET_MODE (target) == GET_MODE (valreg))
     /* TARGET and VALREG cannot be equal at this point because the latter
        would not have REG_FUNCTION_VALUE_P true, while the former would if
        it were referring to the same register.
@@ -1511,18 +1907,53 @@ expand_call (exp, target, ignore, modifier)
   else
     target = copy_to_reg (valreg);
 
+#ifdef PROMOTE_FUNCTION_RETURN
+  /* If we promoted this return value, make the proper SUBREG.  TARGET
+     might be const0_rtx here, so be careful.  */
+  if (GET_CODE (target) == REG
+      && GET_MODE (target) != TYPE_MODE (TREE_TYPE (exp)))
+    {
+      enum machine_mode mode = TYPE_MODE (TREE_TYPE (exp));
+      int unsignedp = TREE_UNSIGNED (TREE_TYPE (exp));
+
+      if (TREE_CODE (TREE_TYPE (exp)) == INTEGER_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == ENUMERAL_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == BOOLEAN_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == CHAR_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == REAL_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE
+         || TREE_CODE (TREE_TYPE (exp)) == OFFSET_TYPE)
+       {
+         PROMOTE_MODE (mode, unsignedp, TREE_TYPE (exp));
+       }
+
+      /* If we didn't promote as expected, something is wrong.  */
+      if (mode != GET_MODE (target))
+       abort ();
+
+      target = gen_rtx (SUBREG, TYPE_MODE (TREE_TYPE (exp)), target, 0);
+      SUBREG_PROMOTED_VAR_P (target) = 1;
+      SUBREG_PROMOTED_UNSIGNED_P (target) = unsignedp;
+    }
+#endif
+
   /* Perform all cleanups needed for the arguments of this call
      (i.e. destructors in C++).  */
   expand_cleanups_to (old_cleanups);
 
-  /* If size of args is variable, restore saved stack-pointer value.  */
+  /* If size of args is variable or this was a constructor call for a stack
+     argument, restore saved stack-pointer value.  */
 
   if (old_stack_level)
     {
-      emit_move_insn (stack_pointer_rtx, old_stack_level);
+      emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
       pending_stack_adjust = old_pending_adj;
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      stack_arg_under_construction = old_stack_arg_under_construction;
+      highest_outgoing_arg_in_use = initial_highest_arg_in_use;
+      stack_usage_map = initial_stack_usage_map;
+#endif
     }
-
 #ifdef ACCUMULATE_OUTGOING_ARGS
   else
     {
@@ -1533,15 +1964,19 @@ expand_call (exp, target, ignore, modifier)
          rtx stack_area
            = gen_rtx (MEM, save_mode,
                       memory_address (save_mode,
-                                      plus_constant (argblock, low_to_save)));
+#ifdef ARGS_GROW_DOWNWARD
+                                      plus_constant (argblock, - high_to_save)
+#else
+                                      plus_constant (argblock, low_to_save)
+#endif
+                                      ));
 
          if (save_mode != BLKmode)
            emit_move_insn (stack_area, save_area);
          else
            emit_block_move (stack_area, validize_mem (save_area),
-                            gen_rtx (CONST_INT, VOIDmode,
-                                     high_to_save - low_to_save + 1,
-                                     PARM_BOUNDARY / BITS_PER_UNIT));
+                            GEN_INT (high_to_save - low_to_save + 1),
+                            PARM_BOUNDARY / BITS_PER_UNIT);
        }
 #endif
          
@@ -1559,8 +1994,7 @@ expand_call (exp, target, ignore, modifier)
              emit_move_insn (stack_area, args[i].save_area);
            else
              emit_block_move (stack_area, validize_mem (args[i].save_area),
-                              gen_rtx (CONST_INT, VOIDmode,
-                                       args[i].size.constant),
+                              GEN_INT (args[i].size.constant),
                               PARM_BOUNDARY / BITS_PER_UNIT);
          }
 
@@ -1569,15 +2003,620 @@ expand_call (exp, target, ignore, modifier)
     }
 #endif
 
-  /* If this was alloca, record the new stack level for nonlocal gotos.  */
-  if (may_be_alloca && nonlocal_goto_stack_level != 0)
-    emit_move_insn (nonlocal_goto_stack_level, stack_pointer_rtx);
+  /* If this was alloca, record the new stack level for nonlocal gotos.  
+     Check for the handler slots since we might not have a save area
+     for non-local gotos. */
+
+  if (may_be_alloca && nonlocal_goto_handler_slot != 0)
+    emit_stack_save (SAVE_NONLOCAL, &nonlocal_goto_stack_level, NULL_RTX);
 
   pop_temp_slots ();
 
   return target;
 }
 \f
+/* Output a library call to function FUN (a SYMBOL_REF rtx)
+   (emitting the queue unless NO_QUEUE is nonzero),
+   for a value of mode OUTMODE,
+   with NARGS different arguments, passed as alternating rtx values
+   and machine_modes to convert them to.
+   The rtx values should have been passed through protect_from_queue already.
+
+   NO_QUEUE will be true if and only if the library call is a `const' call
+   which will be enclosed in REG_LIBCALL/REG_RETVAL notes; it is equivalent
+   to the variable is_const in expand_call.
+
+   NO_QUEUE must be true for const calls, because if it isn't, then
+   any pending increment will be emitted between REG_LIBCALL/REG_RETVAL notes,
+   and will be lost if the libcall sequence is optimized away.
+
+   NO_QUEUE must be false for non-const calls, because if it isn't, the
+   call insn will have its CONST_CALL_P bit set, and it will be incorrectly
+   optimized.  For instance, the instruction scheduler may incorrectly
+   move memory references across the non-const call.  */
+
+void
+emit_library_call (va_alist)
+     va_dcl
+{
+  va_list p;
+  /* Total size in bytes of all the stack-parms scanned so far.  */
+  struct args_size args_size;
+  /* Size of arguments before any adjustments (such as rounding).  */
+  struct args_size original_args_size;
+  register int argnum;
+  enum machine_mode outmode;
+  int nargs;
+  rtx fun;
+  rtx orgfun;
+  int inc;
+  int count;
+  rtx argblock = 0;
+  CUMULATIVE_ARGS args_so_far;
+  struct arg { rtx value; enum machine_mode mode; rtx reg; int partial;
+              struct args_size offset; struct args_size size; };
+  struct arg *argvec;
+  int old_inhibit_defer_pop = inhibit_defer_pop;
+  int no_queue = 0;
+  rtx use_insns;
+  /* library calls are never indirect calls.  */
+  int current_call_is_indirect = 0;
+
+  va_start (p);
+  orgfun = fun = va_arg (p, rtx);
+  no_queue = va_arg (p, int);
+  outmode = va_arg (p, enum machine_mode);
+  nargs = va_arg (p, int);
+
+  /* Copy all the libcall-arguments out of the varargs data
+     and into a vector ARGVEC.
+
+     Compute how to pass each argument.  We only support a very small subset
+     of the full argument passing conventions to limit complexity here since
+     library functions shouldn't have many args.  */
+
+  argvec = (struct arg *) alloca (nargs * sizeof (struct arg));
+
+  INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun);
+
+  args_size.constant = 0;
+  args_size.var = 0;
+
+  for (count = 0; count < nargs; count++)
+    {
+      rtx val = va_arg (p, rtx);
+      enum machine_mode mode = va_arg (p, enum machine_mode);
+
+      /* We cannot convert the arg value to the mode the library wants here;
+        must do it earlier where we know the signedness of the arg.  */
+      if (mode == BLKmode
+         || (GET_MODE (val) != mode && GET_MODE (val) != VOIDmode))
+       abort ();
+
+      /* On some machines, there's no way to pass a float to a library fcn.
+        Pass it as a double instead.  */
+#ifdef LIBGCC_NEEDS_DOUBLE
+      if (LIBGCC_NEEDS_DOUBLE && mode == SFmode)
+       val = convert_to_mode (DFmode, val, 0), mode = DFmode;
+#endif
+
+      /* There's no need to call protect_from_queue, because
+        either emit_move_insn or emit_push_insn will do that.  */
+
+      /* Make sure it is a reasonable operand for a move or push insn.  */
+      if (GET_CODE (val) != REG && GET_CODE (val) != MEM
+         && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
+       val = force_operand (val, NULL_RTX);
+
+      argvec[count].value = val;
+      argvec[count].mode = mode;
+
+#ifdef FUNCTION_ARG_PASS_BY_REFERENCE
+      if (FUNCTION_ARG_PASS_BY_REFERENCE (args_so_far, mode, NULL_TREE, 1))
+       abort ();
+#endif
+
+      argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
+      if (argvec[count].reg && GET_CODE (argvec[count].reg) == EXPR_LIST)
+       abort ();
+#ifdef FUNCTION_ARG_PARTIAL_NREGS
+      argvec[count].partial
+       = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, mode, NULL_TREE, 1);
+#else
+      argvec[count].partial = 0;
+#endif
+
+      locate_and_pad_parm (mode, NULL_TREE,
+                          argvec[count].reg && argvec[count].partial == 0,
+                          NULL_TREE, &args_size, &argvec[count].offset,
+                          &argvec[count].size);
+
+      if (argvec[count].size.var)
+       abort ();
+
+#ifndef REG_PARM_STACK_SPACE
+      if (argvec[count].partial)
+       argvec[count].size.constant -= argvec[count].partial * UNITS_PER_WORD;
+#endif
+
+      if (argvec[count].reg == 0 || argvec[count].partial != 0
+#ifdef REG_PARM_STACK_SPACE
+         || 1
+#endif
+         )
+       args_size.constant += argvec[count].size.constant;
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      /* If this arg is actually passed on the stack, it might be
+        clobbering something we already put there (this library call might
+        be inside the evaluation of an argument to a function whose call
+        requires the stack).  This will only occur when the library call
+        has sufficient args to run out of argument registers.  Abort in
+        this case; if this ever occurs, code must be added to save and
+        restore the arg slot.  */
+
+      if (argvec[count].reg == 0 || argvec[count].partial != 0)
+       abort ();
+#endif
+
+      FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree)0, 1);
+    }
+  va_end (p);
+
+  /* If this machine requires an external definition for library
+     functions, write one out.  */
+  assemble_external_libcall (fun);
+
+  original_args_size = args_size;
+#ifdef STACK_BOUNDARY
+  args_size.constant = (((args_size.constant + (STACK_BYTES - 1))
+                        / STACK_BYTES) * STACK_BYTES);
+#endif
+
+#ifdef REG_PARM_STACK_SPACE
+  args_size.constant = MAX (args_size.constant,
+                           REG_PARM_STACK_SPACE (NULL_TREE));
+#ifndef OUTGOING_REG_PARM_STACK_SPACE
+  args_size.constant -= REG_PARM_STACK_SPACE (NULL_TREE);
+#endif
+#endif
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+  if (args_size.constant > current_function_outgoing_args_size)
+    current_function_outgoing_args_size = args_size.constant;
+  args_size.constant = 0;
+#endif
+
+#ifndef PUSH_ROUNDING
+  argblock = push_block (GEN_INT (args_size.constant), 0, 0);
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+#ifdef STACK_BOUNDARY
+  /* If we push args individually in reverse order, perform stack alignment
+     before the first push (the last arg).  */
+  if (argblock == 0)
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
+#endif
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+  inc = -1;
+  argnum = nargs - 1;
+#else
+  inc = 1;
+  argnum = 0;
+#endif
+
+  /* Push the args that need to be pushed.  */
+
+  for (count = 0; count < nargs; count++, argnum += inc)
+    {
+      register enum machine_mode mode = argvec[argnum].mode;
+      register rtx val = argvec[argnum].value;
+      rtx reg = argvec[argnum].reg;
+      int partial = argvec[argnum].partial;
+
+      if (! (reg != 0 && partial == 0))
+       emit_push_insn (val, mode, NULL_TREE, NULL_RTX, 0, partial, reg, 0,
+                       argblock, GEN_INT (argvec[count].offset.constant));
+      NO_DEFER_POP;
+    }
+
+#ifndef PUSH_ARGS_REVERSED
+#ifdef STACK_BOUNDARY
+  /* If we pushed args in forward order, perform stack alignment
+     after pushing the last arg.  */
+  if (argblock == 0)
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
+#endif
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+  argnum = nargs - 1;
+#else
+  argnum = 0;
+#endif
+
+  /* Now load any reg parms into their regs.  */
+
+  for (count = 0; count < nargs; count++, argnum += inc)
+    {
+      register enum machine_mode mode = argvec[argnum].mode;
+      register rtx val = argvec[argnum].value;
+      rtx reg = argvec[argnum].reg;
+      int partial = argvec[argnum].partial;
+
+      if (reg != 0 && partial == 0)
+       emit_move_insn (reg, val);
+      NO_DEFER_POP;
+    }
+
+  /* For version 1.37, try deleting this entirely.  */
+  if (! no_queue)
+    emit_queue ();
+
+  /* Any regs containing parms remain in use through the call.  */
+  start_sequence ();
+  for (count = 0; count < nargs; count++)
+    if (argvec[count].reg != 0)
+      emit_insn (gen_rtx (USE, VOIDmode, argvec[count].reg));
+
+  use_insns = get_insns ();
+  end_sequence ();
+
+  fun = prepare_call_address (fun, NULL_TREE, &use_insns);
+
+  /* Don't allow popping to be deferred, since then
+     cse'ing of library calls could delete a call and leave the pop.  */
+  NO_DEFER_POP;
+
+  /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
+     will set inhibit_defer_pop to that value.  */
+
+  emit_call_1 (fun, get_identifier (XSTR (orgfun, 0)), args_size.constant, 0,
+              FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
+              outmode != VOIDmode ? hard_libcall_value (outmode) : NULL_RTX,
+              old_inhibit_defer_pop + 1, use_insns, no_queue);
+
+  /* Now restore inhibit_defer_pop to its actual original value.  */
+  OK_DEFER_POP;
+}
+\f
+/* Like emit_library_call except that an extra argument, VALUE,
+   comes second and says where to store the result.
+   (If VALUE is zero, the result comes in the function value register.)  */
+
+void
+emit_library_call_value (va_alist)
+     va_dcl
+{
+  va_list p;
+  /* Total size in bytes of all the stack-parms scanned so far.  */
+  struct args_size args_size;
+  /* Size of arguments before any adjustments (such as rounding).  */
+  struct args_size original_args_size;
+  register int argnum;
+  enum machine_mode outmode;
+  int nargs;
+  rtx fun;
+  rtx orgfun;
+  int inc;
+  int count;
+  rtx argblock = 0;
+  CUMULATIVE_ARGS args_so_far;
+  struct arg { rtx value; enum machine_mode mode; rtx reg; int partial;
+              struct args_size offset; struct args_size size; };
+  struct arg *argvec;
+  int old_inhibit_defer_pop = inhibit_defer_pop;
+  int no_queue = 0;
+  rtx use_insns;
+  rtx value;
+  rtx mem_value = 0;
+  /* library calls are never indirect calls.  */
+  int current_call_is_indirect = 0;
+
+  va_start (p);
+  orgfun = fun = va_arg (p, rtx);
+  value = va_arg (p, rtx);
+  no_queue = va_arg (p, int);
+  outmode = va_arg (p, enum machine_mode);
+  nargs = va_arg (p, int);
+
+  /* If this kind of value comes back in memory,
+     decide where in memory it should come back.  */
+  if (RETURN_IN_MEMORY (type_for_mode (outmode, 0)))
+    {
+      if (GET_CODE (value) == MEM)
+       mem_value = value;
+      else
+       mem_value = assign_stack_temp (outmode, GET_MODE_SIZE (outmode), 0);
+    }
+
+  /* ??? Unfinished: must pass the memory address as an argument.  */
+
+  /* Copy all the libcall-arguments out of the varargs data
+     and into a vector ARGVEC.
+
+     Compute how to pass each argument.  We only support a very small subset
+     of the full argument passing conventions to limit complexity here since
+     library functions shouldn't have many args.  */
+
+  argvec = (struct arg *) alloca ((nargs + 1) * sizeof (struct arg));
+
+  INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun);
+
+  args_size.constant = 0;
+  args_size.var = 0;
+
+  count = 0;
+
+  /* If there's a structure value address to be passed,
+     either pass it in the special place, or pass it as an extra argument.  */
+  if (mem_value)
+    {
+      rtx addr = XEXP (mem_value, 0);
+
+      if (! struct_value_rtx)
+       {
+         nargs++;
+
+         /* Make sure it is a reasonable operand for a move or push insn.  */
+         if (GET_CODE (addr) != REG && GET_CODE (addr) != MEM
+             && ! (CONSTANT_P (addr) && LEGITIMATE_CONSTANT_P (addr)))
+           addr = force_operand (addr, NULL_RTX);
+
+         argvec[count].value = addr;
+         argvec[count].mode = outmode;
+         argvec[count].partial = 0;
+
+         argvec[count].reg = FUNCTION_ARG (args_so_far, outmode, NULL_TREE, 1);
+#ifdef FUNCTION_ARG_PARTIAL_NREGS
+         if (FUNCTION_ARG_PARTIAL_NREGS (args_so_far, outmode, NULL_TREE, 1))
+           abort ();
+#endif
+
+         locate_and_pad_parm (outmode, NULL_TREE,
+                              argvec[count].reg && argvec[count].partial == 0,
+                              NULL_TREE, &args_size, &argvec[count].offset,
+                              &argvec[count].size);
+
+
+         if (argvec[count].reg == 0 || argvec[count].partial != 0
+#ifdef REG_PARM_STACK_SPACE
+             || 1
+#endif
+             )
+           args_size.constant += argvec[count].size.constant;
+
+         FUNCTION_ARG_ADVANCE (args_so_far, outmode, (tree)0, 1);
+       }
+    }
+
+  for (; count < nargs; count++)
+    {
+      rtx val = va_arg (p, rtx);
+      enum machine_mode mode = va_arg (p, enum machine_mode);
+
+      /* We cannot convert the arg value to the mode the library wants here;
+        must do it earlier where we know the signedness of the arg.  */
+      if (mode == BLKmode
+         || (GET_MODE (val) != mode && GET_MODE (val) != VOIDmode))
+       abort ();
+
+      /* On some machines, there's no way to pass a float to a library fcn.
+        Pass it as a double instead.  */
+#ifdef LIBGCC_NEEDS_DOUBLE
+      if (LIBGCC_NEEDS_DOUBLE && mode == SFmode)
+       val = convert_to_mode (DFmode, val, 0), mode = DFmode;
+#endif
+
+      /* There's no need to call protect_from_queue, because
+        either emit_move_insn or emit_push_insn will do that.  */
+
+      /* Make sure it is a reasonable operand for a move or push insn.  */
+      if (GET_CODE (val) != REG && GET_CODE (val) != MEM
+         && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
+       val = force_operand (val, NULL_RTX);
+
+      argvec[count].value = val;
+      argvec[count].mode = mode;
+
+#ifdef FUNCTION_ARG_PASS_BY_REFERENCE
+      if (FUNCTION_ARG_PASS_BY_REFERENCE (args_so_far, mode, NULL_TREE, 1))
+       abort ();
+#endif
+
+      argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
+      if (argvec[count].reg && GET_CODE (argvec[count].reg) == EXPR_LIST)
+       abort ();
+#ifdef FUNCTION_ARG_PARTIAL_NREGS
+      argvec[count].partial
+       = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, mode, NULL_TREE, 1);
+#else
+      argvec[count].partial = 0;
+#endif
+
+      locate_and_pad_parm (mode, NULL_TREE,
+                          argvec[count].reg && argvec[count].partial == 0,
+                          NULL_TREE, &args_size, &argvec[count].offset,
+                          &argvec[count].size);
+
+      if (argvec[count].size.var)
+       abort ();
+
+#ifndef REG_PARM_STACK_SPACE
+      if (argvec[count].partial)
+       argvec[count].size.constant -= argvec[count].partial * UNITS_PER_WORD;
+#endif
+
+      if (argvec[count].reg == 0 || argvec[count].partial != 0
+#ifdef REG_PARM_STACK_SPACE
+         || 1
+#endif
+         )
+       args_size.constant += argvec[count].size.constant;
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      /* If this arg is actually passed on the stack, it might be
+        clobbering something we already put there (this library call might
+        be inside the evaluation of an argument to a function whose call
+        requires the stack).  This will only occur when the library call
+        has sufficient args to run out of argument registers.  Abort in
+        this case; if this ever occurs, code must be added to save and
+        restore the arg slot.  */
+
+      if (argvec[count].reg == 0 || argvec[count].partial != 0)
+       abort ();
+#endif
+
+      FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree)0, 1);
+    }
+  va_end (p);
+
+  /* If this machine requires an external definition for library
+     functions, write one out.  */
+  assemble_external_libcall (fun);
+
+  original_args_size = args_size;
+#ifdef STACK_BOUNDARY
+  args_size.constant = (((args_size.constant + (STACK_BYTES - 1))
+                        / STACK_BYTES) * STACK_BYTES);
+#endif
+
+#ifdef REG_PARM_STACK_SPACE
+  args_size.constant = MAX (args_size.constant,
+                           REG_PARM_STACK_SPACE (NULL_TREE));
+#ifndef OUTGOING_REG_PARM_STACK_SPACE
+  args_size.constant -= REG_PARM_STACK_SPACE (NULL_TREE);
+#endif
+#endif
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+  if (args_size.constant > current_function_outgoing_args_size)
+    current_function_outgoing_args_size = args_size.constant;
+  args_size.constant = 0;
+#endif
+
+#ifndef PUSH_ROUNDING
+  argblock = push_block (GEN_INT (args_size.constant), 0, 0);
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+#ifdef STACK_BOUNDARY
+  /* If we push args individually in reverse order, perform stack alignment
+     before the first push (the last arg).  */
+  if (argblock == 0)
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
+#endif
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+  inc = -1;
+  argnum = nargs - 1;
+#else
+  inc = 1;
+  argnum = 0;
+#endif
+
+  /* Push the args that need to be pushed.  */
+
+  for (count = 0; count < nargs; count++, argnum += inc)
+    {
+      register enum machine_mode mode = argvec[argnum].mode;
+      register rtx val = argvec[argnum].value;
+      rtx reg = argvec[argnum].reg;
+      int partial = argvec[argnum].partial;
+
+      if (! (reg != 0 && partial == 0))
+       emit_push_insn (val, mode, NULL_TREE, NULL_RTX, 0, partial, reg, 0,
+                       argblock, GEN_INT (argvec[count].offset.constant));
+      NO_DEFER_POP;
+    }
+
+#ifndef PUSH_ARGS_REVERSED
+#ifdef STACK_BOUNDARY
+  /* If we pushed args in forward order, perform stack alignment
+     after pushing the last arg.  */
+  if (argblock == 0)
+    anti_adjust_stack (GEN_INT (args_size.constant
+                               - original_args_size.constant));
+#endif
+#endif
+
+#ifdef PUSH_ARGS_REVERSED
+  argnum = nargs - 1;
+#else
+  argnum = 0;
+#endif
+
+  /* Now load any reg parms into their regs.  */
+
+  if (mem_value != 0 && struct_value_rtx != 0)
+    emit_move_insn (struct_value_rtx, XEXP (mem_value, 0));
+
+  for (count = 0; count < nargs; count++, argnum += inc)
+    {
+      register enum machine_mode mode = argvec[argnum].mode;
+      register rtx val = argvec[argnum].value;
+      rtx reg = argvec[argnum].reg;
+      int partial = argvec[argnum].partial;
+
+      if (reg != 0 && partial == 0)
+       emit_move_insn (reg, val);
+      NO_DEFER_POP;
+    }
+
+#if 0
+  /* For version 1.37, try deleting this entirely.  */
+  if (! no_queue)
+    emit_queue ();
+#endif
+
+  /* Any regs containing parms remain in use through the call.  */
+  start_sequence ();
+  for (count = 0; count < nargs; count++)
+    if (argvec[count].reg != 0)
+      emit_insn (gen_rtx (USE, VOIDmode, argvec[count].reg));
+
+  use_insns = get_insns ();
+  end_sequence ();
+
+  fun = prepare_call_address (fun, NULL_TREE, &use_insns);
+
+  /* Don't allow popping to be deferred, since then
+     cse'ing of library calls could delete a call and leave the pop.  */
+  NO_DEFER_POP;
+
+  /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
+     will set inhibit_defer_pop to that value.  */
+
+  emit_call_1 (fun, get_identifier (XSTR (orgfun, 0)), args_size.constant, 0,
+              FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
+              outmode != VOIDmode ? hard_libcall_value (outmode) : NULL_RTX,
+              old_inhibit_defer_pop + 1, use_insns, no_queue);
+
+  /* Now restore inhibit_defer_pop to its actual original value.  */
+  OK_DEFER_POP;
+
+  /* Copy the value to the right place.  */
+  if (outmode != VOIDmode)
+    {
+      if (mem_value)
+       {
+         if (value == 0)
+           value = hard_libcall_value (outmode);
+         if (value != mem_value)
+           emit_move_insn (value, mem_value);
+       }
+      else if (value != 0)
+       emit_move_insn (value, hard_libcall_value (outmode));
+    }
+}
+\f
 #if 0
 /* Return an rtx which represents a suitable home on the stack
    given TYPE, the type of the argument looking for a home.
@@ -1633,12 +2672,14 @@ target_for_arg (type, size, args_addr, offset)
    FNDECL is the declaration of the function we are calling.  */
 
 static void
-store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
+store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl,
+              reg_parm_stack_space)
      struct arg_data *arg;
      rtx argblock;
      int may_be_alloca;
      int variable_size;
      tree fndecl;
+     int reg_parm_stack_space;
 {
   register tree pval = arg->tree_value;
   rtx reg = 0;
@@ -1677,7 +2718,7 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
 #ifdef REG_PARM_STACK_SPACE
            /* Don't store things in the fixed argument area at this point;
               it has already been saved.  */
-           && i > REG_PARM_STACK_SPACE (fndecl)
+           && i > reg_parm_stack_space
 #endif
            )
          break;
@@ -1696,8 +2737,7 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
              arg->save_area = assign_stack_temp (BLKmode,
                                                  arg->size.constant, 1);
              emit_block_move (validize_mem (arg->save_area), stack_area,
-                              gen_rtx (CONST_INT, VOIDmode,
-                                       arg->size.constant),
+                              GEN_INT (arg->size.constant),
                               PARM_BOUNDARY / BITS_PER_UNIT);
            }
          else
@@ -1719,16 +2759,60 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
        this case.   */
     abort ();
 
+#ifdef STRICT_ALIGNMENT
+  /* If this arg needs special alignment, don't load the registers
+     here.  */
+  if (arg->n_aligned_regs != 0)
+    reg = 0;
+#endif
+  
   /* If this is being partially passed in a register, but multiple locations
      are specified, we assume that the one partially used is the one that is
      listed first.  */
   if (reg && GET_CODE (reg) == EXPR_LIST)
     reg = XEXP (reg, 0);
 
-  /* If this is being passes partially in a register, we can't evaluate
+  /* If this is being passed partially in a register, we can't evaluate
      it directly into its stack slot.  Otherwise, we can.  */
   if (arg->value == 0)
-    arg->value = expand_expr (pval, partial ? 0 : arg->stack, VOIDmode, 0);
+    {
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      /* stack_arg_under_construction is nonzero if a function argument is
+        being evaluated directly into the outgoing argument list and
+        expand_call must take special action to preserve the argument list
+        if it is called recursively.
+
+        For scalar function arguments stack_usage_map is sufficient to
+        determine which stack slots must be saved and restored.  Scalar
+        arguments in general have pass_on_stack == 0.
+
+        If this argument is initialized by a function which takes the
+        address of the argument (a C++ constructor or a C function
+        returning a BLKmode structure), then stack_usage_map is
+        insufficient and expand_call must push the stack around the
+        function call.  Such arguments have pass_on_stack == 1.
+
+        Note that it is always safe to set stack_arg_under_construction,
+        but this generates suboptimal code if set when not needed.  */
+
+      if (arg->pass_on_stack)
+       stack_arg_under_construction++;
+#endif
+      arg->value = expand_expr (pval, partial ? NULL_RTX : arg->stack,
+                               VOIDmode, 0);
+
+      /* If we are promoting object (or for any other reason) the mode
+        doesn't agree, convert the mode.  */
+
+      if (GET_MODE (arg->value) != VOIDmode
+         && GET_MODE (arg->value) != arg->mode)
+       arg->value = convert_to_mode (arg->mode, arg->value, arg->unsignedp);
+
+#ifdef ACCUMULATE_OUTGOING_ARGS
+      if (arg->pass_on_stack)
+       stack_arg_under_construction--;
+#endif
+    }
 
   /* Don't allow anything left on stack from computation
      of argument to alloca.  */
@@ -1738,7 +2822,7 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
   if (arg->value == arg->stack)
     /* If the value is already in the stack slot, we are done.  */
     ;
-  else if (TYPE_MODE (TREE_TYPE (pval)) != BLKmode)
+  else if (arg->mode != BLKmode)
     {
       register int size;
 
@@ -1752,7 +2836,7 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
         Note that in C the default argument promotions
         will prevent such mismatches.  */
 
-      size = GET_MODE_SIZE (TYPE_MODE (TREE_TYPE (pval)));
+      size = GET_MODE_SIZE (arg->mode);
       /* Compute how much space the push instruction will push.
         On many machines, pushing a byte will advance the stack
         pointer by a halfword.  */
@@ -1763,17 +2847,16 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
 
       /* Compute how much space the argument should get:
         round up to a multiple of the alignment for arguments.  */
-      if (none != FUNCTION_ARG_PADDING (TYPE_MODE (TREE_TYPE (pval)),
-                                       TREE_TYPE (pval)))
+      if (none != FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)))
        used = (((size + PARM_BOUNDARY / BITS_PER_UNIT - 1)
                 / (PARM_BOUNDARY / BITS_PER_UNIT))
                * (PARM_BOUNDARY / BITS_PER_UNIT));
 
       /* This isn't already where we want it on the stack, so put it there.
         This can either be done with push or copy insns.  */
-      emit_push_insn (arg->value, TYPE_MODE (TREE_TYPE (pval)),
-                     TREE_TYPE (pval), 0, 0, partial, reg,
-                     used - size, argblock, ARGS_SIZE_RTX (arg->offset));
+      emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), NULL_RTX,
+                     0, partial, reg, used - size,
+                     argblock, ARGS_SIZE_RTX (arg->offset));
     }
   else
     {
@@ -1796,16 +2879,14 @@ store_one_arg (arg, argblock, may_be_alloca, variable_size, fndecl)
        }
       else
        {
-         register tree size = size_in_bytes (TREE_TYPE (pval));
          /* PUSH_ROUNDING has no effect on us, because
             emit_push_insn for BLKmode is careful to avoid it.  */
-         excess = (arg->size.constant - TREE_INT_CST_LOW (size)
+         excess = (arg->size.constant - int_size_in_bytes (TREE_TYPE (pval))
                    + partial * UNITS_PER_WORD);
-         size_rtx = expand_expr (size, 0, VOIDmode, 0);
+         size_rtx = expr_size (pval);
        }
 
-      emit_push_insn (arg->value, TYPE_MODE (TREE_TYPE (pval)),
-                     TREE_TYPE (pval), size_rtx,
+      emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx,
                      TYPE_ALIGN (TREE_TYPE (pval)) / BITS_PER_UNIT, partial,
                      reg, excess, argblock, ARGS_SIZE_RTX (arg->offset));
     }