OSDN Git Service

* a29k.h, alpha.h, arc.h, arm.h, avr.h, clipper.h, convex.h,
[pf3gnuchains/gcc-fork.git] / gcc / config / i960 / i960.c
index f633462..6f29fdc 100644 (file)
@@ -1,5 +1,6 @@
 /* Subroutines used for code generation on intel 80960.
-   Copyright (C) 1992 Free Software Foundation, Inc.
+   Copyright (C) 1992, 1995, 1996, 1997, 1998, 1999, 2000, 2001
+   Free Software Foundation, Inc.
    Contributed by Steven McGeady, Intel Corp.
    Additional Work by Glenn Colon-Bonet, Jonathan Shapiro, Andy Wilson
    Converted to GCC 2.0 by Jim Wilson and Michael Tiemann, Cygnus Support.
@@ -18,28 +19,36 @@ GNU General Public License for more details.
 
 You should have received a copy of the GNU General Public License
 along with GNU CC; see the file COPYING.  If not, write to
-the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
-
-#include <stdio.h>
+the Free Software Foundation, 59 Temple Place - Suite 330,
+Boston, MA 02111-1307, USA.  */
 
 #include "config.h"
+#include "system.h"
+#include <math.h>
 #include "rtl.h"
 #include "regs.h"
 #include "hard-reg-set.h"
 #include "real.h"
 #include "insn-config.h"
 #include "conditions.h"
-#include "insn-flags.h"
 #include "output.h"
 #include "insn-attr.h"
 #include "flags.h"
 #include "tree.h"
-#include "insn-codes.h"
-#include "assert.h"
 #include "expr.h"
+#include "except.h"
 #include "function.h"
 #include "recog.h"
-#include <math.h>
+#include "toplev.h"
+#include "cpplib.h"
+#include "c-pragma.h"
+#include "c-lex.h"
+#include "tm_p.h"
+#include "target.h"
+#include "target-def.h"
+
+static void i960_output_function_prologue PARAMS ((FILE *, HOST_WIDE_INT));
+static void i960_output_function_epilogue PARAMS ((FILE *, HOST_WIDE_INT));
 
 /* Save the operands last given to a compare for use when we
    generate a scc or bcc insn.  */
@@ -49,8 +58,8 @@ rtx i960_compare_op0, i960_compare_op1;
 /* Used to implement #pragma align/noalign.  Initialized by OVERRIDE_OPTIONS
    macro in i960.h.  */
 
-static int i960_maxbitalignment;
-static int i960_last_maxbitalignment;
+int i960_maxbitalignment;
+int i960_last_maxbitalignment;
 
 /* Used to implement switching between MEM and ALU insn types, for better
    C series performance.  */
@@ -75,58 +84,25 @@ char epilogue_string[1000];
 
 static int ret_label = 0;
 
-#if 0
-/* Handle pragmas for compatibility with Intel's compilers.  */
-
-/* ??? This is incomplete, since it does not handle all pragmas that the
-   intel compilers understand.  Also, it needs to be rewritten to accept
-   a stream instead of a string for GCC 2.  */
-
-void
-process_pragma(str)
-     char  *str;
-{
-  int align;
-  int i;
-
-  if ((i = sscanf (str, " align %d", &align)) == 1)
-    switch (align)
-      {
-      case 0:                  /* Return to last alignment.  */
-        align = i960_last_maxbitalignment / 8;
-
-      case 16:                 /* Byte alignments. */
-      case 8:
-      case 4:
-      case 2:
-      case 1:
-        i960_last_maxbitalignment = i960_maxbitalignment;
-        i960_maxbitalignment = align * 8;
-        break;
-
-      default:                 /* Unknown, silently ignore.  */
-        break;
-      }
+/* This is true if FNDECL is either a varargs or a stdarg function.
+   This is used to help identify functions that use an argument block.  */
 
-  /* NOTE: ic960 R3.0 pragma align definition:
-
-     #pragma align [(size)] | (identifier=size[,...])
-     #pragma noalign [(identifier)[,...]]
-
-     (all parens are optional)
-
-     - size is [1,2,4,8,16]
-     - noalign means size==1
-     - applies only to component elements of a struct (and union?)
-     - identifier applies to structure tag (only)
-     - missing identifier means next struct
-
-     - alignment rules for bitfields need more investigation  */
+#define VARARGS_STDARG_FUNCTION(FNDECL)        \
+((TYPE_ARG_TYPES (TREE_TYPE (FNDECL)) != 0                                                   \
+  && (TREE_VALUE (tree_last (TYPE_ARG_TYPES (TREE_TYPE (FNDECL)))) != void_type_node))    \
+ || current_function_varargs)
+\f
+/* Initialize the GCC target structure.  */
+#undef TARGET_ASM_ALIGNED_SI_OP
+#define TARGET_ASM_ALIGNED_SI_OP "\t.word\t"
 
-  /* Should be pragma 'far' or equivalent for callx/balx here.  */
-}
-#endif
+#undef TARGET_ASM_FUNCTION_PROLOGUE
+#define TARGET_ASM_FUNCTION_PROLOGUE i960_output_function_prologue
+#undef TARGET_ASM_FUNCTION_EPILOGUE
+#define TARGET_ASM_FUNCTION_EPILOGUE i960_output_function_epilogue
 
+struct gcc_target targetm = TARGET_INITIALIZER;
+\f
 /* Initialize variables before compiling any files.  */
 
 void
@@ -177,6 +153,19 @@ arith_operand (op, mode)
   return (register_operand (op, mode) || literal (op, mode));
 }
 
+/* Return truth value of whether OP can be used as an operands in a three
+   address logic insn, possibly complementing OP, of mode MODE.  */
+
+int
+logic_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  return (register_operand (op, mode)
+         || (GET_CODE (op) == CONST_INT
+             && INTVAL(op) >= -32 && INTVAL(op) < 32));
+}
+
 /* Return true if OP is a register or a valid floating point literal.  */
 
 int
@@ -187,7 +176,7 @@ fp_arith_operand (op, mode)
   return (register_operand (op, mode) || fp_literal (op, mode));
 }
 
-/* Return true is OP is a register or a valid signed integer literal.  */
+/* Return true if OP is a register or a valid signed integer literal.  */
 
 int
 signed_arith_operand (op, mode)
@@ -197,13 +186,13 @@ signed_arith_operand (op, mode)
   return (register_operand (op, mode) || signed_literal (op, mode));
 }
 
-/* Return truth value of whether OP is a integer which fits the
+/* Return truth value of whether OP is an integer which fits the
    range constraining immediate operands in three-address insns.  */
 
 int
 literal (op, mode)
      rtx op;
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
   return ((GET_CODE (op) == CONST_INT) && INTVAL(op) >= 0 && INTVAL(op) < 32);
 }
@@ -215,8 +204,7 @@ fp_literal_one (op, mode)
      rtx op;
      enum machine_mode mode;
 {
-  return (TARGET_NUMERICS && (mode == VOIDmode || mode == GET_MODE (op))
-         && (op == CONST1_RTX (mode)));
+  return (TARGET_NUMERICS && mode == GET_MODE (op) && op == CONST1_RTX (mode));
 }
 
 /* Return true if OP is a float constant of 0.  */
@@ -226,8 +214,7 @@ fp_literal_zero (op, mode)
      rtx op;
      enum machine_mode mode;
 {
-  return (TARGET_NUMERICS && (mode == VOIDmode || mode == GET_MODE (op))
-         && (op == CONST0_RTX (mode)));
+  return (TARGET_NUMERICS && mode == GET_MODE (op) && op == CONST0_RTX (mode));
 }
 
 /* Return true if OP is a valid floating point literal.  */
@@ -245,7 +232,7 @@ fp_literal(op, mode)
 int
 signed_literal(op, mode)
      rtx op;
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
   return ((GET_CODE (op) == CONST_INT) && INTVAL(op) > -32 && INTVAL(op) < 32);
 }
@@ -256,7 +243,7 @@ signed_literal(op, mode)
 int
 symbolic_memory_operand (op, mode)
      rtx op;
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
   if (GET_CODE (op) == SUBREG)
     op = SUBREG_REG (op);
@@ -272,7 +259,7 @@ symbolic_memory_operand (op, mode)
 int
 eq_or_neq (op, mode)
      rtx op;
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
   return (GET_CODE (op) == EQ || GET_CODE (op) == NE);
 }
@@ -294,14 +281,28 @@ arith32_operand (op, mode)
 int
 power2_operand (op,mode)
      rtx op;
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
-  if (GET_CODE(op) != CONST_INT)
+  if (GET_CODE (op) != CONST_INT)
     return 0;
 
   return exact_log2 (INTVAL (op)) >= 0;
 }
 
+/* Return true if OP is an integer constant which is the complement of a
+   power of 2.  */
+
+int
+cmplpower2_operand (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+{
+  if (GET_CODE (op) != CONST_INT)
+    return 0;
+
+  return exact_log2 (~ INTVAL (op)) >= 0;
+}
+
 /* If VAL has only one bit set, return the index of that bit.  Otherwise
    return -1.  */
 
@@ -332,7 +333,7 @@ int
 is_mask (val)
      unsigned int val;
 {
-  register int start, end, i;
+  register int start, end = 0, i;
 
   start = -1;
   for (i = 0; val != 0; val >>= 1, i++)
@@ -412,7 +413,7 @@ bitstr (val, s, e)
 enum machine_mode
 select_cc_mode (op, x)
      RTX_CODE op;
-     rtx x;
+     rtx x ATTRIBUTE_UNUSED;
 {
   if (op == GTU || op == LTU || op == GEU || op == LEU)
     return CC_UNSmode;
@@ -440,9 +441,9 @@ gen_compare_reg (code, x, y)
        y = force_reg (SImode, y);
     }
 
-  cc_reg = gen_rtx (REG, ccmode, 36);
-  emit_insn (gen_rtx (SET, VOIDmode, cc_reg,
-                     gen_rtx (COMPARE, ccmode, x, y)));
+  cc_reg = gen_rtx_REG (ccmode, 36);
+  emit_insn (gen_rtx_SET (VOIDmode, cc_reg,
+                         gen_rtx_COMPARE (ccmode, x, y)));
 
   return cc_reg;
 }
@@ -462,6 +463,12 @@ i960_address_cost (x)
   if (GET_CODE (x) == REG)
     return 1;
 #endif
+  /* This is a MEMA operand -- it's free.  */
+  if (GET_CODE (x) == CONST_INT
+      && INTVAL (x) >= 0
+      && INTVAL (x) < 4096)
+    return 0;
+
   if (GET_CODE (x) == PLUS)
     {
       rtx base = XEXP (x, 0);
@@ -510,21 +517,237 @@ emit_move_sequence (operands, mode)
      rtx *operands;
      enum machine_mode mode;
 {
-  register rtx operand0 = operands[0];
-  register rtx operand1 = operands[1];
-
   /* We can only store registers to memory.  */
-
-  if (GET_CODE (operand0) == MEM && GET_CODE (operand1) != REG)
-    operands[1] = force_reg (mode, operand1);
+  
+  if (GET_CODE (operands[0]) == MEM && GET_CODE (operands[1]) != REG
+      && (operands[1] != const0_rtx || current_function_args_size
+         || current_function_varargs || current_function_stdarg
+         || rtx_equal_function_value_matters))
+    /* Here we use the same test as movsi+1 pattern -- see i960.md.  */
+    operands[1] = force_reg (mode, operands[1]);
+
+  /* Storing multi-word values in unaligned hard registers to memory may
+     require a scratch since we have to store them a register at a time and
+     adding 4 to the memory address may not yield a valid insn.  */
+  /* ??? We don't always need the scratch, but that would complicate things.
+     Maybe later.  */
+  /* ??? We must also handle stores to pseudos here, because the pseudo may be
+     replaced with a MEM later.  This would be cleaner if we didn't have
+     a separate pattern for unaligned DImode/TImode stores.  */
+  if (GET_MODE_SIZE (mode) > UNITS_PER_WORD
+      && (GET_CODE (operands[0]) == MEM
+         || (GET_CODE (operands[0]) == REG
+             && REGNO (operands[0]) >= FIRST_PSEUDO_REGISTER))
+      && GET_CODE (operands[1]) == REG
+      && REGNO (operands[1]) < FIRST_PSEUDO_REGISTER
+      && ! HARD_REGNO_MODE_OK (REGNO (operands[1]), mode))
+    {
+      emit_insn (gen_rtx_PARALLEL
+                (VOIDmode,
+                 gen_rtvec (2,
+                            gen_rtx_SET (VOIDmode, operands[0], operands[1]),
+                            gen_rtx_CLOBBER (VOIDmode,
+                                             gen_rtx_SCRATCH (Pmode)))));
+      return 1;
+    }
 
   return 0;
 }
+
+/* Output assembler to move a double word value.  */
+
+const char *
+i960_output_move_double (dst, src)
+     rtx dst, src;
+{
+  rtx operands[5];
+
+  if (GET_CODE (dst) == REG
+      && GET_CODE (src) == REG)
+    {
+      if ((REGNO (src) & 1)
+         || (REGNO (dst) & 1))
+       {
+         /* We normally copy the low-numbered register first.  However, if
+            the second source register is the same as the first destination
+            register, we must copy in the opposite order.  */
+         if (REGNO (src) + 1 == REGNO (dst))
+           return "mov %D1,%D0\n\tmov  %1,%0";
+         else
+           return "mov %1,%0\n\tmov    %D1,%D0";
+       }
+      else
+       return "movl    %1,%0";
+    }
+  else if (GET_CODE (dst) == REG
+          && GET_CODE (src) == CONST_INT
+          && CONST_OK_FOR_LETTER_P (INTVAL (src), 'I'))
+    {
+      if (REGNO (dst) & 1)
+       return "mov     %1,%0\n\tmov    0,%D0";
+      else
+       return "movl    %1,%0";
+    }
+  else if (GET_CODE (dst) == REG
+          && GET_CODE (src) == MEM)
+    {
+      if (REGNO (dst) & 1)
+       {
+         /* One can optimize a few cases here, but you have to be
+            careful of clobbering registers used in the address and
+            edge conditions.  */
+         operands[0] = dst;
+         operands[1] = src;
+         operands[2] = gen_rtx_REG (Pmode, REGNO (dst) + 1);
+         operands[3] = gen_rtx_MEM (word_mode, operands[2]);
+         operands[4] = adjust_address (operands[3], word_mode,
+                                       UNITS_PER_WORD);
+         output_asm_insn
+           ("lda       %1,%2\n\tld     %3,%0\n\tld     %4,%D0", operands);
+         return "";
+       }
+      else
+       return "ldl     %1,%0";
+    }
+  else if (GET_CODE (dst) == MEM
+          && GET_CODE (src) == REG)
+    {
+      if (REGNO (src) & 1)
+       {
+         operands[0] = dst;
+         operands[1] = adjust_address (dst, word_mode, UNITS_PER_WORD);
+         if (! memory_address_p (word_mode, XEXP (operands[1], 0)))
+           abort ();
+         operands[2] = src;
+         output_asm_insn ("st  %2,%0\n\tst     %D2,%1", operands);
+         return "";
+       }
+      return "stl      %1,%0";
+    }
+  else
+    abort ();
+}
+
+/* Output assembler to move a double word zero.  */
+
+const char *
+i960_output_move_double_zero (dst)
+     rtx dst;
+{
+  rtx operands[2];
+
+  operands[0] = dst;
+    {
+      operands[1] = adjust_address (dst, word_mode, 4);
+      output_asm_insn ("st     g14,%0\n\tst    g14,%1", operands);
+    }
+  return "";
+}
+
+/* Output assembler to move a quad word value.  */
+
+const char *
+i960_output_move_quad (dst, src)
+     rtx dst, src;
+{
+  rtx operands[7];
+
+  if (GET_CODE (dst) == REG
+      && GET_CODE (src) == REG)
+    {
+      if ((REGNO (src) & 3)
+         || (REGNO (dst) & 3))
+       {
+         /* We normally copy starting with the low numbered register.
+            However, if there is an overlap such that the first dest reg
+            is <= the last source reg but not < the first source reg, we
+            must copy in the opposite order.  */
+         if (REGNO (dst) <= REGNO (src) + 3
+             && REGNO (dst) >= REGNO (src))
+           return "mov %F1,%F0\n\tmov  %E1,%E0\n\tmov  %D1,%D0\n\tmov  %1,%0";
+         else
+           return "mov %1,%0\n\tmov    %D1,%D0\n\tmov  %E1,%E0\n\tmov  %F1,%F0";
+       }
+      else
+       return "movq    %1,%0";
+    }
+  else if (GET_CODE (dst) == REG
+          && GET_CODE (src) == CONST_INT
+          && CONST_OK_FOR_LETTER_P (INTVAL (src), 'I'))
+    {
+      if (REGNO (dst) & 3)
+       return "mov     %1,%0\n\tmov    0,%D0\n\tmov    0,%E0\n\tmov    0,%F0";
+      else
+       return "movq    %1,%0";
+    }
+  else if (GET_CODE (dst) == REG
+          && GET_CODE (src) == MEM)
+    {
+      if (REGNO (dst) & 3)
+       {
+         /* One can optimize a few cases here, but you have to be
+            careful of clobbering registers used in the address and
+            edge conditions.  */
+         operands[0] = dst;
+         operands[1] = src;
+         operands[2] = gen_rtx_REG (Pmode, REGNO (dst) + 3);
+         operands[3] = gen_rtx_MEM (word_mode, operands[2]);
+         operands[4]
+           = adjust_address (operands[3], word_mode, UNITS_PER_WORD);
+         operands[5]
+           = adjust_address (operands[4], word_mode, UNITS_PER_WORD);
+         operands[6]
+           = adjust_address (operands[5], word_mode, UNITS_PER_WORD);
+         output_asm_insn ("lda %1,%2\n\tld     %3,%0\n\tld     %4,%D0\n\tld    %5,%E0\n\tld    %6,%F0", operands);
+         return "";
+       }
+      else
+       return "ldq     %1,%0";
+    }
+  else if (GET_CODE (dst) == MEM
+          && GET_CODE (src) == REG)
+    {
+      if (REGNO (src) & 3)
+       {
+         operands[0] = dst;
+         operands[1] = adjust_address (dst, word_mode, UNITS_PER_WORD);
+         operands[2] = adjust_address (dst, word_mode, 2 * UNITS_PER_WORD);
+         operands[3] = adjust_address (dst, word_mode, 3 * UNITS_PER_WORD);
+         if (! memory_address_p (word_mode, XEXP (operands[3], 0)))
+           abort ();
+         operands[4] = src;
+         output_asm_insn ("st  %4,%0\n\tst     %D4,%1\n\tst    %E4,%2\n\tst    %F4,%3", operands);
+         return "";
+       }
+      return "stq      %1,%0";
+    }
+  else
+    abort ();
+}
+
+/* Output assembler to move a quad word zero.  */
+
+const char *
+i960_output_move_quad_zero (dst)
+     rtx dst;
+{
+  rtx operands[4];
+
+  operands[0] = dst;
+    {
+      operands[1] = adjust_address (dst, word_mode, 4);
+      operands[2] = adjust_address (dst, word_mode, 8);
+      operands[3] = adjust_address (dst, word_mode, 12);
+      output_asm_insn ("st     g14,%0\n\tst    g14,%1\n\tst    g14,%2\n\tst    g14,%3", operands);
+    }
+  return "";
+}
+
 \f
-/* Emit insns to load a constant.  Uses several strategies to try to use
-   as few insns as possible.  */
+/* Emit insns to load a constant to non-floating point registers.
+   Uses several strategies to try to use as few insns as possible.  */
 
-char *
+const char *
 i960_output_ldconst (dst, src)
      register rtx dst, src;
 {
@@ -532,7 +755,6 @@ i960_output_ldconst (dst, src)
   register unsigned rsrc2;
   enum machine_mode mode = GET_MODE (dst);
   rtx operands[4];
-  union { long l[2]; double d; } x;
 
   operands[0] = operands[2] = dst;
   operands[1] = operands[3] = src;
@@ -545,37 +767,65 @@ i960_output_ldconst (dst, src)
       output_asm_insn ("ldconst        %1,%0", operands);
       return "";
     }
-  else if (mode == DFmode)
+  else if (mode == XFmode)
     {
-      rtx first, second;
+      REAL_VALUE_TYPE d;
+      long value_long[3];
+      int i;
 
-      if (fp_literal_zero (src, VOIDmode))
+      if (fp_literal_zero (src, XFmode))
+       return "movt    0,%0";
+
+      REAL_VALUE_FROM_CONST_DOUBLE (d, src);
+      REAL_VALUE_TO_TARGET_LONG_DOUBLE (d, value_long);
+
+      output_asm_insn ("# ldconst      %1,%0",operands);
+
+      for (i = 0; i < 3; i++)
        {
-         if (FP_REG_P (dst))
-           return "movrl       %1,%0";
-         else
-           return "movl        0,%0";
+         operands[0] = gen_rtx_REG (SImode, REGNO (dst) + i);
+         operands[1] = GEN_INT (value_long[i]);
+         output_asm_insn (i960_output_ldconst (operands[0], operands[1]),
+                          operands);
        }
 
-#if HOST_FLOAT_FORMAT == TARGET_FLOAT_FORMAT
+      return ""; 
+   }
+  else if (mode == DFmode)
+    {
+      rtx first, second;
+
+      if (fp_literal_zero (src, DFmode))
+       return "movl    0,%0";
+
       split_double (src, &first, &second);
 
       output_asm_insn ("# ldconst      %1,%0",operands);
 
-      operands[0] = gen_rtx (REG, SImode, REGNO (dst));
+      operands[0] = gen_rtx_REG (SImode, REGNO (dst));
       operands[1] = first;
       output_asm_insn (i960_output_ldconst (operands[0], operands[1]),
                      operands);
-      operands[0] = gen_rtx (REG, SImode, REGNO (dst) + 1);
+      operands[0] = gen_rtx_REG (SImode, REGNO (dst) + 1);
       operands[1] = second;
       output_asm_insn (i960_output_ldconst (operands[0], operands[1]),
                      operands);
       return "";
-#else
-      if (fp_literal_one (src, VOIDmode))
-       return "movrl   0f1.0,%0";
-      fatal ("inline double constants not supported on this host");
-#endif
+    }
+  else if (mode == SFmode)
+    {
+      REAL_VALUE_TYPE d;
+      long value;
+
+      REAL_VALUE_FROM_CONST_DOUBLE (d, src);
+      REAL_VALUE_TO_TARGET_SINGLE (d, value);
+
+      output_asm_insn ("# ldconst      %1,%0",operands);
+      operands[0] = gen_rtx_REG (SImode, REGNO (dst));
+      operands[1] = GEN_INT (value);
+      output_asm_insn (i960_output_ldconst (operands[0], operands[1]),
+                     operands);
+      return "";
     }
   else if (mode == TImode)
     {
@@ -593,18 +843,10 @@ i960_output_ldconst (dst, src)
   else if (mode == DImode)
     {
       rtx upperhalf, lowerhalf, xoperands[2];
-      char *string;
 
-      if (GET_CODE (src) == CONST_DOUBLE)
-       {
-         upperhalf = gen_rtx (CONST_INT, VOIDmode, CONST_DOUBLE_HIGH (src));
-         lowerhalf = gen_rtx (CONST_INT, VOIDmode, CONST_DOUBLE_LOW (src));
-       }
-      else if (GET_CODE (src) == CONST_INT)
-       {
-         lowerhalf = src;
-         upperhalf = INTVAL (src) < 0 ? constm1_rtx : const0_rtx;
-       }
+      if (GET_CODE (src) == CONST_DOUBLE || GET_CODE (src) == CONST_INT)
+       split_double (src, &lowerhalf, &upperhalf);
+
       else
        abort ();
 
@@ -615,35 +857,12 @@ i960_output_ldconst (dst, src)
        return "movl    %1,%0";
 
       /* Output the upper half with a recursive call.  */
-      xoperands[0] = gen_rtx (REG, SImode, REGNO (dst) + 1);
+      xoperands[0] = gen_rtx_REG (SImode, REGNO (dst) + 1);
       xoperands[1] = upperhalf;
       output_asm_insn (i960_output_ldconst (xoperands[0], xoperands[1]),
                       xoperands);
       /* The lower word is emitted as normally.  */
     }
-  else if (mode == SFmode)
-    {
-#if HOST_FLOAT_FORMAT == TARGET_FLOAT_FORMAT
-      REAL_VALUE_TYPE d;
-      long value;
-
-      REAL_VALUE_FROM_CONST_DOUBLE (d, src);
-      REAL_VALUE_TO_TARGET_SINGLE (d, value);
-
-      output_asm_insn ("# ldconst      %1,%0",operands);
-      operands[0] = gen_rtx (REG, SImode, REGNO (dst));
-      operands[1] = gen_rtx (CONST_INT, VOIDmode, value);
-      output_asm_insn (i960_output_ldconst (operands[0], operands[1]),
-                     operands);
-#else
-      if (fp_literal_zero (src, VOIDmode))
-       return "movr    0f0.0,%0";
-      if (fp_literal_one (src, VOIDmode))
-       return "movr    0f1.0,%0";
-      fatal ("inline float constants not supported on this host");
-#endif
-      return "";
-    }
   else
     {
       rsrc1 = INTVAL (src);
@@ -674,7 +893,7 @@ i960_output_ldconst (dst, src)
        {
          if (i960_last_insn_type == I_TYPE_REG && TARGET_C_SERIES)
            return "lda %1,%0";
-         operands[1] = gen_rtx (CONST_INT, VOIDmode, rsrc1 - 31);
+         operands[1] = GEN_INT (rsrc1 - 31);
          output_asm_insn ("addo\t31,%1,%0\t# ldconst %3,%0", operands);
          return "";
        }
@@ -685,7 +904,7 @@ i960_output_ldconst (dst, src)
       if (rsrc1 >= -31)
        {
          /* return 'sub -(%1),0,%0' */
-         operands[1] = gen_rtx (CONST_INT, VOIDmode, - rsrc1);
+         operands[1] = GEN_INT (- rsrc1);
          output_asm_insn ("subo\t%1,0,%0\t# ldconst %3,%0", operands);
          return "";
        }
@@ -693,7 +912,7 @@ i960_output_ldconst (dst, src)
       /* ldconst       -32             ->      not     31,X  */
       if (rsrc1 == -32)
        {
-         operands[1] = gen_rtx (CONST_INT, VOIDmode, ~rsrc1);
+         operands[1] = GEN_INT (~rsrc1);
          output_asm_insn ("not\t%1,%0  # ldconst %3,%0", operands);
          return "";
        }
@@ -702,7 +921,7 @@ i960_output_ldconst (dst, src)
   /* If const is a single bit.  */
   if (bitpos (rsrc1) >= 0)
     {
-      operands[1] = gen_rtx (CONST_INT, VOIDmode, bitpos (rsrc1));
+      operands[1] = GEN_INT (bitpos (rsrc1));
       output_asm_insn ("setbit\t%1,0,%0\t# ldconst %3,%0", operands);
       return "";
     }
@@ -715,8 +934,8 @@ i960_output_ldconst (dst, src)
       if (bitstr (rsrc1, &s, &e) < 6)
        {
          rsrc2 = ((unsigned int) rsrc1) >> s;
-         operands[1] = gen_rtx (CONST_INT, VOIDmode, rsrc2);
-         operands[2] = gen_rtx (CONST_INT, VOIDmode, s);
+         operands[1] = GEN_INT (rsrc2);
+         operands[2] = GEN_INT (s);
          output_asm_insn ("shlo\t%2,%1,%0\t# ldconst %3,%0", operands);
          return "";
        }
@@ -782,7 +1001,7 @@ i960_bypass (insn, op1, op2, cmpbr_flag)
 void
 i960_function_name_declare (file, name, fndecl)
      FILE *file;
-     char *name;
+     const char *name;
      tree fndecl;
 {
   register int i, j;
@@ -806,16 +1025,16 @@ i960_function_name_declare (file, name, fndecl)
   else
     leaf_proc_ok = 0;
 
-  /* Even if nobody uses extra parms, can't have leafroc or tail calls if
+  /* Even if nobody uses extra parms, can't have leafproc or tail calls if
      argblock, because argblock uses g14 implicitly.  */
 
-  if (current_function_args_size != 0)
+  if (current_function_args_size != 0 || VARARGS_STDARG_FUNCTION (fndecl))
     {
       tail_call_ok = 0;
       leaf_proc_ok = 0;
     }
       
-  /* See if caller passes in an address to return value. */
+  /* See if caller passes in an address to return value.  */
 
   if (aggregate_value_p (DECL_RESULT (fndecl)))
     {
@@ -887,7 +1106,7 @@ i960_function_name_declare (file, name, fndecl)
   /* Do this after choosing the leaf return register, so it will be listed
      if one was chosen.  */
 
-  fprintf (file, "\t#  Function '%s'\n", name);
+  fprintf (file, "\t#  Function '%s'\n", (name[0] == '*' ? &name[1] : name));
   fprintf (file, "\t#  Registers used: ");
 
   for (i = 0, j = 0; i < FIRST_PSEUDO_REGISTER; i++)
@@ -911,12 +1130,14 @@ i960_function_name_declare (file, name, fndecl)
       /* Make it a leaf procedure.  */
 
       if (TREE_PUBLIC (fndecl))
-       fprintf (file,"\t.globl    %s.lf\n", name);
+       fprintf (file,"\t.globl\t%s.lf\n", (name[0] == '*' ? &name[1] : name));
 
-      fprintf (file, "\t.leafproc\t_%s,%s.lf\n", name, name);
-      fprintf (file, "_%s:\n", name);
-      fprintf (file, "\tlda    LR%d,g14\n", ret_label);
-      fprintf (file, "%s.lf:\n", name);
+      fprintf (file, "\t.leafproc\t");
+      assemble_name (file, name);
+      fprintf (file, ",%s.lf\n", (name[0] == '*' ? &name[1] : name));
+      ASM_OUTPUT_LABEL (file, name);
+      fprintf (file, "\tlda    Li960R%d,g14\n", ret_label);
+      fprintf (file, "%s.lf:\n", (name[0] == '*' ? &name[1] : name));
       fprintf (file, "\tmov    g14,g%d\n", i960_leaf_ret_reg);
 
       if (TARGET_C_SERIES)
@@ -944,8 +1165,7 @@ compute_frame_size (size)
      int size;
 {
   int actual_fsize;
-  int outgoing_args_size
-    = current_function_outgoing_args_size + current_function_pretend_args_size;
+  int outgoing_args_size = current_function_outgoing_args_size;
 
   /* The STARTING_FRAME_OFFSET is totally hidden to us as far
      as size is concerned.  */
@@ -955,99 +1175,196 @@ compute_frame_size (size)
   return actual_fsize;
 }
 
+/* Here register group is range of registers which can be moved by
+   one i960 instruction.  */
+
+struct reg_group
+{
+  char start_reg;
+  char length;
+};
+
+static int i960_form_reg_groups PARAMS ((int, int, int *, int, struct reg_group *));
+static int i960_reg_group_compare PARAMS ((const void *, const void *));
+static int i960_split_reg_group PARAMS ((struct reg_group *, int, int));
+static void i960_arg_size_and_align PARAMS ((enum machine_mode, tree, int *, int *));
+
+/* The following functions forms the biggest as possible register
+   groups with registers in STATE.  REGS contain states of the
+   registers in range [start, finish_reg).  The function returns the
+   number of groups formed.  */
+static int
+i960_form_reg_groups (start_reg, finish_reg, regs, state, reg_groups)
+     int start_reg;
+     int finish_reg;
+     int *regs;
+     int state;
+     struct reg_group *reg_groups;
+{
+  int i;
+  int nw = 0;
+
+  for (i = start_reg; i < finish_reg; )
+    {
+      if (regs [i] != state)
+       {
+         i++;
+         continue;
+       }
+      else if (i % 2 != 0 || regs [i + 1] != state)
+       reg_groups [nw].length = 1;
+      else if (i % 4 != 0 || regs [i + 2] != state)
+       reg_groups [nw].length = 2;
+      else if (regs [i + 3] != state)
+       reg_groups [nw].length = 3;
+      else
+       reg_groups [nw].length = 4;
+      reg_groups [nw].start_reg = i;
+      i += reg_groups [nw].length;
+      nw++;
+    }
+  return nw;
+}
+
+/* We sort register winodws in descending order by length.  */
+static int
+i960_reg_group_compare (group1, group2)
+     const void *group1;
+     const void *group2;
+{
+  const struct reg_group *w1 = group1;
+  const struct reg_group *w2 = group2;
+
+  if (w1->length > w2->length)
+    return -1;
+  else if (w1->length < w2->length)
+    return 1;
+  else
+    return 0;
+}
+
+/* Split the first register group in REG_GROUPS on subgroups one of
+   which will contain SUBGROUP_LENGTH registers.  The function
+   returns new number of winodws.  */
+static int
+i960_split_reg_group (reg_groups, nw, subgroup_length)
+     struct reg_group *reg_groups;
+     int nw;
+     int subgroup_length;
+{
+  if (subgroup_length < reg_groups->length - subgroup_length)
+    /* This guarantees correct alignments of the two subgroups for
+       i960 (see spliting for the group length 2, 3, 4).  More
+       generalized algorithm would require splitting the group more
+       two subgroups.  */
+    subgroup_length = reg_groups->length - subgroup_length;
+  /* More generalized algorithm would require to try merging
+     subgroups here.  But in case i960 it always results in failure
+     because of register group alignment.  */
+  reg_groups[nw].length = reg_groups->length - subgroup_length;
+  reg_groups[nw].start_reg = reg_groups->start_reg + subgroup_length;
+  nw++;
+  reg_groups->length = subgroup_length;
+  qsort (reg_groups, nw, sizeof (struct reg_group), i960_reg_group_compare);
+  return nw;
+}
+
 /* Output code for the function prologue.  */
 
-void
-i960_function_prologue (file, size)
+static void
+i960_output_function_prologue (file, size)
      FILE *file;
-     unsigned int size;
+     HOST_WIDE_INT size;
 {
   register int i, j, nr;
-  int n_iregs = 0;
-  int rsize = 0;
-  int actual_fsize, offset;
+  int n_saved_regs = 0;
+  int n_remaining_saved_regs;
+  HOST_WIDE_INT lvar_size;
+  HOST_WIDE_INT actual_fsize, offset;
+  int gnw, lnw;
+  struct reg_group *g, *l;
   char tmpstr[1000];
   /* -1 if reg must be saved on proc entry, 0 if available, 1 if saved
      somewhere.  */
   int regs[FIRST_PSEUDO_REGISTER];
+  /* All global registers (which must be saved) divided by groups.  */
+  struct reg_group global_reg_groups [16];
+  /* All local registers (which are available) divided by groups.  */
+  struct reg_group local_reg_groups [16];
+
 
   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
     if (regs_ever_live[i]
-       && ((! call_used_regs[i]) || (i > 7 && i < 12)))
+       && ((! call_used_regs[i]) || (i > 7 && i < 12))
+       /* No need to save the static chain pointer.  */
+       && ! (i == STATIC_CHAIN_REGNUM && current_function_needs_context))
       {
        regs[i] = -1;
         /* Count global registers that need saving.  */
        if (i < 16)
-         n_iregs++;
+         n_saved_regs++;
       }
     else
       regs[i] = 0;
 
+  n_remaining_saved_regs = n_saved_regs;
+
   epilogue_string[0] = '\0';
 
-  /* First look for local registers to save globals in.  */
-  for (i = 0; i < 16; i++)
+  if (current_function_profile)
     {
-      if (regs[i] == 0)
-       continue;
+      /* When profiling, we may use registers 20 to 27 to save arguments, so
+        they can't be used here for saving globals.  J is the number of
+        argument registers the mcount call will save.  */
+      for (j = 7; j >= 0 && ! regs_ever_live[j]; j--)
+       ;
 
-      /* Start at r4, not r3.  */
-      for (j = 20; j < 32; j++)
-       {
-         if (regs[j] != 0)
-           continue;
-
-         regs[i] = 1;
-         regs[j] = -1;
-         regs_ever_live[j] = 1;
-         nr = 1;
-         if (i <= 14 && i % 2 == 0 && j <= 30 && j % 2 == 0
-             && regs[i+1] != 0 && regs[j+1] == 0)
-           {
-             nr = 2;
-             regs[i+1] = 1;
-             regs[j+1] = -1;
-             regs_ever_live[j+1] = 1;
-           }
-         if (nr == 2 && i <= 12 && i % 4 == 0 && j <= 28 && j % 4 == 0
-             && regs[i+2] != 0 && regs[j+2] == 0)
-           {
-             nr = 3;
-             regs[i+2] = 1;
-             regs[j+2] = -1;
-             regs_ever_live[j+2] = 1;
-           }
-         if (nr == 3 && regs[i+3] != 0 && regs[j+3] == 0)
-           {
-             nr = 4;
-             regs[i+3] = 1;
-             regs[j+3] = -1;
-             regs_ever_live[j+3] = 1;
-           }
+      for (i = 20; i <= j + 20; i++)
+       regs[i] = -1;
+    }
 
+  gnw = i960_form_reg_groups (0, 16, regs, -1, global_reg_groups);
+  lnw = i960_form_reg_groups (19, 32, regs, 0, local_reg_groups);
+  qsort (global_reg_groups, gnw, sizeof (struct reg_group),
+        i960_reg_group_compare);
+  qsort (local_reg_groups, lnw, sizeof (struct reg_group),
+        i960_reg_group_compare);
+  for (g = global_reg_groups, l = local_reg_groups; lnw != 0 && gnw != 0;)
+    {
+      if (g->length == l->length)
+       {
          fprintf (file, "\tmov%s       %s,%s\n",
-                  ((nr == 4) ? "q" :
-                   (nr == 3) ? "t" :
-                   (nr == 2) ? "l" : ""),
-                  reg_names[i], reg_names[j]);
+                  ((g->length == 4) ? "q" :
+                   (g->length == 3) ? "t" :
+                   (g->length == 2) ? "l" : ""),
+                  reg_names[(unsigned char) g->start_reg],
+                  reg_names[(unsigned char) l->start_reg]);
          sprintf (tmpstr, "\tmov%s     %s,%s\n",
-                  ((nr == 4) ? "q" :
-                   (nr == 3) ? "t" :
-                   (nr == 2) ? "l" : ""),
-                  reg_names[j], reg_names[i]);
+                  ((g->length == 4) ? "q" :
+                   (g->length == 3) ? "t" :
+                   (g->length == 2) ? "l" : ""),
+                  reg_names[(unsigned char) l->start_reg],
+                  reg_names[(unsigned char) g->start_reg]);
          strcat (epilogue_string, tmpstr);
-
-         n_iregs -= nr;
-         i += nr-1;
-         break;
+         n_remaining_saved_regs -= g->length;
+         for (i = 0; i < g->length; i++)
+           {
+             regs [i + g->start_reg] = 1;
+             regs [i + l->start_reg] = -1;
+             regs_ever_live [i + l->start_reg] = 1;
+           }
+         g++;
+         l++;
+         gnw--;
+         lnw--;
        }
+      else if (g->length > l->length)
+       gnw = i960_split_reg_group (g, gnw, l->length);
+      else
+       lnw = i960_split_reg_group (l, lnw, g->length);
     }
 
-  /* N_iregs is now the number of global registers that haven't been saved
-     yet.  */
-
-  rsize = (n_iregs * 4);
-  actual_fsize = compute_frame_size (size) + rsize;
+  actual_fsize = compute_frame_size (size) + 4 * n_remaining_saved_regs;
 #if 0
   /* ??? The 1.2.1 compiler does this also.  This is meant to round the frame
      size up to the nearest multiple of 16.  I don't know whether this is
@@ -1060,6 +1377,34 @@ i960_function_prologue (file, size)
   actual_fsize = (actual_fsize + 15) & ~0xF;
 #endif
 
+  /* Check stack limit if necessary.  */
+  if (current_function_limit_stack)
+    {
+      rtx min_stack = stack_limit_rtx;
+      if (actual_fsize != 0)
+       min_stack = plus_constant (stack_limit_rtx, -actual_fsize);
+
+      /* Now, emulate a little bit of reload.  We want to turn 'min_stack'
+        into an arith_operand.  Use register 20 as the temporary.  */
+      if (legitimate_address_p (Pmode, min_stack, 1) 
+         && !arith_operand (min_stack, Pmode))
+       {
+         rtx tmp = gen_rtx_MEM (Pmode, min_stack);
+         fputs ("\tlda\t", file);
+         i960_print_operand (file, tmp, 0);
+         fputs (",r4\n", file);
+         min_stack = gen_rtx_REG (Pmode, 20);
+       }
+      if (arith_operand (min_stack, Pmode))
+       {
+         fputs ("\tcmpo\tsp,", file);
+         i960_print_operand (file, min_stack, 0);
+         fputs ("\n\tfaultge.f\n", file);
+       }
+      else
+       warning ("stack limit expression is not supported");
+    }
+
   /* Allocate space for register save and locals.  */
   if (actual_fsize > 0)
     {
@@ -1070,10 +1415,13 @@ i960_function_prologue (file, size)
     }
 
   /* Take hardware register save area created by the call instruction
-     into account.  */
-  offset = compute_frame_size (size) + 64;
+     into account, but store them before the argument block area.  */
+  lvar_size = actual_fsize - compute_frame_size (0) - n_remaining_saved_regs * 4;
+  offset = STARTING_FRAME_OFFSET + lvar_size;
   /* Save registers on stack if needed.  */
-  for (i = 0, j = n_iregs; j > 0 && i < 16; i++)
+  /* ??? Is it worth to use the same algorithm as one for saving
+     global registers in local registers? */
+  for (i = 0, j = n_remaining_saved_regs; j > 0 && i < 16; i++)
     {
       if (regs[i] != -1)
        continue;
@@ -1106,30 +1454,109 @@ i960_function_prologue (file, size)
       offset += nr * 4;
     }
 
-  if (actual_fsize == 0 && size == 0 && rsize == 0)
+  if (actual_fsize == 0)
     return;
 
   fprintf (file, "\t#Prologue stats:\n");
   fprintf (file, "\t#  Total Frame Size: %d bytes\n", actual_fsize);
 
-  if (size)
-    fprintf (file, "\t#  Local Variable Size: %d bytes\n", size);
-  if (rsize)
+  if (lvar_size)
+    fprintf (file, "\t#  Local Variable Size: %d bytes\n", lvar_size);
+  if (n_saved_regs)
     fprintf (file, "\t#  Register Save Size: %d regs, %d bytes\n",
-            n_iregs, rsize);
+            n_saved_regs, n_saved_regs * 4);
   fprintf (file, "\t#End Prologue#\n");
 }
 
-/* Output code for the function epilogue.  */
+/* Output code for the function profiler.  */
 
 void
-i960_function_epilogue (file, size)
+output_function_profiler (file, labelno)
+     FILE *file;
+     int labelno;
+{
+  /* The last used parameter register.  */
+  int last_parm_reg;
+  int i, j, increment;
+  int varargs_stdarg_function
+    = VARARGS_STDARG_FUNCTION (current_function_decl);
+
+  /* Figure out the last used parameter register.  The proper thing to do
+     is to walk incoming args of the function.  A function might have live
+     parameter registers even if it has no incoming args.  Note that we
+     don't have to save parameter registers g8 to g11 because they are
+     call preserved.  */
+
+  /* See also output_function_prologue, which tries to use local registers
+     for preserved call-saved global registers.  */
+
+  for (last_parm_reg = 7;
+       last_parm_reg >= 0 && ! regs_ever_live[last_parm_reg];
+       last_parm_reg--)
+    ;
+
+  /* Save parameter registers in regs r4 (20) to r11 (27).  */
+
+  for (i = 0, j = 4; i <= last_parm_reg; i += increment, j += increment)
+    {
+      if (i % 4 == 0 && (last_parm_reg - i) >= 3)
+       increment = 4;
+      else if (i % 4 == 0 && (last_parm_reg - i) >= 2)
+       increment = 3;
+      else if (i % 2 == 0 && (last_parm_reg - i) >= 1)
+       increment = 2;
+      else
+       increment = 1;
+
+      fprintf (file, "\tmov%s  g%d,r%d\n",
+              (increment == 4 ? "q" : increment == 3 ? "t"
+               : increment == 2 ? "l": ""), i, j);
+      }
+
+  /* If this function uses the arg pointer, then save it in r3 and then
+     set it to zero.  */
+
+  if (current_function_args_size != 0 || varargs_stdarg_function)
+    fprintf (file, "\tmov      g14,r3\n\tmov   0,g14\n");
+
+  /* Load location address into g0 and call mcount.  */
+
+  fprintf (file, "\tlda\tLP%d,g0\n\tcallx\tmcount\n", labelno);
+
+  /* If this function uses the arg pointer, restore it.  */
+
+  if (current_function_args_size != 0 || varargs_stdarg_function)
+    fprintf (file, "\tmov      r3,g14\n");
+
+  /* Restore parameter registers.  */
+
+  for (i = 0, j = 4; i <= last_parm_reg; i += increment, j += increment)
+    {
+      if (i % 4 == 0 && (last_parm_reg - i) >= 3)
+       increment = 4;
+      else if (i % 4 == 0 && (last_parm_reg - i) >= 2)
+       increment = 3;
+      else if (i % 2 == 0 && (last_parm_reg - i) >= 1)
+       increment = 2;
+      else
+       increment = 1;
+
+      fprintf (file, "\tmov%s  r%d,g%d\n",
+              (increment == 4 ? "q" : increment == 3 ? "t"
+               : increment == 2 ? "l": ""), j, i);
+    }
+}
+
+/* Output code for the function epilogue.  */
+
+static void
+i960_output_function_epilogue (file, size)
      FILE *file;
-     unsigned int size;
+     HOST_WIDE_INT size ATTRIBUTE_UNUSED;
 {
   if (i960_leaf_ret_reg >= 0)
     {
-      fprintf (file, "LR%d:    ret\n", ret_label);
+      fprintf (file, "Li960R%d:        ret\n", ret_label);
       return;
     }
 
@@ -1159,11 +1586,11 @@ i960_function_epilogue (file, size)
            }
          break;
        }
-      fprintf (file, "LR%d:    ret\n", ret_label);
+      fprintf (file, "Li960R%d:        ret\n", ret_label);
       return;
     }
 
-  fprintf (file, "LR%d:\n", ret_label);
+  fprintf (file, "Li960R%d:\n", ret_label);
 
   fprintf (file, "\t#EPILOGUE#\n");
 
@@ -1173,9 +1600,10 @@ i960_function_epilogue (file, size)
   if (epilogue_string[0] != '\0')
     fprintf (file, "%s", epilogue_string);
 
-  /* Must clear g14 on return.  */
+  /* Must clear g14 on return if this function set it.
+     Only varargs/stdarg functions modify g14.  */
 
-  if (current_function_args_size != 0)
+  if (VARARGS_STDARG_FUNCTION (current_function_decl))
     fprintf (file, "\tmov      0,g14\n");
 
   fprintf (file, "\tret\n");
@@ -1184,24 +1612,25 @@ i960_function_epilogue (file, size)
 
 /* Output code for a call insn.  */
 
-char *
-i960_output_call_insn (target, argsize_rtx, arg_pointer, scratch_reg, insn)
-     register rtx target, argsize_rtx, arg_pointer, scratch_reg, insn;
+const char *
+i960_output_call_insn (target, argsize_rtx, arg_pointer, insn)
+     register rtx target, argsize_rtx, arg_pointer, insn;
 {
   int argsize = INTVAL (argsize_rtx);
   rtx nexti = next_real_insn (insn);
-  rtx operands[3];
+  rtx operands[2];
+  int varargs_stdarg_function
+    = VARARGS_STDARG_FUNCTION (current_function_decl);
 
   operands[0] = target;
   operands[1] = arg_pointer;
-  operands[2] = scratch_reg;
 
-  if (current_function_args_size != 0)
-    output_asm_insn ("mov      g14,%2", operands);
+  if (current_function_args_size != 0 || varargs_stdarg_function)
+    output_asm_insn ("mov      g14,r3", operands);
 
   if (argsize > 48)
     output_asm_insn ("lda      %a1,g14", operands);
-  else if (current_function_args_size != 0)
+  else if (current_function_args_size != 0 || varargs_stdarg_function)
     output_asm_insn ("mov      0,g14", operands);
 
   /* The code used to assume that calls to SYMBOL_REFs could not be more
@@ -1222,15 +1651,20 @@ i960_output_call_insn (target, argsize_rtx, arg_pointer, scratch_reg, insn)
 
   output_asm_insn ("callx      %0", operands);
 
-  if (current_function_args_size != 0)
-    output_asm_insn ("mov      %2,g14", operands);
+  /* If the caller sets g14 to the address of the argblock, then the caller
+     must clear it after the return.  */
+
+  if (current_function_args_size != 0 || varargs_stdarg_function)
+    output_asm_insn ("mov      r3,g14", operands);
+  else if (argsize > 48)
+    output_asm_insn ("mov      0,g14", operands);
 
   return "";
 }
 
 /* Output code for a return insn.  */
 
-char *
+const char *
 i960_output_ret_insn (insn)
      register rtx insn;
 {
@@ -1241,11 +1675,14 @@ i960_output_ret_insn (insn)
       if (! TARGET_CODE_ALIGN && next_real_insn (insn) == 0)
        return "";
 
-      sprintf (lbuf, "b        LR%d", ret_label);
+      sprintf (lbuf, "b        Li960R%d", ret_label);
       return lbuf;
     }
 
-  if (current_function_args_size != 0)
+  /* Must clear g14 on return if this function set it.
+     Only varargs/stdarg functions modify g14.  */
+
+  if (VARARGS_STDARG_FUNCTION (current_function_decl))
     output_asm_insn ("mov      0,g14", 0);
 
   if (i960_leaf_ret_reg >= 0)
@@ -1256,59 +1693,35 @@ i960_output_ret_insn (insn)
   return "ret";
 }
 \f
-#if 0
-/* Return a character string representing the branch prediction
-   opcode to be tacked on an instruction.  This must at least
-   return a null string.  */
-
-char *
-i960_br_predict_opcode (lab_ref, insn)
-     rtx lab_ref, insn;
-{
-  if (TARGET_BRANCH_PREDICT)
-    {
-      unsigned long label_uid;
-      
-      if (GET_CODE (lab_ref) == CODE_LABEL)
-       label_uid = INSN_UID (lab_ref);
-      else if (GET_CODE (lab_ref) == LABEL_REF)
-       label_uid = INSN_UID (XEXP (lab_ref, 0));
-      else
-       return ".f";
-
-      /* If not optimizing, then the insn_addresses array will not be
-        valid.  In this case, always return ".t" since most branches
-        are taken.  If optimizing, return .t for backward branches
-        and .f for forward branches.  */
-      if (! optimize
-         || insn_addresses[label_uid] < insn_addresses[INSN_UID (insn)])
-       return ".t";
-      return ".f";
-    }
-    
-  return "";
-}
-#endif
-
 /* Print the operand represented by rtx X formatted by code CODE.  */
 
 void
 i960_print_operand (file, x, code)
      FILE *file;
      rtx x;
-     char code;
+     int code;
 {
-  enum rtx_code rtxcode = GET_CODE (x);
+  enum rtx_code rtxcode = x ? GET_CODE (x) : NIL;
 
   if (rtxcode == REG)
     {
       switch (code)
        {
        case 'D':
-         /* Second reg of a double.  */
+         /* Second reg of a double or quad.  */
          fprintf (file, "%s", reg_names[REGNO (x)+1]);
          break;
 
+       case 'E':
+         /* Third reg of a quad.  */
+         fprintf (file, "%s", reg_names[REGNO (x)+2]);
+         break;
+
+       case 'F':
+         /* Fourth reg of a quad.  */
+         fprintf (file, "%s", reg_names[REGNO (x)+3]);
+         break;
+
        case 0:
          fprintf (file, "%s", reg_names[REGNO (x)]);
          break;
@@ -1325,30 +1738,34 @@ i960_print_operand (file, x, code)
     }
   else if (rtxcode == CONST_INT)
     {
-      if (INTVAL (x) > 9999 || INTVAL (x) < -999)
-       fprintf (file, "0x%x", INTVAL (x));
+      HOST_WIDE_INT val = INTVAL (x);
+      if (code == 'C')
+       val = ~val;
+      if (val > 9999 || val < -999)
+       fprintf (file, "0x%x", val);
       else
-       fprintf (file, "%d", INTVAL (x));
+       fprintf (file, "%d", val);
       return;
     }
   else if (rtxcode == CONST_DOUBLE)
     {
-      double d;
+      REAL_VALUE_TYPE d;
+      char dstr[30];
 
-      if (x == CONST0_RTX (DFmode) || x == CONST0_RTX (SFmode))
+      if (x == CONST0_RTX (GET_MODE (x)))
        {
          fprintf (file, "0f0.0");
          return;
        }
-      else if (x == CONST1_RTX (DFmode) || x == CONST1_RTX (SFmode))
+      else if (x == CONST1_RTX (GET_MODE (x)))
        {
          fprintf (file, "0f1.0");
          return;
        }
 
-      /* This better be a comment.  */
       REAL_VALUE_FROM_CONST_DOUBLE (d, x);
-      fprintf (file, "%#g", d);
+      REAL_VALUE_TO_DECIMAL (d, "%#g", dstr);
+      fprintf (file, "0f%s", dstr);
       return;
     }
 
@@ -1405,6 +1822,19 @@ i960_print_operand (file, x, code)
       else abort ();
       break;
 
+    case '+':
+      /* For conditional branches, substitute ".t" or ".f".  */
+      if (TARGET_BRANCH_PREDICT)
+       {
+         x = find_reg_note (current_output_insn, REG_BR_PROB, 0);
+         if (x)
+           {
+             int pred_val = INTVAL (XEXP (x, 0));
+             fputs ((pred_val < REG_BR_PROB_BASE / 2 ? ".f" : ".t"), file);
+           }
+       }
+      break;
+
     case 0:
       output_addr_const (file, x);
       break;
@@ -1499,7 +1929,7 @@ i960_print_operand_addr (file, addr)
     }
   else if (GET_CODE (addr) == MULT)
     {
-      breg = XEXP (addr, 0);
+      ireg = XEXP (addr, 0);
       scale = XEXP (addr, 1);
     }
   else
@@ -1538,15 +1968,33 @@ i960_print_operand_addr (file, addr)
    convert common non-canonical forms to canonical form so that they will
    be recognized.  */
 
+/* These two macros allow us to accept either a REG or a SUBREG anyplace
+   where a register is valid.  */
+
+#define RTX_OK_FOR_BASE_P(X, STRICT)                                   \
+  ((GET_CODE (X) == REG                                                        \
+    && (STRICT ? REG_OK_FOR_BASE_P_STRICT (X) : REG_OK_FOR_BASE_P (X)))        \
+   || (GET_CODE (X) == SUBREG                                          \
+       && GET_CODE (SUBREG_REG (X)) == REG                             \
+       && (STRICT ? REG_OK_FOR_BASE_P_STRICT (SUBREG_REG (X))          \
+          : REG_OK_FOR_BASE_P (SUBREG_REG (X)))))
+
+#define RTX_OK_FOR_INDEX_P(X, STRICT)                                  \
+  ((GET_CODE (X) == REG                                                        \
+    && (STRICT ? REG_OK_FOR_INDEX_P_STRICT (X) : REG_OK_FOR_INDEX_P (X)))\
+   || (GET_CODE (X) == SUBREG                                          \
+       && GET_CODE (SUBREG_REG (X)) == REG                             \
+       && (STRICT ? REG_OK_FOR_INDEX_P_STRICT (SUBREG_REG (X))         \
+          : REG_OK_FOR_INDEX_P (SUBREG_REG (X)))))
+
 int
 legitimate_address_p (mode, addr, strict)
-     enum machine_mode mode;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
      register rtx addr;
      int strict;
 {
-  if (GET_CODE (addr) == REG)
-    return (strict ? REG_OK_FOR_BASE_P_STRICT (addr)
-           : REG_OK_FOR_BASE_P (addr));
+  if (RTX_OK_FOR_BASE_P (addr, strict))
+    return 1;
   else if (CONSTANT_P (addr))
     return 1;
   else if (GET_CODE (addr) == PLUS)
@@ -1559,15 +2007,10 @@ legitimate_address_p (mode, addr, strict)
       op0 = XEXP (addr, 0);
       op1 = XEXP (addr, 1);
 
-      if (GET_CODE (op0) == REG)
+      if (RTX_OK_FOR_BASE_P (op0, strict))
        {
-         if (! (strict ? REG_OK_FOR_BASE_P_STRICT (op0)
-                : REG_OK_FOR_BASE_P (op0)))
-           return 0;
-
-         if (GET_CODE (op1) == REG)
-           return (strict ? REG_OK_FOR_INDEX_P_STRICT (op1)
-                   : REG_OK_FOR_INDEX_P (op1));
+         if (RTX_OK_FOR_INDEX_P (op1, strict))
+           return 1;
          else if (CONSTANT_P (op1))
            return 1;
          else
@@ -1577,29 +2020,21 @@ legitimate_address_p (mode, addr, strict)
        {
          if (GET_CODE (XEXP (op0, 0)) == MULT)
            {
-             if (! (GET_CODE (XEXP (XEXP (op0, 0), 0)) == REG
-                    && (strict ? REG_OK_FOR_INDEX_P_STRICT (XEXP (XEXP (op0, 0), 0))
-                        : REG_OK_FOR_INDEX_P (XEXP (XEXP (op0, 0), 0)))
+             if (! (RTX_OK_FOR_INDEX_P (XEXP (XEXP (op0, 0), 0), strict)
                     && SCALE_TERM_P (XEXP (XEXP (op0, 0), 1))))
                return 0;
 
-             if (GET_CODE (XEXP (op0, 1)) == REG)
-               return ((strict ? REG_OK_FOR_BASE_P_STRICT (XEXP (op0, 1))
-                        : REG_OK_FOR_BASE_P (XEXP (op0, 1)))
-                       && CONSTANT_P (op1));
+             if (RTX_OK_FOR_BASE_P (XEXP (op0, 1), strict)
+                 && CONSTANT_P (op1))
+               return 1;
              else
                return 0;
            }
-         else if (GET_CODE (XEXP (op0, 0)) == REG)
+         else if (RTX_OK_FOR_BASE_P (XEXP (op0, 0), strict))
            {
-             if (! (strict ? REG_OK_FOR_BASE_P_STRICT (XEXP (op0, 0))
-                    : REG_OK_FOR_BASE_P (XEXP (op0, 0))))
-               return 0;
-
-             if (GET_CODE (XEXP (op0, 1)) == REG)
-               return ((strict ? REG_OK_FOR_INDEX_P_STRICT (XEXP (op0, 1))
-                        : REG_OK_FOR_INDEX_P (XEXP (op0, 1)))
-                       && CONSTANT_P (op1));
+             if (RTX_OK_FOR_INDEX_P (XEXP (op0, 1), strict)
+                 && CONSTANT_P (op1))
+               return 1;
              else
                return 0;
            }
@@ -1608,15 +2043,12 @@ legitimate_address_p (mode, addr, strict)
        }
       else if (GET_CODE (op0) == MULT)
        {
-         if (! (GET_CODE (XEXP (op0, 0)) == REG
-                && (strict ? REG_OK_FOR_INDEX_P_STRICT (XEXP (op0, 0))
-                    : REG_OK_FOR_INDEX_P (XEXP (op0, 0)))
+         if (! (RTX_OK_FOR_INDEX_P (XEXP (op0, 0), strict)
                 && SCALE_TERM_P (XEXP (op0, 1))))
            return 0;
 
-         if (GET_CODE (op1) == REG)
-           return (strict ? REG_OK_FOR_BASE_P_STRICT (op1)
-                   : REG_OK_FOR_BASE_P (op1));
+         if (RTX_OK_FOR_BASE_P (op1, strict))
+           return 1;
          else if (CONSTANT_P (op1))
            return 1;
          else
@@ -1630,9 +2062,7 @@ legitimate_address_p (mode, addr, strict)
       if (! TARGET_COMPLEX_ADDR && ! reload_completed)
        return 0;
 
-      return (GET_CODE (XEXP (addr, 0)) == REG
-             && (strict ? REG_OK_FOR_INDEX_P_STRICT (XEXP (addr, 0))
-                 : REG_OK_FOR_INDEX_P (XEXP (addr, 0)))
+      return (RTX_OK_FOR_INDEX_P (XEXP (addr, 0), strict)
              && SCALE_TERM_P (XEXP (addr, 1)));
     }
   else
@@ -1649,8 +2079,8 @@ legitimate_address_p (mode, addr, strict)
 rtx
 legitimize_address (x, oldx, mode)
      register rtx x;
-     register rtx oldx;
-     enum machine_mode mode;
+     register rtx oldx ATTRIBUTE_UNUSED;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 { 
   if (GET_CODE (x) == SYMBOL_REF)
     {
@@ -1667,9 +2097,9 @@ legitimize_address (x, oldx, mode)
      similar optimizations.  */
   if (GET_CODE (x) == PLUS && GET_CODE (XEXP (x, 0)) == MULT
       && GET_CODE (XEXP (x, 1)) == PLUS)
-    x = gen_rtx (PLUS, Pmode,
-                gen_rtx (PLUS, Pmode, XEXP (x, 0), XEXP (XEXP (x, 1), 0)),
-                XEXP (XEXP (x, 1), 1));
+    x = gen_rtx_PLUS (Pmode,
+                     gen_rtx_PLUS (Pmode, XEXP (x, 0), XEXP (XEXP (x, 1), 0)),
+                     XEXP (XEXP (x, 1), 1));
 
   /* Canonicalize (plus (plus (mult (reg) (const)) (plus (reg) (const))) const)
      into (plus (plus (mult (reg) (const)) (reg)) (const)).  */
@@ -1691,13 +2121,13 @@ legitimize_address (x, oldx, mode)
          other = XEXP (x, 1);
        }
       else
-       constant = 0;
+       constant = 0, other = 0;
 
       if (constant)
-       x = gen_rtx (PLUS, Pmode,
-                    gen_rtx (PLUS, Pmode, XEXP (XEXP (x, 0), 0),
-                             XEXP (XEXP (XEXP (x, 0), 1), 0)),
-                    plus_constant (other, INTVAL (constant)));
+       x = gen_rtx_PLUS (Pmode,
+                         gen_rtx_PLUS (Pmode, XEXP (XEXP (x, 0), 0),
+                                       XEXP (XEXP (XEXP (x, 0), 1), 0)),
+                         plus_constant (other, INTVAL (constant)));
     }
 
   return x;
@@ -1705,7 +2135,7 @@ legitimize_address (x, oldx, mode)
 \f
 #if 0
 /* Return the most stringent alignment that we are willing to consider
-   objects of size SIZE and known alignment ALIGN as having. */
+   objects of size SIZE and known alignment ALIGN as having.  */
    
 int
 i960_alignment (size, align)
@@ -1726,40 +2156,57 @@ i960_alignment (size, align)
 }
 #endif
 \f
-/* Modes for condition codes.  */
-#define C_MODES                \
-  ((1 << (int) CCmode) | (1 << (int) CC_UNSmode) | (1<< (int) CC_CHKmode))
-
-/* Modes for single-word (and smaller) quantities.  */
-#define S_MODES                                                \
- (~C_MODES                                             \
-  & ~ ((1 << (int) DImode) | (1 << (int) TImode)       \
-       | (1 << (int) DFmode) | (1 << (int) TFmode)))
 
-/* Modes for double-word (and smaller) quantities.  */
-#define D_MODES                                        \
-  (~C_MODES                                    \
-   & ~ ((1 << (int) TImode) | (1 << (int) TFmode)))
+int
+hard_regno_mode_ok (regno, mode)
+     int regno;
+     enum machine_mode mode;
+{
+  if (regno < 32)
+    {
+      switch (mode)
+       {
+       case CCmode: case CC_UNSmode: case CC_CHKmode:
+         return 0;
 
-/* Modes for quad-word quantities.  */
-#define T_MODES (~C_MODES)
+       case DImode: case DFmode:
+         return (regno & 1) == 0;
 
-/* Modes for single-float quantities.  */
-#define SF_MODES ((1 << (int) SFmode))
+       case TImode: case XFmode:
+         return (regno & 3) == 0;
 
-/* Modes for double-float quantities.  */
-#define DF_MODES (SF_MODES | (1 << (int) DFmode) | (1 << (int) SCmode))
+       default:
+         return 1;
+       }
+    }
+  else if (regno >= 32 && regno < 36)
+    {
+      switch (mode)
+       {
+       case SFmode: case DFmode: case XFmode:
+       case SCmode: case DCmode:
+         return 1;
 
-/* Modes for quad-float quantities.  */
-#define TF_MODES (DF_MODES | (1 << (int) TFmode) | (1 << (int) DCmode))
+       default:
+         return 0;
+       }
+    }
+  else if (regno == 36)
+    {
+      switch (mode)
+       {
+       case CCmode: case CC_UNSmode: case CC_CHKmode:
+         return 1;
 
-unsigned int hard_regno_mode_ok[FIRST_PSEUDO_REGISTER] = {
-  T_MODES, S_MODES, D_MODES, S_MODES, T_MODES, S_MODES, D_MODES, S_MODES,
-  T_MODES, S_MODES, D_MODES, S_MODES, T_MODES, S_MODES, D_MODES, S_MODES,
-  T_MODES, S_MODES, D_MODES, S_MODES, T_MODES, S_MODES, D_MODES, S_MODES,
-  T_MODES, S_MODES, D_MODES, S_MODES, T_MODES, S_MODES, D_MODES, S_MODES,
+       default:
+         return 0;
+       }
+    }
+  else if (regno == 37)
+    return 0;
 
-  TF_MODES, TF_MODES, TF_MODES, TF_MODES, C_MODES};
+  abort ();
+}
 
 \f
 /* Return the minimum alignment of an expression rtx X in bytes.  This takes
@@ -1800,7 +2247,7 @@ i960_expr_alignment (x, size)
 
     case SYMBOL_REF:
       /* If this is a valid program, objects are guaranteed to be
-        correctly aligned for whatever size the reference actually is. */
+        correctly aligned for whatever size the reference actually is.  */
       align = i960_object_bytes_bitalign (size) / BITS_PER_UNIT;
       break;
 
@@ -1810,8 +2257,7 @@ i960_expr_alignment (x, size)
       break;
 
     case ASHIFT:
-    case LSHIFT:
-      align = i960_expr_alignment (XEXP (x, 0));
+      align = i960_expr_alignment (XEXP (x, 0), size);
 
       if (GET_CODE (XEXP (x, 1)) == CONST_INT)
        {
@@ -1826,6 +2272,8 @@ i960_expr_alignment (x, size)
 
       align = MIN (align, 16);
       break;
+    default:
+      break;
     }
 
   return align;
@@ -1905,14 +2353,22 @@ i960_arg_size_and_align (mode, type, size_out, align_out)
   else if (mode == VOIDmode)
     {
       /* End of parm list.  */
-      assert (type != 0 && TYPE_MODE (type) == VOIDmode);
+      if (type == 0 || TYPE_MODE (type) != VOIDmode)
+       abort ();
       size = 1;
     }
   else
     size = (GET_MODE_SIZE (mode) + UNITS_PER_WORD - 1) / UNITS_PER_WORD;
 
   if (type == 0)
-    align = size;
+    {
+      /* ??? This is a hack to properly correct the alignment of XFmode
+        values without affecting anything else.  */
+      if (size == 3)
+       align = 4;
+      else
+       align = size;
+    }
   else if (TYPE_ALIGN (type) >= BITS_PER_WORD)
     align = TYPE_ALIGN (type) / BITS_PER_WORD;
   else
@@ -1927,7 +2383,9 @@ i960_arg_size_and_align (mode, type, size_out, align_out)
    subsequent arguments are placed on the stack.
 
    Additionally, parameters with an alignment requirement stronger than
-   a word must be be aligned appropriately.  */
+   a word must be aligned appropriately.  Note that this means that a
+   64 bit object with a 32 bit alignment is not 64 bit aligned and may be
+   passed in an odd/even register pair.  */
 
 /* Update CUM to advance past an argument described by MODE and TYPE.  */
 
@@ -1936,18 +2394,23 @@ i960_function_arg_advance (cum, mode, type, named)
      CUMULATIVE_ARGS *cum;
      enum machine_mode mode;
      tree type;
-     int named;
+     int named ATTRIBUTE_UNUSED;
 {
   int size, align;
 
   i960_arg_size_and_align (mode, type, &size, &align);
 
-  if (named == 0 || size > 4 || cum->ca_nstackparms != 0
-      || (size + ROUND (cum->ca_nregparms, align)) > NPARM_REGS
+  if (size > 4 || cum->ca_nstackparms != 0
+      || (size + ROUND_PARM (cum->ca_nregparms, align)) > NPARM_REGS
       || MUST_PASS_IN_STACK (mode, type))
-    cum->ca_nstackparms = ROUND (cum->ca_nstackparms, align) + size;
+    {
+      /* Indicate that all the registers are in use, even if all are not,
+        so va_start will compute the right value.  */
+      cum->ca_nregparms = NPARM_REGS;
+      cum->ca_nstackparms = ROUND_PARM (cum->ca_nstackparms, align) + size;
+    }
   else
-    cum->ca_nregparms = ROUND (cum->ca_nregparms, align) + size;
+    cum->ca_nregparms = ROUND_PARM (cum->ca_nregparms, align) + size;
 }
 
 /* Return the register that the argument described by MODE and TYPE is
@@ -1958,79 +2421,31 @@ i960_function_arg (cum, mode, type, named)
      CUMULATIVE_ARGS *cum;
      enum machine_mode mode;
      tree type;
-     int named;
+     int named ATTRIBUTE_UNUSED;
 {
   rtx ret;
   int size, align;
 
+  if (mode == VOIDmode)
+    return 0;
+
   i960_arg_size_and_align (mode, type, &size, &align);
 
-  if (named == 0 || size > 4 || cum->ca_nstackparms != 0
-      || (size + ROUND (cum->ca_nregparms, align)) > NPARM_REGS
+  if (size > 4 || cum->ca_nstackparms != 0
+      || (size + ROUND_PARM (cum->ca_nregparms, align)) > NPARM_REGS
       || MUST_PASS_IN_STACK (mode, type))
     {
-      cum->ca_nstackparms = ROUND (cum->ca_nstackparms, align);
+      cum->ca_nstackparms = ROUND_PARM (cum->ca_nstackparms, align);
       ret = 0;
     }
   else
     {
-      cum->ca_nregparms = ROUND (cum->ca_nregparms, align);
-      ret = gen_rtx (REG, mode, cum->ca_nregparms);
+      cum->ca_nregparms = ROUND_PARM (cum->ca_nregparms, align);
+      ret = gen_rtx_REG (mode, cum->ca_nregparms);
     }
 
   return ret;
 }
-
-/* Return the rtx for the register representing the return value, or 0
-   if the return value must be passed through the stack.  */
-
-rtx
-i960_function_value (type)
-     tree type;
-{
-  int mode = TYPE_MODE (type);
-
-  if (mode == BLKmode)
-    {
-      unsigned int size = int_size_in_bytes (type);
-
-      if (size <= 16)
-       mode = mode_for_size (i960_object_bytes_bitalign (size), MODE_INT, 0);
-    }
-
-  if (mode == BLKmode || mode == VOIDmode)
-    /* Tell stmt.c and expr.c to pass in address */
-    return 0;
-  else
-    return gen_rtx (REG, mode, 0);
-}
-\f
-/* Floating-point support.  */
-
-void
-i960_output_double (file, value)
-     FILE *file;
-     double value;
-{
-  if (REAL_VALUE_ISINF (value))
-    {
-      fprintf (file, "\t.word  0\n");
-      fprintf (file, "\t.word  0x7ff00000      # Infinity\n");
-    }
-  else
-    fprintf (file, "\t.double 0d%.17e\n", (value));
-}
-
-void
-i960_output_float (file, value)
-     FILE *file;
-     double value;
-{
-  if (REAL_VALUE_ISINF (value))
-    fprintf (file, "\t.word    0x7f800000      # Infinity\n");
-  else
-    fprintf (file, "\t.float 0f%.12e\n", (value));
-}
 \f
 /* Return the number of bits that an object of size N bytes is aligned to.  */
 
@@ -2047,45 +2462,29 @@ i960_object_bytes_bitalign (n)
   return n;
 }
 
-/* Compute the size of an aggregate type TSIZE.  */
-
-tree
-i960_round_size (tsize)
-     tree tsize;
-{
-  int size, byte_size, align;
-
-  if (TREE_CODE (tsize) != INTEGER_CST)
-    return tsize;
-
-  size = TREE_INT_CST_LOW (tsize);
-  byte_size = (size + BITS_PER_UNIT - 1) / BITS_PER_UNIT;
-  align = i960_object_bytes_bitalign (byte_size);
-
-  /* Handle #pragma align.  */
-  if (align > i960_maxbitalignment)
-    align = i960_maxbitalignment;
-
-  if (size % align)
-    size = ((size / align) + 1) * align;
-
-  return size_int (size);
-}
-
-/* Compute the alignment for an aggregate type TSIZE.  */
+/* Compute the alignment for an aggregate type TSIZE.
+   Alignment is MAX (greatest member alignment,
+                     MIN (pragma align, structure size alignment)).  */
 
 int
 i960_round_align (align, tsize)
      int align;
      tree tsize;
 {
-  int byte_size;
+  int new_align;
 
-  if (TREE_CODE (tsize) != INTEGER_CST)
+  if (! tsize || TREE_CODE (tsize) != INTEGER_CST)
     return align;
 
-  byte_size = (TREE_INT_CST_LOW (tsize) + BITS_PER_UNIT - 1) / BITS_PER_UNIT;
-  align = i960_object_bytes_bitalign (byte_size);
+  new_align = i960_object_bytes_bitalign (TREE_INT_CST_LOW (tsize)
+                                         / BITS_PER_UNIT);
+  /* Handle #pragma align.  */
+  if (new_align > i960_maxbitalignment)
+    new_align = i960_maxbitalignment;
+
+  if (align < new_align)
+    align = new_align;
+
   return align;
 }
 \f
@@ -2096,39 +2495,156 @@ i960_round_align (align, tsize)
 void
 i960_setup_incoming_varargs (cum, mode, type, pretend_size, no_rtl)
      CUMULATIVE_ARGS *cum;
-     enum machine_mode mode;
-     tree type;
-     int *pretend_size;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+     tree type ATTRIBUTE_UNUSED;
+     int *pretend_size ATTRIBUTE_UNUSED;
      int no_rtl;
 {
-  if (cum->ca_nregparms < NPARM_REGS)
-    {
-      int first_reg_offset = cum->ca_nregparms;
+  /* Note: for a varargs fn with only a va_alist argument, this is 0.  */
+  int first_reg = cum->ca_nregparms;
 
-      if (first_reg_offset > NPARM_REGS)
-       first_reg_offset = NPARM_REGS;
+  /* Copy only unnamed register arguments to memory.  If there are
+     any stack parms, there are no unnamed arguments in registers, and
+     an argument block was already allocated by the caller.
+     Remember that any arg bigger than 4 words is passed on the stack as
+     are all subsequent args.
 
-      if (! (no_rtl) && first_reg_offset != NPARM_REGS)
-       {
-         rtx label = gen_label_rtx ();
-         emit_insn (gen_cmpsi (arg_pointer_rtx, const0_rtx));
-         emit_jump_insn (gen_bne (label));
-         emit_insn (gen_rtx (SET, VOIDmode, arg_pointer_rtx,
+     If there are no stack arguments but there are exactly NPARM_REGS
+     registers, either there were no extra arguments or the caller
+     allocated an argument block.  */
+
+  if (cum->ca_nstackparms == 0 && first_reg < NPARM_REGS && !no_rtl)
+    {
+      rtx label = gen_label_rtx ();
+      rtx regblock;
+
+      /* If arg_pointer_rtx == 0, no arguments were passed on the stack
+        and we need to allocate a chunk to save the registers (if any
+        arguments were passed on the stack the caller would allocate the
+        48 bytes as well).  We must allocate all 48 bytes (12*4) because
+        va_start assumes it.  */
+      emit_insn (gen_cmpsi (arg_pointer_rtx, const0_rtx));
+      emit_jump_insn (gen_bne (label));
+      emit_insn (gen_rtx_SET (VOIDmode, arg_pointer_rtx,
                              stack_pointer_rtx));
-         emit_insn (gen_rtx (SET, VOIDmode, stack_pointer_rtx,
+      emit_insn (gen_rtx_SET (VOIDmode, stack_pointer_rtx,
                              memory_address (SImode,
                                              plus_constant (stack_pointer_rtx,
                                                             48))));
-         emit_label (label);
-         move_block_from_reg
-           (first_reg_offset,
-            gen_rtx (MEM, BLKmode, virtual_incoming_args_rtx),
-            NPARM_REGS - first_reg_offset);
-       }
-      *pretend_size = (NPARM_REGS - first_reg_offset) * UNITS_PER_WORD;
+      emit_label (label);
+
+      /* ??? Note that we unnecessarily store one extra register for stdarg
+        fns.  We could optimize this, but it's kept as for now.  */
+      regblock = gen_rtx_MEM (BLKmode,
+                             plus_constant (arg_pointer_rtx, first_reg * 4));
+      set_mem_alias_set (regblock, get_varargs_alias_set ());
+      set_mem_align (regblock, BITS_PER_WORD);
+      move_block_from_reg (first_reg, regblock,
+                          NPARM_REGS - first_reg,
+                          (NPARM_REGS - first_reg) * UNITS_PER_WORD);
     }
 }
 
+/* Define the `__builtin_va_list' type for the ABI.  */
+
+tree
+i960_build_va_list ()
+{
+  return build_array_type (unsigned_type_node,
+                          build_index_type (size_one_node));
+}
+
+/* Implement `va_start' for varargs and stdarg.  */
+
+void
+i960_va_start (stdarg_p, valist, nextarg)
+     int stdarg_p ATTRIBUTE_UNUSED;
+     tree valist;
+     rtx nextarg ATTRIBUTE_UNUSED;
+{
+  tree s, t, base, num;
+
+  /* The array type always decays to a pointer before we get here, so we
+     can't use ARRAY_REF.  */
+  base = build1 (INDIRECT_REF, unsigned_type_node, valist);
+  num = build1 (INDIRECT_REF, unsigned_type_node,
+               build (PLUS_EXPR, unsigned_type_node, valist,
+                      TYPE_SIZE_UNIT (TREE_TYPE (valist))));
+
+  s = make_tree (unsigned_type_node, arg_pointer_rtx);
+  t = build (MODIFY_EXPR, unsigned_type_node, base, s);
+  TREE_SIDE_EFFECTS (t) = 1;
+  expand_expr (t, const0_rtx, VOIDmode, EXPAND_NORMAL);
+
+  s = build_int_2 ((current_function_args_info.ca_nregparms
+                   + current_function_args_info.ca_nstackparms) * 4, 0);
+  t = build (MODIFY_EXPR, unsigned_type_node, num, s);
+  TREE_SIDE_EFFECTS (t) = 1;
+  expand_expr (t, const0_rtx, VOIDmode, EXPAND_NORMAL);
+}
+
+/* Implement `va_arg'.  */
+
+rtx
+i960_va_arg (valist, type)
+     tree valist, type;
+{
+  HOST_WIDE_INT siz, ali;
+  tree base, num, pad, next, this, t1, t2, int48;
+  rtx addr_rtx;
+
+  /* The array type always decays to a pointer before we get here, so we
+     can't use ARRAY_REF.  */
+  base = build1 (INDIRECT_REF, unsigned_type_node, valist);
+  num = build1 (INDIRECT_REF, unsigned_type_node,
+               build (PLUS_EXPR, unsigned_type_node, valist,
+                      TYPE_SIZE_UNIT (TREE_TYPE (valist))));
+
+  /* Round up sizeof(type) to a word.  */
+  siz = (int_size_in_bytes (type) + UNITS_PER_WORD - 1) & -UNITS_PER_WORD;
+
+  /* Round up alignment to a word.  */
+  ali = TYPE_ALIGN (type);
+  if (ali < BITS_PER_WORD)
+    ali = BITS_PER_WORD;
+  ali /= BITS_PER_UNIT;
+
+  /* Align NUM appropriate for the argument.  */
+  pad = fold (build (PLUS_EXPR, unsigned_type_node, num, 
+                     build_int_2 (ali - 1, 0)));
+  pad = fold (build (BIT_AND_EXPR, unsigned_type_node, pad,
+                     build_int_2 (-ali, -1)));
+  pad = save_expr (pad);
+
+  /* Increment VPAD past this argument.  */
+  next = fold (build (PLUS_EXPR, unsigned_type_node, pad,
+                     build_int_2 (siz, 0)));
+  next = save_expr (next);
+
+  /* Find the offset for the current argument.  Mind peculiar overflow
+     from registers to stack.  */
+  int48 = build_int_2 (48, 0);
+  if (siz > 16)
+    t2 = integer_one_node;
+  else
+    t2 = fold (build (GT_EXPR, integer_type_node, next, int48));
+  t1 = fold (build (LE_EXPR, integer_type_node, num, int48));
+  t1 = fold (build (TRUTH_AND_EXPR, integer_type_node, t1, t2));
+  this = fold (build (COND_EXPR, unsigned_type_node, t1, int48, pad));
+
+  /* Find the address for the current argument.  */
+  t1 = fold (build (PLUS_EXPR, unsigned_type_node, base, this));
+  t1 = build1 (NOP_EXPR, ptr_type_node, t1);
+  addr_rtx = expand_expr (t1, NULL_RTX, Pmode, EXPAND_NORMAL);
+
+  /* Increment NUM.  */
+  t1 = build (MODIFY_EXPR, unsigned_type_node, num, next);
+  TREE_SIDE_EFFECTS (t1) = 1;
+  expand_expr (t1, const0_rtx, VOIDmode, EXPAND_NORMAL);
+  
+  return addr_rtx;
+}
+
 /* Calculate the final size of the reg parm stack space for the current
    function, based on how many bytes would be allocated on the stack.  */
 
@@ -2162,7 +2678,7 @@ i960_reg_parm_stack_space (fndecl)
 
   /* Otherwise, we have an arg block if the current function has more than
      48 bytes of parameters.  */
-  if (current_function_args_size != 0)
+  if (current_function_args_size != 0 || VARARGS_STDARG_FUNCTION (fndecl))
     return 48;
   else
     return 0;
@@ -2191,7 +2707,7 @@ secondary_reload_class (class, mode, in)
 
   /* We can place any hard register, 0.0, and 1.0 into FP_REGS.  */
   if (class == FP_REGS
-      && ((regno >= 0 && regno <= FIRST_PSEUDO_REGISTER)
+      && ((regno >= 0 && regno < FIRST_PSEUDO_REGISTER)
          || in == CONST0_RTX (mode) || in == CONST1_RTX (mode)))
     return NO_REGS;
 
@@ -2205,7 +2721,7 @@ secondary_reload_class (class, mode, in)
 
 void
 i960_scan_opcode (p)
-     char *p;
+     const char *p;
 {
   switch (*p)
     {