OSDN Git Service

* gcc.dg/vect/vect-105.c: Prevent compiler from hoisting abort
[pf3gnuchains/gcc-fork.git] / gcc / caller-save.c
index 65621ad..002f760 100644 (file)
@@ -1,29 +1,31 @@
 /* Save and restore call-clobbered registers which are live across a call.
-   Copyright (C) 1989, 92, 94, 95, 97-99, 2000 Free Software Foundation, Inc.
+   Copyright (C) 1989, 1992, 1994, 1995, 1997, 1998, 1999, 2000,
+   2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008 Free Software Foundation, Inc.
 
-This file is part of GNU CC.
+This file is part of GCC.
 
-GNU CC is free software; you can redistribute it and/or modify
-it under the terms of the GNU General Public License as published by
-the Free Software Foundation; either version 2, or (at your option)
-any later version.
+GCC is free software; you can redistribute it and/or modify it under
+the terms of the GNU General Public License as published by the Free
+Software Foundation; either version 3, or (at your option) any later
+version.
 
-GNU CC is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
-GNU General Public License for more details.
+GCC is distributed in the hope that it will be useful, but WITHOUT ANY
+WARRANTY; without even the implied warranty of MERCHANTABILITY or
+FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
+for more details.
 
 You should have received a copy of the GNU General Public License
-along with GNU CC; see the file COPYING.  If not, write to
-the Free Software Foundation, 59 Temple Place - Suite 330,
-Boston, MA 02111-1307, USA.  */
+along with GCC; see the file COPYING3.  If not see
+<http://www.gnu.org/licenses/>.  */
 
 #include "config.h"
 #include "system.h"
+#include "coretypes.h"
+#include "tm.h"
 #include "rtl.h"
+#include "regs.h"
 #include "insn-config.h"
 #include "flags.h"
-#include "regs.h"
 #include "hard-reg-set.h"
 #include "recog.h"
 #include "basic-block.h"
@@ -32,6 +34,14 @@ Boston, MA 02111-1307, USA.  */
 #include "expr.h"
 #include "toplev.h"
 #include "tm_p.h"
+#include "addresses.h"
+#include "output.h"
+#include "df.h"
+#include "ggc.h"
+
+/* Call used hard registers which can not be saved because there is no
+   insn for this.  */
+HARD_REG_SET no_caller_save_reg_set;
 
 #ifndef MAX_MOVE_MAX
 #define MAX_MOVE_MAX MOVE_MAX
@@ -48,25 +58,31 @@ Boston, MA 02111-1307, USA.  */
    register because it is live we first try to save in multi-register modes.
    If that is not possible the save is done one register at a time.  */
 
-static enum machine_mode 
+static enum machine_mode
   regno_save_mode[FIRST_PSEUDO_REGISTER][MAX_MOVE_MAX / MIN_UNITS_PER_WORD + 1];
 
 /* For each hard register, a place on the stack where it can be saved,
    if needed.  */
 
-static rtx 
+static rtx
   regno_save_mem[FIRST_PSEUDO_REGISTER][MAX_MOVE_MAX / MIN_UNITS_PER_WORD + 1];
 
+/* The number of elements in the subsequent array.  */
+static int save_slots_num;
+
+/* Allocated slots so far.  */
+static rtx save_slots[FIRST_PSEUDO_REGISTER];
+
 /* We will only make a register eligible for caller-save if it can be
    saved in its widest mode with a simple SET insn as long as the memory
    address is valid.  We record the INSN_CODE is those insns here since
    when we emit them, the addresses might not be valid, so they might not
    be recognized.  */
 
-static enum insn_code 
-  reg_save_code[FIRST_PSEUDO_REGISTER][MAX_MOVE_MAX / MIN_UNITS_PER_WORD + 1];
-static enum insn_code 
-  reg_restore_code[FIRST_PSEUDO_REGISTER][MAX_MOVE_MAX / MIN_UNITS_PER_WORD + 1];
+static int
+  cached_reg_save_code[FIRST_PSEUDO_REGISTER][MAX_MACHINE_MODE];
+static int
+  cached_reg_restore_code[FIRST_PSEUDO_REGISTER][MAX_MACHINE_MODE];
 
 /* Set of hard regs currently residing in save area (during insn scan).  */
 
@@ -80,40 +96,114 @@ static int n_regs_saved;
    insn.  */
 static HARD_REG_SET referenced_regs;
 
-/* Computed in mark_set_regs, holds all registers set by the current
-   instruction.  */
-static HARD_REG_SET this_insn_sets;
 
+static int reg_save_code (int, enum machine_mode);
+static int reg_restore_code (int, enum machine_mode);
+
+struct saved_hard_reg;
+static void initiate_saved_hard_regs (void);
+static struct saved_hard_reg *new_saved_hard_reg (int, int);
+static void finish_saved_hard_regs (void);
+static int saved_hard_reg_compare_func (const void *, const void *);
+
+static void mark_set_regs (rtx, const_rtx, void *);
+static void add_stored_regs (rtx, const_rtx, void *);
+static void mark_referenced_regs (rtx);
+static int insert_save (struct insn_chain *, int, int, HARD_REG_SET *,
+                       enum machine_mode *);
+static int insert_restore (struct insn_chain *, int, int, int,
+                          enum machine_mode *);
+static struct insn_chain *insert_one_insn (struct insn_chain *, int, int,
+                                          rtx);
+static void add_stored_regs (rtx, const_rtx, void *);
 
-static void mark_set_regs              PARAMS ((rtx, rtx, void *));
-static void mark_referenced_regs       PARAMS ((rtx));
-static int insert_save                 PARAMS ((struct insn_chain *, int, int,
-                                                HARD_REG_SET *));
-static int insert_restore              PARAMS ((struct insn_chain *, int, int,
-                                                int));
-static struct insn_chain *insert_one_insn PARAMS ((struct insn_chain *, int,
-                                                  enum insn_code, rtx));
-static void add_stored_regs            PARAMS ((rtx, rtx, void *));
+\f
+
+static GTY(()) rtx savepat;
+static GTY(()) rtx restpat;
+static GTY(()) rtx test_reg;
+static GTY(()) rtx test_mem;
+static GTY(()) rtx saveinsn;
+static GTY(()) rtx restinsn;
+
+/* Return the INSN_CODE used to save register REG in mode MODE.  */
+static int
+reg_save_code (int reg, enum machine_mode mode)
+{
+  bool ok;
+  if (cached_reg_save_code[reg][mode])
+     return cached_reg_save_code[reg][mode];
+  if (!HARD_REGNO_MODE_OK (reg, mode))
+     {
+       cached_reg_save_code[reg][mode] = -1;
+       cached_reg_restore_code[reg][mode] = -1;
+       return -1;
+     }
+
+  /* Update the register number and modes of the register
+     and memory operand.  */
+  SET_REGNO (test_reg, reg);
+  PUT_MODE (test_reg, mode);
+  PUT_MODE (test_mem, mode);
+
+  /* Force re-recognition of the modified insns.  */
+  INSN_CODE (saveinsn) = -1;
+  INSN_CODE (restinsn) = -1;
+
+  cached_reg_save_code[reg][mode] = recog_memoized (saveinsn);
+  cached_reg_restore_code[reg][mode] = recog_memoized (restinsn);
+
+  /* Now extract both insns and see if we can meet their
+     constraints.  */
+  ok = (cached_reg_save_code[reg][mode] != -1
+       && cached_reg_restore_code[reg][mode] != -1);
+  if (ok)
+    {
+      extract_insn (saveinsn);
+      ok = constrain_operands (1);
+      extract_insn (restinsn);
+      ok &= constrain_operands (1);
+    }
+
+  if (! ok)
+    {
+      cached_reg_save_code[reg][mode] = -1;
+      cached_reg_restore_code[reg][mode] = -1;
+    }
+  gcc_assert (cached_reg_save_code[reg][mode]);
+  return cached_reg_save_code[reg][mode];
+}
+
+/* Return the INSN_CODE used to restore register REG in mode MODE.  */
+static int
+reg_restore_code (int reg, enum machine_mode mode)
+{
+  if (cached_reg_restore_code[reg][mode])
+     return cached_reg_restore_code[reg][mode];
+  /* Populate our cache.  */
+  reg_save_code (reg, mode);
+  return cached_reg_restore_code[reg][mode];
+}
 \f
 /* Initialize for caller-save.
 
    Look at all the hard registers that are used by a call and for which
    regclass.c has not already excluded from being used across a call.
 
-   Ensure that we can find a mode to save the register and that there is a 
+   Ensure that we can find a mode to save the register and that there is a
    simple insn to save and restore the register.  This latter check avoids
    problems that would occur if we tried to save the MQ register of some
    machines directly into memory.  */
 
 void
-init_caller_save ()
+init_caller_save (void)
 {
-  char *first_obj = (char *) oballoc (0);
   rtx addr_reg;
   int offset;
   rtx address;
   int i, j;
 
+  CLEAR_HARD_REG_SET (no_caller_save_reg_set);
   /* First find all the registers that we need to deal with and all
      the modes that they can have.  If we can't find a mode to use,
      we can't have the register live over calls.  */
@@ -124,7 +214,8 @@ init_caller_save ()
        {
          for (j = 1; j <= MOVE_MAX_WORDS; j++)
            {
-             regno_save_mode[i][j] = HARD_REGNO_CALLER_SAVE_MODE (i, j);
+             regno_save_mode[i][j] = HARD_REGNO_CALLER_SAVE_MODE (i, j,
+                                                                  VOIDmode);
              if (regno_save_mode[i][j] == VOIDmode && j == 1)
                {
                  call_fixed_regs[i] = 1;
@@ -148,11 +239,12 @@ init_caller_save ()
      that register in every mode we will use to save registers.  */
 
   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-    if (TEST_HARD_REG_BIT (reg_class_contents[(int) BASE_REG_CLASS], i))
+    if (TEST_HARD_REG_BIT
+       (reg_class_contents
+        [(int) base_reg_class (regno_save_mode[i][1], PLUS, CONST_INT)], i))
       break;
 
-  if (i == FIRST_PSEUDO_REGISTER)
-    abort ();
+  gcc_assert (i < FIRST_PSEUDO_REGISTER);
 
   addr_reg = gen_rtx_REG (Pmode, i);
 
@@ -174,63 +266,140 @@ init_caller_save ()
     address = addr_reg;
 
   /* Next we try to form an insn to save and restore the register.  We
-     see if such an insn is recognized and meets its constraints.  */
+     see if such an insn is recognized and meets its constraints.
+
+     To avoid lots of unnecessary RTL allocation, we construct all the RTL
+     once, then modify the memory and register operands in-place.  */
 
-  start_sequence ();
+  test_reg = gen_rtx_REG (VOIDmode, 0);
+  test_mem = gen_rtx_MEM (VOIDmode, address);
+  savepat = gen_rtx_SET (VOIDmode, test_mem, test_reg);
+  restpat = gen_rtx_SET (VOIDmode, test_reg, test_mem);
+
+  saveinsn = gen_rtx_INSN (VOIDmode, 0, 0, 0, 0, 0, savepat, -1, 0);
+  restinsn = gen_rtx_INSN (VOIDmode, 0, 0, 0, 0, 0, restpat, -1, 0);
 
   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
     for (j = 1; j <= MOVE_MAX_WORDS; j++)
-      if (regno_save_mode[i][j] != VOIDmode)
-        {
-         rtx mem = gen_rtx_MEM (regno_save_mode[i][j], address);
-         rtx reg = gen_rtx_REG (regno_save_mode[i][j], i);
-         rtx savepat = gen_rtx_SET (VOIDmode, mem, reg);
-         rtx restpat = gen_rtx_SET (VOIDmode, reg, mem);
-         rtx saveinsn = emit_insn (savepat);
-         rtx restinsn = emit_insn (restpat);
-         int ok;
-
-         reg_save_code[i][j] = recog_memoized (saveinsn);
-         reg_restore_code[i][j] = recog_memoized (restinsn);
-
-         /* Now extract both insns and see if we can meet their
-             constraints.  */
-         ok = (reg_save_code[i][j] != (enum insn_code)-1
-               && reg_restore_code[i][j] != (enum insn_code)-1);
-         if (ok)
+      if (reg_save_code (i,regno_save_mode[i][j]) == -1)
+       {
+         regno_save_mode[i][j] = VOIDmode;
+         if (j == 1)
            {
-             extract_insn (saveinsn);
-             ok = constrain_operands (1);
-             extract_insn (restinsn);
-             ok &= constrain_operands (1);
+             call_fixed_regs[i] = 1;
+             SET_HARD_REG_BIT (call_fixed_reg_set, i);
+             if (call_used_regs[i])
+               SET_HARD_REG_BIT (no_caller_save_reg_set, i);
            }
-
-         if (! ok)
-           {
-             regno_save_mode[i][j] = VOIDmode;
-             if (j == 1)
-               {
-                 call_fixed_regs[i] = 1;
-                 SET_HARD_REG_BIT (call_fixed_reg_set, i);
-               }
-           }
-      }
-
-  end_sequence ();
-
-  obfree (first_obj);
+       }
 }
+
 \f
+
 /* Initialize save areas by showing that we haven't allocated any yet.  */
 
 void
-init_save_areas ()
+init_save_areas (void)
 {
   int i, j;
 
   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
     for (j = 1; j <= MOVE_MAX_WORDS; j++)
       regno_save_mem[i][j] = 0;
+  save_slots_num = 0;
+    
+}
+
+/* The structure represents a hard register which should be saved
+   through the call.  It is used when the integrated register
+   allocator (IRA) is used and sharing save slots is on.  */
+struct saved_hard_reg
+{
+  /* Order number starting with 0.  */
+  int num;
+  /* The hard regno.  */
+  int hard_regno;
+  /* Execution frequency of all calls through which given hard
+     register should be saved.  */
+  int call_freq;
+  /* Stack slot reserved to save the hard register through calls.  */
+  rtx slot;
+  /* True if it is first hard register in the chain of hard registers
+     sharing the same stack slot.  */
+  int first_p;
+  /* Order number of the next hard register structure with the same
+     slot in the chain.  -1 represents end of the chain.  */
+  int next;
+};
+
+/* Map: hard register number to the corresponding structure.  */
+static struct saved_hard_reg *hard_reg_map[FIRST_PSEUDO_REGISTER];
+
+/* The number of all structures representing hard registers should be
+   saved, in order words, the number of used elements in the following
+   array.  */
+static int saved_regs_num;
+
+/* Pointers to all the structures.  Index is the order number of the
+   corresponding structure.  */
+static struct saved_hard_reg *all_saved_regs[FIRST_PSEUDO_REGISTER];
+
+/* First called function for work with saved hard registers.  */
+static void
+initiate_saved_hard_regs (void)
+{
+  int i;
+
+  saved_regs_num = 0;
+  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
+    hard_reg_map[i] = NULL;
+}
+
+/* Allocate and return new saved hard register with given REGNO and
+   CALL_FREQ.  */
+static struct saved_hard_reg *
+new_saved_hard_reg (int regno, int call_freq)
+{
+  struct saved_hard_reg *saved_reg;
+
+  saved_reg
+    = (struct saved_hard_reg *) xmalloc (sizeof (struct saved_hard_reg));
+  hard_reg_map[regno] = all_saved_regs[saved_regs_num] = saved_reg;
+  saved_reg->num = saved_regs_num++;
+  saved_reg->hard_regno = regno;
+  saved_reg->call_freq = call_freq;
+  saved_reg->first_p = FALSE;
+  saved_reg->next = -1;
+  return saved_reg;
+}
+
+/* Free memory allocated for the saved hard registers.  */
+static void
+finish_saved_hard_regs (void)
+{
+  int i;
+
+  for (i = 0; i < saved_regs_num; i++)
+    free (all_saved_regs[i]);
+}
+
+/* The function is used to sort the saved hard register structures
+   according their frequency.  */
+static int
+saved_hard_reg_compare_func (const void *v1p, const void *v2p)
+{
+  const struct saved_hard_reg *p1 = *(struct saved_hard_reg * const *) v1p;
+  const struct saved_hard_reg *p2 = *(struct saved_hard_reg * const *) v2p;
+  
+  if (flag_omit_frame_pointer)
+    {
+      if (p1->call_freq - p2->call_freq != 0)
+       return p1->call_freq - p2->call_freq;
+    }
+  else if (p2->call_freq - p1->call_freq != 0)
+    return p2->call_freq - p1->call_freq;
+
+  return p1->num - p2->num;
 }
 
 /* Allocate save areas for any hard registers that might need saving.
@@ -239,22 +408,27 @@ init_save_areas ()
    overestimate slightly (especially if some of these registers are later
    used as spill registers), but it should not be significant.
 
+   For IRA we use priority coloring to decrease stack slots needed for
+   saving hard registers through calls.  We build conflicts for them
+   to do coloring.
+
    Future work:
 
      In the fallback case we should iterate backwards across all possible
-     modes for the save, choosing the largest available one instead of 
+     modes for the save, choosing the largest available one instead of
      falling back to the smallest mode immediately.  (eg TF -> DF -> SF).
 
      We do not try to use "move multiple" instructions that exist
-     on some machines (such as the 68k moveml).  It could be a win to try 
+     on some machines (such as the 68k moveml).  It could be a win to try
      and use them when possible.  The hard part is doing it in a way that is
-     machine independent since they might be saving non-consecutive 
+     machine independent since they might be saving non-consecutive
      registers. (imagine caller-saving d0,d1,a0,a1 on the 68k) */
 
 void
-setup_save_areas ()
+setup_save_areas (void)
 {
   int i, j, k;
+  unsigned int r;
   HARD_REG_SET hard_regs_used;
 
   /* Allocate space in the save area for the largest multi-register
@@ -266,75 +440,322 @@ setup_save_areas ()
   for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
     if (reg_renumber[i] >= 0 && REG_N_CALLS_CROSSED (i) > 0)
       {
-       int regno = reg_renumber[i];
-       int endregno 
-         = regno + HARD_REGNO_NREGS (regno, GET_MODE (regno_reg_rtx[i]));
-       int nregs = endregno - regno;
-
-       for (j = 0; j < nregs; j++)
-         {
-           if (call_used_regs[regno+j]) 
-             SET_HARD_REG_BIT (hard_regs_used, regno+j);
-         }
+       unsigned int regno = reg_renumber[i];
+       unsigned int endregno
+         = end_hard_regno (GET_MODE (regno_reg_rtx[i]), regno);
+       for (r = regno; r < endregno; r++)
+         if (call_used_regs[r])
+           SET_HARD_REG_BIT (hard_regs_used, r);
       }
 
-  /* Now run through all the call-used hard-registers and allocate
-     space for them in the caller-save area.  Try to allocate space
-     in a manner which allows multi-register saves/restores to be done.  */
-
-  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-    for (j = MOVE_MAX_WORDS; j > 0; j--)
-      {
-       int do_save = 1;
-
-       /* If no mode exists for this size, try another.  Also break out
-          if we have already saved this hard register.  */
-       if (regno_save_mode[i][j] == VOIDmode || regno_save_mem[i][1] != 0)
-         continue;
-
-       /* See if any register in this group has been saved.  */
-       for (k = 0; k < j; k++)
-         if (regno_save_mem[i + k][1])
+  if (flag_ira && optimize && flag_ira_share_save_slots)
+    {
+      rtx insn, slot;
+      struct insn_chain *chain, *next;
+      char *saved_reg_conflicts;
+      unsigned int regno;
+      int next_k, freq;
+      struct saved_hard_reg *saved_reg, *saved_reg2, *saved_reg3;
+      int call_saved_regs_num;
+      struct saved_hard_reg *call_saved_regs[FIRST_PSEUDO_REGISTER];
+      HARD_REG_SET hard_regs_to_save, used_regs, this_insn_sets;
+      reg_set_iterator rsi;
+      int best_slot_num;
+      int prev_save_slots_num;
+      rtx prev_save_slots[FIRST_PSEUDO_REGISTER];
+      
+      initiate_saved_hard_regs ();
+      /* Create hard reg saved regs.  */
+      for (chain = reload_insn_chain; chain != 0; chain = next)
+       {
+         insn = chain->insn;
+         next = chain->next;
+         if (GET_CODE (insn) != CALL_INSN
+             || find_reg_note (insn, REG_NORETURN, NULL))
+           continue;
+         freq = REG_FREQ_FROM_BB (BLOCK_FOR_INSN (insn));
+         REG_SET_TO_HARD_REG_SET (hard_regs_to_save,
+                                  &chain->live_throughout);
+         COPY_HARD_REG_SET (used_regs, call_used_reg_set);
+
+         /* Record all registers set in this call insn.  These don't
+            need to be saved.  N.B. the call insn might set a subreg
+            of a multi-hard-reg pseudo; then the pseudo is considered
+            live during the call, but the subreg that is set
+            isn't.  */
+         CLEAR_HARD_REG_SET (this_insn_sets);
+         note_stores (PATTERN (insn), mark_set_regs, &this_insn_sets);
+         /* Sibcalls are considered to set the return value.  */
+         if (SIBLING_CALL_P (insn) && crtl->return_rtx)
+           mark_set_regs (crtl->return_rtx, NULL_RTX, &this_insn_sets);
+
+         AND_COMPL_HARD_REG_SET (used_regs, call_fixed_reg_set);
+         AND_COMPL_HARD_REG_SET (used_regs, this_insn_sets);
+         AND_HARD_REG_SET (hard_regs_to_save, used_regs);
+         for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
+           if (TEST_HARD_REG_BIT (hard_regs_to_save, regno))
+             {
+               if (hard_reg_map[regno] != NULL)
+                 hard_reg_map[regno]->call_freq += freq;
+               else
+                 saved_reg = new_saved_hard_reg (regno, freq);
+             }
+         /* Look through all live pseudos, mark their hard registers.  */
+         EXECUTE_IF_SET_IN_REG_SET
+           (&chain->live_throughout, FIRST_PSEUDO_REGISTER, regno, rsi)
            {
-             do_save = 0;
-             break;
+             int r = reg_renumber[regno];
+             int bound;
+             
+             if (r < 0)
+               continue;
+             
+             bound = r + hard_regno_nregs[r][PSEUDO_REGNO_MODE (regno)];
+             for (; r < bound; r++)
+               if (TEST_HARD_REG_BIT (used_regs, r))
+                 {
+                   if (hard_reg_map[r] != NULL)
+                     hard_reg_map[r]->call_freq += freq;
+                   else
+                     saved_reg = new_saved_hard_reg (r, freq);
+                   SET_HARD_REG_BIT (hard_regs_to_save, r);
+                 }
            }
-       if (! do_save)
-         continue;
+       }
+      /* Find saved hard register conflicts.  */
+      saved_reg_conflicts = (char *) xmalloc (saved_regs_num * saved_regs_num);
+      memset (saved_reg_conflicts, 0, saved_regs_num * saved_regs_num);
+      for (chain = reload_insn_chain; chain != 0; chain = next)
+       {
+         call_saved_regs_num = 0;
+         insn = chain->insn;
+         next = chain->next;
+         if (GET_CODE (insn) != CALL_INSN
+             || find_reg_note (insn, REG_NORETURN, NULL))
+           continue;
+         REG_SET_TO_HARD_REG_SET (hard_regs_to_save,
+                                  &chain->live_throughout);
+         COPY_HARD_REG_SET (used_regs, call_used_reg_set);
+
+         /* Record all registers set in this call insn.  These don't
+            need to be saved.  N.B. the call insn might set a subreg
+            of a multi-hard-reg pseudo; then the pseudo is considered
+            live during the call, but the subreg that is set
+            isn't.  */
+         CLEAR_HARD_REG_SET (this_insn_sets);
+         note_stores (PATTERN (insn), mark_set_regs, &this_insn_sets);
+         /* Sibcalls are considered to set the return value,
+            compare flow.c:propagate_one_insn.  */
+         if (SIBLING_CALL_P (insn) && crtl->return_rtx)
+           mark_set_regs (crtl->return_rtx, NULL_RTX, &this_insn_sets);
+
+         AND_COMPL_HARD_REG_SET (used_regs, call_fixed_reg_set);
+         AND_COMPL_HARD_REG_SET (used_regs, this_insn_sets);
+         AND_HARD_REG_SET (hard_regs_to_save, used_regs);
+         for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
+           if (TEST_HARD_REG_BIT (hard_regs_to_save, regno))
+             {
+               gcc_assert (hard_reg_map[regno] != NULL);
+               call_saved_regs[call_saved_regs_num++] = hard_reg_map[regno];
+             }
+         /* Look through all live pseudos, mark their hard registers.  */
+         EXECUTE_IF_SET_IN_REG_SET
+           (&chain->live_throughout, FIRST_PSEUDO_REGISTER, regno, rsi)
+           {
+             int r = reg_renumber[regno];
+             int bound;
+             
+             if (r < 0)
+               continue;
 
-       for (k = 0; k < j; k++)
-         if (! TEST_HARD_REG_BIT (hard_regs_used, i + k))
+             bound = r + hard_regno_nregs[r][PSEUDO_REGNO_MODE (regno)];
+             for (; r < bound; r++)
+               if (TEST_HARD_REG_BIT (used_regs, r))
+                 call_saved_regs[call_saved_regs_num++] = hard_reg_map[r];
+           }
+         for (i = 0; i < call_saved_regs_num; i++)
            {
-             do_save = 0;
-             break;
+             saved_reg = call_saved_regs[i];
+             for (j = 0; j < call_saved_regs_num; j++)
+               if (i != j)
+                 {
+                   saved_reg2 = call_saved_regs[j];
+                   saved_reg_conflicts[saved_reg->num * saved_regs_num
+                                       + saved_reg2->num]
+                     = saved_reg_conflicts[saved_reg2->num * saved_regs_num
+                                           + saved_reg->num]
+                     = TRUE;
+                 }
            }
-       if (! do_save)
-         continue;
-
-       /* We have found an acceptable mode to store in.  */
-       regno_save_mem[i][j]
-         = assign_stack_local (regno_save_mode[i][j],
-                               GET_MODE_SIZE (regno_save_mode[i][j]), 0);
-
-       /* Setup single word save area just in case...  */
-       for (k = 0; k < j; k++)
+       }
+      /* Sort saved hard regs.  */
+      qsort (all_saved_regs, saved_regs_num, sizeof (struct saved_hard_reg *),
+            saved_hard_reg_compare_func);
+      /* Initiate slots available from the previous reload
+        iteration.  */
+      prev_save_slots_num = save_slots_num;
+      memcpy (prev_save_slots, save_slots, save_slots_num * sizeof (rtx));
+      save_slots_num = 0;
+      /* Allocate stack slots for the saved hard registers.  */
+      for (i = 0; i < saved_regs_num; i++)
+       {
+         saved_reg = all_saved_regs[i];
+         regno = saved_reg->hard_regno;
+         for (j = 0; j < i; j++)
+           {
+             saved_reg2 = all_saved_regs[j];
+             if (! saved_reg2->first_p)
+               continue;
+             slot = saved_reg2->slot;
+             for (k = j; k >= 0; k = next_k)
+               {
+                 saved_reg3 = all_saved_regs[k];
+                 next_k = saved_reg3->next;
+                 if (saved_reg_conflicts[saved_reg->num * saved_regs_num
+                                         + saved_reg3->num])
+                   break;
+               }
+             if (k < 0
+                 && (GET_MODE_SIZE (regno_save_mode[regno][1])
+                     <= GET_MODE_SIZE (regno_save_mode
+                                       [saved_reg2->hard_regno][1])))
+               {
+                 saved_reg->slot
+                   = adjust_address_nv
+                     (slot, regno_save_mode[saved_reg->hard_regno][1], 0);
+                 regno_save_mem[regno][1] = saved_reg->slot;
+                 saved_reg->next = saved_reg2->next;
+                 saved_reg2->next = i;
+                 if (dump_file != NULL)
+                   fprintf (dump_file, "%d uses slot of %d\n",
+                            regno, saved_reg2->hard_regno);
+                 break;
+               }
+           }
+         if (j == i)
+           {
+             saved_reg->first_p = TRUE;
+             for (best_slot_num = -1, j = 0; j < prev_save_slots_num; j++)
+               {
+                 slot = prev_save_slots[j];
+                 if (slot == NULL_RTX)
+                   continue;
+                 if (GET_MODE_SIZE (regno_save_mode[regno][1])
+                     <= GET_MODE_SIZE (GET_MODE (slot))
+                     && best_slot_num < 0)
+                   best_slot_num = j;
+                 if (GET_MODE (slot) == regno_save_mode[regno][1])
+                   break;
+               }
+             if (best_slot_num >= 0)
+               {
+                 saved_reg->slot = prev_save_slots[best_slot_num];
+                 saved_reg->slot
+                   = adjust_address_nv
+                     (saved_reg->slot,
+                      regno_save_mode[saved_reg->hard_regno][1], 0);
+                 if (dump_file != NULL)
+                   fprintf (dump_file,
+                            "%d uses a slot from prev iteration\n", regno);
+                 prev_save_slots[best_slot_num] = NULL_RTX;
+                 if (best_slot_num + 1 == prev_save_slots_num)
+                   prev_save_slots_num--;
+               }
+             else
+               {
+                 saved_reg->slot
+                   = assign_stack_local_1
+                     (regno_save_mode[regno][1],
+                      GET_MODE_SIZE (regno_save_mode[regno][1]), 0, true);
+                 if (dump_file != NULL)
+                   fprintf (dump_file, "%d uses a new slot\n", regno);
+               }
+             regno_save_mem[regno][1] = saved_reg->slot;
+             save_slots[save_slots_num++] = saved_reg->slot;
+           }
+       }
+      free (saved_reg_conflicts);
+      finish_saved_hard_regs ();
+    }
+  else
+    {
+      /* Now run through all the call-used hard-registers and allocate
+        space for them in the caller-save area.  Try to allocate space
+        in a manner which allows multi-register saves/restores to be done.  */
+      
+      for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
+       for (j = MOVE_MAX_WORDS; j > 0; j--)
          {
-           /* This should not depend on WORDS_BIG_ENDIAN.
-              The order of words in regs is the same as in memory.  */
-           rtx temp = gen_rtx_MEM (regno_save_mode[i+k][1], 
-                                   XEXP (regno_save_mem[i][j], 0));
-
-           regno_save_mem[i+k][1] 
-             = adj_offsettable_operand (temp, k * UNITS_PER_WORD);
+           int do_save = 1;
+           
+           /* If no mode exists for this size, try another.  Also break out
+              if we have already saved this hard register.  */
+           if (regno_save_mode[i][j] == VOIDmode || regno_save_mem[i][1] != 0)
+             continue;
+           
+           /* See if any register in this group has been saved.  */
+           for (k = 0; k < j; k++)
+             if (regno_save_mem[i + k][1])
+               {
+                 do_save = 0;
+                 break;
+               }
+           if (! do_save)
+             continue;
+           
+           for (k = 0; k < j; k++)
+             if (! TEST_HARD_REG_BIT (hard_regs_used, i + k))
+               {
+                 do_save = 0;
+                 break;
+               }
+           if (! do_save)
+             continue;
+           
+           /* We have found an acceptable mode to store in.  Since
+              hard register is always saved in the widest mode
+              available, the mode may be wider than necessary, it is
+              OK to reduce the alignment of spill space.  We will
+              verify that it is equal to or greater than required
+              when we restore and save the hard register in
+              insert_restore and insert_save.  */
+           regno_save_mem[i][j]
+             = assign_stack_local_1 (regno_save_mode[i][j],
+                                     GET_MODE_SIZE (regno_save_mode[i][j]),
+                                     0, true);
+           
+           /* Setup single word save area just in case...  */
+           for (k = 0; k < j; k++)
+             /* This should not depend on WORDS_BIG_ENDIAN.
+                The order of words in regs is the same as in memory.  */
+             regno_save_mem[i + k][1]
+               = adjust_address_nv (regno_save_mem[i][j],
+                                    regno_save_mode[i + k][1],
+                                    k * UNITS_PER_WORD);
          }
-      }
+    }
+
+  /* Now loop again and set the alias set of any save areas we made to
+     the alias set used to represent frame objects.  */
+  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
+    for (j = MOVE_MAX_WORDS; j > 0; j--)
+      if (regno_save_mem[i][j] != 0)
+       set_mem_alias_set (regno_save_mem[i][j], get_frame_alias_set ());
 }
+
 \f
+
 /* Find the places where hard regs are live across calls and save them.  */
+
 void
-save_call_clobbered_regs ()
+save_call_clobbered_regs (void)
 {
   struct insn_chain *chain, *next;
+  enum machine_mode save_mode [FIRST_PSEUDO_REGISTER];
+
+  /* Computed in mark_set_regs, holds all registers set by the current
+     instruction.  */
+  HARD_REG_SET this_insn_sets;
 
   CLEAR_HARD_REG_SET (hard_regs_saved);
   n_regs_saved = 0;
@@ -346,10 +767,9 @@ save_call_clobbered_regs ()
 
       next = chain->next;
 
-      if (chain->is_caller_save_insn)
-       abort ();
+      gcc_assert (!chain->is_caller_save_insn);
 
-      if (GET_RTX_CLASS (code) == 'i')
+      if (INSN_P (insn))
        {
          /* If some registers have been saved, see if INSN references
             any of them.  We must restore them before the insn if so.  */
@@ -370,27 +790,55 @@ save_call_clobbered_regs ()
 
              for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
                if (TEST_HARD_REG_BIT (referenced_regs, regno))
-                 regno += insert_restore (chain, 1, regno, MOVE_MAX_WORDS);
+                 regno += insert_restore (chain, 1, regno, MOVE_MAX_WORDS, save_mode);
            }
 
-         if (code == CALL_INSN)
+         if (code == CALL_INSN
+             && ! SIBLING_CALL_P (insn)
+             && ! find_reg_note (insn, REG_NORETURN, NULL))
            {
-             int regno;
+             unsigned regno;
              HARD_REG_SET hard_regs_to_save;
+             reg_set_iterator rsi;
 
              /* Use the register life information in CHAIN to compute which
                 regs are live during the call.  */
              REG_SET_TO_HARD_REG_SET (hard_regs_to_save,
                                       &chain->live_throughout);
-             compute_use_by_pseudos (&hard_regs_to_save,
-                                     &chain->live_throughout);
+             /* Save hard registers always in the widest mode available.  */
+             for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
+               if (TEST_HARD_REG_BIT (hard_regs_to_save, regno))
+                 save_mode [regno] = regno_save_mode [regno][1];
+               else
+                 save_mode [regno] = VOIDmode;
+
+             /* Look through all live pseudos, mark their hard registers
+                and choose proper mode for saving.  */
+             EXECUTE_IF_SET_IN_REG_SET
+               (&chain->live_throughout, FIRST_PSEUDO_REGISTER, regno, rsi)
+               {
+                 int r = reg_renumber[regno];
+                 int nregs;
+                 enum machine_mode mode;
+
+                 if (r < 0)
+                   continue;
+                 nregs = hard_regno_nregs[r][PSEUDO_REGNO_MODE (regno)];
+                 mode = HARD_REGNO_CALLER_SAVE_MODE
+                   (r, nregs, PSEUDO_REGNO_MODE (regno));
+                 if (GET_MODE_BITSIZE (mode)
+                     > GET_MODE_BITSIZE (save_mode[r]))
+                   save_mode[r] = mode;
+                 while (nregs-- > 0)
+                   SET_HARD_REG_BIT (hard_regs_to_save, r + nregs);
+               }
 
              /* Record all registers set in this call insn.  These don't need
                 to be saved.  N.B. the call insn might set a subreg of a
                 multi-hard-reg pseudo; then the pseudo is considered live
                 during the call, but the subreg that is set isn't.  */
              CLEAR_HARD_REG_SET (this_insn_sets);
-             note_stores (PATTERN (insn), mark_set_regs, NULL);
+             note_stores (PATTERN (insn), mark_set_regs, &this_insn_sets);
 
              /* Compute which hard regs must be saved before this call.  */
              AND_COMPL_HARD_REG_SET (hard_regs_to_save, call_fixed_reg_set);
@@ -400,7 +848,7 @@ save_call_clobbered_regs ()
 
              for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
                if (TEST_HARD_REG_BIT (hard_regs_to_save, regno))
-                 regno += insert_save (chain, 1, regno, &hard_regs_to_save);
+                 regno += insert_save (chain, 1, regno, &hard_regs_to_save, save_mode);
 
              /* Must recompute n_regs_saved.  */
              n_regs_saved = 0;
@@ -410,7 +858,7 @@ save_call_clobbered_regs ()
            }
        }
 
-      if (chain->next == 0 || chain->next->block > chain->block)
+      if (chain->next == 0 || chain->next->block != chain->block)
        {
          int regno;
          /* At the end of the basic block, we must restore any registers that
@@ -420,40 +868,42 @@ save_call_clobbered_regs ()
          if (n_regs_saved)
            for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
              if (TEST_HARD_REG_BIT (hard_regs_saved, regno))
-               regno += insert_restore (chain, GET_CODE (insn) == JUMP_INSN,
-                                        regno, MOVE_MAX_WORDS);
+               regno += insert_restore (chain, JUMP_P (insn),
+                                        regno, MOVE_MAX_WORDS, save_mode);
        }
-    }  
+    }
 }
 
-/* Here from note_stores when an insn stores a value in a register.
+/* Here from note_stores, or directly from save_call_clobbered_regs, when
+   an insn stores a value in a register.
    Set the proper bit or bits in this_insn_sets.  All pseudos that have
    been assigned hard regs have had their register number changed already,
    so we can ignore pseudos.  */
 static void
-mark_set_regs (reg, setter, data)
-     rtx reg;
-     rtx setter ATTRIBUTE_UNUSED;
-     void *data ATTRIBUTE_UNUSED;
+mark_set_regs (rtx reg, const_rtx setter ATTRIBUTE_UNUSED, void *data)
 {
-  register int regno, endregno, i;
-  enum machine_mode mode = GET_MODE (reg);
-  int word = 0;
+  int regno, endregno, i;
+  HARD_REG_SET *this_insn_sets = (HARD_REG_SET *) data;
 
   if (GET_CODE (reg) == SUBREG)
     {
-      word = SUBREG_WORD (reg);
-      reg = SUBREG_REG (reg);
+      rtx inner = SUBREG_REG (reg);
+      if (!REG_P (inner) || REGNO (inner) >= FIRST_PSEUDO_REGISTER)
+       return;
+      regno = subreg_regno (reg);
+      endregno = regno + subreg_nregs (reg);
     }
-
-  if (GET_CODE (reg) != REG || REGNO (reg) >= FIRST_PSEUDO_REGISTER)
+  else if (REG_P (reg)
+          && REGNO (reg) < FIRST_PSEUDO_REGISTER)
+    {
+      regno = REGNO (reg);
+      endregno = END_HARD_REGNO (reg);
+    }
+  else
     return;
 
-  regno = REGNO (reg) + word;
-  endregno = regno + HARD_REGNO_NREGS (regno, mode);
-
   for (i = regno; i < endregno; i++)
-    SET_HARD_REG_BIT (this_insn_sets, i);
+    SET_HARD_REG_BIT (*this_insn_sets, i);
 }
 
 /* Here from note_stores when an insn stores a value in a register.
@@ -461,29 +911,34 @@ mark_set_regs (reg, setter, data)
    been assigned hard regs have had their register number changed already,
    so we can ignore pseudos.  */
 static void
-add_stored_regs (reg, setter, data)
-     rtx reg;
-     rtx setter;
-     void *data;
+add_stored_regs (rtx reg, const_rtx setter, void *data)
 {
-  register int regno, endregno, i;
+  int regno, endregno, i;
   enum machine_mode mode = GET_MODE (reg);
-  int word = 0;
+  int offset = 0;
 
   if (GET_CODE (setter) == CLOBBER)
     return;
 
-  while (GET_CODE (reg) == SUBREG)
+  if (GET_CODE (reg) == SUBREG
+      && REG_P (SUBREG_REG (reg))
+      && REGNO (SUBREG_REG (reg)) < FIRST_PSEUDO_REGISTER)
     {
-      word += SUBREG_WORD (reg);
-      reg = SUBREG_REG (reg);
+      offset = subreg_regno_offset (REGNO (SUBREG_REG (reg)),
+                                   GET_MODE (SUBREG_REG (reg)),
+                                   SUBREG_BYTE (reg),
+                                   GET_MODE (reg));
+      regno = REGNO (SUBREG_REG (reg)) + offset;
+      endregno = regno + subreg_nregs (reg);
     }
+  else
+    {
+      if (!REG_P (reg) || REGNO (reg) >= FIRST_PSEUDO_REGISTER)
+       return;
 
-  if (GET_CODE (reg) != REG || REGNO (reg) >= FIRST_PSEUDO_REGISTER)
-    return;
-
-  regno = REGNO (reg) + word;
-  endregno = regno + HARD_REGNO_NREGS (regno, mode);
+      regno = REGNO (reg) + offset;
+      endregno = end_hard_regno (mode, regno);
+    }
 
   for (i = regno; i < endregno; i++)
     SET_REGNO_REG_SET ((regset) data, i);
@@ -491,8 +946,7 @@ add_stored_regs (reg, setter, data)
 
 /* Walk X and record all referenced registers in REFERENCED_REGS.  */
 static void
-mark_referenced_regs (x)
-     rtx x;
+mark_referenced_regs (rtx x)
 {
   enum rtx_code code = GET_CODE (x);
   const char *fmt;
@@ -504,8 +958,17 @@ mark_referenced_regs (x)
     {
       x = SET_DEST (x);
       code = GET_CODE (x);
-      if (code == REG || code == PC || code == CC0
-         || (code == SUBREG && GET_CODE (SUBREG_REG (x)) == REG))
+      if ((code == REG && REGNO (x) < FIRST_PSEUDO_REGISTER)
+         || code == PC || code == CC0
+         || (code == SUBREG && REG_P (SUBREG_REG (x))
+             && REGNO (SUBREG_REG (x)) < FIRST_PSEUDO_REGISTER
+             /* If we're setting only part of a multi-word register,
+                we shall mark it as referenced, because the words
+                that are not being set should be restored.  */
+             && ((GET_MODE_SIZE (GET_MODE (x))
+                  >= GET_MODE_SIZE (GET_MODE (SUBREG_REG (x))))
+                 || (GET_MODE_SIZE (GET_MODE (SUBREG_REG (x)))
+                     <= UNITS_PER_WORD))))
        return;
     }
   if (code == MEM || code == SUBREG)
@@ -521,11 +984,7 @@ mark_referenced_regs (x)
                       : reg_renumber[regno]);
 
       if (hardregno >= 0)
-       {
-         int nregs = HARD_REGNO_NREGS (hardregno, GET_MODE (x));
-         while (nregs-- > 0)
-           SET_HARD_REG_BIT (referenced_regs, hardregno + nregs);
-       }
+       add_to_hard_reg_set (&referenced_regs, GET_MODE (x), hardregno);
       /* If this is a pseudo that did not get a hard register, scan its
         memory location, since it might involve the use of another
         register, which might be saved.  */
@@ -561,27 +1020,23 @@ mark_referenced_regs (x)
    Return the extra number of registers saved.  */
 
 static int
-insert_restore (chain, before_p, regno, maxrestore)
-     struct insn_chain *chain;
-     int before_p;
-     int regno;
-     int maxrestore;
+insert_restore (struct insn_chain *chain, int before_p, int regno,
+               int maxrestore, enum machine_mode *save_mode)
 {
   int i, k;
   rtx pat = NULL_RTX;
-  enum insn_code code = CODE_FOR_nothing;
-  int numregs = 0;
-  struct insn_chain *new;
-
-  /* A common failure mode if register status is not correct in the RTL
-     is for this routine to be called with a REGNO we didn't expect to
-     save.  That will cause us to write an insn with a (nil) SET_DEST
-     or SET_SRC.  Instead of doing so and causing a crash later, check
-     for this common case and abort here instead.  This will remove one
-     step in debugging such problems.  */
-
-  if (regno_save_mem[regno][1] == 0)
-    abort ();
+  int code;
+  unsigned int numregs = 0;
+  struct insn_chain *new_chain;
+  rtx mem;
+
+  /* A common failure mode if register status is not correct in the
+     RTL is for this routine to be called with a REGNO we didn't
+     expect to save.  That will cause us to write an insn with a (nil)
+     SET_DEST or SET_SRC.  Instead of doing so and causing a crash
+     later, check for this common case here instead.  This will remove
+     one step in debugging such problems.  */
+  gcc_assert (regno_save_mem[regno][1]);
 
   /* Get the pattern to emit and update our status.
 
@@ -601,7 +1056,7 @@ insert_restore (chain, before_p, regno, maxrestore)
            ok = 0;
            break;
          }
-      /* Must do this one restore at a time */
+      /* Must do this one restore at a time */
       if (! ok)
        continue;
 
@@ -609,54 +1064,65 @@ insert_restore (chain, before_p, regno, maxrestore)
       break;
     }
 
+  mem = regno_save_mem [regno][numregs];
+  if (save_mode [regno] != VOIDmode
+      && save_mode [regno] != GET_MODE (mem)
+      && numregs == (unsigned int) hard_regno_nregs[regno][save_mode [regno]]
+      /* Check that insn to restore REGNO in save_mode[regno] is
+        correct.  */
+      && reg_save_code (regno, save_mode[regno]) >= 0)
+    mem = adjust_address (mem, save_mode[regno], 0);
+  else
+    mem = copy_rtx (mem);
+
+  /* Verify that the alignment of spill space is equal to or greater
+     than required.  */
+  gcc_assert (MIN (MAX_SUPPORTED_STACK_ALIGNMENT,
+                  GET_MODE_ALIGNMENT (GET_MODE (mem))) <= MEM_ALIGN (mem));
+
   pat = gen_rtx_SET (VOIDmode,
-                    gen_rtx_REG (GET_MODE (regno_save_mem[regno][numregs]), 
-                                 regno), 
-                    regno_save_mem[regno][numregs]);
-  code = reg_restore_code[regno][numregs];
-  new = insert_one_insn (chain, before_p, code, pat);
+                    gen_rtx_REG (GET_MODE (mem),
+                                 regno), mem);
+  code = reg_restore_code (regno, GET_MODE (mem));
+  new_chain = insert_one_insn (chain, before_p, code, pat);
 
   /* Clear status for all registers we restored.  */
   for (k = 0; k < i; k++)
     {
       CLEAR_HARD_REG_BIT (hard_regs_saved, regno + k);
-      SET_REGNO_REG_SET (&new->dead_or_set, regno + k);
+      SET_REGNO_REG_SET (&new_chain->dead_or_set, regno + k);
       n_regs_saved--;
     }
 
-
-
-  /* Tell our callers how many extra registers we saved/restored */
+  /* Tell our callers how many extra registers we saved/restored.  */
   return numregs - 1;
 }
 
 /* Like insert_restore above, but save registers instead.  */
+
 static int
-insert_save (chain, before_p, regno, to_save)
-     struct insn_chain *chain;
-     int before_p;
-     int regno;
-     HARD_REG_SET *to_save;
+insert_save (struct insn_chain *chain, int before_p, int regno,
+            HARD_REG_SET (*to_save), enum machine_mode *save_mode)
 {
-  int i, k;
+  int i;
+  unsigned int k;
   rtx pat = NULL_RTX;
-  enum insn_code code = CODE_FOR_nothing;
-  int numregs = 0;
-  struct insn_chain *new;
-
-  /* A common failure mode if register status is not correct in the RTL
-     is for this routine to be called with a REGNO we didn't expect to
-     save.  That will cause us to write an insn with a (nil) SET_DEST
-     or SET_SRC.  Instead of doing so and causing a crash later, check
-     for this common case and abort here instead.  This will remove one
+  int code;
+  unsigned int numregs = 0;
+  struct insn_chain *new_chain;
+  rtx mem;
+
+  /* A common failure mode if register status is not correct in the
+     RTL is for this routine to be called with a REGNO we didn't
+     expect to save.  That will cause us to write an insn with a (nil)
+     SET_DEST or SET_SRC.  Instead of doing so and causing a crash
+     later, check for this common case here.  This will remove one
      step in debugging such problems.  */
-
-  if (regno_save_mem[regno][1] == 0)
-    abort ();
+  gcc_assert (regno_save_mem[regno][1]);
 
   /* Get the pattern to emit and update our status.
 
-     See if we can save several registers with a single instruction.  
+     See if we can save several registers with a single instruction.
      Work backwards to the single register case.  */
   for (i = MOVE_MAX_WORDS; i > 0; i--)
     {
@@ -671,7 +1137,7 @@ insert_save (chain, before_p, regno, to_save)
            ok = 0;
            break;
          }
-      /* Must do this one save at a time */
+      /* Must do this one save at a time */
       if (! ok)
        continue;
 
@@ -679,35 +1145,47 @@ insert_save (chain, before_p, regno, to_save)
       break;
     }
 
-  pat = gen_rtx_SET (VOIDmode, regno_save_mem[regno][numregs],
-                    gen_rtx_REG (GET_MODE (regno_save_mem[regno][numregs]),
+  mem = regno_save_mem [regno][numregs];
+  if (save_mode [regno] != VOIDmode
+      && save_mode [regno] != GET_MODE (mem)
+      && numregs == (unsigned int) hard_regno_nregs[regno][save_mode [regno]]
+      /* Check that insn to save REGNO in save_mode[regno] is
+        correct.  */
+      && reg_save_code (regno, save_mode[regno]) >= 0)
+    mem = adjust_address (mem, save_mode[regno], 0);
+  else
+    mem = copy_rtx (mem);
+
+  /* Verify that the alignment of spill space is equal to or greater
+     than required.  */
+  gcc_assert (MIN (MAX_SUPPORTED_STACK_ALIGNMENT,
+                  GET_MODE_ALIGNMENT (GET_MODE (mem))) <= MEM_ALIGN (mem));
+
+  pat = gen_rtx_SET (VOIDmode, mem,
+                    gen_rtx_REG (GET_MODE (mem),
                                  regno));
-  code = reg_save_code[regno][numregs];
-  new = insert_one_insn (chain, before_p, code, pat);
+  code = reg_save_code (regno, GET_MODE (mem));
+  new_chain = insert_one_insn (chain, before_p, code, pat);
 
   /* Set hard_regs_saved and dead_or_set for all the registers we saved.  */
   for (k = 0; k < numregs; k++)
     {
       SET_HARD_REG_BIT (hard_regs_saved, regno + k);
-      SET_REGNO_REG_SET (&new->dead_or_set, regno + k);
+      SET_REGNO_REG_SET (&new_chain->dead_or_set, regno + k);
       n_regs_saved++;
     }
 
-  /* Tell our callers how many extra registers we saved/restored */
+  /* Tell our callers how many extra registers we saved/restored */
   return numregs - 1;
 }
 
 /* Emit a new caller-save insn and set the code.  */
 static struct insn_chain *
-insert_one_insn (chain, before_p, code, pat)
-     struct insn_chain *chain;
-     int before_p;
-     enum insn_code code;
-     rtx pat;
+insert_one_insn (struct insn_chain *chain, int before_p, int code, rtx pat)
 {
   rtx insn = chain->insn;
-  struct insn_chain *new;
-  
+  struct insn_chain *new_chain;
+
 #ifdef HAVE_cc0
   /* If INSN references CC0, put our insns in front of the insn that sets
      CC0.  This is always safe, since the only way we could be passed an
@@ -715,77 +1193,110 @@ insert_one_insn (chain, before_p, code, pat)
      isn't a problem.  We do, however, assume here that CALL_INSNs don't
      reference CC0.  Guard against non-INSN's like CODE_LABEL.  */
 
-  if ((GET_CODE (insn) == INSN || GET_CODE (insn) == JUMP_INSN)
+  if ((NONJUMP_INSN_P (insn) || JUMP_P (insn))
       && before_p
       && reg_referenced_p (cc0_rtx, PATTERN (insn)))
     chain = chain->prev, insn = chain->insn;
 #endif
 
-  new = new_insn_chain ();
+  new_chain = new_insn_chain ();
   if (before_p)
     {
       rtx link;
 
-      new->prev = chain->prev;
-      if (new->prev != 0)
-       new->prev->next = new;
+      new_chain->prev = chain->prev;
+      if (new_chain->prev != 0)
+       new_chain->prev->next = new_chain;
       else
-       reload_insn_chain = new;
+       reload_insn_chain = new_chain;
 
-      chain->prev = new;
-      new->next = chain;
-      new->insn = emit_insn_before (pat, insn);
+      chain->prev = new_chain;
+      new_chain->next = chain;
+      new_chain->insn = emit_insn_before (pat, insn);
       /* ??? It would be nice if we could exclude the already / still saved
         registers from the live sets.  */
-      COPY_REG_SET (&new->live_throughout, &chain->live_throughout);
-      /* Registers that die in CHAIN->INSN still live in the new insn.  */
+      COPY_REG_SET (&new_chain->live_throughout, &chain->live_throughout);
+      /* Registers that die in CHAIN->INSN still live in the new insn.
+        Likewise for those which are autoincremented or autodecremented.  */
       for (link = REG_NOTES (chain->insn); link; link = XEXP (link, 1))
        {
-         if (REG_NOTE_KIND (link) == REG_DEAD)
+         enum reg_note kind = REG_NOTE_KIND (link);
+         if (kind == REG_DEAD || kind == REG_INC)
            {
              rtx reg = XEXP (link, 0);
              int regno, i;
 
-             if (GET_CODE (reg) != REG)
-               abort ();
-
+             gcc_assert (REG_P (reg));
              regno = REGNO (reg);
              if (regno >= FIRST_PSEUDO_REGISTER)
                regno = reg_renumber[regno];
              if (regno < 0)
                continue;
-             for (i = HARD_REGNO_NREGS (regno, GET_MODE (reg)) - 1;
+             for (i = hard_regno_nregs[regno][GET_MODE (reg)] - 1;
                   i >= 0; i--)
-               SET_REGNO_REG_SET (&new->live_throughout, regno + i);
+               SET_REGNO_REG_SET (&new_chain->live_throughout, regno + i);
            }
        }
-      CLEAR_REG_SET (&new->dead_or_set);
-      if (chain->insn == BLOCK_HEAD (chain->block))
-       BLOCK_HEAD (chain->block) = new->insn;
+
+      /* If CHAIN->INSN is a call, then the registers which contain
+        the arguments to the function are live in the new insn.  */
+      if (CALL_P (chain->insn))
+       {
+         for (link = CALL_INSN_FUNCTION_USAGE (chain->insn);
+              link != NULL_RTX;
+              link = XEXP (link, 1))
+           {
+             rtx arg = XEXP (link, 0);
+
+             if (GET_CODE (arg) == USE)
+               {
+                 rtx reg = XEXP (arg, 0);
+
+                 if (REG_P (reg))
+                   {
+                     int i, regno = REGNO (reg);
+
+                     /* Registers in CALL_INSN_FUNCTION_USAGE are always
+                        hard registers.  */
+                     gcc_assert (regno < FIRST_PSEUDO_REGISTER);
+
+                     for (i = hard_regno_nregs[regno][GET_MODE (reg)] - 1;
+                          i >= 0; i--)
+                       SET_REGNO_REG_SET (&new_chain->live_throughout, regno + i);
+                   }
+               }
+           }
+         
+       }
+
+      CLEAR_REG_SET (&new_chain->dead_or_set);
+      if (chain->insn == BB_HEAD (BASIC_BLOCK (chain->block)))
+       BB_HEAD (BASIC_BLOCK (chain->block)) = new_chain->insn;
     }
   else
     {
-      new->next = chain->next;
-      if (new->next != 0)
-       new->next->prev = new;
-      chain->next = new;
-      new->prev = chain;
-      new->insn = emit_insn_after (pat, insn);
+      new_chain->next = chain->next;
+      if (new_chain->next != 0)
+       new_chain->next->prev = new_chain;
+      chain->next = new_chain;
+      new_chain->prev = chain;
+      new_chain->insn = emit_insn_after (pat, insn);
       /* ??? It would be nice if we could exclude the already / still saved
         registers from the live sets, and observe REG_UNUSED notes.  */
-      COPY_REG_SET (&new->live_throughout, &chain->live_throughout);
+      COPY_REG_SET (&new_chain->live_throughout, &chain->live_throughout);
       /* Registers that are set in CHAIN->INSN live in the new insn.
-         (Unless there is a REG_UNUSED note for them, but we don't
+        (Unless there is a REG_UNUSED note for them, but we don't
          look for them here.) */
       note_stores (PATTERN (chain->insn), add_stored_regs,
-                  &new->live_throughout);
-      CLEAR_REG_SET (&new->dead_or_set);
-      if (chain->insn == BLOCK_END (chain->block))
-       BLOCK_END (chain->block) = new->insn;
+                  &new_chain->live_throughout);
+      CLEAR_REG_SET (&new_chain->dead_or_set);
+      if (chain->insn == BB_END (BASIC_BLOCK (chain->block)))
+       BB_END (BASIC_BLOCK (chain->block)) = new_chain->insn;
     }
-  new->block = chain->block;
-  new->is_caller_save_insn = 1;
+  new_chain->block = chain->block;
+  new_chain->is_caller_save_insn = 1;
 
-  INSN_CODE (new->insn) = code;
-  return new;
+  INSN_CODE (new_chain->insn) = code;
+  return new_chain;
 }
+#include "gt-caller-save.h"