OSDN Git Service

* Makefile.in (tree-into-ssa.o, tree-outof-ssa.o,
[pf3gnuchains/gcc-fork.git] / gcc / reg-stack.c
index 3f8df8d..4ed7204 100644 (file)
@@ -1,6 +1,6 @@
 /* Register to Stack convert for GNU compiler.
-   Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998,
-   1999, 2000, 2001, 2002 Free Software Foundation, Inc.
+   Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
+   2000, 2001, 2002, 2003, 2004, 2005 Free Software Foundation, Inc.
 
    This file is part of GCC.
 
@@ -16,8 +16,8 @@
 
    You should have received a copy of the GNU General Public License
    along with GCC; see the file COPYING.  If not, write to the Free
-   Software Foundation, 59 Temple Place - Suite 330, Boston, MA
-   02111-1307, USA.  */
+   Software Foundation, 51 Franklin Street, Fifth Floor, Boston, MA
+   02110-1301, USA.  */
 
 /* This pass converts stack-like registers from the "flat register
    file" model that gcc uses, to a stack convention that the 387 uses.
                asm ("foo" : "=t" (a) : "f" (b));
 
       This asm says that input B is not popped by the asm, and that
-      the asm pushes a result onto the reg-stack, ie, the stack is one
+      the asm pushes a result onto the reg-stack, i.e., the stack is one
       deeper after the asm than it was before.  But, it is possible that
       reload will think that it can use the same reg for both the input and
       the output, if input B dies in this insn.
 \f
 #include "config.h"
 #include "system.h"
+#include "coretypes.h"
+#include "tm.h"
 #include "tree.h"
 #include "rtl.h"
 #include "tm_p.h"
 #include "varray.h"
 #include "reload.h"
 #include "ggc.h"
+#include "timevar.h"
+#include "tree-pass.h"
+#include "target.h"
+#include "vecprim.h"
+
+#ifdef STACK_REGS
 
 /* We use this array to cache info about insns, because otherwise we
    spend too much time in stack_regs_mentioned_p.
    Indexed by insn UIDs.  A value of zero is uninitialized, one indicates
    the insn uses stack registers, two indicates the insn does not use
    stack registers.  */
-static GTY(()) varray_type stack_regs_mentioned_data;
-
-#ifdef STACK_REGS
+static VEC(char,heap) *stack_regs_mentioned_data;
 
 #define REG_STACK_SIZE (LAST_STACK_REG - FIRST_STACK_REG + 1)
 
@@ -206,7 +212,7 @@ typedef struct block_info_def
   struct stack_def stack_out;  /* Output stack configuration.  */
   HARD_REG_SET out_reg_set;    /* Stack regs live on output.  */
   int done;                    /* True if block already converted.  */
-  int predecessors;            /* Number of predecessors that needs
+  int predecessors;            /* Number of predecessors that need
                                   to be visited.  */
 } *block_info;
 
@@ -222,7 +228,12 @@ enum emit_where
 /* The block we're currently working on.  */
 static basic_block current_block;
 
-/* This is the register file for all register after conversion */
+/* In the current_block, whether we're processing the first register
+   stack or call instruction, i.e. the regstack is currently the
+   same as BLOCK_INFO(current_block)->stack_in.  */
+static bool starting_stack_p;
+
+/* This is the register file for all register after conversion.  */
 static rtx
   FP_mode_reg[LAST_STACK_REG+1-FIRST_STACK_REG][(int) MAX_MACHINE_MODE];
 
@@ -230,49 +241,38 @@ static rtx
   (FP_mode_reg[(regno)-FIRST_STACK_REG][(int) (mode)])
 
 /* Used to initialize uninitialized registers.  */
-static rtx nan;
+static rtx not_a_num;
 
 /* Forward declarations */
 
-static int stack_regs_mentioned_p      PARAMS ((rtx pat));
-static void straighten_stack           PARAMS ((rtx, stack));
-static void pop_stack                  PARAMS ((stack, int));
-static rtx *get_true_reg               PARAMS ((rtx *));
-
-static int check_asm_stack_operands    PARAMS ((rtx));
-static int get_asm_operand_n_inputs    PARAMS ((rtx));
-static rtx stack_result                        PARAMS ((tree));
-static void replace_reg                        PARAMS ((rtx *, int));
-static void remove_regno_note          PARAMS ((rtx, enum reg_note,
-                                                unsigned int));
-static int get_hard_regnum             PARAMS ((stack, rtx));
-static rtx emit_pop_insn               PARAMS ((rtx, stack, rtx,
-                                              enum emit_where));
-static void emit_swap_insn             PARAMS ((rtx, stack, rtx));
-static void move_for_stack_reg         PARAMS ((rtx, stack, rtx));
-static int swap_rtx_condition_1                PARAMS ((rtx));
-static int swap_rtx_condition          PARAMS ((rtx));
-static void compare_for_stack_reg      PARAMS ((rtx, stack, rtx));
-static void subst_stack_regs_pat       PARAMS ((rtx, stack, rtx));
-static void subst_asm_stack_regs       PARAMS ((rtx, stack));
-static void subst_stack_regs           PARAMS ((rtx, stack));
-static void change_stack               PARAMS ((rtx, stack, stack,
-                                              enum emit_where));
-static int convert_regs_entry          PARAMS ((void));
-static void convert_regs_exit          PARAMS ((void));
-static int convert_regs_1              PARAMS ((FILE *, basic_block));
-static int convert_regs_2              PARAMS ((FILE *, basic_block));
-static int convert_regs                        PARAMS ((FILE *));
-static void print_stack                PARAMS ((FILE *, stack));
-static rtx next_flags_user             PARAMS ((rtx));
-static void record_label_references    PARAMS ((rtx, rtx));
-static bool compensate_edge            PARAMS ((edge, FILE *));
+static int stack_regs_mentioned_p (rtx pat);
+static void pop_stack (stack, int);
+static rtx *get_true_reg (rtx *);
+
+static int check_asm_stack_operands (rtx);
+static int get_asm_operand_n_inputs (rtx);
+static rtx stack_result (tree);
+static void replace_reg (rtx *, int);
+static void remove_regno_note (rtx, enum reg_note, unsigned int);
+static int get_hard_regnum (stack, rtx);
+static rtx emit_pop_insn (rtx, stack, rtx, enum emit_where);
+static void swap_to_top(rtx, stack, rtx, rtx);
+static bool move_for_stack_reg (rtx, stack, rtx);
+static bool move_nan_for_stack_reg (rtx, stack, rtx);
+static int swap_rtx_condition_1 (rtx);
+static int swap_rtx_condition (rtx);
+static void compare_for_stack_reg (rtx, stack, rtx);
+static bool subst_stack_regs_pat (rtx, stack, rtx);
+static void subst_asm_stack_regs (rtx, stack);
+static bool subst_stack_regs (rtx, stack);
+static void change_stack (rtx, stack, stack, enum emit_where);
+static void print_stack (FILE *, stack);
+static rtx next_flags_user (rtx);
 \f
-/* Return non-zero if any stack register is mentioned somewhere within PAT.  */
+/* Return nonzero if any stack register is mentioned somewhere within PAT.  */
 
 static int
-stack_regs_mentioned_p (pat)
-     rtx pat;
+stack_regs_mentioned_p (rtx pat)
 {
   const char *fmt;
   int i;
@@ -301,8 +301,7 @@ stack_regs_mentioned_p (pat)
 /* Return nonzero if INSN mentions stacked registers, else return zero.  */
 
 int
-stack_regs_mentioned (insn)
-     rtx insn;
+stack_regs_mentioned (rtx insn)
 {
   unsigned int uid, max;
   int test;
@@ -311,21 +310,27 @@ stack_regs_mentioned (insn)
     return 0;
 
   uid = INSN_UID (insn);
-  max = VARRAY_SIZE (stack_regs_mentioned_data);
+  max = VEC_length (char, stack_regs_mentioned_data);
   if (uid >= max)
     {
+      char *p;
+      unsigned int old_max = max;
+
       /* Allocate some extra size to avoid too many reallocs, but
         do not grow too quickly.  */
-      max = uid + uid / 20;
-      VARRAY_GROW (stack_regs_mentioned_data, max);
+      max = uid + uid / 20 + 1;
+      VEC_safe_grow (char, heap, stack_regs_mentioned_data, max);
+      p = VEC_address (char, stack_regs_mentioned_data);
+      memset (&p[old_max], 0,
+             sizeof (char) * (max - old_max));
     }
 
-  test = VARRAY_CHAR (stack_regs_mentioned_data, uid);
+  test = VEC_index (char, stack_regs_mentioned_data, uid);
   if (test == 0)
     {
       /* This insn has yet to be examined.  Do so now.  */
       test = stack_regs_mentioned_p (PATTERN (insn)) ? 1 : 2;
-      VARRAY_CHAR (stack_regs_mentioned_data, uid) = test;
+      VEC_replace (char, stack_regs_mentioned_data, uid, test);
     }
 
   return test == 1;
@@ -334,32 +339,28 @@ stack_regs_mentioned (insn)
 static rtx ix86_flags_rtx;
 
 static rtx
-next_flags_user (insn)
-     rtx insn;
+next_flags_user (rtx insn)
 {
   /* Search forward looking for the first use of this value.
      Stop at block boundaries.  */
 
-  while (insn != current_block->end)
+  while (insn != BB_END (current_block))
     {
       insn = NEXT_INSN (insn);
 
       if (INSN_P (insn) && reg_mentioned_p (ix86_flags_rtx, PATTERN (insn)))
        return insn;
 
-      if (GET_CODE (insn) == CALL_INSN)
+      if (CALL_P (insn))
        return NULL_RTX;
     }
   return NULL_RTX;
 }
 \f
-/* Reorganize the stack into ascending numbers,
-   after this insn.  */
+/* Reorganize the stack into ascending numbers, before this insn.  */
 
 static void
-straighten_stack (insn, regstack)
-     rtx insn;
-     stack regstack;
+straighten_stack (rtx insn, stack regstack)
 {
   struct stack_def temp_stack;
   int top;
@@ -376,21 +377,19 @@ straighten_stack (insn, regstack)
   for (top = temp_stack.top = regstack->top; top >= 0; top--)
     temp_stack.reg[top] = FIRST_STACK_REG + temp_stack.top - top;
 
-  change_stack (insn, regstack, &temp_stack, EMIT_AFTER);
+  change_stack (insn, regstack, &temp_stack, EMIT_BEFORE);
 }
 
-/* Pop a register from the stack */
+/* Pop a register from the stack */
 
 static void
-pop_stack (regstack, regno)
-     stack regstack;
-     int   regno;
+pop_stack (stack regstack, int regno)
 {
   int top = regstack->top;
 
   CLEAR_HARD_REG_BIT (regstack->reg_set, regno);
   regstack->top--;
-  /* If regno was not at the top of stack then adjust stack */
+  /* If regno was not at the top of stack then adjust stack */
   if (regstack->reg [top] != regno)
     {
       int i;
@@ -405,160 +404,12 @@ pop_stack (regstack, regno)
     }
 }
 \f
-/* Convert register usage from "flat" register file usage to a "stack
-   register file.  FIRST is the first insn in the function, FILE is the
-   dump file, if used.
-
-   Construct a CFG and run life analysis.  Then convert each insn one
-   by one.  Run a last cleanup_cfg pass, if optimizing, to eliminate
-   code duplication created when the converter inserts pop insns on
-   the edges.  */
-
-void
-reg_to_stack (first, file)
-     rtx first;
-     FILE *file;
-{
-  basic_block bb;
-  int i;
-  int max_uid;
-
-  /* Clean up previous run.  */
-  stack_regs_mentioned_data = 0;
-
-  if (!optimize)
-    split_all_insns (0);
-
-  /* See if there is something to do.  Flow analysis is quite
-     expensive so we might save some compilation time.  */
-  for (i = FIRST_STACK_REG; i <= LAST_STACK_REG; i++)
-    if (regs_ever_live[i])
-      break;
-  if (i > LAST_STACK_REG)
-    return;
-
-  /* Ok, floating point instructions exist.  If not optimizing,
-     build the CFG and run life analysis.  */
-  if (!optimize)
-    {
-      count_or_remove_death_notes (NULL, 1);
-      life_analysis (first, file, PROP_DEATH_NOTES);
-    }
-  mark_dfs_back_edges ();
-
-  /* Set up block info for each basic block.  */
-  alloc_aux_for_blocks (sizeof (struct block_info_def));
-  FOR_EACH_BB_REVERSE (bb)
-    {
-      edge e;
-      for (e = bb->pred; e; e=e->pred_next)
-       if (!(e->flags & EDGE_DFS_BACK)
-           && e->src != ENTRY_BLOCK_PTR)
-         BLOCK_INFO (bb)->predecessors++;
-    }
-
-  /* Create the replacement registers up front.  */
-  for (i = FIRST_STACK_REG; i <= LAST_STACK_REG; i++)
-    {
-      enum machine_mode mode;
-      for (mode = GET_CLASS_NARROWEST_MODE (MODE_FLOAT);
-          mode != VOIDmode;
-          mode = GET_MODE_WIDER_MODE (mode))
-       FP_MODE_REG (i, mode) = gen_rtx_REG (mode, i);
-      for (mode = GET_CLASS_NARROWEST_MODE (MODE_COMPLEX_FLOAT);
-          mode != VOIDmode;
-          mode = GET_MODE_WIDER_MODE (mode))
-       FP_MODE_REG (i, mode) = gen_rtx_REG (mode, i);
-    }
-
-  ix86_flags_rtx = gen_rtx_REG (CCmode, FLAGS_REG);
-
-  /* A QNaN for initializing uninitialized variables.
-
-     ??? We can't load from constant memory in PIC mode, because
-     we're insertting these instructions before the prologue and
-     the PIC register hasn't been set up.  In that case, fall back
-     on zero, which we can get from `ldz'.  */
-
-  if (flag_pic)
-    nan = CONST0_RTX (SFmode);
-  else
-    {
-      nan = gen_lowpart (SFmode, GEN_INT (0x7fc00000));
-      nan = force_const_mem (SFmode, nan);
-    }
-
-  /* Allocate a cache for stack_regs_mentioned.  */
-  max_uid = get_max_uid ();
-  VARRAY_CHAR_INIT (stack_regs_mentioned_data, max_uid + 1,
-                   "stack_regs_mentioned cache");
-
-  convert_regs (file);
-
-  free_aux_for_blocks ();
-}
-\f
-/* Check PAT, which is in INSN, for LABEL_REFs.  Add INSN to the
-   label's chain of references, and note which insn contains each
-   reference.  */
-
-static void
-record_label_references (insn, pat)
-     rtx insn, pat;
-{
-  enum rtx_code code = GET_CODE (pat);
-  int i;
-  const char *fmt;
-
-  if (code == LABEL_REF)
-    {
-      rtx label = XEXP (pat, 0);
-      rtx ref;
-
-      if (GET_CODE (label) != CODE_LABEL)
-       abort ();
-
-      /* If this is an undefined label, LABEL_REFS (label) contains
-         garbage.  */
-      if (INSN_UID (label) == 0)
-       return;
-
-      /* Don't make a duplicate in the code_label's chain.  */
-
-      for (ref = LABEL_REFS (label);
-          ref && ref != label;
-          ref = LABEL_NEXTREF (ref))
-       if (CONTAINING_INSN (ref) == insn)
-         return;
-
-      CONTAINING_INSN (pat) = insn;
-      LABEL_NEXTREF (pat) = LABEL_REFS (label);
-      LABEL_REFS (label) = pat;
-
-      return;
-    }
-
-  fmt = GET_RTX_FORMAT (code);
-  for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
-    {
-      if (fmt[i] == 'e')
-       record_label_references (insn, XEXP (pat, i));
-      if (fmt[i] == 'E')
-       {
-         int j;
-         for (j = 0; j < XVECLEN (pat, i); j++)
-           record_label_references (insn, XVECEXP (pat, i, j));
-       }
-    }
-}
-\f
 /* Return a pointer to the REG expression within PAT.  If PAT is not a
    REG, possible enclosed by a conversion rtx, return the inner part of
    PAT that stopped the search.  */
 
 static rtx *
-get_true_reg (pat)
-     rtx *pat;
+get_true_reg (rtx *pat)
 {
   for (;;)
     switch (GET_CODE (*pat))
@@ -584,16 +435,25 @@ get_true_reg (pat)
       case FIX:
       case FLOAT_EXTEND:
        pat = & XEXP (*pat, 0);
+       break;
+
+      case FLOAT_TRUNCATE:
+       if (!flag_unsafe_math_optimizations)
+         return pat;
+       pat = & XEXP (*pat, 0);
+       break;
       }
 }
 \f
+/* Set if we find any malformed asms in a block.  */
+static bool any_malformed_asm;
+
 /* There are many rules that an asm statement for stack-like regs must
    follow.  Those rules are explained at the top of this file: the rule
    numbers below refer to that explanation.  */
 
 static int
-check_asm_stack_operands (insn)
-     rtx insn;
+check_asm_stack_operands (rtx insn)
 {
   int i;
   int n_clobbers;
@@ -629,7 +489,7 @@ check_asm_stack_operands (insn)
   /* Strip SUBREGs here to make the following code simpler.  */
   for (i = 0; i < recog_data.n_operands; i++)
     if (GET_CODE (recog_data.operand[i]) == SUBREG
-       && GET_CODE (SUBREG_REG (recog_data.operand[i])) == REG)
+       && REG_P (SUBREG_REG (recog_data.operand[i])))
       recog_data.operand[i] = SUBREG_REG (recog_data.operand[i]);
 
   /* Set up CLOBBER_REG.  */
@@ -638,7 +498,7 @@ check_asm_stack_operands (insn)
 
   if (GET_CODE (body) == PARALLEL)
     {
-      clobber_reg = (rtx *) alloca (XVECLEN (body, 0) * sizeof (rtx));
+      clobber_reg = alloca (XVECLEN (body, 0) * sizeof (rtx));
 
       for (i = 0; i < XVECLEN (body, 0); i++)
        if (GET_CODE (XVECEXP (body, 0, i)) == CLOBBER)
@@ -646,7 +506,7 @@ check_asm_stack_operands (insn)
            rtx clobber = XVECEXP (body, 0, i);
            rtx reg = XEXP (clobber, 0);
 
-           if (GET_CODE (reg) == SUBREG && GET_CODE (SUBREG_REG (reg)) == REG)
+           if (GET_CODE (reg) == SUBREG && REG_P (SUBREG_REG (reg)))
              reg = SUBREG_REG (reg);
 
            if (STACK_REG_P (reg))
@@ -668,7 +528,7 @@ check_asm_stack_operands (insn)
   for (i = 0; i < n_outputs; i++)
     if (STACK_REG_P (recog_data.operand[i]))
       {
-       if (reg_class_size[(int) recog_op_alt[i][alt].class] != 1)
+       if (reg_class_size[(int) recog_op_alt[i][alt].cl] != 1)
          {
            error_for_asm (insn, "output constraint %d must specify a single register", i);
            malformed_asm = 1;
@@ -744,7 +604,7 @@ check_asm_stack_operands (insn)
       malformed_asm = 1;
     }
 
-  /* Enfore rule #3: If any input operand uses the "f" constraint, all
+  /* Enforce rule #3: If any input operand uses the "f" constraint, all
      output constraints must use the "&" earlyclobber.
 
      ??? Detect this more deterministically by having constrain_asm_operands
@@ -759,7 +619,7 @@ check_asm_stack_operands (insn)
          if (operands_match_p (recog_data.operand[j], recog_data.operand[i]))
            {
              error_for_asm (insn,
-                            "output operand %d must use `&' constraint", j);
+                            "output operand %d must use %<&%> constraint", j);
              malformed_asm = 1;
            }
       }
@@ -768,6 +628,7 @@ check_asm_stack_operands (insn)
     {
       /* Avoid further trouble with this insn.  */
       PATTERN (insn) = gen_rtx_USE (VOIDmode, const0_rtx);
+      any_malformed_asm = true;
       return 0;
     }
 
@@ -780,50 +641,42 @@ check_asm_stack_operands (insn)
    placed.  */
 
 static int
-get_asm_operand_n_inputs (body)
-     rtx body;
+get_asm_operand_n_inputs (rtx body)
 {
-  if (GET_CODE (body) == SET && GET_CODE (SET_SRC (body)) == ASM_OPERANDS)
-    return ASM_OPERANDS_INPUT_LENGTH (SET_SRC (body));
-
-  else if (GET_CODE (body) == ASM_OPERANDS)
-    return ASM_OPERANDS_INPUT_LENGTH (body);
-
-  else if (GET_CODE (body) == PARALLEL
-          && GET_CODE (XVECEXP (body, 0, 0)) == SET)
-    return ASM_OPERANDS_INPUT_LENGTH (SET_SRC (XVECEXP (body, 0, 0)));
-
-  else if (GET_CODE (body) == PARALLEL
-          && GET_CODE (XVECEXP (body, 0, 0)) == ASM_OPERANDS)
-    return ASM_OPERANDS_INPUT_LENGTH (XVECEXP (body, 0, 0));
-
-  abort ();
+  switch (GET_CODE (body))
+    {
+    case SET:
+      gcc_assert (GET_CODE (SET_SRC (body)) == ASM_OPERANDS);
+      return ASM_OPERANDS_INPUT_LENGTH (SET_SRC (body));
+      
+    case ASM_OPERANDS:
+      return ASM_OPERANDS_INPUT_LENGTH (body);
+      
+    case PARALLEL:
+      return get_asm_operand_n_inputs (XVECEXP (body, 0, 0));
+      
+    default:
+      gcc_unreachable ();
+    }
 }
 
 /* If current function returns its result in an fp stack register,
    return the REG.  Otherwise, return 0.  */
 
 static rtx
-stack_result (decl)
-     tree decl;
+stack_result (tree decl)
 {
   rtx result;
 
   /* If the value is supposed to be returned in memory, then clearly
      it is not returned in a stack register.  */
-  if (aggregate_value_p (DECL_RESULT (decl)))
+  if (aggregate_value_p (DECL_RESULT (decl), decl))
     return 0;
 
   result = DECL_RTL_IF_SET (DECL_RESULT (decl));
   if (result != 0)
-    {
-#ifdef FUNCTION_OUTGOING_VALUE
-      result
-       = FUNCTION_OUTGOING_VALUE (TREE_TYPE (DECL_RESULT (decl)), decl);
-#else
-      result = FUNCTION_VALUE (TREE_TYPE (DECL_RESULT (decl)), decl);
-#endif
-    }
+    result = targetm.calls.function_value (TREE_TYPE (DECL_RESULT (decl)),
+                                          decl, true);
 
   return result != 0 && STACK_REG_P (result) ? result : 0;
 }
@@ -838,20 +691,14 @@ stack_result (decl)
    the desired hard REGNO.  */
 
 static void
-replace_reg (reg, regno)
-     rtx *reg;
-     int regno;
+replace_reg (rtx *reg, int regno)
 {
-  if (regno < FIRST_STACK_REG || regno > LAST_STACK_REG
-      || ! STACK_REG_P (*reg))
-    abort ();
+  gcc_assert (regno >= FIRST_STACK_REG);
+  gcc_assert (regno <= LAST_STACK_REG);
+  gcc_assert (STACK_REG_P (*reg));
 
-  switch (GET_MODE_CLASS (GET_MODE (*reg)))
-    {
-    default: abort ();
-    case MODE_FLOAT:
-    case MODE_COMPLEX_FLOAT:;
-    }
+  gcc_assert (SCALAR_FLOAT_MODE_P (GET_MODE (*reg))
+             || GET_MODE_CLASS (GET_MODE (*reg)) == MODE_COMPLEX_FLOAT);
 
   *reg = FP_MODE_REG (regno, GET_MODE (*reg));
 }
@@ -860,10 +707,7 @@ replace_reg (reg, regno)
    number REGNO from INSN.  Remove only one such note.  */
 
 static void
-remove_regno_note (insn, note, regno)
-     rtx insn;
-     enum reg_note note;
-     unsigned int regno;
+remove_regno_note (rtx insn, enum reg_note note, unsigned int regno)
 {
   rtx *note_link, this;
 
@@ -878,7 +722,7 @@ remove_regno_note (insn, note, regno)
     else
       note_link = &XEXP (this, 1);
 
-  abort ();
+  gcc_unreachable ();
 }
 
 /* Find the hard register number of virtual register REG in REGSTACK.
@@ -886,14 +730,11 @@ remove_regno_note (insn, note, regno)
    returned if the register is not found.  */
 
 static int
-get_hard_regnum (regstack, reg)
-     stack regstack;
-     rtx reg;
+get_hard_regnum (stack regstack, rtx reg)
 {
   int i;
 
-  if (! STACK_REG_P (reg))
-    abort ();
+  gcc_assert (STACK_REG_P (reg));
 
   for (i = regstack->top; i >= 0; i--)
     if (regstack->reg[i] == REGNO (reg))
@@ -910,11 +751,7 @@ get_hard_regnum (regstack, reg)
    cases the movdf pattern to pop.  */
 
 static rtx
-emit_pop_insn (insn, regstack, reg, where)
-     rtx insn;
-     stack regstack;
-     rtx reg;
-     enum emit_where where;
+emit_pop_insn (rtx insn, stack regstack, rtx reg, enum emit_where where)
 {
   rtx pop_insn, pop_rtx;
   int hard_regno;
@@ -931,15 +768,13 @@ emit_pop_insn (insn, regstack, reg, where)
        pop_insn = emit_pop_insn (insn, regstack, reg1, where);
       if (get_hard_regnum (regstack, reg2) >= 0)
        pop_insn = emit_pop_insn (insn, regstack, reg2, where);
-      if (!pop_insn)
-       abort ();
+      gcc_assert (pop_insn);
       return pop_insn;
     }
 
   hard_regno = get_hard_regnum (regstack, reg);
 
-  if (hard_regno < FIRST_STACK_REG)
-    abort ();
+  gcc_assert (hard_regno >= FIRST_STACK_REG);
 
   pop_rtx = gen_rtx_SET (VOIDmode, FP_MODE_REG (hard_regno, DFmode),
                         FP_MODE_REG (FIRST_STACK_REG, DFmode));
@@ -969,10 +804,7 @@ emit_pop_insn (insn, regstack, reg, where)
    If REG is already at the top of the stack, no insn is emitted.  */
 
 static void
-emit_swap_insn (insn, regstack, reg)
-     rtx insn;
-     stack regstack;
-     rtx reg;
+emit_swap_insn (rtx insn, stack regstack, rtx reg)
 {
   int hard_regno;
   rtx swap_rtx;
@@ -982,8 +814,7 @@ emit_swap_insn (insn, regstack, reg)
 
   hard_regno = get_hard_regnum (regstack, reg);
 
-  if (hard_regno < FIRST_STACK_REG)
-    abort ();
+  gcc_assert (hard_regno >= FIRST_STACK_REG);
   if (hard_regno == FIRST_STACK_REG)
     return;
 
@@ -996,16 +827,16 @@ emit_swap_insn (insn, regstack, reg)
   /* Find the previous insn involving stack regs, but don't pass a
      block boundary.  */
   i1 = NULL;
-  if (current_block && insn != current_block->head)
+  if (current_block && insn != BB_HEAD (current_block))
     {
       rtx tmp = PREV_INSN (insn);
-      rtx limit = PREV_INSN (current_block->head);
+      rtx limit = PREV_INSN (BB_HEAD (current_block));
       while (tmp != limit)
        {
-         if (GET_CODE (tmp) == CODE_LABEL
-             || GET_CODE (tmp) == CALL_INSN
+         if (LABEL_P (tmp)
+             || CALL_P (tmp)
              || NOTE_INSN_BASIC_BLOCK_P (tmp)
-             || (GET_CODE (tmp) == INSN
+             || (NONJUMP_INSN_P (tmp)
                  && stack_regs_mentioned (tmp)))
            {
              i1 = tmp;
@@ -1024,8 +855,8 @@ emit_swap_insn (insn, regstack, reg)
       /* If the previous register stack push was from the reg we are to
         swap with, omit the swap.  */
 
-      if (GET_CODE (i1dest) == REG && REGNO (i1dest) == FIRST_STACK_REG
-         && GET_CODE (i1src) == REG
+      if (REG_P (i1dest) && REGNO (i1dest) == FIRST_STACK_REG
+         && REG_P (i1src)
          && REGNO (i1src) == (unsigned) hard_regno - 1
          && find_regno_note (i1, REG_DEAD, FIRST_STACK_REG) == NULL_RTX)
        return;
@@ -1033,36 +864,91 @@ emit_swap_insn (insn, regstack, reg)
       /* If the previous insn wrote to the reg we are to swap with,
         omit the swap.  */
 
-      if (GET_CODE (i1dest) == REG && REGNO (i1dest) == (unsigned) hard_regno
-         && GET_CODE (i1src) == REG && REGNO (i1src) == FIRST_STACK_REG
+      if (REG_P (i1dest) && REGNO (i1dest) == (unsigned) hard_regno
+         && REG_P (i1src) && REGNO (i1src) == FIRST_STACK_REG
          && find_regno_note (i1, REG_DEAD, FIRST_STACK_REG) == NULL_RTX)
        return;
     }
 
+  /* Avoid emitting the swap if this is the first register stack insn
+     of the current_block.  Instead update the current_block's stack_in
+     and let compensate edges take care of this for us.  */
+  if (current_block && starting_stack_p)
+    {
+      BLOCK_INFO (current_block)->stack_in = *regstack;
+      starting_stack_p = false;
+      return;
+    }
+
   swap_rtx = gen_swapxf (FP_MODE_REG (hard_regno, XFmode),
                         FP_MODE_REG (FIRST_STACK_REG, XFmode));
 
   if (i1)
     emit_insn_after (swap_rtx, i1);
   else if (current_block)
-    emit_insn_before (swap_rtx, current_block->head);
+    emit_insn_before (swap_rtx, BB_HEAD (current_block));
   else
     emit_insn_before (swap_rtx, insn);
 }
 \f
-/* Handle a move to or from a stack register in PAT, which is in INSN.
-   REGSTACK is the current stack.  */
+/* Emit an insns before INSN to swap virtual register SRC1 with
+   the top of stack and virtual register SRC2 with second stack
+   slot. REGSTACK is the stack state before the swaps, and
+   is updated to reflect the swaps.  A swap insn is represented as a
+   PARALLEL of two patterns: each pattern moves one reg to the other.
+
+   If SRC1 and/or SRC2 are already at the right place, no swap insn
+   is emitted.  */
 
 static void
-move_for_stack_reg (insn, regstack, pat)
-     rtx insn;
-     stack regstack;
-     rtx pat;
+swap_to_top (rtx insn, stack regstack, rtx src1, rtx src2)
+{
+  struct stack_def temp_stack;
+  int regno, j, k, temp;
+
+  temp_stack = *regstack;
+
+  /* Place operand 1 at the top of stack.  */
+  regno = get_hard_regnum (&temp_stack, src1);
+  gcc_assert (regno >= 0);
+  if (regno != FIRST_STACK_REG)
+    {
+      k = temp_stack.top - (regno - FIRST_STACK_REG);
+      j = temp_stack.top;
+
+      temp = temp_stack.reg[k];
+      temp_stack.reg[k] = temp_stack.reg[j];
+      temp_stack.reg[j] = temp;
+    }
+
+  /* Place operand 2 next on the stack.  */
+  regno = get_hard_regnum (&temp_stack, src2);
+  gcc_assert (regno >= 0);
+  if (regno != FIRST_STACK_REG + 1)
+    {
+      k = temp_stack.top - (regno - FIRST_STACK_REG);
+      j = temp_stack.top - 1;
+
+      temp = temp_stack.reg[k];
+      temp_stack.reg[k] = temp_stack.reg[j];
+      temp_stack.reg[j] = temp;
+    }
+
+  change_stack (insn, regstack, &temp_stack, EMIT_BEFORE);
+}
+\f
+/* Handle a move to or from a stack register in PAT, which is in INSN.
+   REGSTACK is the current stack.  Return whether a control flow insn
+   was deleted in the process.  */
+
+static bool
+move_for_stack_reg (rtx insn, stack regstack, rtx pat)
 {
   rtx *psrc =  get_true_reg (&SET_SRC (pat));
   rtx *pdest = get_true_reg (&SET_DEST (pat));
   rtx src, dest;
   rtx note;
+  bool control_flow_insn_deleted = false;
 
   src = *psrc; dest = *pdest;
 
@@ -1077,36 +963,35 @@ move_for_stack_reg (insn, regstack, pat)
          int i;
 
          /* If this is a no-op move, there must not be a REG_DEAD note.  */
-         if (REGNO (src) == REGNO (dest))
-           abort ();
+         gcc_assert (REGNO (src) != REGNO (dest));
 
          for (i = regstack->top; i >= 0; i--)
            if (regstack->reg[i] == REGNO (src))
              break;
 
-         /* The source must be live, and the dest must be dead.  */
-         if (i < 0 || get_hard_regnum (regstack, dest) >= FIRST_STACK_REG)
-           abort ();
+         /* The destination must be dead, or life analysis is borked.  */
+         gcc_assert (get_hard_regnum (regstack, dest) < FIRST_STACK_REG);
+
+         /* If the source is not live, this is yet another case of
+            uninitialized variables.  Load up a NaN instead.  */
+         if (i < 0)
+           return move_nan_for_stack_reg (insn, regstack, dest);
 
          /* It is possible that the dest is unused after this insn.
             If so, just pop the src.  */
 
          if (find_regno_note (insn, REG_UNUSED, REGNO (dest)))
+           emit_pop_insn (insn, regstack, src, EMIT_AFTER);
+         else
            {
-             emit_pop_insn (insn, regstack, src, EMIT_AFTER);
-
-             delete_insn (insn);
-             return;
+             regstack->reg[i] = REGNO (dest);
+             SET_HARD_REG_BIT (regstack->reg_set, REGNO (dest));
+             CLEAR_HARD_REG_BIT (regstack->reg_set, REGNO (src));
            }
 
-         regstack->reg[i] = REGNO (dest);
-
-         SET_HARD_REG_BIT (regstack->reg_set, REGNO (dest));
-         CLEAR_HARD_REG_BIT (regstack->reg_set, REGNO (src));
-
+         control_flow_insn_deleted |= control_flow_insn_p (insn);
          delete_insn (insn);
-
-         return;
+         return control_flow_insn_deleted;
        }
 
       /* The source reg does not die.  */
@@ -1121,13 +1006,13 @@ move_for_stack_reg (insn, regstack, pat)
          if (find_regno_note (insn, REG_UNUSED, REGNO (dest)))
            emit_pop_insn (insn, regstack, dest, EMIT_AFTER);
 
+         control_flow_insn_deleted |= control_flow_insn_p (insn);
          delete_insn (insn);
-         return;
+         return control_flow_insn_deleted;
        }
 
-      /* The destination ought to be dead */
-      if (get_hard_regnum (regstack, dest) >= FIRST_STACK_REG)
-       abort ();
+      /* The destination ought to be dead.  */
+      gcc_assert (get_hard_regnum (regstack, dest) < FIRST_STACK_REG);
 
       replace_reg (psrc, get_hard_regnum (regstack, src));
 
@@ -1150,7 +1035,7 @@ move_for_stack_reg (insn, regstack, pat)
          regstack->top--;
          CLEAR_HARD_REG_BIT (regstack->reg_set, REGNO (src));
        }
-      else if ((GET_MODE (src) == XFmode || GET_MODE (src) == TFmode)
+      else if ((GET_MODE (src) == XFmode)
               && regstack->top < REG_STACK_SIZE - 1)
        {
          /* A 387 cannot write an XFmode value to a MEM without
@@ -1160,40 +1045,53 @@ move_for_stack_reg (insn, regstack, pat)
             available.  Push the source value here if the register
             stack is not full, and then write the value to memory via
             a pop.  */
-         rtx push_rtx, push_insn;
+         rtx push_rtx;
          rtx top_stack_reg = FP_MODE_REG (FIRST_STACK_REG, GET_MODE (src));
 
-         if (GET_MODE (src) == TFmode)
-           push_rtx = gen_movtf (top_stack_reg, top_stack_reg);
-         else
-           push_rtx = gen_movxf (top_stack_reg, top_stack_reg);
-         push_insn = emit_insn_before (push_rtx, insn);
+         push_rtx = gen_movxf (top_stack_reg, top_stack_reg);
+         emit_insn_before (push_rtx, insn);
          REG_NOTES (insn) = gen_rtx_EXPR_LIST (REG_DEAD, top_stack_reg,
                                                REG_NOTES (insn));
        }
 
       replace_reg (psrc, FIRST_STACK_REG);
     }
-  else if (STACK_REG_P (dest))
+  else
     {
+      gcc_assert (STACK_REG_P (dest));
+
       /* Load from MEM, or possibly integer REG or constant, into the
         stack regs.  The actual target is always the top of the
         stack. The stack mapping is changed to reflect that DEST is
         now at top of stack.  */
 
-      /* The destination ought to be dead */
-      if (get_hard_regnum (regstack, dest) >= FIRST_STACK_REG)
-       abort ();
+      /* The destination ought to be dead.  */
+      gcc_assert (get_hard_regnum (regstack, dest) < FIRST_STACK_REG);
 
-      if (regstack->top >= REG_STACK_SIZE)
-       abort ();
+      gcc_assert (regstack->top < REG_STACK_SIZE);
 
       regstack->reg[++regstack->top] = REGNO (dest);
       SET_HARD_REG_BIT (regstack->reg_set, REGNO (dest));
       replace_reg (pdest, FIRST_STACK_REG);
     }
-  else
-    abort ();
+
+  return control_flow_insn_deleted;
+}
+
+/* A helper function which replaces INSN with a pattern that loads up
+   a NaN into DEST, then invokes move_for_stack_reg.  */
+
+static bool
+move_nan_for_stack_reg (rtx insn, stack regstack, rtx dest)
+{
+  rtx pat;
+
+  dest = FP_MODE_REG (REGNO (dest), SFmode);
+  pat = gen_rtx_SET (VOIDmode, dest, not_a_num);
+  PATTERN (insn) = pat;
+  INSN_CODE (insn) = -1;
+
+  return move_for_stack_reg (insn, regstack, pat);
 }
 \f
 /* Swap the condition on a branch, if there is one.  Return true if we
@@ -1201,13 +1099,12 @@ move_for_stack_reg (insn, regstack, pat)
    such.  */
 
 static int
-swap_rtx_condition_1 (pat)
-     rtx pat;
+swap_rtx_condition_1 (rtx pat)
 {
   const char *fmt;
   int i, r = 0;
 
-  if (GET_RTX_CLASS (GET_CODE (pat)) == '<')
+  if (COMPARISON_P (pat))
     {
       PUT_CODE (pat, swap_condition (GET_CODE (pat)));
       r = 1;
@@ -1233,15 +1130,14 @@ swap_rtx_condition_1 (pat)
 }
 
 static int
-swap_rtx_condition (insn)
-     rtx insn;
+swap_rtx_condition (rtx insn)
 {
   rtx pat = PATTERN (insn);
 
   /* We're looking for a single set to cc0 or an HImode temporary.  */
 
   if (GET_CODE (pat) == SET
-      && GET_CODE (SET_DEST (pat)) == REG
+      && REG_P (SET_DEST (pat))
       && REGNO (SET_DEST (pat)) == FLAGS_REG)
     {
       insn = next_flags_user (insn);
@@ -1250,9 +1146,9 @@ swap_rtx_condition (insn)
       pat = PATTERN (insn);
     }
 
-  /* See if this is, or ends in, a fnstsw, aka unspec 9.  If so, we're
-     not doing anything with the cc value right now.  We may be able to
-     search for one though.  */
+  /* See if this is, or ends in, a fnstsw.  If so, we're not doing anything
+     with the cc value right now.  We may be able to search for one
+     though.  */
 
   if (GET_CODE (pat) == SET
       && GET_CODE (SET_SRC (pat)) == UNSPEC
@@ -1262,18 +1158,22 @@ swap_rtx_condition (insn)
 
       /* Search forward looking for the first use of this value.
         Stop at block boundaries.  */
-      while (insn != current_block->end)
+      while (insn != BB_END (current_block))
        {
          insn = NEXT_INSN (insn);
          if (INSN_P (insn) && reg_mentioned_p (dest, insn))
            break;
-         if (GET_CODE (insn) == CALL_INSN)
+         if (CALL_P (insn))
            return 0;
        }
 
+      /* We haven't found it.  */
+      if (insn == BB_END (current_block))
+       return 0;
+
       /* So we've found the insn using this value.  If it is anything
-        other than sahf, aka unspec 10, or the value does not die
-        (meaning we'd have to search further), then we must give up.  */
+        other than sahf or the value does not die (meaning we'd have
+        to search further), then we must give up.  */
       pat = PATTERN (insn);
       if (GET_CODE (pat) != SET
          || GET_CODE (SET_SRC (pat)) != UNSPEC
@@ -1321,18 +1221,13 @@ swap_rtx_condition (insn)
    set up.  */
 
 static void
-compare_for_stack_reg (insn, regstack, pat_src)
-     rtx insn;
-     stack regstack;
-     rtx pat_src;
+compare_for_stack_reg (rtx insn, stack regstack, rtx pat_src)
 {
   rtx *src1, *src2;
   rtx src1_note, src2_note;
-  rtx flags_user;
 
   src1 = get_true_reg (&XEXP (pat_src, 0));
   src2 = get_true_reg (&XEXP (pat_src, 1));
-  flags_user = next_flags_user (insn);
 
   /* ??? If fxch turns out to be cheaper than fstp, give priority to
      registers that die in this insn - move those to stack top first.  */
@@ -1410,15 +1305,14 @@ compare_for_stack_reg (insn, regstack, pat_src)
 }
 \f
 /* Substitute new registers in PAT, which is part of INSN.  REGSTACK
-   is the current register layout.  */
+   is the current register layout.  Return whether a control flow insn
+   was deleted in the process.  */
 
-static void
-subst_stack_regs_pat (insn, regstack, pat)
-     rtx insn;
-     stack regstack;
-     rtx pat;
+static bool
+subst_stack_regs_pat (rtx insn, stack regstack, rtx pat)
 {
   rtx *dest, *src;
+  bool control_flow_insn_deleted = false;
 
   switch (GET_CODE (pat))
     {
@@ -1430,11 +1324,11 @@ subst_stack_regs_pat (insn, regstack, pat)
          && find_regno_note (insn, REG_DEAD, REGNO (*src)))
        {
          emit_pop_insn (insn, regstack, *src, EMIT_AFTER);
-         return;
+         return control_flow_insn_deleted;
        }
       /* ??? Uninitialized USE should not happen.  */
-      else if (get_hard_regnum (regstack, *src) == -1)
-       abort ();
+      else
+       gcc_assert (get_hard_regnum (regstack, *src) != -1);
       break;
 
     case CLOBBER:
@@ -1449,7 +1343,7 @@ subst_stack_regs_pat (insn, regstack, pat)
            if (pat != PATTERN (insn))
              {
                /* The fix_truncdi_1 pattern wants to be able to allocate
-                  it's own scratch register.  It does this by clobbering
+                  its own scratch register.  It does this by clobbering
                   an fp reg so that it is assured of an empty reg-stack
                   register.  If the register is live, kill it now.
                   Remove the DEAD/UNUSED note so we don't try to kill it
@@ -1460,11 +1354,10 @@ subst_stack_regs_pat (insn, regstack, pat)
                else
                  {
                    note = find_reg_note (insn, REG_UNUSED, *dest);
-                   if (!note)
-                     abort ();
+                   gcc_assert (note);
                  }
                remove_note (insn, note);
-               replace_reg (dest, LAST_STACK_REG);
+               replace_reg (dest, FIRST_STACK_REG + 1);
              }
            else
              {
@@ -1473,23 +1366,19 @@ subst_stack_regs_pat (insn, regstack, pat)
                   all other clobbers, this must be due to a function
                   returning without a value.  Load up a NaN.  */
 
-               if (! note
-                   && get_hard_regnum (regstack, *dest) == -1)
+               if (!note)
                  {
-                   pat = gen_rtx_SET (VOIDmode,
-                                      FP_MODE_REG (REGNO (*dest), SFmode),
-                                      nan);
-                   PATTERN (insn) = pat;
-                   move_for_stack_reg (insn, regstack, pat);
-                 }
-               if (! note && COMPLEX_MODE_P (GET_MODE (*dest))
-                   && get_hard_regnum (regstack, FP_MODE_REG (REGNO (*dest), DFmode)) == -1)
-                 {
-                   pat = gen_rtx_SET (VOIDmode,
-                                      FP_MODE_REG (REGNO (*dest) + 1, SFmode),
-                                      nan);
-                   PATTERN (insn) = pat;
-                   move_for_stack_reg (insn, regstack, pat);
+                   rtx t = *dest;
+                   if (get_hard_regnum (regstack, t) == -1)
+                     control_flow_insn_deleted
+                       |= move_nan_for_stack_reg (insn, regstack, t);
+                   if (COMPLEX_MODE_P (GET_MODE (t)))
+                     {
+                       t = FP_MODE_REG (REGNO (t) + 1, DFmode);
+                       if (get_hard_regnum (regstack, t) == -1)
+                         control_flow_insn_deleted
+                           |= move_nan_for_stack_reg (insn, regstack, t);
+                     }
                  }
              }
          }
@@ -1509,10 +1398,10 @@ subst_stack_regs_pat (insn, regstack, pat)
        /* See if this is a `movM' pattern, and handle elsewhere if so.  */
        if (STACK_REG_P (*src)
            || (STACK_REG_P (*dest)
-               && (GET_CODE (*src) == REG || GET_CODE (*src) == MEM
+               && (REG_P (*src) || MEM_P (*src)
                    || GET_CODE (*src) == CONST_DOUBLE)))
          {
-           move_for_stack_reg (insn, regstack, pat);
+           control_flow_insn_deleted |= move_for_stack_reg (insn, regstack, pat);
            break;
          }
 
@@ -1525,7 +1414,7 @@ subst_stack_regs_pat (insn, regstack, pat)
          case CALL:
            {
              int count;
-             for (count = HARD_REGNO_NREGS (REGNO (*dest), GET_MODE (*dest));
+             for (count = hard_regno_nregs[REGNO (*dest)][GET_MODE (*dest)];
                   --count >= 0;)
                {
                  regstack->reg[++regstack->top] = REGNO (*dest) + count;
@@ -1537,8 +1426,7 @@ subst_stack_regs_pat (insn, regstack, pat)
 
          case REG:
            /* This is a `tstM2' case.  */
-           if (*dest != cc0_rtx)
-             abort ();
+           gcc_assert (*dest == cc0_rtx);
            src1 = src;
 
            /* Fall through.  */
@@ -1613,8 +1501,8 @@ subst_stack_regs_pat (insn, regstack, pat)
 
                src1_hard_regnum = get_hard_regnum (regstack, *src1);
                src2_hard_regnum = get_hard_regnum (regstack, *src2);
-               if (src1_hard_regnum == -1 || src2_hard_regnum == -1)
-                 abort ();
+               gcc_assert (src1_hard_regnum != -1);
+               gcc_assert (src2_hard_regnum != -1);
 
                if (src1_hard_regnum != FIRST_STACK_REG
                    && src2_hard_regnum != FIRST_STACK_REG)
@@ -1687,8 +1575,8 @@ subst_stack_regs_pat (insn, regstack, pat)
                replace_reg (dest, get_hard_regnum (regstack, *dest));
              }
 
-           /* Keep operand 1 maching with destination.  */
-           if (GET_RTX_CLASS (GET_CODE (pat_src)) == 'c'
+           /* Keep operand 1 matching with destination.  */
+           if (COMMUTATIVE_ARITH_P (pat_src)
                && REG_P (*src1) && REG_P (*src2)
                && REGNO (*src1) != REGNO (*dest))
             {
@@ -1701,12 +1589,14 @@ subst_stack_regs_pat (insn, regstack, pat)
          case UNSPEC:
            switch (XINT (pat_src, 1))
              {
-             case UNSPEC_SIN:
-             case UNSPEC_COS:
+             case UNSPEC_FIST:
+
+             case UNSPEC_FIST_FLOOR:
+             case UNSPEC_FIST_CEIL:
+
                /* These insns only operate on the top of the stack.  */
 
                src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
-
                emit_swap_insn (insn, regstack, *src1);
 
                src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
@@ -1724,88 +1614,263 @@ subst_stack_regs_pat (insn, regstack, pat)
                replace_reg (src1, FIRST_STACK_REG);
                break;
 
-             case UNSPEC_SAHF:
-               /* (unspec [(unspec [(compare)] UNSPEC_FNSTSW)] UNSPEC_SAHF)
-                  The combination matches the PPRO fcomi instruction.  */
+             case UNSPEC_SIN:
+             case UNSPEC_COS:
+             case UNSPEC_FRNDINT:
+             case UNSPEC_F2XM1:
 
-               pat_src = XVECEXP (pat_src, 0, 0);
-               if (GET_CODE (pat_src) != UNSPEC
-                   || XINT (pat_src, 1) != UNSPEC_FNSTSW)
-                 abort ();
-               /* FALLTHRU */
+             case UNSPEC_FRNDINT_FLOOR:
+             case UNSPEC_FRNDINT_CEIL:
+             case UNSPEC_FRNDINT_TRUNC:
+             case UNSPEC_FRNDINT_MASK_PM:
 
-             case UNSPEC_FNSTSW:
-               /* Combined fcomp+fnstsw generated for doing well with
-                  CSE.  When optimizing this would have been broken
-                  up before now.  */
+               /* These insns only operate on the top of the stack.  */
 
-               pat_src = XVECEXP (pat_src, 0, 0);
-               if (GET_CODE (pat_src) != COMPARE)
-                 abort ();
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
 
-               compare_for_stack_reg (insn, regstack, pat_src);
-               break;
+               emit_swap_insn (insn, regstack, *src1);
 
-             default:
-               abort ();
-             }
-           break;
+               /* Input should never die, it is
+                  replaced with output.  */
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               gcc_assert (!src1_note);
 
-         case IF_THEN_ELSE:
-           /* This insn requires the top of stack to be the destination.  */
+               if (STACK_REG_P (*dest))
+                 replace_reg (dest, FIRST_STACK_REG);
 
-           src1 = get_true_reg (&XEXP (pat_src, 1));
-           src2 = get_true_reg (&XEXP (pat_src, 2));
+               replace_reg (src1, FIRST_STACK_REG);
+               break;
 
-           src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
-           src2_note = find_regno_note (insn, REG_DEAD, REGNO (*src2));
+             case UNSPEC_FPATAN:
+             case UNSPEC_FYL2X:
+             case UNSPEC_FYL2XP1:
+               /* These insns operate on the top two stack slots.  */
 
-           /* If the comparison operator is an FP comparison operator,
-              it is handled correctly by compare_for_stack_reg () who
-              will move the destination to the top of stack. But if the
-              comparison operator is not an FP comparison operator, we
-              have to handle it here.  */
-           if (get_hard_regnum (regstack, *dest) >= FIRST_STACK_REG
-               && REGNO (*dest) != regstack->reg[regstack->top])
-             {
-               /* In case one of operands is the top of stack and the operands
-                  dies, it is safe to make it the destination operand by
-                  reversing the direction of cmove and avoid fxch.  */
-               if ((REGNO (*src1) == regstack->reg[regstack->top]
-                    && src1_note)
-                   || (REGNO (*src2) == regstack->reg[regstack->top]
-                       && src2_note))
-                 {
-                   int idx1 = (get_hard_regnum (regstack, *src1)
-                               - FIRST_STACK_REG);
-                   int idx2 = (get_hard_regnum (regstack, *src2)
-                               - FIRST_STACK_REG);
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
+               src2 = get_true_reg (&XVECEXP (pat_src, 0, 1));
 
-                   /* Make reg-stack believe that the operands are already
-                      swapped on the stack */
-                   regstack->reg[regstack->top - idx1] = REGNO (*src2);
-                   regstack->reg[regstack->top - idx2] = REGNO (*src1);
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               src2_note = find_regno_note (insn, REG_DEAD, REGNO (*src2));
 
-                   /* Reverse condition to compensate the operand swap.
-                      i386 do have comparison always reversible.  */
-                   PUT_CODE (XEXP (pat_src, 0),
-                             reversed_comparison_code (XEXP (pat_src, 0), insn));
-                 }
-               else
-                 emit_swap_insn (insn, regstack, *dest);
-             }
+               swap_to_top (insn, regstack, *src1, *src2);
 
-           {
-             rtx src_note [3];
-             int i;
+               replace_reg (src1, FIRST_STACK_REG);
+               replace_reg (src2, FIRST_STACK_REG + 1);
 
-             src_note[0] = 0;
-             src_note[1] = src1_note;
-             src_note[2] = src2_note;
+               if (src1_note)
+                 replace_reg (&XEXP (src1_note, 0), FIRST_STACK_REG);
+               if (src2_note)
+                 replace_reg (&XEXP (src2_note, 0), FIRST_STACK_REG + 1);
 
-             if (STACK_REG_P (*src1))
-               replace_reg (src1, get_hard_regnum (regstack, *src1));
-             if (STACK_REG_P (*src2))
+               /* Pop both input operands from the stack.  */
+               CLEAR_HARD_REG_BIT (regstack->reg_set,
+                                   regstack->reg[regstack->top]);
+               CLEAR_HARD_REG_BIT (regstack->reg_set,
+                                   regstack->reg[regstack->top - 1]);
+               regstack->top -= 2;
+
+               /* Push the result back onto the stack.  */
+               regstack->reg[++regstack->top] = REGNO (*dest);
+               SET_HARD_REG_BIT (regstack->reg_set, REGNO (*dest));
+               replace_reg (dest, FIRST_STACK_REG);
+               break;
+
+             case UNSPEC_FSCALE_FRACT:
+             case UNSPEC_FPREM_F:
+             case UNSPEC_FPREM1_F:
+               /* These insns operate on the top two stack slots.
+                  first part of double input, double output insn.  */
+
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
+               src2 = get_true_reg (&XVECEXP (pat_src, 0, 1));
+
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               src2_note = find_regno_note (insn, REG_DEAD, REGNO (*src2));
+
+               /* Inputs should never die, they are
+                  replaced with outputs.  */
+               gcc_assert (!src1_note);
+               gcc_assert (!src2_note);
+
+               swap_to_top (insn, regstack, *src1, *src2);
+
+               /* Push the result back onto stack. Empty stack slot
+                  will be filled in second part of insn.  */
+               if (STACK_REG_P (*dest)) {
+                 regstack->reg[regstack->top] = REGNO (*dest);
+                 SET_HARD_REG_BIT (regstack->reg_set, REGNO (*dest));
+                 replace_reg (dest, FIRST_STACK_REG);
+               }
+
+               replace_reg (src1, FIRST_STACK_REG);
+               replace_reg (src2, FIRST_STACK_REG + 1);
+               break;
+
+             case UNSPEC_FSCALE_EXP:
+             case UNSPEC_FPREM_U:
+             case UNSPEC_FPREM1_U:
+               /* These insns operate on the top two stack slots./
+                  second part of double input, double output insn.  */
+
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
+               src2 = get_true_reg (&XVECEXP (pat_src, 0, 1));
+
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               src2_note = find_regno_note (insn, REG_DEAD, REGNO (*src2));
+
+               /* Inputs should never die, they are
+                  replaced with outputs.  */
+               gcc_assert (!src1_note);
+               gcc_assert (!src2_note);
+
+               swap_to_top (insn, regstack, *src1, *src2);
+
+               /* Push the result back onto stack. Fill empty slot from
+                  first part of insn and fix top of stack pointer.  */
+               if (STACK_REG_P (*dest)) {
+                 regstack->reg[regstack->top - 1] = REGNO (*dest);
+                 SET_HARD_REG_BIT (regstack->reg_set, REGNO (*dest));
+                 replace_reg (dest, FIRST_STACK_REG + 1);
+               }
+
+               replace_reg (src1, FIRST_STACK_REG);
+               replace_reg (src2, FIRST_STACK_REG + 1);
+               break;
+
+             case UNSPEC_SINCOS_COS:
+             case UNSPEC_TAN_ONE:
+             case UNSPEC_XTRACT_FRACT:
+               /* These insns operate on the top two stack slots,
+                  first part of one input, double output insn.  */
+
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
+
+               emit_swap_insn (insn, regstack, *src1);
+
+               /* Input should never die, it is
+                  replaced with output.  */
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               gcc_assert (!src1_note);
+
+               /* Push the result back onto stack. Empty stack slot
+                  will be filled in second part of insn.  */
+               if (STACK_REG_P (*dest)) {
+                 regstack->reg[regstack->top + 1] = REGNO (*dest);
+                 SET_HARD_REG_BIT (regstack->reg_set, REGNO (*dest));
+                 replace_reg (dest, FIRST_STACK_REG);
+               }
+
+               replace_reg (src1, FIRST_STACK_REG);
+               break;
+
+             case UNSPEC_SINCOS_SIN:
+             case UNSPEC_TAN_TAN:
+             case UNSPEC_XTRACT_EXP:
+               /* These insns operate on the top two stack slots,
+                  second part of one input, double output insn.  */
+
+               src1 = get_true_reg (&XVECEXP (pat_src, 0, 0));
+
+               emit_swap_insn (insn, regstack, *src1);
+
+               /* Input should never die, it is
+                  replaced with output.  */
+               src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+               gcc_assert (!src1_note);
+
+               /* Push the result back onto stack. Fill empty slot from
+                  first part of insn and fix top of stack pointer.  */
+               if (STACK_REG_P (*dest)) {
+                 regstack->reg[regstack->top] = REGNO (*dest);
+                 SET_HARD_REG_BIT (regstack->reg_set, REGNO (*dest));
+                 replace_reg (dest, FIRST_STACK_REG + 1);
+
+                 regstack->top++;
+               }
+
+               replace_reg (src1, FIRST_STACK_REG);
+               break;
+
+             case UNSPEC_SAHF:
+               /* (unspec [(unspec [(compare)] UNSPEC_FNSTSW)] UNSPEC_SAHF)
+                  The combination matches the PPRO fcomi instruction.  */
+
+               pat_src = XVECEXP (pat_src, 0, 0);
+               gcc_assert (GET_CODE (pat_src) == UNSPEC);
+               gcc_assert (XINT (pat_src, 1) == UNSPEC_FNSTSW);
+               /* Fall through.  */
+
+             case UNSPEC_FNSTSW:
+               /* Combined fcomp+fnstsw generated for doing well with
+                  CSE.  When optimizing this would have been broken
+                  up before now.  */
+
+               pat_src = XVECEXP (pat_src, 0, 0);
+               gcc_assert (GET_CODE (pat_src) == COMPARE);
+
+               compare_for_stack_reg (insn, regstack, pat_src);
+               break;
+
+             default:
+               gcc_unreachable ();
+             }
+           break;
+
+         case IF_THEN_ELSE:
+           /* This insn requires the top of stack to be the destination.  */
+
+           src1 = get_true_reg (&XEXP (pat_src, 1));
+           src2 = get_true_reg (&XEXP (pat_src, 2));
+
+           src1_note = find_regno_note (insn, REG_DEAD, REGNO (*src1));
+           src2_note = find_regno_note (insn, REG_DEAD, REGNO (*src2));
+
+           /* If the comparison operator is an FP comparison operator,
+              it is handled correctly by compare_for_stack_reg () who
+              will move the destination to the top of stack. But if the
+              comparison operator is not an FP comparison operator, we
+              have to handle it here.  */
+           if (get_hard_regnum (regstack, *dest) >= FIRST_STACK_REG
+               && REGNO (*dest) != regstack->reg[regstack->top])
+             {
+               /* In case one of operands is the top of stack and the operands
+                  dies, it is safe to make it the destination operand by
+                  reversing the direction of cmove and avoid fxch.  */
+               if ((REGNO (*src1) == regstack->reg[regstack->top]
+                    && src1_note)
+                   || (REGNO (*src2) == regstack->reg[regstack->top]
+                       && src2_note))
+                 {
+                   int idx1 = (get_hard_regnum (regstack, *src1)
+                               - FIRST_STACK_REG);
+                   int idx2 = (get_hard_regnum (regstack, *src2)
+                               - FIRST_STACK_REG);
+
+                   /* Make reg-stack believe that the operands are already
+                      swapped on the stack */
+                   regstack->reg[regstack->top - idx1] = REGNO (*src2);
+                   regstack->reg[regstack->top - idx2] = REGNO (*src1);
+
+                   /* Reverse condition to compensate the operand swap.
+                      i386 do have comparison always reversible.  */
+                   PUT_CODE (XEXP (pat_src, 0),
+                             reversed_comparison_code (XEXP (pat_src, 0), insn));
+                 }
+               else
+                 emit_swap_insn (insn, regstack, *dest);
+             }
+
+           {
+             rtx src_note [3];
+             int i;
+
+             src_note[0] = 0;
+             src_note[1] = src1_note;
+             src_note[2] = src2_note;
+
+             if (STACK_REG_P (*src1))
+               replace_reg (src1, get_hard_regnum (regstack, *src1));
+             if (STACK_REG_P (*src2))
                replace_reg (src2, get_hard_regnum (regstack, *src2));
 
              for (i = 1; i <= 2; i++)
@@ -1814,17 +1879,13 @@ subst_stack_regs_pat (insn, regstack, pat)
                    int regno = REGNO (XEXP (src_note[i], 0));
 
                    /* If the register that dies is not at the top of
-                      stack, then move the top of stack to the dead reg */
-                   if (regno != regstack->reg[regstack->top])
-                     {
-                       remove_regno_note (insn, REG_DEAD, regno);
-                       emit_pop_insn (insn, regstack, XEXP (src_note[i], 0),
-                                      EMIT_AFTER);
-                     }
-                   else
-                     /* Top of stack never dies, as it is the
-                        destination.  */
-                     abort ();
+                      stack, then move the top of stack to the dead reg.
+                      Top of stack should never die, as it is the
+                      destination.  */
+                   gcc_assert (regno != regstack->reg[regstack->top]);
+                   remove_regno_note (insn, REG_DEAD, regno);
+                   emit_pop_insn (insn, regstack, XEXP (src_note[i], 0),
+                                   EMIT_AFTER);
                  }
            }
 
@@ -1837,7 +1898,7 @@ subst_stack_regs_pat (insn, regstack, pat)
            break;
 
          default:
-           abort ();
+           gcc_unreachable ();
          }
        break;
       }
@@ -1845,6 +1906,8 @@ subst_stack_regs_pat (insn, regstack, pat)
     default:
       break;
     }
+
+  return control_flow_insn_deleted;
 }
 \f
 /* Substitute hard regnums for any stack regs in INSN, which has
@@ -1858,9 +1921,7 @@ subst_stack_regs_pat (insn, regstack, pat)
    requirements, since record_asm_stack_regs removes any problem asm.  */
 
 static void
-subst_asm_stack_regs (insn, regstack)
-     rtx insn;
-     stack regstack;
+subst_asm_stack_regs (rtx insn, stack regstack)
 {
   rtx body = PATTERN (insn);
   int alt;
@@ -1894,13 +1955,12 @@ subst_asm_stack_regs (insn, regstack)
   n_inputs = get_asm_operand_n_inputs (body);
   n_outputs = recog_data.n_operands - n_inputs;
 
-  if (alt < 0)
-    abort ();
+  gcc_assert (alt >= 0);
 
   /* Strip SUBREGs here to make the following code simpler.  */
   for (i = 0; i < recog_data.n_operands; i++)
     if (GET_CODE (recog_data.operand[i]) == SUBREG
-       && GET_CODE (SUBREG_REG (recog_data.operand[i])) == REG)
+       && REG_P (SUBREG_REG (recog_data.operand[i])))
       {
        recog_data.operand_loc[i] = & SUBREG_REG (recog_data.operand[i]);
        recog_data.operand[i] = SUBREG_REG (recog_data.operand[i]);
@@ -1911,9 +1971,9 @@ subst_asm_stack_regs (insn, regstack)
   for (i = 0, note = REG_NOTES (insn); note; note = XEXP (note, 1))
     i++;
 
-  note_reg = (rtx *) alloca (i * sizeof (rtx));
-  note_loc = (rtx **) alloca (i * sizeof (rtx *));
-  note_kind = (enum reg_note *) alloca (i * sizeof (enum reg_note));
+  note_reg = alloca (i * sizeof (rtx));
+  note_loc = alloca (i * sizeof (rtx *));
+  note_kind = alloca (i * sizeof (enum reg_note));
 
   n_notes = 0;
   for (note = REG_NOTES (insn); note; note = XEXP (note, 1))
@@ -1921,7 +1981,7 @@ subst_asm_stack_regs (insn, regstack)
       rtx reg = XEXP (note, 0);
       rtx *loc = & XEXP (note, 0);
 
-      if (GET_CODE (reg) == SUBREG && GET_CODE (SUBREG_REG (reg)) == REG)
+      if (GET_CODE (reg) == SUBREG && REG_P (SUBREG_REG (reg)))
        {
          loc = & SUBREG_REG (reg);
          reg = SUBREG_REG (reg);
@@ -1944,8 +2004,8 @@ subst_asm_stack_regs (insn, regstack)
 
   if (GET_CODE (body) == PARALLEL)
     {
-      clobber_reg = (rtx *) alloca (XVECLEN (body, 0) * sizeof (rtx));
-      clobber_loc = (rtx **) alloca (XVECLEN (body, 0) * sizeof (rtx *));
+      clobber_reg = alloca (XVECLEN (body, 0) * sizeof (rtx));
+      clobber_loc = alloca (XVECLEN (body, 0) * sizeof (rtx *));
 
       for (i = 0; i < XVECLEN (body, 0); i++)
        if (GET_CODE (XVECEXP (body, 0, i)) == CLOBBER)
@@ -1954,7 +2014,7 @@ subst_asm_stack_regs (insn, regstack)
            rtx reg = XEXP (clobber, 0);
            rtx *loc = & XEXP (clobber, 0);
 
-           if (GET_CODE (reg) == SUBREG && GET_CODE (SUBREG_REG (reg)) == REG)
+           if (GET_CODE (reg) == SUBREG && REG_P (SUBREG_REG (reg)))
              {
                loc = & SUBREG_REG (reg);
                reg = SUBREG_REG (reg);
@@ -1975,9 +2035,9 @@ subst_asm_stack_regs (insn, regstack)
 
   for (i = n_outputs; i < n_outputs + n_inputs; i++)
     if (STACK_REG_P (recog_data.operand[i])
-       && reg_class_subset_p (recog_op_alt[i][alt].class,
+       && reg_class_subset_p (recog_op_alt[i][alt].cl,
                               FLOAT_REGS)
-       && recog_op_alt[i][alt].class != FLOAT_REGS)
+       && recog_op_alt[i][alt].cl != FLOAT_REGS)
       {
        /* If an operand needs to be in a particular reg in
           FLOAT_REGS, the constraint was either 't' or 'u'.  Since
@@ -1988,8 +2048,7 @@ subst_asm_stack_regs (insn, regstack)
 
        int regno = get_hard_regnum (&temp_stack, recog_data.operand[i]);
 
-       if (regno < 0)
-         abort ();
+       gcc_assert (regno >= 0);
 
        if ((unsigned int) regno != REGNO (recog_data.operand[i]))
          {
@@ -2022,8 +2081,7 @@ subst_asm_stack_regs (insn, regstack)
       {
        int regnum = get_hard_regnum (regstack, recog_data.operand[i]);
 
-       if (regnum < 0)
-         abort ();
+       gcc_assert (regnum >= 0);
 
        replace_reg (recog_data.operand_loc[i], regnum);
       }
@@ -2033,8 +2091,7 @@ subst_asm_stack_regs (insn, regstack)
       {
        int regnum = get_hard_regnum (regstack, note_reg[i]);
 
-       if (regnum < 0)
-         abort ();
+       gcc_assert (regnum >= 0);
 
        replace_reg (note_loc[i], regnum);
       }
@@ -2048,7 +2105,7 @@ subst_asm_stack_regs (insn, regstack)
       if (regnum >= 0)
        {
          /* Sigh - clobbers always have QImode.  But replace_reg knows
-            that these regs can't be MODE_INT and will abort.  Just put
+            that these regs can't be MODE_INT and will assert.  Just put
             the right reg there without calling replace_reg.  */
 
          *clobber_loc[i] = FP_MODE_REG (regnum, DFmode);
@@ -2144,17 +2201,17 @@ subst_asm_stack_regs (insn, regstack)
 /* Substitute stack hard reg numbers for stack virtual registers in
    INSN.  Non-stack register numbers are not changed.  REGSTACK is the
    current stack content.  Insns may be emitted as needed to arrange the
-   stack for the 387 based on the contents of the insn.  */
+   stack for the 387 based on the contents of the insn.  Return whether
+   a control flow insn was deleted in the process.  */
 
-static void
-subst_stack_regs (insn, regstack)
-     rtx insn;
-     stack regstack;
+static bool
+subst_stack_regs (rtx insn, stack regstack)
 {
   rtx *note_link, note;
+  bool control_flow_insn_deleted = false;
   int i;
 
-  if (GET_CODE (insn) == CALL_INSN)
+  if (CALL_P (insn))
     {
       int top = regstack->top;
 
@@ -2164,7 +2221,7 @@ subst_stack_regs (insn, regstack)
 
       if (top >= 0)
        {
-         straighten_stack (PREV_INSN (insn), regstack);
+         straighten_stack (insn, regstack);
 
          /* Now mark the arguments as dead after the call.  */
 
@@ -2192,25 +2249,32 @@ subst_stack_regs (insn, regstack)
             Any REG_UNUSED notes will be handled by subst_asm_stack_regs.  */
 
          subst_asm_stack_regs (insn, regstack);
-         return;
+         return control_flow_insn_deleted;
        }
 
       if (GET_CODE (PATTERN (insn)) == PARALLEL)
        for (i = 0; i < XVECLEN (PATTERN (insn), 0); i++)
          {
            if (stack_regs_mentioned_p (XVECEXP (PATTERN (insn), 0, i)))
-             subst_stack_regs_pat (insn, regstack,
-                                   XVECEXP (PATTERN (insn), 0, i));
+             {
+               if (GET_CODE (XVECEXP (PATTERN (insn), 0, i)) == CLOBBER)
+                  XVECEXP (PATTERN (insn), 0, i)
+                    = shallow_copy_rtx (XVECEXP (PATTERN (insn), 0, i));
+               control_flow_insn_deleted
+                 |= subst_stack_regs_pat (insn, regstack,
+                                          XVECEXP (PATTERN (insn), 0, i));
+             }
          }
       else
-       subst_stack_regs_pat (insn, regstack, PATTERN (insn));
+       control_flow_insn_deleted
+         |= subst_stack_regs_pat (insn, regstack, PATTERN (insn));
     }
 
   /* subst_stack_regs_pat may have deleted a no-op insn.  If so, any
      REG_UNUSED will already have been dealt with, so just return.  */
 
-  if (GET_CODE (insn) == NOTE || INSN_DELETED_P (insn))
-    return;
+  if (NOTE_P (insn) || INSN_DELETED_P (insn))
+    return control_flow_insn_deleted;
 
   /* If there is a REG_UNUSED note on a stack register on this insn,
      the indicated reg must be popped.  The REG_UNUSED note is removed,
@@ -2226,6 +2290,8 @@ subst_stack_regs (insn, regstack)
       }
     else
       note_link = &XEXP (note, 1);
+
+  return control_flow_insn_deleted;
 }
 \f
 /* Change the organization of the stack so that it fits a new basic
@@ -2234,38 +2300,134 @@ subst_stack_regs (insn, regstack)
 
    Insert any needed insns before or after INSN, as indicated by
    WHERE.  OLD is the original stack layout, and NEW is the desired
-   form.  OLD is updated to reflect the code emitted, ie, it will be
+   form.  OLD is updated to reflect the code emitted, i.e., it will be
    the same as NEW upon return.
 
    This function will not preserve block_end[].  But that information
    is no longer needed once this has executed.  */
 
 static void
-change_stack (insn, old, new, where)
-     rtx insn;
-     stack old;
-     stack new;
-     enum emit_where where;
+change_stack (rtx insn, stack old, stack new, enum emit_where where)
 {
   int reg;
   int update_end = 0;
 
+  /* Stack adjustments for the first insn in a block update the
+     current_block's stack_in instead of inserting insns directly.
+     compensate_edges will add the necessary code later.  */
+  if (current_block
+      && starting_stack_p
+      && where == EMIT_BEFORE)
+    {
+      BLOCK_INFO (current_block)->stack_in = *new;
+      starting_stack_p = false;
+      *old = *new;
+      return;
+    }
+
   /* We will be inserting new insns "backwards".  If we are to insert
      after INSN, find the next insn, and insert before it.  */
 
   if (where == EMIT_AFTER)
     {
-      if (current_block && current_block->end == insn)
+      if (current_block && BB_END (current_block) == insn)
        update_end = 1;
       insn = NEXT_INSN (insn);
     }
 
   /* Pop any registers that are not needed in the new block.  */
 
-  for (reg = old->top; reg >= 0; reg--)
-    if (! TEST_HARD_REG_BIT (new->reg_set, old->reg[reg]))
-      emit_pop_insn (insn, old, FP_MODE_REG (old->reg[reg], DFmode),
-                    EMIT_BEFORE);
+  /* If the destination block's stack already has a specified layout
+     and contains two or more registers, use a more intelligent algorithm
+     to pop registers that minimizes the number number of fxchs below.  */
+  if (new->top > 0)
+    {
+      bool slots[REG_STACK_SIZE];
+      int pops[REG_STACK_SIZE];
+      int next, dest, topsrc;
+
+      /* First pass to determine the free slots.  */
+      for (reg = 0; reg <= new->top; reg++)
+       slots[reg] = TEST_HARD_REG_BIT (new->reg_set, old->reg[reg]);
+
+      /* Second pass to allocate preferred slots.  */
+      topsrc = -1;
+      for (reg = old->top; reg > new->top; reg--)
+       if (TEST_HARD_REG_BIT (new->reg_set, old->reg[reg]))
+         {
+           dest = -1;
+           for (next = 0; next <= new->top; next++)
+             if (!slots[next] && new->reg[next] == old->reg[reg])
+               {
+                 /* If this is a preference for the new top of stack, record
+                    the fact by remembering it's old->reg in topsrc.  */
+                  if (next == new->top)
+                   topsrc = reg;
+                 slots[next] = true;
+                 dest = next;
+                 break;
+               }
+           pops[reg] = dest;
+         }
+       else
+         pops[reg] = reg;
+
+      /* Intentionally, avoid placing the top of stack in it's correct
+        location, if we still need to permute the stack below and we
+        can usefully place it somewhere else.  This is the case if any
+        slot is still unallocated, in which case we should place the
+        top of stack there.  */
+      if (topsrc != -1)
+       for (reg = 0; reg < new->top; reg++)
+         if (!slots[reg])
+           {
+             pops[topsrc] = reg;
+             slots[new->top] = false;
+             slots[reg] = true;
+             break;
+           }
+
+      /* Third pass allocates remaining slots and emits pop insns.  */
+      next = new->top;
+      for (reg = old->top; reg > new->top; reg--)
+       {
+         dest = pops[reg];
+         if (dest == -1)
+           {
+             /* Find next free slot.  */
+             while (slots[next])
+               next--;
+             dest = next--;
+           }
+         emit_pop_insn (insn, old, FP_MODE_REG (old->reg[dest], DFmode),
+                        EMIT_BEFORE);
+       }
+    }
+  else
+    {
+      /* The following loop attempts to maximize the number of times we
+        pop the top of the stack, as this permits the use of the faster
+        ffreep instruction on platforms that support it.  */
+      int live, next;
+
+      live = 0;
+      for (reg = 0; reg <= old->top; reg++)
+        if (TEST_HARD_REG_BIT (new->reg_set, old->reg[reg]))
+          live++;
+
+      next = live;
+      while (old->top >= live)
+        if (TEST_HARD_REG_BIT (new->reg_set, old->reg[old->top]))
+         {
+           while (TEST_HARD_REG_BIT (new->reg_set, old->reg[next]))
+             next--;
+           emit_pop_insn (insn, old, FP_MODE_REG (old->reg[next], DFmode),
+                          EMIT_BEFORE);
+         }
+       else
+         emit_pop_insn (insn, old, FP_MODE_REG (old->reg[old->top], DFmode),
+                        EMIT_BEFORE);
+    }
 
   if (new->top == -2)
     {
@@ -2284,10 +2446,9 @@ change_stack (insn, old, new, where)
         not their depth or liveliness.  */
 
       GO_IF_HARD_REG_EQUAL (old->reg_set, new->reg_set, win);
-      abort ();
+      gcc_unreachable ();
     win:
-      if (old->top != new->top)
-       abort ();
+      gcc_assert (old->top == new->top);
 
       /* If the stack is not empty (new->top != -1), loop here emitting
         swaps until the stack is correct.
@@ -2310,8 +2471,7 @@ change_stack (insn, old, new, where)
                  if (new->reg[reg] == old->reg[old->top])
                    break;
 
-               if (reg == -1)
-                 abort ();
+               gcc_assert (reg != -1);
 
                emit_swap_insn (insn, old,
                                FP_MODE_REG (old->reg[reg], DFmode));
@@ -2333,20 +2493,17 @@ change_stack (insn, old, new, where)
       /* At this point there must be no differences.  */
 
       for (reg = old->top; reg >= 0; reg--)
-       if (old->reg[reg] != new->reg[reg])
-         abort ();
+       gcc_assert (old->reg[reg] == new->reg[reg]);
     }
 
   if (update_end)
-    current_block->end = PREV_INSN (insn);
+    BB_END (current_block) = PREV_INSN (insn);
 }
 \f
 /* Print stack configuration.  */
 
 static void
-print_stack (file, s)
-     FILE *file;
-     stack s;
+print_stack (FILE *file, stack s)
 {
   if (! file)
     return;
@@ -2374,29 +2531,11 @@ print_stack (file, s)
    commit_edge_insertions needs to be called.  */
 
 static int
-convert_regs_entry ()
+convert_regs_entry (void)
 {
   int inserted = 0;
   edge e;
-  basic_block block;
-
-  FOR_EACH_BB_REVERSE (block)
-    {
-      block_info bi = BLOCK_INFO (block);
-      int reg;
-
-      /* Set current register status at last instruction `uninitialized'.  */
-      bi->stack_in.top = -2;
-
-      /* Copy live_at_end and live_at_start into temporaries.  */
-      for (reg = FIRST_STACK_REG; reg <= LAST_STACK_REG; reg++)
-       {
-         if (REGNO_REG_SET_P (block->global_live_at_end, reg))
-           SET_HARD_REG_BIT (bi->out_reg_set, reg);
-         if (REGNO_REG_SET_P (block->global_live_at_start, reg))
-           SET_HARD_REG_BIT (bi->stack_in.reg_set, reg);
-       }
-    }
+  edge_iterator ei;
 
   /* Load something into each stack register live at function entry.
      Such live registers can be caused by uninitialized variables or
@@ -2404,10 +2543,10 @@ convert_regs_entry ()
      the push/pop code happy, and to not scrog the register stack, we
      must put something in these registers.  Use a QNaN.
 
-     Note that we are insertting converted code here.  This code is
+     Note that we are inserting converted code here.  This code is
      never seen by the convert_regs pass.  */
 
-  for (e = ENTRY_BLOCK_PTR->succ; e ; e = e->succ_next)
+  FOR_EACH_EDGE (e, ei, ENTRY_BLOCK_PTR->succs)
     {
       basic_block block = e->dest;
       block_info bi = BLOCK_INFO (block);
@@ -2422,7 +2561,7 @@ convert_regs_entry ()
 
            init = gen_rtx_SET (VOIDmode,
                                FP_MODE_REG (FIRST_STACK_REG, SFmode),
-                               nan);
+                               not_a_num);
            insert_insn_on_edge (init, e);
            inserted = 1;
          }
@@ -2437,7 +2576,7 @@ convert_regs_entry ()
    be `empty', or the function return value at top-of-stack.  */
 
 static void
-convert_regs_exit ()
+convert_regs_exit (void)
 {
   int value_reg_low, value_reg_high;
   stack output_stack;
@@ -2449,7 +2588,7 @@ convert_regs_exit ()
     {
       value_reg_low = REGNO (retvalue);
       value_reg_high = value_reg_low
-       + HARD_REGNO_NREGS (value_reg_low, GET_MODE (retvalue)) - 1;
+       + hard_regno_nregs[value_reg_low][GET_MODE (retvalue)] - 1;
     }
 
   output_stack = &BLOCK_INFO (EXIT_BLOCK_PTR)->stack_in;
@@ -2468,130 +2607,115 @@ convert_regs_exit ()
     }
 }
 
-/* Adjust the stack of this block on exit to match the stack of the
-   target block, or copy stack info into the stack of the successor
-   of the successor hasn't been processed yet.  */
+/* Copy the stack info from the end of edge E's source block to the
+   start of E's destination block.  */
+
+static void
+propagate_stack (edge e)
+{
+  stack src_stack = &BLOCK_INFO (e->src)->stack_out;
+  stack dest_stack = &BLOCK_INFO (e->dest)->stack_in;
+  int reg;
+
+  /* Preserve the order of the original stack, but check whether
+     any pops are needed.  */
+  dest_stack->top = -1;
+  for (reg = 0; reg <= src_stack->top; ++reg)
+    if (TEST_HARD_REG_BIT (dest_stack->reg_set, src_stack->reg[reg]))
+      dest_stack->reg[++dest_stack->top] = src_stack->reg[reg];
+}
+
+
+/* Adjust the stack of edge E's source block on exit to match the stack
+   of it's target block upon input.  The stack layouts of both blocks
+   should have been defined by now.  */
+
 static bool
-compensate_edge (e, file)
-    edge e;
-    FILE *file;
+compensate_edge (edge e)
 {
-  basic_block block = e->src, target = e->dest;
-  block_info bi = BLOCK_INFO (block);
-  struct stack_def regstack, tmpstack;
+  basic_block source = e->src, target = e->dest;
   stack target_stack = &BLOCK_INFO (target)->stack_in;
+  stack source_stack = &BLOCK_INFO (source)->stack_out;
+  struct stack_def regstack;
   int reg;
 
-  current_block = block;
-  regstack = bi->stack_out;
-  if (file)
-    fprintf (file, "Edge %d->%d: ", block->index, target->index);
+  if (dump_file)
+    fprintf (dump_file, "Edge %d->%d: ", source->index, target->index);
 
-  if (target_stack->top == -2)
+  gcc_assert (target_stack->top != -2);
+
+  /* Check whether stacks are identical.  */
+  if (target_stack->top == source_stack->top)
     {
-      /* The target block hasn't had a stack order selected.
-         We need merely ensure that no pops are needed.  */
-      for (reg = regstack.top; reg >= 0; --reg)
-       if (!TEST_HARD_REG_BIT (target_stack->reg_set, regstack.reg[reg]))
+      for (reg = target_stack->top; reg >= 0; --reg)
+       if (target_stack->reg[reg] != source_stack->reg[reg])
          break;
 
       if (reg == -1)
        {
-         if (file)
-           fprintf (file, "new block; copying stack position\n");
-
-         /* change_stack kills values in regstack.  */
-         tmpstack = regstack;
-
-         change_stack (block->end, &tmpstack, target_stack, EMIT_AFTER);
+         if (dump_file)
+           fprintf (dump_file, "no changes needed\n");
          return false;
        }
-
-      if (file)
-       fprintf (file, "new block; pops needed\n");
     }
-  else
-    {
-      if (target_stack->top == regstack.top)
-       {
-         for (reg = target_stack->top; reg >= 0; --reg)
-           if (target_stack->reg[reg] != regstack.reg[reg])
-             break;
-
-         if (reg == -1)
-           {
-             if (file)
-               fprintf (file, "no changes needed\n");
-             return false;
-           }
-       }
 
-      if (file)
-       {
-         fprintf (file, "correcting stack to ");
-         print_stack (file, target_stack);
-       }
+  if (dump_file)
+    {
+      fprintf (dump_file, "correcting stack to ");
+      print_stack (dump_file, target_stack);
     }
 
-  /* Care for non-call EH edges specially.  The normal return path have
-     values in registers.  These will be popped en masse by the unwind
-     library.  */
-  if ((e->flags & (EDGE_EH | EDGE_ABNORMAL_CALL)) == EDGE_EH)
-    target_stack->top = -1;
-
-  /* Other calls may appear to have values live in st(0), but the
+  /* Abnormal calls may appear to have values live in st(0), but the
      abnormal return path will not have actually loaded the values.  */
-  else if (e->flags & EDGE_ABNORMAL_CALL)
+  if (e->flags & EDGE_ABNORMAL_CALL)
     {
       /* Assert that the lifetimes are as we expect -- one value
          live at st(0) on the end of the source block, and no
-         values live at the beginning of the destination block.  */
-      HARD_REG_SET tmp;
+         values live at the beginning of the destination block.
+        For complex return values, we may have st(1) live as well.  */
+      gcc_assert (source_stack->top == 0 || source_stack->top == 1);
+      gcc_assert (target_stack->top == -1);
+      return false;
+    }
 
-      CLEAR_HARD_REG_SET (tmp);
-      GO_IF_HARD_REG_EQUAL (target_stack->reg_set, tmp, eh1);
-      abort ();
-    eh1:
+  /* Handle non-call EH edges specially.  The normal return path have
+     values in registers.  These will be popped en masse by the unwind
+     library.  */
+  if (e->flags & EDGE_EH)
+    {
+      gcc_assert (target_stack->top == -1);
+      return false;
+    }
 
-      SET_HARD_REG_BIT (tmp, FIRST_STACK_REG);
-      GO_IF_HARD_REG_EQUAL (regstack.reg_set, tmp, eh2);
-      abort ();
-    eh2:
+  /* We don't support abnormal edges.  Global takes care to
+     avoid any live register across them, so we should never
+     have to insert instructions on such edges.  */
+  gcc_assert (! (e->flags & EDGE_ABNORMAL));
 
-      target_stack->top = -1;
-    }
+  /* Make a copy of source_stack as change_stack is destructive.  */
+  regstack = *source_stack;
 
   /* It is better to output directly to the end of the block
      instead of to the edge, because emit_swap can do minimal
      insn scheduling.  We can do this when there is only one
      edge out, and it is not abnormal.  */
-  else if (block->succ->succ_next == NULL && !(e->flags & EDGE_ABNORMAL))
+  if (EDGE_COUNT (source->succs) == 1)
     {
-      /* change_stack kills values in regstack.  */
-      tmpstack = regstack;
-
-      change_stack (block->end, &tmpstack, target_stack,
-                   (GET_CODE (block->end) == JUMP_INSN
-                    ? EMIT_BEFORE : EMIT_AFTER));
+      current_block = source;
+      change_stack (BB_END (source), &regstack, target_stack,
+                   (JUMP_P (BB_END (source)) ? EMIT_BEFORE : EMIT_AFTER));
     }
   else
     {
       rtx seq, after;
 
-      /* We don't support abnormal edges.  Global takes care to
-         avoid any live register across them, so we should never
-         have to insert instructions on such edges.  */
-      if (e->flags & EDGE_ABNORMAL)
-       abort ();
-
       current_block = NULL;
       start_sequence ();
 
       /* ??? change_stack needs some point to emit insns after.  */
-      after = emit_note (NULL, NOTE_INSN_DELETED);
+      after = emit_note (NOTE_INSN_DELETED);
 
-      tmpstack = regstack;
-      change_stack (after, &tmpstack, target_stack, EMIT_BEFORE);
+      change_stack (after, &regstack, target_stack, EMIT_BEFORE);
 
       seq = get_insns ();
       end_sequence ();
@@ -2602,107 +2726,150 @@ compensate_edge (e, file)
   return false;
 }
 
+/* Traverse all non-entry edges in the CFG, and emit the necessary
+   edge compensation code to change the stack from stack_out of the
+   source block to the stack_in of the destination block.  */
+
+static bool
+compensate_edges (void)
+{
+  bool inserted = false;
+  basic_block bb;
+
+  starting_stack_p = false;
+
+  FOR_EACH_BB (bb)
+    if (bb != ENTRY_BLOCK_PTR)
+      {
+        edge e;
+        edge_iterator ei;
+
+        FOR_EACH_EDGE (e, ei, bb->succs)
+         inserted |= compensate_edge (e);
+      }
+  return inserted;
+}
+
+/* Select the better of two edges E1 and E2 to use to determine the
+   stack layout for their shared destination basic block.  This is
+   typically the more frequently executed.  The edge E1 may be NULL
+   (in which case E2 is returned), but E2 is always non-NULL.  */
+
+static edge
+better_edge (edge e1, edge e2)
+{
+  if (!e1)
+    return e2;
+
+  if (EDGE_FREQUENCY (e1) > EDGE_FREQUENCY (e2))
+    return e1;
+  if (EDGE_FREQUENCY (e1) < EDGE_FREQUENCY (e2))
+    return e2;
+
+  if (e1->count > e2->count)
+    return e1;
+  if (e1->count < e2->count)
+    return e2;
+
+  /* Prefer critical edges to minimize inserting compensation code on
+     critical edges.  */
+
+  if (EDGE_CRITICAL_P (e1) != EDGE_CRITICAL_P (e2))
+    return EDGE_CRITICAL_P (e1) ? e1 : e2;
+
+  /* Avoid non-deterministic behavior.  */
+  return (e1->src->index < e2->src->index) ? e1 : e2;
+}
+
 /* Convert stack register references in one block.  */
 
-static int
-convert_regs_1 (file, block)
-     FILE *file;
-     basic_block block;
+static void
+convert_regs_1 (basic_block block)
 {
   struct stack_def regstack;
   block_info bi = BLOCK_INFO (block);
-  int inserted, reg;
+  int reg;
   rtx insn, next;
-  edge e, beste = NULL;
+  bool control_flow_insn_deleted = false;
 
-  inserted = 0;
+  any_malformed_asm = false;
 
-  /* Find the edge we will copy stack from.  It should be the most frequent
-     one as it will get cheapest after compensation code is generated,
-     if multiple such exists, take one with largest count, prefer critical
-     one (as splitting critical edges is more expensive), or one with lowest
-     index, to avoid random changes with different orders of the edges.  */
-  for (e = block->pred; e ; e = e->pred_next)
+  /* Choose an initial stack layout, if one hasn't already been chosen.  */
+  if (bi->stack_in.top == -2)
     {
-      if (e->flags & EDGE_DFS_BACK)
-       ;
-      else if (! beste)
-       beste = e;
-      else if (EDGE_FREQUENCY (beste) < EDGE_FREQUENCY (e))
-       beste = e;
-      else if (EDGE_FREQUENCY (beste) > EDGE_FREQUENCY (e))
-       ;
-      else if (beste->count < e->count)
-       beste = e;
-      else if (beste->count > e->count)
-       ;
-      else if ((EDGE_CRITICAL_P (e) != 0)
-              != (EDGE_CRITICAL_P (beste) != 0))
+      edge e, beste = NULL;
+      edge_iterator ei;
+
+      /* Select the best incoming edge (typically the most frequent) to
+        use as a template for this basic block.  */
+      FOR_EACH_EDGE (e, ei, block->preds)
+       if (BLOCK_INFO (e->src)->done)
+         beste = better_edge (beste, e);
+
+      if (beste)
+       propagate_stack (beste);
+      else
        {
-         if (EDGE_CRITICAL_P (e))
-           beste = e;
+         /* No predecessors.  Create an arbitrary input stack.  */
+         bi->stack_in.top = -1;
+         for (reg = LAST_STACK_REG; reg >= FIRST_STACK_REG; --reg)
+           if (TEST_HARD_REG_BIT (bi->stack_in.reg_set, reg))
+             bi->stack_in.reg[++bi->stack_in.top] = reg;
        }
-      else if (e->src->index < beste->src->index)
-       beste = e;
     }
 
-  /* Entry block does have stack already initialized.  */
-  if (bi->stack_in.top == -2)
-    inserted |= compensate_edge (beste, file);
-  else
-    beste = NULL;
-
-  current_block = block;
-
-  if (file)
+  if (dump_file)
     {
-      fprintf (file, "\nBasic block %d\nInput stack: ", block->index);
-      print_stack (file, &bi->stack_in);
+      fprintf (dump_file, "\nBasic block %d\nInput stack: ", block->index);
+      print_stack (dump_file, &bi->stack_in);
     }
 
   /* Process all insns in this block.  Keep track of NEXT so that we
      don't process insns emitted while substituting in INSN.  */
-  next = block->head;
+  current_block = block;
+  next = BB_HEAD (block);
   regstack = bi->stack_in;
+  starting_stack_p = true;
+
   do
     {
       insn = next;
       next = NEXT_INSN (insn);
 
       /* Ensure we have not missed a block boundary.  */
-      if (next == NULL)
-       abort ();
-      if (insn == block->end)
+      gcc_assert (next);
+      if (insn == BB_END (block))
        next = NULL;
 
       /* Don't bother processing unless there is a stack reg
         mentioned or if it's a CALL_INSN.  */
       if (stack_regs_mentioned (insn)
-         || GET_CODE (insn) == CALL_INSN)
+         || CALL_P (insn))
        {
-         if (file)
+         if (dump_file)
            {
-             fprintf (file, "  insn %d input stack: ",
+             fprintf (dump_file, "  insn %d input stack: ",
                       INSN_UID (insn));
-             print_stack (file, &regstack);
+             print_stack (dump_file, &regstack);
            }
-         subst_stack_regs (insn, &regstack);
+         control_flow_insn_deleted |= subst_stack_regs (insn, &regstack);
+         starting_stack_p = false;
        }
     }
   while (next);
 
-  if (file)
+  if (dump_file)
     {
-      fprintf (file, "Expected live registers [");
+      fprintf (dump_file, "Expected live registers [");
       for (reg = FIRST_STACK_REG; reg <= LAST_STACK_REG; ++reg)
        if (TEST_HARD_REG_BIT (bi->out_reg_set, reg))
-         fprintf (file, " %d", reg);
-      fprintf (file, " ]\nOutput stack: ");
-      print_stack (file, &regstack);
+         fprintf (dump_file, " %d", reg);
+      fprintf (dump_file, " ]\nOutput stack: ");
+      print_stack (dump_file, &regstack);
     }
 
-  insn = block->end;
-  if (GET_CODE (insn) == JUMP_INSN)
+  insn = BB_END (block);
+  if (JUMP_P (insn))
     insn = PREV_INSN (insn);
 
   /* If the function is declared to return a value, but it returns one
@@ -2716,99 +2883,107 @@ convert_regs_1 (file, block)
        {
          rtx set;
 
-         if (file)
-           {
-             fprintf (file, "Emitting insn initializing reg %d\n",
-                      reg);
-           }
+         if (dump_file)
+           fprintf (dump_file, "Emitting insn initializing reg %d\n", reg);
 
-         set = gen_rtx_SET (VOIDmode, FP_MODE_REG (reg, SFmode),
-                            nan);
+         set = gen_rtx_SET (VOIDmode, FP_MODE_REG (reg, SFmode), not_a_num);
          insn = emit_insn_after (set, insn);
-         subst_stack_regs (insn, &regstack);
+         control_flow_insn_deleted |= subst_stack_regs (insn, &regstack);
        }
     }
-
-  /* Something failed if the stack lives don't match.  */
+  
+  /* Amongst the insns possibly deleted during the substitution process above,
+     might have been the only trapping insn in the block.  We purge the now
+     possibly dead EH edges here to avoid an ICE from fixup_abnormal_edges,
+     called at the end of convert_regs.  The order in which we process the
+     blocks ensures that we never delete an already processed edge.
+
+     Note that, at this point, the CFG may have been damaged by the emission
+     of instructions after an abnormal call, which moves the basic block end
+     (and is the reason why we call fixup_abnormal_edges later).  So we must
+     be sure that the trapping insn has been deleted before trying to purge
+     dead edges, otherwise we risk purging valid edges.
+
+     ??? We are normally supposed not to delete trapping insns, so we pretend
+     that the insns deleted above don't actually trap.  It would have been
+     better to detect this earlier and avoid creating the EH edge in the first
+     place, still, but we don't have enough information at that time.  */
+
+  if (control_flow_insn_deleted)
+    purge_dead_edges (block);
+
+  /* Something failed if the stack lives don't match.  If we had malformed
+     asms, we zapped the instruction itself, but that didn't produce the
+     same pattern of register kills as before.  */
   GO_IF_HARD_REG_EQUAL (regstack.reg_set, bi->out_reg_set, win);
-  abort ();
+  gcc_assert (any_malformed_asm);
  win:
   bi->stack_out = regstack;
-
-  /* Compensate the back edges, as those wasn't visited yet.  */
-  for (e = block->succ; e ; e = e->succ_next)
-    {
-      if (e->flags & EDGE_DFS_BACK
-         || (e->dest == EXIT_BLOCK_PTR))
-       {
-         if (!BLOCK_INFO (e->dest)->done
-             && e->dest != block)
-           abort ();
-         inserted |= compensate_edge (e, file);
-       }
-    }
-  for (e = block->pred; e ; e = e->pred_next)
-    {
-      if (e != beste && !(e->flags & EDGE_DFS_BACK)
-         && e->src != ENTRY_BLOCK_PTR)
-       {
-         if (!BLOCK_INFO (e->src)->done)
-           abort ();
-         inserted |= compensate_edge (e, file);
-       }
-    }
-
-  return inserted;
+  bi->done = true;
 }
 
 /* Convert registers in all blocks reachable from BLOCK.  */
 
-static int
-convert_regs_2 (file, block)
-     FILE *file;
-     basic_block block;
+static void
+convert_regs_2 (basic_block block)
 {
   basic_block *stack, *sp;
-  int inserted;
 
-  stack = (basic_block *) xmalloc (sizeof (*stack) * n_basic_blocks);
+  /* We process the blocks in a top-down manner, in a way such that one block
+     is only processed after all its predecessors.  The number of predecessors
+     of every block has already been computed.  */ 
+
+  stack = XNEWVEC (basic_block, n_basic_blocks);
   sp = stack;
 
   *sp++ = block;
 
-  inserted = 0;
   do
     {
       edge e;
+      edge_iterator ei;
 
       block = *--sp;
-      inserted |= convert_regs_1 (file, block);
-      BLOCK_INFO (block)->done = 1;
 
-      for (e = block->succ; e ; e = e->succ_next)
+      /* Processing BLOCK is achieved by convert_regs_1, which may purge
+        some dead EH outgoing edge after the deletion of the trapping
+        insn inside the block.  Since the number of predecessors of
+        BLOCK's successors was computed based on the initial edge set,
+        we check the necessity to process some of these successors
+        before such an edge deletion may happen.  However, there is
+        a pitfall: if BLOCK is the only predecessor of a successor and
+        the edge between them happens to be deleted, the successor
+        becomes unreachable and should not be processed.  The problem
+        is that there is no way to preventively detect this case so we
+        stack the successor in all cases and hand over the task of
+        fixing up the discrepancy to convert_regs_1.  */
+
+      FOR_EACH_EDGE (e, ei, block->succs)
        if (! (e->flags & EDGE_DFS_BACK))
          {
            BLOCK_INFO (e->dest)->predecessors--;
            if (!BLOCK_INFO (e->dest)->predecessors)
-              *sp++ = e->dest;
+             *sp++ = e->dest;
          }
+
+      convert_regs_1 (block);
     }
   while (sp != stack);
 
-  return inserted;
+  free (stack);
 }
 
 /* Traverse all basic blocks in a function, converting the register
    references in each insn from the "flat" register file that gcc uses,
    to the stack-like registers the 387 uses.  */
 
-static int
-convert_regs (file)
-     FILE *file;
+static void
+convert_regs (void)
 {
   int inserted;
   basic_block b;
   edge e;
+  edge_iterator ei;
 
   /* Initialize uninitialized registers on function entry.  */
   inserted = convert_regs_entry ();
@@ -2819,11 +2994,11 @@ convert_regs (file)
 
   /* ??? Future: process inner loops first, and give them arbitrary
      initial stacks which emit_swap_insn can modify.  This ought to
-     prevent double fxch that aften appears at the head of a loop.  */
+     prevent double fxch that often appears at the head of a loop.  */
 
   /* Process all blocks reachable from all entry points.  */
-  for (e = ENTRY_BLOCK_PTR->succ; e ; e = e->succ_next)
-    inserted |= convert_regs_2 (file, e->dest);
+  FOR_EACH_EDGE (e, ei, ENTRY_BLOCK_PTR->succs)
+    convert_regs_2 (e->dest);
 
   /* ??? Process all unreachable blocks.  Though there's no excuse
      for keeping these even when not optimizing.  */
@@ -2832,28 +3007,176 @@ convert_regs (file)
       block_info bi = BLOCK_INFO (b);
 
       if (! bi->done)
-       {
-         int reg;
+       convert_regs_2 (b);
+    }
 
-         /* Create an arbitrary input stack.  */
-         bi->stack_in.top = -1;
-         for (reg = LAST_STACK_REG; reg >= FIRST_STACK_REG; --reg)
-           if (TEST_HARD_REG_BIT (bi->stack_in.reg_set, reg))
-             bi->stack_in.reg[++bi->stack_in.top] = reg;
+  inserted |= compensate_edges ();
 
-         inserted |= convert_regs_2 (file, b);
-       }
-    }
+  clear_aux_for_blocks ();
 
   fixup_abnormal_edges ();
   if (inserted)
     commit_edge_insertions ();
 
-  if (file)
-    fputc ('\n', file);
+  if (dump_file)
+    fputc ('\n', dump_file);
+}
+\f
+/* Convert register usage from "flat" register file usage to a "stack
+   register file.  FILE is the dump file, if used.
+
+   Construct a CFG and run life analysis.  Then convert each insn one
+   by one.  Run a last cleanup_cfg pass, if optimizing, to eliminate
+   code duplication created when the converter inserts pop insns on
+   the edges.  */
 
-  return inserted;
+static bool
+reg_to_stack (void)
+{
+  basic_block bb;
+  int i;
+  int max_uid;
+
+  /* Clean up previous run.  */
+  if (stack_regs_mentioned_data != NULL)
+    VEC_free (char, heap, stack_regs_mentioned_data);
+
+  /* See if there is something to do.  Flow analysis is quite
+     expensive so we might save some compilation time.  */
+  for (i = FIRST_STACK_REG; i <= LAST_STACK_REG; i++)
+    if (regs_ever_live[i])
+      break;
+  if (i > LAST_STACK_REG)
+    return false;
+
+  /* Ok, floating point instructions exist.  If not optimizing,
+     build the CFG and run life analysis.
+     Also need to rebuild life when superblock scheduling is done
+     as it don't update liveness yet.  */
+  if (!optimize
+      || ((flag_sched2_use_superblocks || flag_sched2_use_traces)
+         && flag_schedule_insns_after_reload))
+    {
+      count_or_remove_death_notes (NULL, 1);
+      life_analysis (PROP_DEATH_NOTES);
+    }
+  mark_dfs_back_edges ();
+
+  /* Set up block info for each basic block.  */
+  alloc_aux_for_blocks (sizeof (struct block_info_def));
+  FOR_EACH_BB (bb)
+    {
+      block_info bi = BLOCK_INFO (bb);
+      edge_iterator ei;
+      edge e;
+      int reg;
+
+      FOR_EACH_EDGE (e, ei, bb->preds)
+       if (!(e->flags & EDGE_DFS_BACK)
+           && e->src != ENTRY_BLOCK_PTR)
+         bi->predecessors++;
+
+      /* Set current register status at last instruction `uninitialized'.  */
+      bi->stack_in.top = -2;
+
+      /* Copy live_at_end and live_at_start into temporaries.  */
+      for (reg = FIRST_STACK_REG; reg <= LAST_STACK_REG; reg++)
+       {
+         if (REGNO_REG_SET_P (bb->il.rtl->global_live_at_end, reg))
+           SET_HARD_REG_BIT (bi->out_reg_set, reg);
+         if (REGNO_REG_SET_P (bb->il.rtl->global_live_at_start, reg))
+           SET_HARD_REG_BIT (bi->stack_in.reg_set, reg);
+       }
+    }
+
+  /* Create the replacement registers up front.  */
+  for (i = FIRST_STACK_REG; i <= LAST_STACK_REG; i++)
+    {
+      enum machine_mode mode;
+      for (mode = GET_CLASS_NARROWEST_MODE (MODE_FLOAT);
+          mode != VOIDmode;
+          mode = GET_MODE_WIDER_MODE (mode))
+       FP_MODE_REG (i, mode) = gen_rtx_REG (mode, i);
+      for (mode = GET_CLASS_NARROWEST_MODE (MODE_COMPLEX_FLOAT);
+          mode != VOIDmode;
+          mode = GET_MODE_WIDER_MODE (mode))
+       FP_MODE_REG (i, mode) = gen_rtx_REG (mode, i);
+    }
+
+  ix86_flags_rtx = gen_rtx_REG (CCmode, FLAGS_REG);
+
+  /* A QNaN for initializing uninitialized variables.
+
+     ??? We can't load from constant memory in PIC mode, because
+     we're inserting these instructions before the prologue and
+     the PIC register hasn't been set up.  In that case, fall back
+     on zero, which we can get from `ldz'.  */
+
+  if (flag_pic)
+    not_a_num = CONST0_RTX (SFmode);
+  else
+    {
+      not_a_num = gen_lowpart (SFmode, GEN_INT (0x7fc00000));
+      not_a_num = force_const_mem (SFmode, not_a_num);
+    }
+
+  /* Allocate a cache for stack_regs_mentioned.  */
+  max_uid = get_max_uid ();
+  stack_regs_mentioned_data = VEC_alloc (char, heap, max_uid + 1);
+  memset (VEC_address (char, stack_regs_mentioned_data),
+         0, sizeof (char) * max_uid + 1);
+
+  convert_regs ();
+
+  free_aux_for_blocks ();
+  return true;
 }
 #endif /* STACK_REGS */
+\f
+static bool
+gate_handle_stack_regs (void)
+{
+#ifdef STACK_REGS
+  return 1;
+#else
+  return 0;
+#endif
+}
+
+/* Convert register usage from flat register file usage to a stack
+   register file.  */
+static unsigned int
+rest_of_handle_stack_regs (void)
+{
+#ifdef STACK_REGS
+  if (reg_to_stack () && optimize)
+    {
+      if (cleanup_cfg (CLEANUP_EXPENSIVE | CLEANUP_POST_REGSTACK
+                       | (flag_crossjumping ? CLEANUP_CROSSJUMP : 0))
+          && (flag_reorder_blocks || flag_reorder_blocks_and_partition))
+        {
+          reorder_basic_blocks (0);
+          cleanup_cfg (CLEANUP_EXPENSIVE | CLEANUP_POST_REGSTACK);
+        }
+    }
+#endif
+  return 0;
+}
 
-#include "gt-reg-stack.h"
+struct tree_opt_pass pass_stack_regs =
+{
+  "stack",                              /* name */
+  gate_handle_stack_regs,               /* gate */
+  rest_of_handle_stack_regs,            /* execute */
+  NULL,                                 /* sub */
+  NULL,                                 /* next */
+  0,                                    /* static_pass_number */
+  TV_REG_STACK,                         /* tv_id */
+  0,                                    /* properties_required */
+  0,                                    /* properties_provided */
+  0,                                    /* properties_destroyed */
+  0,                                    /* todo_flags_start */
+  TODO_dump_func |
+  TODO_ggc_collect,                     /* todo_flags_finish */
+  'k'                                   /* letter */
+};