OSDN Git Service

* fr.po: Update.
[pf3gnuchains/gcc-fork.git] / gcc / reorg.c
index 631ef4b..e4585c9 100644 (file)
@@ -1,24 +1,25 @@
 /* Perform instruction reorganizations for delay slot filling.
-   Copyright (C) 1992, 93, 94, 95, 96, 1997 Free Software Foundation, Inc.
+   Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998,
+   1999, 2000, 2001, 2002, 2003, 2004 Free Software Foundation, Inc.
    Contributed by Richard Kenner (kenner@vlsi1.ultra.nyu.edu).
    Hacked by Michael Tiemann (tiemann@cygnus.com).
 
-This file is part of GNU CC.
+This file is part of GCC.
 
-GNU CC is free software; you can redistribute it and/or modify
-it under the terms of the GNU General Public License as published by
-the Free Software Foundation; either version 2, or (at your option)
-any later version.
+GCC is free software; you can redistribute it and/or modify it under
+the terms of the GNU General Public License as published by the Free
+Software Foundation; either version 2, or (at your option) any later
+version.
 
-GNU CC is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
-GNU General Public License for more details.
+GCC is distributed in the hope that it will be useful, but WITHOUT ANY
+WARRANTY; without even the implied warranty of MERCHANTABILITY or
+FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
+for more details.
 
 You should have received a copy of the GNU General Public License
-along with GNU CC; see the file COPYING.  If not, write to
-the Free Software Foundation, 59 Temple Place - Suite 330,
-Boston, MA 02111-1307, USA.  */
+along with GCC; see the file COPYING.  If not, write to the Free
+Software Foundation, 59 Temple Place - Suite 330, Boston, MA
+02111-1307, USA.  */
 
 /* Instruction reorganization pass.
 
@@ -55,12 +56,16 @@ Boston, MA 02111-1307, USA.  */
    is taken.
 
    The HP-PA always has a branch delay slot.  For unconditional branches
-   its effects can be annulled when the branch is taken.  The effects 
+   its effects can be annulled when the branch is taken.  The effects
    of the delay slot in a conditional branch can be nullified for forward
    taken branches, or for untaken backward branches.  This means
    we can hoist insns from the fall-through path for forward branches or
    steal insns from the target of backward branches.
 
+   The TMS320C3x and C4x have three branch delay slots.  When the three
+   slots are filled, the branch penalty is zero.  Most insns can fill the
+   delay slots except jump insns.
+
    Three techniques for filling delay slots have been implemented so far:
 
    (1) `fill_simple_delay_slots' is the simplest, most efficient way
@@ -113,35 +118,33 @@ Boston, MA 02111-1307, USA.  */
    based on the condition code of the previous insn.
 
    The HP-PA can conditionally nullify insns, providing a similar
-   effect to the ARM, differing mostly in which insn is "in charge".   */
+   effect to the ARM, differing mostly in which insn is "in charge".  */
 
 #include "config.h"
-#include <stdio.h>
+#include "system.h"
+#include "coretypes.h"
+#include "tm.h"
+#include "toplev.h"
 #include "rtl.h"
+#include "tm_p.h"
+#include "expr.h"
+#include "function.h"
 #include "insn-config.h"
 #include "conditions.h"
 #include "hard-reg-set.h"
 #include "basic-block.h"
 #include "regs.h"
-#include "insn-flags.h"
 #include "recog.h"
 #include "flags.h"
 #include "output.h"
 #include "obstack.h"
 #include "insn-attr.h"
-
-/* Import list of registers used as spill regs from reload.  */
-extern HARD_REG_SET used_spill_regs;
-
-/* Import highest label used in function at end of reload.  */
-extern int max_label_num_after_reload;
-
+#include "resource.h"
+#include "except.h"
+#include "params.h"
 
 #ifdef DELAY_SLOTS
 
-#define obstack_chunk_alloc xmalloc
-#define obstack_chunk_free free
-
 #ifndef ANNUL_IFTRUE_SLOTS
 #define eligible_for_annul_true(INSN, SLOTS, TRIAL, FLAGS) 0
 #endif
@@ -164,58 +167,9 @@ static rtx *unfilled_firstobj;
 #define unfilled_slots_next    \
   ((rtx *) obstack_next_free (&unfilled_slots_obstack))
 
-/* This structure is used to indicate which hardware resources are set or
-   needed by insns so far.  */
-
-struct resources
-{
-  char memory;                 /* Insn sets or needs a memory location.  */
-  char unch_memory;            /* Insn sets of needs a "unchanging" MEM.  */
-  char volatil;                        /* Insn sets or needs a volatile memory loc.  */
-  char cc;                     /* Insn sets or needs the condition codes.  */
-  HARD_REG_SET regs;           /* Which registers are set or needed.  */
-};
-
-/* Macro to clear all resources.  */
-#define CLEAR_RESOURCE(RES)    \
- do { (RES)->memory = (RES)->unch_memory = (RES)->volatil = (RES)->cc = 0; \
-      CLEAR_HARD_REG_SET ((RES)->regs); } while (0)
-
-/* Indicates what resources are required at the beginning of the epilogue.  */
-static struct resources start_of_epilogue_needs;
-
-/* Indicates what resources are required at function end.  */
-static struct resources end_of_function_needs;
-
 /* Points to the label before the end of the function.  */
 static rtx end_of_function_label;
 
-/* This structure is used to record liveness information at the targets or
-   fallthrough insns of branches.  We will most likely need the information
-   at targets again, so save them in a hash table rather than recomputing them
-   each time.  */
-
-struct target_info
-{
-  int uid;                     /* INSN_UID of target.  */
-  struct target_info *next;    /* Next info for same hash bucket.  */
-  HARD_REG_SET live_regs;      /* Registers live at target.  */
-  int block;                   /* Basic block number containing target.  */
-  int bb_tick;                 /* Generation count of basic block info.  */
-};
-
-#define TARGET_HASH_PRIME 257
-
-/* Define the hash table itself.  */
-static struct target_info **target_hash_table;
-
-/* For each basic block, we maintain a generation number of its basic
-   block info, which is updated each time we move an insn from the
-   target of a jump.  This is the generation number indexed by block
-   number.  */
-
-static int *bb_ticks;
-
 /* Mapping between INSN_UID's and position in the code since INSN_UID's do
    not always monotonically increase.  */
 static int *uid_to_ruid;
@@ -223,471 +177,70 @@ static int *uid_to_ruid;
 /* Highest valid index in `uid_to_ruid'.  */
 static int max_uid;
 
-static void mark_referenced_resources PROTO((rtx, struct resources *, int));
-static void mark_set_resources PROTO((rtx, struct resources *, int, int));
-static int stop_search_p       PROTO((rtx, int));
-static int resource_conflicts_p        PROTO((struct resources *,
-                                      struct resources *));
-static int insn_references_resource_p PROTO((rtx, struct resources *, int));
-static int insn_sets_resources_p PROTO((rtx, struct resources *, int));
-static rtx find_end_label      PROTO((void));
-static rtx emit_delay_sequence PROTO((rtx, rtx, int, int));
-static rtx add_to_delay_list   PROTO((rtx, rtx));
-static void delete_from_delay_slot PROTO((rtx));
-static void delete_scheduled_jump PROTO((rtx));
-static void note_delay_statistics PROTO((int, int));
-static rtx optimize_skip       PROTO((rtx));
-static int get_jump_flags PROTO((rtx, rtx));
-static int rare_destination PROTO((rtx));
-static int mostly_true_jump    PROTO((rtx, rtx));
-static rtx get_branch_condition        PROTO((rtx, rtx));
-static int condition_dominates_p PROTO((rtx, rtx));
-static rtx steal_delay_list_from_target PROTO((rtx, rtx, rtx, rtx,
-                                              struct resources *,
-                                              struct resources *,
-                                              struct resources *,
-                                              int, int *, int *, rtx *));
-static rtx steal_delay_list_from_fallthrough PROTO((rtx, rtx, rtx, rtx,
-                                                   struct resources *,
-                                                   struct resources *,
-                                                   struct resources *,
-                                                   int, int *, int *));
-static void try_merge_delay_insns PROTO((rtx, rtx));
-static rtx redundant_insn      PROTO((rtx, rtx, rtx));
-static int own_thread_p                PROTO((rtx, rtx, int));
-static int find_basic_block    PROTO((rtx));
-static void update_block       PROTO((rtx, rtx));
-static int reorg_redirect_jump PROTO((rtx, rtx));
-static void update_reg_dead_notes PROTO((rtx, rtx));
-static void fix_reg_dead_note PROTO((rtx, rtx));
-static void update_reg_unused_notes PROTO((rtx, rtx));
-static void update_live_status PROTO((rtx, rtx));
-static rtx next_insn_no_annul  PROTO((rtx));
-static void mark_target_live_regs PROTO((rtx, struct resources *));
-static void fill_simple_delay_slots PROTO((rtx, int));
-static rtx fill_slots_from_thread PROTO((rtx, rtx, rtx, rtx, int, int,
-                                        int, int, int, int *));
-static void fill_eager_delay_slots PROTO((rtx));
-static void relax_delay_slots  PROTO((rtx));
-static void make_return_insns  PROTO((rtx));
-static int redirect_with_delay_slots_safe_p PROTO ((rtx, rtx, rtx));
-static int redirect_with_delay_list_safe_p PROTO ((rtx, rtx, rtx));
-\f
-/* Given X, some rtl, and RES, a pointer to a `struct resource', mark
-   which resources are references by the insn.  If INCLUDE_CALLED_ROUTINE
-   is TRUE, resources used by the called routine will be included for
-   CALL_INSNs.  */
-
-static void
-mark_referenced_resources (x, res, include_delayed_effects)
-     register rtx x;
-     register struct resources *res;
-     register int include_delayed_effects;
-{
-  register enum rtx_code code = GET_CODE (x);
-  register int i, j;
-  register char *format_ptr;
-
-  /* Handle leaf items for which we set resource flags.  Also, special-case
-     CALL, SET and CLOBBER operators.  */
-  switch (code)
-    {
-    case CONST:
-    case CONST_INT:
-    case CONST_DOUBLE:
-    case PC:
-    case SYMBOL_REF:
-    case LABEL_REF:
-      return;
-
-    case SUBREG:
-      if (GET_CODE (SUBREG_REG (x)) != REG)
-       mark_referenced_resources (SUBREG_REG (x), res, 0);
-      else
-       {
-         int regno = REGNO (SUBREG_REG (x)) + SUBREG_WORD (x);
-         int last_regno = regno + HARD_REGNO_NREGS (regno, GET_MODE (x));
-         for (i = regno; i < last_regno; i++)
-           SET_HARD_REG_BIT (res->regs, i);
-       }
-      return;
-
-    case REG:
-      for (i = 0; i < HARD_REGNO_NREGS (REGNO (x), GET_MODE (x)); i++)
-       SET_HARD_REG_BIT (res->regs, REGNO (x) + i);
-      return;
-
-    case MEM:
-      /* If this memory shouldn't change, it really isn't referencing
-        memory.  */
-      if (RTX_UNCHANGING_P (x))
-       res->unch_memory = 1;
-      else
-       res->memory = 1;
-      res->volatil = MEM_VOLATILE_P (x);
-
-      /* Mark registers used to access memory.  */
-      mark_referenced_resources (XEXP (x, 0), res, 0);
-      return;
-
-    case CC0:
-      res->cc = 1;
-      return;
-
-    case UNSPEC_VOLATILE:
-    case ASM_INPUT:
-    case TRAP_IF:
-      /* Traditional asm's are always volatile.  */
-      res->volatil = 1;
-      return;
-
-    case ASM_OPERANDS:
-      res->volatil = MEM_VOLATILE_P (x);
-
-      /* For all ASM_OPERANDS, we must traverse the vector of input operands.
-        We can not just fall through here since then we would be confused
-        by the ASM_INPUT rtx inside ASM_OPERANDS, which do not indicate
-        traditional asms unlike their normal usage.  */
-      
-      for (i = 0; i < ASM_OPERANDS_INPUT_LENGTH (x); i++)
-       mark_referenced_resources (ASM_OPERANDS_INPUT (x, i), res, 0);
-      return;
-
-    case CALL:
-      /* The first operand will be a (MEM (xxx)) but doesn't really reference
-        memory.  The second operand may be referenced, though.  */
-      mark_referenced_resources (XEXP (XEXP (x, 0), 0), res, 0);
-      mark_referenced_resources (XEXP (x, 1), res, 0);
-      return;
-
-    case SET:
-      /* Usually, the first operand of SET is set, not referenced.  But
-        registers used to access memory are referenced.  SET_DEST is
-        also referenced if it is a ZERO_EXTRACT or SIGN_EXTRACT.  */
-
-      mark_referenced_resources (SET_SRC (x), res, 0);
-
-      x = SET_DEST (x);
-      if (GET_CODE (x) == SIGN_EXTRACT || GET_CODE (x) == ZERO_EXTRACT)
-       mark_referenced_resources (x, res, 0);
-      else if (GET_CODE (x) == SUBREG)
-       x = SUBREG_REG (x);
-      if (GET_CODE (x) == MEM)
-       mark_referenced_resources (XEXP (x, 0), res, 0);
-      return;
-
-    case CLOBBER:
-      return;
-
-    case CALL_INSN:
-      if (include_delayed_effects)
-       {
-         /* A CALL references memory, the frame pointer if it exists, the
-            stack pointer, any global registers and any registers given in
-            USE insns immediately in front of the CALL.
-
-            However, we may have moved some of the parameter loading insns
-            into the delay slot of this CALL.  If so, the USE's for them
-            don't count and should be skipped.  */
-         rtx insn = PREV_INSN (x);
-         rtx sequence = 0;
-         int seq_size = 0;
-         rtx next = NEXT_INSN (x);
-         int i;
-
-         /* If we are part of a delay slot sequence, point at the SEQUENCE.  */
-         if (NEXT_INSN (insn) != x)
-           {
-             next = NEXT_INSN (NEXT_INSN (insn));
-             sequence = PATTERN (NEXT_INSN (insn));
-             seq_size = XVECLEN (sequence, 0);
-             if (GET_CODE (sequence) != SEQUENCE)
-               abort ();
-           }
-
-         res->memory = 1;
-         SET_HARD_REG_BIT (res->regs, STACK_POINTER_REGNUM);
-         if (frame_pointer_needed)
-           {
-             SET_HARD_REG_BIT (res->regs, FRAME_POINTER_REGNUM);
-#if FRAME_POINTER_REGNUM != HARD_FRAME_POINTER_REGNUM
-             SET_HARD_REG_BIT (res->regs, HARD_FRAME_POINTER_REGNUM);
-#endif
-           }
-
-         for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-           if (global_regs[i])
-             SET_HARD_REG_BIT (res->regs, i);
-
-         /* Check for a NOTE_INSN_SETJMP.  If it exists, then we must
-            assume that this call can need any register.
-
-            This is done to be more conservative about how we handle setjmp.
-            We assume that they both use and set all registers.  Using all
-            registers ensures that a register will not be considered dead
-            just because it crosses a setjmp call.  A register should be
-            considered dead only if the setjmp call returns non-zero.  */
-         if (next && GET_CODE (next) == NOTE
-             && NOTE_LINE_NUMBER (next) == NOTE_INSN_SETJMP)
-           SET_HARD_REG_SET (res->regs);
-
-         {
-           rtx link;
-
-           for (link = CALL_INSN_FUNCTION_USAGE (x);
-                link;
-                link = XEXP (link, 1))
-             if (GET_CODE (XEXP (link, 0)) == USE)
-               {
-                 for (i = 1; i < seq_size; i++)
-                   {
-                     rtx slot_pat = PATTERN (XVECEXP (sequence, 0, i));
-                     if (GET_CODE (slot_pat) == SET
-                         && rtx_equal_p (SET_DEST (slot_pat),
-                                         SET_DEST (XEXP (link, 0))))
-                       break;
-                   }
-                 if (i >= seq_size)
-                   mark_referenced_resources (SET_DEST (XEXP (link, 0)),
-                                              res, 0);
-               }
-         }
-       }
-
-      /* ... fall through to other INSN processing ...  */
-
-    case INSN:
-    case JUMP_INSN:
-
-#ifdef INSN_REFERENCES_ARE_DELAYED
-      if (! include_delayed_effects
-         && INSN_REFERENCES_ARE_DELAYED (x))
-       return;
+static int stop_search_p (rtx, int);
+static int resource_conflicts_p (struct resources *, struct resources *);
+static int insn_references_resource_p (rtx, struct resources *, int);
+static int insn_sets_resource_p (rtx, struct resources *, int);
+static rtx find_end_label (void);
+static rtx emit_delay_sequence (rtx, rtx, int);
+static rtx add_to_delay_list (rtx, rtx);
+static rtx delete_from_delay_slot (rtx);
+static void delete_scheduled_jump (rtx);
+static void note_delay_statistics (int, int);
+#if defined(ANNUL_IFFALSE_SLOTS) || defined(ANNUL_IFTRUE_SLOTS)
+static rtx optimize_skip (rtx);
 #endif
-
-      /* No special processing, just speed up.  */
-      mark_referenced_resources (PATTERN (x), res, include_delayed_effects);
-      return;
-    }
-
-  /* Process each sub-expression and flag what it needs.  */
-  format_ptr = GET_RTX_FORMAT (code);
-  for (i = 0; i < GET_RTX_LENGTH (code); i++)
-    switch (*format_ptr++)
-      {
-      case 'e':
-       mark_referenced_resources (XEXP (x, i), res, include_delayed_effects);
-       break;
-
-      case 'E':
-       for (j = 0; j < XVECLEN (x, i); j++)
-         mark_referenced_resources (XVECEXP (x, i, j), res,
-                                    include_delayed_effects);
-       break;
-      }
-}
-\f
-/* Given X, a part of an insn, and a pointer to a `struct resource', RES,
-   indicate which resources are modified by the insn. If INCLUDE_CALLED_ROUTINE
-   is nonzero, also mark resources potentially set by the called routine.
-
-   If IN_DEST is nonzero, it means we are inside a SET.  Otherwise,
-   objects are being referenced instead of set.
-
-   We never mark the insn as modifying the condition code unless it explicitly
-   SETs CC0 even though this is not totally correct.  The reason for this is
-   that we require a SET of CC0 to immediately precede the reference to CC0.
-   So if some other insn sets CC0 as a side-effect, we know it cannot affect
-   our computation and thus may be placed in a delay slot.   */
-
-static void
-mark_set_resources (x, res, in_dest, include_delayed_effects)
-     register rtx x;
-     register struct resources *res;
-     int in_dest;
-     int include_delayed_effects;
-{
-  register enum rtx_code code;
-  register int i, j;
-  register char *format_ptr;
-
- restart:
-
-  code = GET_CODE (x);
-
-  switch (code)
-    {
-    case NOTE:
-    case BARRIER:
-    case CODE_LABEL:
-    case USE:
-    case CONST_INT:
-    case CONST_DOUBLE:
-    case LABEL_REF:
-    case SYMBOL_REF:
-    case CONST:
-    case PC:
-      /* These don't set any resources.  */
-      return;
-
-    case CC0:
-      if (in_dest)
-       res->cc = 1;
-      return;
-
-    case CALL_INSN:
-      /* Called routine modifies the condition code, memory, any registers
-        that aren't saved across calls, global registers and anything
-        explicitly CLOBBERed immediately after the CALL_INSN.  */
-
-      if (include_delayed_effects)
-       {
-         rtx next = NEXT_INSN (x);
-         rtx prev = PREV_INSN (x);
-         rtx link;
-
-         res->cc = res->memory = 1;
-         for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-           if (call_used_regs[i] || global_regs[i])
-             SET_HARD_REG_BIT (res->regs, i);
-
-         /* If X is part of a delay slot sequence, then NEXT should be
-            the first insn after the sequence.  */
-         if (NEXT_INSN (prev) != x)
-           next = NEXT_INSN (NEXT_INSN (prev));
-
-         for (link = CALL_INSN_FUNCTION_USAGE (x);
-              link; link = XEXP (link, 1))
-           if (GET_CODE (XEXP (link, 0)) == CLOBBER)
-             mark_set_resources (SET_DEST (XEXP (link, 0)), res, 1, 0);
-
-         /* Check for a NOTE_INSN_SETJMP.  If it exists, then we must
-            assume that this call can clobber any register.  */
-         if (next && GET_CODE (next) == NOTE
-             && NOTE_LINE_NUMBER (next) == NOTE_INSN_SETJMP)
-           SET_HARD_REG_SET (res->regs);
-       }
-
-      /* ... and also what it's RTL says it modifies, if anything.  */
-
-    case JUMP_INSN:
-    case INSN:
-
-       /* An insn consisting of just a CLOBBER (or USE) is just for flow
-          and doesn't actually do anything, so we ignore it.  */
-
-#ifdef INSN_SETS_ARE_DELAYED
-      if (! include_delayed_effects
-         && INSN_SETS_ARE_DELAYED (x))
-       return;
+static int get_jump_flags (rtx, rtx);
+static int rare_destination (rtx);
+static int mostly_true_jump (rtx, rtx);
+static rtx get_branch_condition (rtx, rtx);
+static int condition_dominates_p (rtx, rtx);
+static int redirect_with_delay_slots_safe_p (rtx, rtx, rtx);
+static int redirect_with_delay_list_safe_p (rtx, rtx, rtx);
+static int check_annul_list_true_false (int, rtx);
+static rtx steal_delay_list_from_target (rtx, rtx, rtx, rtx,
+                                        struct resources *,
+                                        struct resources *,
+                                        struct resources *,
+                                        int, int *, int *, rtx *);
+static rtx steal_delay_list_from_fallthrough (rtx, rtx, rtx, rtx,
+                                             struct resources *,
+                                             struct resources *,
+                                             struct resources *,
+                                             int, int *, int *);
+static void try_merge_delay_insns (rtx, rtx);
+static rtx redundant_insn (rtx, rtx, rtx);
+static int own_thread_p (rtx, rtx, int);
+static void update_block (rtx, rtx);
+static int reorg_redirect_jump (rtx, rtx);
+static void update_reg_dead_notes (rtx, rtx);
+static void fix_reg_dead_note (rtx, rtx);
+static void update_reg_unused_notes (rtx, rtx);
+static void fill_simple_delay_slots (int);
+static rtx fill_slots_from_thread (rtx, rtx, rtx, rtx, int, int, int, int,
+                                  int *, rtx);
+static void fill_eager_delay_slots (void);
+static void relax_delay_slots (rtx);
+#ifdef HAVE_return
+static void make_return_insns (rtx);
 #endif
-
-      x = PATTERN (x);
-      if (GET_CODE (x) != USE && GET_CODE (x) != CLOBBER)
-       goto restart;
-      return;
-
-    case SET:
-      /* If the source of a SET is a CALL, this is actually done by
-        the called routine.  So only include it if we are to include the
-        effects of the calling routine.  */
-
-      mark_set_resources (SET_DEST (x), res,
-                         (include_delayed_effects
-                          || GET_CODE (SET_SRC (x)) != CALL),
-                         0);
-
-      mark_set_resources (SET_SRC (x), res, 0, 0);
-      return;
-
-    case CLOBBER:
-      mark_set_resources (XEXP (x, 0), res, 1, 0);
-      return;
-      
-    case SEQUENCE:
-      for (i = 0; i < XVECLEN (x, 0); i++)
-       if (! (INSN_ANNULLED_BRANCH_P (XVECEXP (x, 0, 0))
-              && INSN_FROM_TARGET_P (XVECEXP (x, 0, i))))
-         mark_set_resources (XVECEXP (x, 0, i), res, 0,
-                             include_delayed_effects);
-      return;
-
-    case POST_INC:
-    case PRE_INC:
-    case POST_DEC:
-    case PRE_DEC:
-      mark_set_resources (XEXP (x, 0), res, 1, 0);
-      return;
-
-    case ZERO_EXTRACT:
-      mark_set_resources (XEXP (x, 0), res, in_dest, 0);
-      mark_set_resources (XEXP (x, 1), res, 0, 0);
-      mark_set_resources (XEXP (x, 2), res, 0, 0);
-      return;
-
-    case MEM:
-      if (in_dest)
-       {
-         res->memory = 1;
-         res->unch_memory = RTX_UNCHANGING_P (x);
-         res->volatil = MEM_VOLATILE_P (x);
-       }
-
-      mark_set_resources (XEXP (x, 0), res, 0, 0);
-      return;
-
-    case SUBREG:
-      if (in_dest)
-       {
-         if (GET_CODE (SUBREG_REG (x)) != REG)
-           mark_set_resources (SUBREG_REG (x), res,
-                               in_dest, include_delayed_effects);
-         else
-           {
-             int regno = REGNO (SUBREG_REG (x)) + SUBREG_WORD (x);
-             int last_regno = regno + HARD_REGNO_NREGS (regno, GET_MODE (x));
-             for (i = regno; i < last_regno; i++)
-               SET_HARD_REG_BIT (res->regs, i);
-           }
-       }
-      return;
-
-    case REG:
-      if (in_dest)
-        for (i = 0; i < HARD_REGNO_NREGS (REGNO (x), GET_MODE (x)); i++)
-         SET_HARD_REG_BIT (res->regs, REGNO (x) + i);
-      return;
-    }
-
-  /* Process each sub-expression and flag what it needs.  */
-  format_ptr = GET_RTX_FORMAT (code);
-  for (i = 0; i < GET_RTX_LENGTH (code); i++)
-    switch (*format_ptr++)
-      {
-      case 'e':
-       mark_set_resources (XEXP (x, i), res, in_dest, include_delayed_effects);
-       break;
-
-      case 'E':
-       for (j = 0; j < XVECLEN (x, i); j++)
-         mark_set_resources (XVECEXP (x, i, j), res, in_dest,
-                             include_delayed_effects);
-       break;
-      }
-}
 \f
 /* Return TRUE if this insn should stop the search for insn to fill delay
    slots.  LABELS_P indicates that labels should terminate the search.
    In all cases, jumps terminate the search.  */
 
 static int
-stop_search_p (insn, labels_p)
-     rtx insn;
-     int labels_p;
+stop_search_p (rtx insn, int labels_p)
 {
   if (insn == 0)
     return 1;
 
+  /* If the insn can throw an exception that is caught within the function,
+     it may effectively perform a jump from the viewpoint of the function.
+     Therefore act like for a jump.  */
+  if (can_throw_internal (insn))
+    return 1;
+
   switch (GET_CODE (insn))
     {
     case NOTE:
@@ -717,8 +270,7 @@ stop_search_p (insn, labels_p)
    resource set contains a volatile memory reference.  Otherwise, return FALSE.  */
 
 static int
-resource_conflicts_p (res1, res2)
-     struct resources *res1, *res2;
+resource_conflicts_p (struct resources *res1, struct resources *res2)
 {
   if ((res1->cc && res2->cc) || (res1->memory && res2->memory)
       || (res1->unch_memory && res2->unch_memory)
@@ -740,7 +292,7 @@ resource_conflicts_p (res1, res2)
 }
 
 /* Return TRUE if any resource marked in RES, a `struct resources', is
-   referenced by INSN.  If INCLUDE_CALLED_ROUTINE is set, return if the called
+   referenced by INSN.  If INCLUDE_DELAYED_EFFECTS is set, return if the called
    routine is using those resources.
 
    We compute this by computing all the resources referenced by INSN and
@@ -749,10 +301,8 @@ resource_conflicts_p (res1, res2)
    a large block of complex code.  */
 
 static int
-insn_references_resource_p (insn, res, include_delayed_effects)
-     register rtx insn;
-     register struct resources *res;
-     int include_delayed_effects;
+insn_references_resource_p (rtx insn, struct resources *res,
+                           int include_delayed_effects)
 {
   struct resources insn_res;
 
@@ -762,15 +312,13 @@ insn_references_resource_p (insn, res, include_delayed_effects)
 }
 
 /* Return TRUE if INSN modifies resources that are marked in RES.
-   INCLUDE_CALLED_ROUTINE is set if the actions of that routine should be
+   INCLUDE_DELAYED_EFFECTS is set if the actions of that routine should be
    included.   CC0 is only modified if it is explicitly set; see comments
    in front of mark_set_resources for details.  */
 
 static int
-insn_sets_resource_p (insn, res, include_delayed_effects)
-     register rtx insn;
-     register struct resources *res;
-     int include_delayed_effects;
+insn_sets_resource_p (rtx insn, struct resources *res,
+                     int include_delayed_effects)
 {
   struct resources insn_sets;
 
@@ -783,7 +331,7 @@ insn_sets_resource_p (insn, res, include_delayed_effects)
    none, make one.  */
 
 static rtx
-find_end_label ()
+find_end_label (void)
 {
   rtx insn;
 
@@ -802,7 +350,7 @@ find_end_label ()
                 || GET_CODE (PATTERN (insn)) == CLOBBER)))
     insn = PREV_INSN (insn);
 
-  /* When a target threads its epilogue we might already have a 
+  /* When a target threads its epilogue we might already have a
      suitable return insn.  If so put a label before it for the
      end_of_function_label.  */
   if (GET_CODE (insn) == BARRIER
@@ -824,22 +372,42 @@ find_end_label ()
     end_of_function_label = insn;
   else
     {
-      /* Otherwise, make a new label and emit a RETURN and BARRIER,
-        if needed.  */
       end_of_function_label = gen_label_rtx ();
       LABEL_NUSES (end_of_function_label) = 0;
-      emit_label (end_of_function_label);
-#ifdef HAVE_return
-      if (HAVE_return)
+      /* If the basic block reorder pass moves the return insn to
+        some other place try to locate it again and put our
+        end_of_function_label there.  */
+      while (insn && ! (GET_CODE (insn) == JUMP_INSN
+                       && (GET_CODE (PATTERN (insn)) == RETURN)))
+       insn = PREV_INSN (insn);
+      if (insn)
        {
-         /* The return we make may have delay slots too.  */
-         rtx insn = gen_return ();
-         insn = emit_jump_insn (insn);
-         emit_barrier ();
-          if (num_delay_slots (insn) > 0)
-           obstack_ptr_grow (&unfilled_slots_obstack, insn);
+         insn = PREV_INSN (insn);
+
+         /* Put the label before an USE insns that may proceed the
+            RETURN insn.  */
+         while (GET_CODE (insn) == USE)
+           insn = PREV_INSN (insn);
+
+         emit_label_after (end_of_function_label, insn);
        }
+      else
+       {
+         /* Otherwise, make a new label and emit a RETURN and BARRIER,
+            if needed.  */
+         emit_label (end_of_function_label);
+#ifdef HAVE_return
+         if (HAVE_return)
+           {
+             /* The return we make may have delay slots too.  */
+             rtx insn = gen_return ();
+             insn = emit_jump_insn (insn);
+             emit_barrier ();
+             if (num_delay_slots (insn) > 0)
+               obstack_ptr_grow (&unfilled_slots_obstack, insn);
+           }
 #endif
+       }
     }
 
   /* Show one additional use for this label so it won't go away until
@@ -860,17 +428,13 @@ find_end_label ()
    Returns the SEQUENCE that replaces INSN.  */
 
 static rtx
-emit_delay_sequence (insn, list, length, avail)
-     rtx insn;
-     rtx list;
-     int length;
-     int avail;
+emit_delay_sequence (rtx insn, rtx list, int length)
 {
-  register int i = 1;
-  register rtx li;
+  int i = 1;
+  rtx li;
   int had_barrier = 0;
 
-  /* Allocate the the rtvec to hold the insns and the SEQUENCE.  */
+  /* Allocate the rtvec to hold the insns and the SEQUENCE.  */
   rtvec seqv = rtvec_alloc (length + 1);
   rtx seq = gen_rtx_SEQUENCE (VOIDmode, seqv);
   rtx seq_insn = make_insn_raw (seq);
@@ -881,11 +445,11 @@ emit_delay_sequence (insn, list, length, avail)
   rtx delay_insn = copy_rtx (insn);
 
   /* If INSN is followed by a BARRIER, delete the BARRIER since it will only
-     confuse further processing.  Update LAST in case it was the last insn.  
+     confuse further processing.  Update LAST in case it was the last insn.
      We will put the BARRIER back in later.  */
   if (NEXT_INSN (insn) && GET_CODE (NEXT_INSN (insn)) == BARRIER)
     {
-      delete_insn (NEXT_INSN (insn));
+      delete_related_insns (NEXT_INSN (insn));
       last = get_last_insn ();
       had_barrier = 1;
     }
@@ -919,7 +483,7 @@ emit_delay_sequence (insn, list, length, avail)
   for (li = list; li; li = XEXP (li, 1), i++)
     {
       rtx tem = XEXP (li, 0);
-      rtx note;
+      rtx note, next;
 
       /* Show that this copy of the insn isn't deleted.  */
       INSN_DELETED_P (tem) = 0;
@@ -928,11 +492,33 @@ emit_delay_sequence (insn, list, length, avail)
       PREV_INSN (tem) = XVECEXP (seq, 0, i - 1);
       NEXT_INSN (XVECEXP (seq, 0, i - 1)) = tem;
 
-      /* Remove any REG_DEAD notes because we can't rely on them now
-        that the insn has been moved.  */
-      for (note = REG_NOTES (tem); note; note = XEXP (note, 1))
-       if (REG_NOTE_KIND (note) == REG_DEAD)
-         XEXP (note, 0) = const0_rtx;
+      /* SPARC assembler, for instance, emit warning when debug info is output
+         into the delay slot.  */
+      if (INSN_LOCATOR (tem) && !INSN_LOCATOR (seq_insn))
+       INSN_LOCATOR (seq_insn) = INSN_LOCATOR (tem);
+      INSN_LOCATOR (tem) = 0;
+
+      for (note = REG_NOTES (tem); note; note = next)
+       {
+         next = XEXP (note, 1);
+         switch (REG_NOTE_KIND (note))
+           {
+           case REG_DEAD:
+             /* Remove any REG_DEAD notes because we can't rely on them now
+                that the insn has been moved.  */
+             remove_note (tem, note);
+             break;
+
+           case REG_LABEL:
+             /* Keep the label reference count up to date.  */
+             if (GET_CODE (XEXP (note, 0)) == CODE_LABEL)
+               LABEL_NUSES (XEXP (note, 0)) ++;
+             break;
+
+           default:
+             break;
+           }
+       }
     }
 
   NEXT_INSN (XVECEXP (seq, 0, length)) = NEXT_INSN (seq_insn);
@@ -950,7 +536,7 @@ emit_delay_sequence (insn, list, length, avail)
   if (NEXT_INSN (seq_insn) && GET_CODE (NEXT_INSN (seq_insn)) == INSN
       && GET_CODE (PATTERN (NEXT_INSN (seq_insn))) == SEQUENCE)
     PREV_INSN (XVECEXP (PATTERN (NEXT_INSN (seq_insn)), 0, 0)) = seq_insn;
-    
+
   /* If there used to be a BARRIER, put it back.  */
   if (had_barrier)
     emit_barrier_after (seq_insn);
@@ -965,26 +551,15 @@ emit_delay_sequence (insn, list, length, avail)
    be in the order in which the insns are to be executed.  */
 
 static rtx
-add_to_delay_list (insn, delay_list)
-     rtx insn;
-     rtx delay_list;
+add_to_delay_list (rtx insn, rtx delay_list)
 {
   /* If we have an empty list, just make a new list element.  If
-     INSN has it's block number recorded, clear it since we may
+     INSN has its block number recorded, clear it since we may
      be moving the insn to a new block.  */
 
   if (delay_list == 0)
     {
-      struct target_info *tinfo;
-      
-      for (tinfo = target_hash_table[INSN_UID (insn) % TARGET_HASH_PRIME];
-          tinfo; tinfo = tinfo->next)
-       if (tinfo->uid == INSN_UID (insn))
-         break;
-
-      if (tinfo)
-       tinfo->block = -1;
-
+      clear_hashed_info_for_insn (insn);
       return gen_rtx_INSN_LIST (VOIDmode, insn, NULL_RTX);
     }
 
@@ -993,14 +568,13 @@ add_to_delay_list (insn, delay_list)
   XEXP (delay_list, 1) = add_to_delay_list (insn, XEXP (delay_list, 1));
 
   return delay_list;
-}   
+}
 \f
-/* Delete INSN from the the delay slot of the insn that it is in.  This may
-   produce an insn without anything in its delay slots.  */
+/* Delete INSN from the delay slot of the insn that it is in, which may
+   produce an insn with no delay slots.  Return the new insn.  */
 
-static void
-delete_from_delay_slot (insn)
-     rtx insn;
+static rtx
+delete_from_delay_slot (rtx insn)
 {
   rtx trial, seq_insn, seq, prev;
   rtx delay_list = 0;
@@ -1029,7 +603,7 @@ delete_from_delay_slot (insn)
      list, and rebuild the delay list if non-empty.  */
   prev = PREV_INSN (seq_insn);
   trial = XVECEXP (seq, 0, 0);
-  delete_insn (seq_insn);
+  delete_related_insns (seq_insn);
   add_insn_after (trial, prev);
 
   if (GET_CODE (trial) == JUMP_INSN
@@ -1039,22 +613,25 @@ delete_from_delay_slot (insn)
   /* If there are any delay insns, remit them.  Otherwise clear the
      annul flag.  */
   if (delay_list)
-    trial = emit_delay_sequence (trial, delay_list, XVECLEN (seq, 0) - 2, 0);
-  else
+    trial = emit_delay_sequence (trial, delay_list, XVECLEN (seq, 0) - 2);
+  else if (GET_CODE (trial) == JUMP_INSN
+          || GET_CODE (trial) == CALL_INSN
+          || GET_CODE (trial) == INSN)
     INSN_ANNULLED_BRANCH_P (trial) = 0;
 
   INSN_FROM_TARGET_P (insn) = 0;
 
   /* Show we need to fill this insn again.  */
   obstack_ptr_grow (&unfilled_slots_obstack, trial);
+
+  return trial;
 }
 \f
 /* Delete INSN, a JUMP_INSN.  If it is a conditional jump, we must track down
    the insn that sets CC0 for it and delete it too.  */
 
 static void
-delete_scheduled_jump (insn)
-     rtx insn;
+delete_scheduled_jump (rtx insn)
 {
   /* Delete the insn that sets cc0 for us.  On machines without cc0, we could
      delete the insn that sets the condition code, but it is hard to find it.
@@ -1085,17 +662,17 @@ delete_scheduled_jump (insn)
          if (GET_CODE (trial) == NOTE)
            trial = prev_nonnote_insn (trial);
          if (sets_cc0_p (PATTERN (trial)) != 1
-             || FIND_REG_INC_NOTE (trial, 0))
+             || FIND_REG_INC_NOTE (trial, NULL_RTX))
            return;
          if (PREV_INSN (NEXT_INSN (trial)) == trial)
-           delete_insn (trial);
+           delete_related_insns (trial);
          else
            delete_from_delay_slot (trial);
        }
     }
 #endif
 
-  delete_insn (insn);
+  delete_related_insns (insn);
 }
 \f
 /* Counters for delay-slot filling.  */
@@ -1111,8 +688,7 @@ static int num_filled_delays[NUM_REORG_FUNCTIONS][MAX_DELAY_HISTOGRAM+1][MAX_REO
 static int reorg_pass_number;
 
 static void
-note_delay_statistics (slots_filled, index)
-     int slots_filled, index;
+note_delay_statistics (int slots_filled, int index)
 {
   num_insns_needing_delays[index][reorg_pass_number]++;
   if (slots_filled > MAX_DELAY_HISTOGRAM)
@@ -1155,10 +731,9 @@ note_delay_statistics (slots_filled, index)
    of delay slots required.  */
 
 static rtx
-optimize_skip (insn)
-     register rtx insn;
+optimize_skip (rtx insn)
 {
-  register rtx trial = next_nonnote_insn (insn);
+  rtx trial = next_nonnote_insn (insn);
   rtx next_trial = next_active_insn (trial);
   rtx delay_list = 0;
   rtx target_label;
@@ -1171,7 +746,8 @@ optimize_skip (insn)
       || GET_CODE (PATTERN (trial)) == SEQUENCE
       || recog_memoized (trial) < 0
       || (! eligible_for_annul_false (insn, 0, trial, flags)
-         && ! eligible_for_annul_true (insn, 0, trial, flags)))
+         && ! eligible_for_annul_true (insn, 0, trial, flags))
+      || can_throw_internal (trial))
     return 0;
 
   /* There are two cases where we are just executing one insn (we assume
@@ -1180,7 +756,8 @@ optimize_skip (insn)
      we have one insn followed by a branch to the same label we branch to.
      In both of these cases, inverting the jump and annulling the delay
      slot give the same effect in fewer insns.  */
-  if ((next_trial == next_active_insn (JUMP_LABEL (insn)))
+  if ((next_trial == next_active_insn (JUMP_LABEL (insn))
+       && ! (next_trial == 0 && current_function_epilogue_delay_list != 0))
       || (next_trial != 0
          && GET_CODE (next_trial) == JUMP_INSN
          && JUMP_LABEL (insn) == JUMP_LABEL (next_trial)
@@ -1189,7 +766,7 @@ optimize_skip (insn)
     {
       if (eligible_for_annul_false (insn, 0, trial, flags))
        {
-         if (invert_jump (insn, JUMP_LABEL (insn)))
+         if (invert_jump (insn, JUMP_LABEL (insn), 1))
            INSN_FROM_TARGET_P (trial) = 1;
          else if (! eligible_for_annul_true (insn, 0, trial, flags))
            return 0;
@@ -1198,7 +775,7 @@ optimize_skip (insn)
       delay_list = add_to_delay_list (trial, NULL_RTX);
       next_trial = next_active_insn (trial);
       update_block (trial, trial);
-      delete_insn (trial);
+      delete_related_insns (trial);
 
       /* Also, if we are targeting an unconditional
         branch, thread our jump to the target of that branch.  Don't
@@ -1228,7 +805,6 @@ optimize_skip (insn)
 }
 #endif
 \f
-
 /*  Encode and return branch direction and prediction information for
     INSN assuming it will jump to LABEL.
 
@@ -1236,8 +812,7 @@ optimize_skip (insn)
     are predicted as very likely taken.  */
 
 static int
-get_jump_flags (insn, label)
-     rtx insn, label;
+get_jump_flags (rtx insn, rtx label)
 {
   int flags;
 
@@ -1252,15 +827,15 @@ get_jump_flags (insn, label)
       && INSN_UID (insn) <= max_uid
       && label != 0
       && INSN_UID (label) <= max_uid)
-    flags 
+    flags
       = (uid_to_ruid[INSN_UID (label)] > uid_to_ruid[INSN_UID (insn)])
         ? ATTR_FLAG_forward : ATTR_FLAG_backward;
   /* No valid direction information.  */
   else
     flags = 0;
-  
+
   /* If insn is a conditional branch call mostly_true_jump to get
-     determine the branch prediction.  
+     determine the branch prediction.
 
      Non conditional branches are predicted as very likely taken.  */
   if (GET_CODE (insn) == JUMP_INSN
@@ -1271,21 +846,21 @@ get_jump_flags (insn, label)
       prediction = mostly_true_jump (insn, get_branch_condition (insn, label));
       switch (prediction)
        {
-         case 2:
-           flags |= (ATTR_FLAG_very_likely | ATTR_FLAG_likely);
-           break;
-         case 1:
-           flags |= ATTR_FLAG_likely;
-           break;
-         case 0:
-           flags |= ATTR_FLAG_unlikely;
-           break;
-         case -1:
-           flags |= (ATTR_FLAG_very_unlikely | ATTR_FLAG_unlikely);
-           break;
+       case 2:
+         flags |= (ATTR_FLAG_very_likely | ATTR_FLAG_likely);
+         break;
+       case 1:
+         flags |= ATTR_FLAG_likely;
+         break;
+       case 0:
+         flags |= ATTR_FLAG_unlikely;
+         break;
+       case -1:
+         flags |= (ATTR_FLAG_very_unlikely | ATTR_FLAG_unlikely);
+         break;
 
-         default:
-           abort();
+       default:
+         abort ();
        }
     }
   else
@@ -1300,8 +875,7 @@ get_jump_flags (insn, label)
    return 0.  */
 
 static int
-rare_destination (insn)
-     rtx insn;
+rare_destination (rtx insn)
 {
   int jump_count = 0;
   rtx next;
@@ -1318,7 +892,7 @@ rare_destination (insn)
        case CODE_LABEL:
          return 0;
        case BARRIER:
-         /* A BARRIER can either be after a JUMP_INSN or a CALL_INSN.  We 
+         /* A BARRIER can either be after a JUMP_INSN or a CALL_INSN.  We
             don't scan past JUMP_INSNs, so any barrier we find here must
             have been after a CALL_INSN and hence mean the call doesn't
             return.  */
@@ -1331,6 +905,9 @@ rare_destination (insn)
            next = JUMP_LABEL (insn);
          else
            return 0;
+
+       default:
+         break;
        }
     }
 
@@ -1346,37 +923,35 @@ rare_destination (insn)
    taken, return 1.  If the branch is slightly less likely to be taken,
    return 0 and if the branch is highly unlikely to be taken, return -1.
 
-   CONDITION, if non-zero, is the condition that JUMP_INSN is testing.  */
+   CONDITION, if nonzero, is the condition that JUMP_INSN is testing.  */
 
 static int
-mostly_true_jump (jump_insn, condition)
-     rtx jump_insn, condition;
+mostly_true_jump (rtx jump_insn, rtx condition)
 {
   rtx target_label = JUMP_LABEL (jump_insn);
-  rtx insn;
+  rtx insn, note;
   int rare_dest = rare_destination (target_label);
   int rare_fallthrough = rare_destination (NEXT_INSN (jump_insn));
 
   /* If branch probabilities are available, then use that number since it
      always gives a correct answer.  */
-  if (flag_branch_probabilities)
+  note = find_reg_note (jump_insn, REG_BR_PROB, 0);
+  if (note)
     {
-      rtx note = find_reg_note (jump_insn, REG_BR_PROB, 0);;
-      if (note)
-       {
-         int prob = XINT (note, 0);
+      int prob = INTVAL (XEXP (note, 0));
 
-         if (prob >= REG_BR_PROB_BASE * 9 / 10)
-           return 2;
-         else if (prob >= REG_BR_PROB_BASE / 2)
-           return 1;
-         else if (prob >= REG_BR_PROB_BASE / 10)
-           return 0;
-         else
-           return -1;
-       }
+      if (prob >= REG_BR_PROB_BASE * 9 / 10)
+       return 2;
+      else if (prob >= REG_BR_PROB_BASE / 2)
+       return 1;
+      else if (prob >= REG_BR_PROB_BASE / 10)
+       return 0;
+      else
+       return -1;
     }
 
+  /* ??? Ought to use estimate_probability instead.  */
+
   /* If this is a branch outside a loop, it is highly unlikely.  */
   if (GET_CODE (PATTERN (jump_insn)) == SET
       && GET_CODE (SET_SRC (PATTERN (jump_insn))) == IF_THEN_ELSE
@@ -1390,7 +965,7 @@ mostly_true_jump (jump_insn, condition)
     {
       /* If this is the test of a loop, it is very likely true.  We scan
         backwards from the target label.  If we find a NOTE_INSN_LOOP_BEG
-        before the next real insn, we assume the branch is to the top of 
+        before the next real insn, we assume the branch is to the top of
         the loop.  */
       for (insn = PREV_INSN (target_label);
           insn && GET_CODE (insn) == NOTE;
@@ -1426,7 +1001,7 @@ mostly_true_jump (jump_insn, condition)
       return 2;
     }
 
-  /* If we couldn't figure out what this jump was, assume it won't be 
+  /* If we couldn't figure out what this jump was, assume it won't be
      taken.  This should be rare.  */
   if (condition == 0)
     return 0;
@@ -1446,13 +1021,16 @@ mostly_true_jump (jump_insn, condition)
     case LE:
     case LT:
       if (XEXP (condition, 1) == const0_rtx)
-        return 0;
+       return 0;
       break;
     case GE:
     case GT:
       if (XEXP (condition, 1) == const0_rtx)
        return 1;
       break;
+
+    default:
+      break;
     }
 
   /* Predict backward branches usually take, forward branches usually not.  If
@@ -1461,7 +1039,7 @@ mostly_true_jump (jump_insn, condition)
   return (target_label == 0 || INSN_UID (jump_insn) > max_uid
          || INSN_UID (target_label) > max_uid
          || (uid_to_ruid[INSN_UID (jump_insn)]
-             > uid_to_ruid[INSN_UID (target_label)]));;
+             > uid_to_ruid[INSN_UID (target_label)]));
 }
 
 /* Return the condition under which INSN will branch to TARGET.  If TARGET
@@ -1470,13 +1048,11 @@ mostly_true_jump (jump_insn, condition)
    type of jump, or it doesn't go to TARGET, return 0.  */
 
 static rtx
-get_branch_condition (insn, target)
-     rtx insn;
-     rtx target;
+get_branch_condition (rtx insn, rtx target)
 {
   rtx pat = PATTERN (insn);
   rtx src;
-  
+
   if (condjump_in_parallel_p (insn))
     pat = XVECEXP (pat, 0, 0);
 
@@ -1502,20 +1078,23 @@ get_branch_condition (insn, target)
               || (GET_CODE (XEXP (src, 2)) == LABEL_REF
                   && XEXP (XEXP (src, 2), 0) == target))
           && XEXP (src, 1) == pc_rtx)
-    return gen_rtx_fmt_ee (reverse_condition (GET_CODE (XEXP (src, 0))),
-                          GET_MODE (XEXP (src, 0)),
-                          XEXP (XEXP (src, 0), 0), XEXP (XEXP (src, 0), 1));
+    {
+      enum rtx_code rev;
+      rev = reversed_comparison_code (XEXP (src, 0), insn);
+      if (rev != UNKNOWN)
+       return gen_rtx_fmt_ee (rev, GET_MODE (XEXP (src, 0)),
+                              XEXP (XEXP (src, 0), 0),
+                              XEXP (XEXP (src, 0), 1));
+    }
 
   return 0;
 }
 
-/* Return non-zero if CONDITION is more strict than the condition of
+/* Return nonzero if CONDITION is more strict than the condition of
    INSN, i.e., if INSN will always branch if CONDITION is true.  */
 
 static int
-condition_dominates_p (condition, insn)
-     rtx condition;
-     rtx insn;
+condition_dominates_p (rtx condition, rtx insn)
 {
   rtx other_condition = get_branch_condition (insn, JUMP_LABEL (insn));
   enum rtx_code code = GET_CODE (condition);
@@ -1537,19 +1116,18 @@ condition_dominates_p (condition, insn)
   return comparison_dominates_p (code, other_code);
 }
 
-/* Return non-zero if redirecting JUMP to NEWLABEL does not invalidate
+/* Return nonzero if redirecting JUMP to NEWLABEL does not invalidate
    any insns already in the delay slot of JUMP.  */
 
 static int
-redirect_with_delay_slots_safe_p (jump, newlabel, seq)
-     rtx jump, newlabel, seq;
+redirect_with_delay_slots_safe_p (rtx jump, rtx newlabel, rtx seq)
 {
-  int flags, slots, i;
+  int flags, i;
   rtx pat = PATTERN (seq);
 
   /* Make sure all the delay slots of this jump would still
      be valid after threading the jump.  If they are still
-     valid, then return non-zero.  */
+     valid, then return nonzero.  */
 
   flags = get_jump_flags (jump, newlabel);
   for (i = 1; i < XVECLEN (pat, 0); i++)
@@ -1566,25 +1144,24 @@ redirect_with_delay_slots_safe_p (jump, newlabel, seq)
           ? eligible_for_annul_true (jump, i - 1,
                                      XVECEXP (pat, 0, i), flags) :
 #endif
-          eligible_for_delay (jump, i -1, XVECEXP (pat, 0, i), flags)))
+          eligible_for_delay (jump, i - 1, XVECEXP (pat, 0, i), flags)))
       break;
 
   return (i == XVECLEN (pat, 0));
 }
 
-/* Return non-zero if redirecting JUMP to NEWLABEL does not invalidate
+/* Return nonzero if redirecting JUMP to NEWLABEL does not invalidate
    any insns we wish to place in the delay slot of JUMP.  */
 
 static int
-redirect_with_delay_list_safe_p (jump, newlabel, delay_list)
-     rtx jump, newlabel, delay_list;
+redirect_with_delay_list_safe_p (rtx jump, rtx newlabel, rtx delay_list)
 {
   int flags, i;
   rtx li;
 
   /* Make sure all the insns in DELAY_LIST would still be
      valid after threading the jump.  If they are still
-     valid, then return non-zero.  */
+     valid, then return nonzero.  */
 
   flags = get_jump_flags (jump, newlabel);
   for (li = delay_list, i = 0; li; li = XEXP (li, 1), i++)
@@ -1605,6 +1182,29 @@ redirect_with_delay_list_safe_p (jump, newlabel, delay_list)
   return (li == NULL);
 }
 
+/* DELAY_LIST is a list of insns that have already been placed into delay
+   slots.  See if all of them have the same annulling status as ANNUL_TRUE_P.
+   If not, return 0; otherwise return 1.  */
+
+static int
+check_annul_list_true_false (int annul_true_p, rtx delay_list)
+{
+  rtx temp;
+
+  if (delay_list)
+    {
+      for (temp = delay_list; temp; temp = XEXP (temp, 1))
+       {
+         rtx trial = XEXP (temp, 0);
+
+         if ((annul_true_p && INSN_FROM_TARGET_P (trial))
+             || (!annul_true_p && !INSN_FROM_TARGET_P (trial)))
+           return 0;
+       }
+    }
+
+  return 1;
+}
 \f
 /* INSN branches to an insn whose pattern SEQ is a SEQUENCE.  Given that
    the condition tested by INSN is CONDITION and the resources shown in
@@ -1619,33 +1219,29 @@ redirect_with_delay_list_safe_p (jump, newlabel, delay_list)
    insns in DELAY_LIST).  It is updated with the number that have been
    filled from the SEQUENCE, if any.
 
-   PANNUL_P points to a non-zero value if we already know that we need
+   PANNUL_P points to a nonzero value if we already know that we need
    to annul INSN.  If this routine determines that annulling is needed,
-   it may set that value non-zero.
+   it may set that value nonzero.
 
    PNEW_THREAD points to a location that is to receive the place at which
    execution should continue.  */
 
 static rtx
-steal_delay_list_from_target (insn, condition, seq, delay_list,
-                             sets, needed, other_needed,
-                             slots_to_fill, pslots_filled, pannul_p,
-                             pnew_thread)
-     rtx insn, condition;
-     rtx seq;
-     rtx delay_list;
-     struct resources *sets, *needed, *other_needed;
-     int slots_to_fill;
-     int *pslots_filled;
-     int *pannul_p;
-     rtx *pnew_thread;
+steal_delay_list_from_target (rtx insn, rtx condition, rtx seq,
+                             rtx delay_list, struct resources *sets,
+                             struct resources *needed,
+                             struct resources *other_needed,
+                             int slots_to_fill, int *pslots_filled,
+                             int *pannul_p, rtx *pnew_thread)
 {
   rtx temp;
   int slots_remaining = slots_to_fill - *pslots_filled;
   int total_slots_filled = *pslots_filled;
   rtx new_delay_list = 0;
   int must_annul = *pannul_p;
+  int used_annul = 0;
   int i;
+  struct resources cc_set;
 
   /* We can't do anything if there are more delay slots in SEQ than we
      can handle, or if we don't know that it will be a taken branch.
@@ -1655,13 +1251,37 @@ steal_delay_list_from_target (insn, condition, seq, delay_list,
      Also, exit if the branch has more than one set, since then it is computing
      other results that can't be ignored, e.g. the HPPA mov&branch instruction.
      ??? It may be possible to move other sets into INSN in addition to
-     moving the instructions in the delay slots.  */
+     moving the instructions in the delay slots.
+
+     We can not steal the delay list if one of the instructions in the
+     current delay_list modifies the condition codes and the jump in the
+     sequence is a conditional jump. We can not do this because we can
+     not change the direction of the jump because the condition codes
+     will effect the direction of the jump in the sequence.  */
+
+  CLEAR_RESOURCE (&cc_set);
+  for (temp = delay_list; temp; temp = XEXP (temp, 1))
+    {
+      rtx trial = XEXP (temp, 0);
+
+      mark_set_resources (trial, &cc_set, 0, MARK_SRC_DEST_CALL);
+      if (insn_references_resource_p (XVECEXP (seq , 0, 0), &cc_set, 0))
+       return delay_list;
+    }
 
   if (XVECLEN (seq, 0) - 1 > slots_remaining
       || ! condition_dominates_p (condition, XVECEXP (seq, 0, 0))
       || ! single_set (XVECEXP (seq, 0, 0)))
     return delay_list;
 
+#ifdef MD_CAN_REDIRECT_BRANCH
+  /* On some targets, branches with delay slots can have a limited
+     displacement.  Give the back end a chance to tell us we can't do
+     this.  */
+  if (! MD_CAN_REDIRECT_BRANCH (insn, XVECEXP (seq, 0, 0)))
+    return delay_list;
+#endif
+
   for (i = 1; i < XVECLEN (seq, 0); i++)
     {
       rtx trial = XVECEXP (seq, 0, i);
@@ -1695,9 +1315,15 @@ steal_delay_list_from_target (insn, condition, seq, delay_list,
               || (! insn_sets_resource_p (trial, other_needed, 0)
                   && ! may_trap_p (PATTERN (trial)))))
          ? eligible_for_delay (insn, total_slots_filled, trial, flags)
-         : (must_annul = 1,
-            eligible_for_annul_false (insn, total_slots_filled, trial, flags)))
+         : (must_annul || (delay_list == NULL && new_delay_list == NULL))
+            && (must_annul = 1,
+                check_annul_list_true_false (0, delay_list)
+                && check_annul_list_true_false (0, new_delay_list)
+                && eligible_for_annul_false (insn, total_slots_filled,
+                                             trial, flags)))
        {
+         if (must_annul)
+           used_annul = 1;
          temp = copy_rtx (trial);
          INSN_FROM_TARGET_P (temp) = 1;
          new_delay_list = add_to_delay_list (temp, new_delay_list);
@@ -1716,7 +1342,8 @@ steal_delay_list_from_target (insn, condition, seq, delay_list,
   /* Add any new insns to the delay list and update the count of the
      number of slots filled.  */
   *pslots_filled = total_slots_filled;
-  *pannul_p = must_annul;
+  if (used_annul)
+    *pannul_p = 1;
 
   if (delay_list == 0)
     return new_delay_list;
@@ -1727,25 +1354,23 @@ steal_delay_list_from_target (insn, condition, seq, delay_list,
   return delay_list;
 }
 \f
-/* Similar to steal_delay_list_from_target except that SEQ is on the 
+/* Similar to steal_delay_list_from_target except that SEQ is on the
    fallthrough path of INSN.  Here we only do something if the delay insn
    of SEQ is an unconditional branch.  In that case we steal its delay slot
    for INSN since unconditional branches are much easier to fill.  */
 
 static rtx
-steal_delay_list_from_fallthrough (insn, condition, seq, 
-                                  delay_list, sets, needed, other_needed,
-                                  slots_to_fill, pslots_filled, pannul_p)
-     rtx insn, condition;
-     rtx seq;
-     rtx delay_list;
-     struct resources *sets, *needed, *other_needed;
-     int slots_to_fill;
-     int *pslots_filled;
-     int *pannul_p;
+steal_delay_list_from_fallthrough (rtx insn, rtx condition, rtx seq,
+                                  rtx delay_list, struct resources *sets,
+                                  struct resources *needed,
+                                  struct resources *other_needed,
+                                  int slots_to_fill, int *pslots_filled,
+                                  int *pannul_p)
 {
   int i;
   int flags;
+  int must_annul = *pannul_p;
+  int used_annul = 0;
 
   flags = get_jump_flags (insn, JUMP_LABEL (insn));
 
@@ -1779,14 +1404,17 @@ steal_delay_list_from_fallthrough (insn, condition, seq,
          continue;
        }
 
-      if (! *pannul_p
+      if (! must_annul
          && ((condition == const_true_rtx
               || (! insn_sets_resource_p (trial, other_needed, 0)
                   && ! may_trap_p (PATTERN (trial)))))
          ? eligible_for_delay (insn, *pslots_filled, trial, flags)
-         : (*pannul_p = 1,
-            eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
+         : (must_annul || delay_list == NULL) && (must_annul = 1,
+            check_annul_list_true_false (1, delay_list)
+            && eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
        {
+         if (must_annul)
+           used_annul = 1;
          delete_from_delay_slot (trial);
          delay_list = add_to_delay_list (trial, delay_list);
 
@@ -1797,6 +1425,8 @@ steal_delay_list_from_fallthrough (insn, condition, seq,
        break;
     }
 
+  if (used_annul)
+    *pannul_p = 1;
   return delay_list;
 }
 \f
@@ -1810,8 +1440,7 @@ steal_delay_list_from_fallthrough (insn, condition, seq,
    we delete the merged insn.  */
 
 static void
-try_merge_delay_insns (insn, thread)
-     rtx insn, thread;
+try_merge_delay_insns (rtx insn, rtx thread)
 {
   rtx trial, next_trial;
   rtx delay_insn = XVECEXP (PATTERN (insn), 0, 0);
@@ -1830,13 +1459,15 @@ try_merge_delay_insns (insn, thread)
   CLEAR_RESOURCE (&set);
 
   /* If this is not an annulling branch, take into account anything needed in
-     NEXT_TO_MATCH.  This prevents two increments from being incorrectly
+     INSN's delay slot.  This prevents two increments from being incorrectly
      folded into one.  If we are annulling, this would be the correct
      thing to do.  (The alternative, looking at things set in NEXT_TO_MATCH
      will essentially disable this optimization.  This method is somewhat of
      a kludge, but I don't see a better way.)  */
   if (! annul_p)
-    mark_referenced_resources (next_to_match, &needed, 1);
+    for (i = 1 ; i < num_slots; i++)
+      if (XVECEXP (PATTERN (insn), 0, i))
+       mark_referenced_resources (XVECEXP (PATTERN (insn), 0, i), &needed, 1);
 
   for (trial = thread; !stop_search_p (trial, 1); trial = next_trial)
     {
@@ -1875,7 +1506,7 @@ try_merge_delay_insns (insn, thread)
              if (trial == thread)
                thread = next_active_insn (thread);
 
-             delete_insn (trial);
+             delete_related_insns (trial);
              INSN_FROM_TARGET_P (next_to_match) = 0;
            }
          else
@@ -1885,11 +1516,9 @@ try_merge_delay_insns (insn, thread)
            break;
 
          next_to_match = XVECEXP (PATTERN (insn), 0, slot_number);
-         if (! annul_p)
-           mark_referenced_resources (next_to_match, &needed, 1);
        }
 
-      mark_set_resources (trial, &set, 0, 1);
+      mark_set_resources (trial, &set, 0, MARK_SRC_DEST_CALL);
       mark_referenced_resources (trial, &needed, 1);
     }
 
@@ -1904,7 +1533,7 @@ try_merge_delay_insns (insn, thread)
       rtx filled_insn = XVECEXP (pat, 0, 0);
 
       /* Account for resources set/needed by the filled insn.  */
-      mark_set_resources (filled_insn, &set, 0, 1);
+      mark_set_resources (filled_insn, &set, 0, MARK_SRC_DEST_CALL);
       mark_referenced_resources (filled_insn, &needed, 1);
 
       for (i = 1; i < XVECLEN (pat, 0); i++)
@@ -1922,8 +1551,12 @@ try_merge_delay_insns (insn, thread)
            {
              if (! annul_p)
                {
+                 rtx new;
+
                  update_block (dtrial, thread);
-                 delete_from_delay_slot (dtrial);
+                 new = delete_from_delay_slot (dtrial);
+                 if (INSN_DELETED_P (thread))
+                   thread = new;
                  INSN_FROM_TARGET_P (next_to_match) = 0;
                }
              else
@@ -1935,12 +1568,19 @@ try_merge_delay_insns (insn, thread)
 
              next_to_match = XVECEXP (PATTERN (insn), 0, slot_number);
            }
+         else
+           {
+             /* Keep track of the set/referenced resources for the delay
+                slots of any trial insns we encounter.  */
+             mark_set_resources (dtrial, &set, 0, MARK_SRC_DEST_CALL);
+             mark_referenced_resources (dtrial, &needed, 1);
+           }
        }
     }
 
   /* If all insns in the delay slot have been matched and we were previously
      annulling the branch, we need not any more.  In that case delete all the
-     merged insns.  Also clear the INSN_FROM_TARGET_P bit of each insn the
+     merged insns.  Also clear the INSN_FROM_TARGET_P bit of each insn in
      the delay list so that we know that it isn't only being used at the
      target.  */
   if (slot_number == num_slots && annul_p)
@@ -1949,13 +1589,17 @@ try_merge_delay_insns (insn, thread)
        {
          if (GET_MODE (merged_insns) == SImode)
            {
+             rtx new;
+
              update_block (XEXP (merged_insns, 0), thread);
-             delete_from_delay_slot (XEXP (merged_insns, 0));
+             new = delete_from_delay_slot (XEXP (merged_insns, 0));
+             if (INSN_DELETED_P (thread))
+               thread = new;
            }
          else
            {
              update_block (XEXP (merged_insns, 0), thread);
-             delete_insn (XEXP (merged_insns, 0));
+             delete_related_insns (XEXP (merged_insns, 0));
            }
        }
 
@@ -1977,7 +1621,7 @@ try_merge_delay_insns (insn, thread)
    If we are not careful, this routine can take up a significant fraction
    of the total compilation time (4%), but only wins rarely.  Hence we
    speed this routine up by making two passes.  The first pass goes back
-   until it hits a label and sees if it find an insn with an identical
+   until it hits a label and sees if it finds an insn with an identical
    pattern.  Only in this (relatively rare) event does it check for
    data conflicts.
 
@@ -1986,16 +1630,14 @@ try_merge_delay_insns (insn, thread)
    gain in rare cases.  */
 
 static rtx
-redundant_insn (insn, target, delay_list)
-     rtx insn;
-     rtx target;
-     rtx delay_list;
+redundant_insn (rtx insn, rtx target, rtx delay_list)
 {
   rtx target_main = target;
   rtx ipat = PATTERN (insn);
   rtx trial, pat;
   struct resources needed, set;
   int i;
+  unsigned insns_to_search;
 
   /* If INSN has any REG_UNUSED notes, it can't match anything since we
      are allowed to not actually assign to such a register.  */
@@ -2003,12 +1645,15 @@ redundant_insn (insn, target, delay_list)
     return 0;
 
   /* Scan backwards looking for a match.  */
-  for (trial = PREV_INSN (target); trial; trial = PREV_INSN (trial))
+  for (trial = PREV_INSN (target),
+        insns_to_search = MAX_DELAY_SLOT_INSN_SEARCH;
+       trial && insns_to_search > 0;
+       trial = PREV_INSN (trial), --insns_to_search)
     {
       if (GET_CODE (trial) == CODE_LABEL)
        return 0;
 
-      if (GET_RTX_CLASS (GET_CODE (trial)) != 'i')
+      if (! INSN_P (trial))
        continue;
 
       pat = PATTERN (trial);
@@ -2023,17 +1668,17 @@ redundant_insn (insn, target, delay_list)
            return 0;
 
          /* Stop for an INSN or JUMP_INSN with delayed effects and its delay
-            slots because it is difficult to track its resource needs 
+            slots because it is difficult to track its resource needs
             correctly.  */
 
 #ifdef INSN_SETS_ARE_DELAYED
          if (INSN_SETS_ARE_DELAYED (XVECEXP (pat, 0, 0)))
-           return 0; 
+           return 0;
 #endif
 
 #ifdef INSN_REFERENCES_ARE_DELAYED
          if (INSN_REFERENCES_ARE_DELAYED (XVECEXP (pat, 0, 0)))
-           return 0; 
+           return 0;
 #endif
 
          /* See if any of the insns in the delay slot match, updating
@@ -2063,7 +1708,7 @@ redundant_insn (insn, target, delay_list)
 
   CLEAR_RESOURCE (&needed);
   CLEAR_RESOURCE (&set);
-  mark_set_resources (insn, &set, 0, 1);
+  mark_set_resources (insn, &set, 0, MARK_SRC_DEST_CALL);
   mark_referenced_resources (insn, &needed, 1);
 
   /* If TARGET is a SEQUENCE, get the main insn.  */
@@ -2104,9 +1749,10 @@ redundant_insn (insn, target, delay_list)
   /* Scan backwards until we reach a label or an insn that uses something
      INSN sets or sets something insn uses or sets.  */
 
-  for (trial = PREV_INSN (target);
-       trial && GET_CODE (trial) != CODE_LABEL;
-       trial = PREV_INSN (trial))
+  for (trial = PREV_INSN (target),
+        insns_to_search = MAX_DELAY_SLOT_INSN_SEARCH;
+       trial && GET_CODE (trial) != CODE_LABEL && insns_to_search > 0;
+       trial = PREV_INSN (trial), --insns_to_search)
     {
       if (GET_CODE (trial) != INSN && GET_CODE (trial) != CALL_INSN
          && GET_CODE (trial) != JUMP_INSN)
@@ -2123,17 +1769,17 @@ redundant_insn (insn, target, delay_list)
          if (GET_CODE (XVECEXP (pat, 0, 0)) == CALL_INSN)
            return 0;
 
-         /* If this this is an INSN or JUMP_INSN with delayed effects, it
+         /* If this is an INSN or JUMP_INSN with delayed effects, it
             is hard to track the resource needs properly, so give up.  */
 
 #ifdef INSN_SETS_ARE_DELAYED
          if (INSN_SETS_ARE_DELAYED (XVECEXP (pat, 0, 0)))
-           return 0; 
+           return 0;
 #endif
 
 #ifdef INSN_REFERENCES_ARE_DELAYED
          if (INSN_REFERENCES_ARE_DELAYED (XVECEXP (pat, 0, 0)))
-           return 0; 
+           return 0;
 #endif
 
          /* See if any of the insns in the delay slot match, updating
@@ -2161,8 +1807,7 @@ redundant_insn (insn, target, delay_list)
                return 0;
            }
 
-
-         /* If the insn requiring the delay slot conflicts with INSN, we 
+         /* If the insn requiring the delay slot conflicts with INSN, we
             must stop.  */
          if (insn_sets_resource_p (XVECEXP (pat, 0, 0), &needed, 1))
            return 0;
@@ -2183,19 +1828,16 @@ redundant_insn (insn, target, delay_list)
   return 0;
 }
 \f
-/* Return 1 if THREAD can only be executed in one way.  If LABEL is non-zero,
+/* Return 1 if THREAD can only be executed in one way.  If LABEL is nonzero,
    it is the target of the branch insn being scanned.  If ALLOW_FALLTHROUGH
-   is non-zero, we are allowed to fall into this thread; otherwise, we are
+   is nonzero, we are allowed to fall into this thread; otherwise, we are
    not.
 
    If LABEL is used more than one or we pass a label other than LABEL before
    finding an active insn, we do not own this thread.  */
 
 static int
-own_thread_p (thread, label, allow_fallthrough)
-     rtx thread;
-     rtx label;
-     int allow_fallthrough;
+own_thread_p (rtx thread, rtx label, int allow_fallthrough)
 {
   rtx active_insn;
   rtx insn;
@@ -2229,41 +1871,6 @@ own_thread_p (thread, label, allow_fallthrough)
   return 1;
 }
 \f
-/* Find the number of the basic block that starts closest to INSN.  Return -1
-   if we couldn't find such a basic block.  */
-
-static int
-find_basic_block (insn)
-     rtx insn;
-{
-  int i;
-
-  /* Scan backwards to the previous BARRIER.  Then see if we can find a
-     label that starts a basic block.  Return the basic block number.  */
-
-  for (insn = prev_nonnote_insn (insn);
-       insn && GET_CODE (insn) != BARRIER;
-       insn = prev_nonnote_insn (insn))
-    ;
-
-  /* The start of the function is basic block zero.  */
-  if (insn == 0)
-    return 0;
-
-  /* See if any of the upcoming CODE_LABELs start a basic block.  If we reach
-     anything other than a CODE_LABEL or note, we can't find this code.  */
-  for (insn = next_nonnote_insn (insn);
-       insn && GET_CODE (insn) == CODE_LABEL;
-       insn = next_nonnote_insn (insn))
-    {
-      for (i = 0; i < n_basic_blocks; i++)
-       if (insn == basic_block_head[i])
-         return i;
-    }
-
-  return -1;
-}
-\f
 /* Called when INSN is being moved from a location near the target of a jump.
    We leave a marker of the form (use (INSN)) immediately in front
    of WHERE for mark_target_live_regs.  These markers will be deleted when
@@ -2274,13 +1881,9 @@ find_basic_block (insn)
    BARRIER in relax_delay_slots.  */
 
 static void
-update_block (insn, where)
-     rtx insn;
-     rtx where;
+update_block (rtx insn, rtx where)
 {
-  int b;
-
-  /* Ignore if this was in a delay slot and it came from the target of 
+  /* Ignore if this was in a delay slot and it came from the target of
      a branch.  */
   if (INSN_FROM_TARGET_P (insn))
     return;
@@ -2290,25 +1893,17 @@ update_block (insn, where)
   /* INSN might be making a value live in a block where it didn't use to
      be.  So recompute liveness information for this block.  */
 
-  b = find_basic_block (insn);
-  if (b != -1)
-    bb_ticks[b]++;
+  incr_ticks_for_insn (insn);
 }
 
 /* Similar to REDIRECT_JUMP except that we update the BB_TICKS entry for
    the basic block containing the jump.  */
 
 static int
-reorg_redirect_jump (jump, nlabel)
-     rtx jump;
-     rtx nlabel;
+reorg_redirect_jump (rtx jump, rtx nlabel)
 {
-  int b = find_basic_block (jump);
-
-  if (b != -1)
-    bb_ticks[b]++;
-
-  return redirect_jump (jump, nlabel);
+  incr_ticks_for_insn (jump);
+  return redirect_jump (jump, nlabel, 1);
 }
 
 /* Called when INSN is being moved forward into a delay slot of DELAYED_INSN.
@@ -2323,8 +1918,7 @@ reorg_redirect_jump (jump, nlabel)
    is dead because it sees a REG_DEAD note immediately before a CODE_LABEL.  */
 
 static void
-update_reg_dead_notes (insn, delayed_insn)
-     rtx insn, delayed_insn;
+update_reg_dead_notes (rtx insn, rtx delayed_insn)
 {
   rtx p, link, next;
 
@@ -2357,8 +1951,7 @@ update_reg_dead_notes (insn, delayed_insn)
    confused into thinking the register is dead.  */
 
 static void
-fix_reg_dead_note (start_insn, stop_insn)
-     rtx start_insn, stop_insn;
+fix_reg_dead_note (rtx start_insn, rtx stop_insn)
 {
   rtx p, link, next;
 
@@ -2388,10 +1981,9 @@ fix_reg_dead_note (start_insn, stop_insn)
    does.  */
 
 static void
-update_reg_unused_notes (insn, redundant_insn)
-     rtx insn, redundant_insn;
+update_reg_unused_notes (rtx insn, rtx redundant_insn)
 {
-  rtx p, link, next;
+  rtx link, next;
 
   for (link = REG_NOTES (insn); link; link = next)
     {
@@ -2407,580 +1999,29 @@ update_reg_unused_notes (insn, redundant_insn)
     }
 }
 \f
-/* Marks registers possibly live at the current place being scanned by
-   mark_target_live_regs.  Used only by next two function.    */
-
-static HARD_REG_SET current_live_regs;
-
-/* Marks registers for which we have seen a REG_DEAD note but no assignment.
-   Also only used by the next two functions.  */
+/* Scan a function looking for insns that need a delay slot and find insns to
+   put into the delay slot.
 
-static HARD_REG_SET pending_dead_regs;
+   NON_JUMPS_P is nonzero if we are to only try to fill non-jump insns (such
+   as calls).  We do these first since we don't want jump insns (that are
+   easier to fill) to get the only insns that could be used for non-jump insns.
+   When it is zero, only try to fill JUMP_INSNs.
 
-/* Utility function called from mark_target_live_regs via note_stores.
-   It deadens any CLOBBERed registers and livens any SET registers.  */
+   When slots are filled in this manner, the insns (including the
+   delay_insn) are put together in a SEQUENCE rtx.  In this fashion,
+   it is possible to tell whether a delay slot has really been filled
+   or not.  `final' knows how to deal with this, by communicating
+   through FINAL_SEQUENCE.  */
 
 static void
-update_live_status (dest, x)
-     rtx dest;
-     rtx x;
+fill_simple_delay_slots (int non_jumps_p)
 {
-  int first_regno, last_regno;
+  rtx insn, pat, trial, next_trial;
   int i;
-
-  if (GET_CODE (dest) != REG
-      && (GET_CODE (dest) != SUBREG || GET_CODE (SUBREG_REG (dest)) != REG))
-    return;
-
-  if (GET_CODE (dest) == SUBREG)
-    first_regno = REGNO (SUBREG_REG (dest)) + SUBREG_WORD (dest);
-  else
-    first_regno = REGNO (dest);
-
-  last_regno = first_regno + HARD_REGNO_NREGS (first_regno, GET_MODE (dest));
-
-  if (GET_CODE (x) == CLOBBER)
-    for (i = first_regno; i < last_regno; i++)
-      CLEAR_HARD_REG_BIT (current_live_regs, i);
-  else
-    for (i = first_regno; i < last_regno; i++)
-      {
-       SET_HARD_REG_BIT (current_live_regs, i);
-       CLEAR_HARD_REG_BIT (pending_dead_regs, i);
-      }
-}
-
-/* Similar to next_insn, but ignores insns in the delay slots of
-   an annulled branch.  */
-
-static rtx
-next_insn_no_annul (insn)
-     rtx insn;
-{
-  if (insn)
-    {
-      /* If INSN is an annulled branch, skip any insns from the target
-        of the branch.  */
-      if (INSN_ANNULLED_BRANCH_P (insn)
-         && NEXT_INSN (PREV_INSN (insn)) != insn)
-       while (INSN_FROM_TARGET_P (NEXT_INSN (insn)))
-         insn = NEXT_INSN (insn);
-
-      insn = NEXT_INSN (insn);
-      if (insn && GET_CODE (insn) == INSN
-         && GET_CODE (PATTERN (insn)) == SEQUENCE)
-       insn = XVECEXP (PATTERN (insn), 0, 0);
-    }
-
-  return insn;
-}
-\f
-/* A subroutine of mark_target_live_regs.  Search forward from TARGET
-   looking for registers that are set before they are used.  These are dead. 
-   Stop after passing a few conditional jumps, and/or a small
-   number of unconditional branches.  */
-
-static rtx
-find_dead_or_set_registers (target, res, jump_target, jump_count, set, needed)
-     rtx target;
-     struct resources *res;
-     rtx *jump_target;
-     int jump_count;
-     struct resources set, needed;
-{
-  HARD_REG_SET scratch;
-  rtx insn, next;
-  rtx jump_insn = 0;
-  int i;
-
-  for (insn = target; insn; insn = next)
-    {
-      rtx this_jump_insn = insn;
-
-      next = NEXT_INSN (insn);
-      switch (GET_CODE (insn))
-       {
-       case CODE_LABEL:
-         /* After a label, any pending dead registers that weren't yet
-            used can be made dead.  */
-         AND_COMPL_HARD_REG_SET (pending_dead_regs, needed.regs);
-         AND_COMPL_HARD_REG_SET (res->regs, pending_dead_regs);
-         CLEAR_HARD_REG_SET (pending_dead_regs);
-
-         if (CODE_LABEL_NUMBER (insn) < max_label_num_after_reload)
-           {
-             /* All spill registers are dead at a label, so kill all of the
-                ones that aren't needed also.  */
-             COPY_HARD_REG_SET (scratch, used_spill_regs);
-             AND_COMPL_HARD_REG_SET (scratch, needed.regs);
-             AND_COMPL_HARD_REG_SET (res->regs, scratch);
-           }
-         continue;
-
-       case BARRIER:
-       case NOTE:
-         continue;
-
-       case INSN:
-         if (GET_CODE (PATTERN (insn)) == USE)
-           {
-             /* If INSN is a USE made by update_block, we care about the
-                underlying insn.  Any registers set by the underlying insn
-                are live since the insn is being done somewhere else.  */
-             if (GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
-               mark_set_resources (XEXP (PATTERN (insn), 0), res, 0, 1);
-
-             /* All other USE insns are to be ignored.  */
-             continue;
-           }
-         else if (GET_CODE (PATTERN (insn)) == CLOBBER)
-           continue;
-         else if (GET_CODE (PATTERN (insn)) == SEQUENCE)
-           {
-             /* An unconditional jump can be used to fill the delay slot
-                of a call, so search for a JUMP_INSN in any position.  */
-             for (i = 0; i < XVECLEN (PATTERN (insn), 0); i++)
-               {
-                 this_jump_insn = XVECEXP (PATTERN (insn), 0, i);
-                 if (GET_CODE (this_jump_insn) == JUMP_INSN)
-                   break;
-               }
-           }
-       }
-
-      if (GET_CODE (this_jump_insn) == JUMP_INSN)
-       {
-         if (jump_count++ < 10)
-           {
-             if (simplejump_p (this_jump_insn)
-                 || GET_CODE (PATTERN (this_jump_insn)) == RETURN)
-               {
-                 next = JUMP_LABEL (this_jump_insn);
-                 if (jump_insn == 0)
-                   {
-                     jump_insn = insn;
-                     if (jump_target)
-                       *jump_target = JUMP_LABEL (this_jump_insn);
-                   }
-               }
-             else if (condjump_p (this_jump_insn)
-                      || condjump_in_parallel_p (this_jump_insn))
-               {
-                 struct resources target_set, target_res;
-                 struct resources fallthrough_res;
-
-                 /* We can handle conditional branches here by following
-                    both paths, and then IOR the results of the two paths
-                    together, which will give us registers that are dead
-                    on both paths.  Since this is expensive, we give it
-                    a much higher cost than unconditional branches.  The
-                    cost was chosen so that we will follow at most 1
-                    conditional branch.  */
-
-                 jump_count += 4;
-                 if (jump_count >= 10)
-                   break;
-
-                 mark_referenced_resources (insn, &needed, 1);
-
-                 /* For an annulled branch, mark_set_resources ignores slots
-                    filled by instructions from the target.  This is correct
-                    if the branch is not taken.  Since we are following both
-                    paths from the branch, we must also compute correct info
-                    if the branch is taken.  We do this by inverting all of
-                    the INSN_FROM_TARGET_P bits, calling mark_set_resources,
-                    and then inverting the INSN_FROM_TARGET_P bits again.  */
-
-                 if (GET_CODE (PATTERN (insn)) == SEQUENCE
-                     && INSN_ANNULLED_BRANCH_P (this_jump_insn))
-                   {
-                     for (i = 1; i < XVECLEN (PATTERN (insn), 0); i++)
-                       INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i))
-                         = ! INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i));
-
-                     target_set = set;
-                     mark_set_resources (insn, &target_set, 0, 1);
-
-                     for (i = 1; i < XVECLEN (PATTERN (insn), 0); i++)
-                       INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i))
-                         = ! INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i));
-
-                     mark_set_resources (insn, &set, 0, 1);
-                   }
-                 else
-                   {
-                     mark_set_resources (insn, &set, 0, 1);
-                     target_set = set;
-                   }
-
-                 target_res = *res;
-                 COPY_HARD_REG_SET (scratch, target_set.regs);
-                 AND_COMPL_HARD_REG_SET (scratch, needed.regs);
-                 AND_COMPL_HARD_REG_SET (target_res.regs, scratch);
-
-                 fallthrough_res = *res;
-                 COPY_HARD_REG_SET (scratch, set.regs);
-                 AND_COMPL_HARD_REG_SET (scratch, needed.regs);
-                 AND_COMPL_HARD_REG_SET (fallthrough_res.regs, scratch);
-
-                 find_dead_or_set_registers (JUMP_LABEL (this_jump_insn),
-                                             &target_res, 0, jump_count,
-                                             target_set, needed);
-                 find_dead_or_set_registers (next,
-                                             &fallthrough_res, 0, jump_count,
-                                             set, needed);
-                 IOR_HARD_REG_SET (fallthrough_res.regs, target_res.regs);
-                 AND_HARD_REG_SET (res->regs, fallthrough_res.regs);
-                 break;
-               }
-             else
-               break;
-           }
-         else
-           {
-             /* Don't try this optimization if we expired our jump count
-                above, since that would mean there may be an infinite loop
-                in the function being compiled.  */
-             jump_insn = 0;
-             break;
-           }
-       }
-
-      mark_referenced_resources (insn, &needed, 1);
-      mark_set_resources (insn, &set, 0, 1);
-
-      COPY_HARD_REG_SET (scratch, set.regs);
-      AND_COMPL_HARD_REG_SET (scratch, needed.regs);
-      AND_COMPL_HARD_REG_SET (res->regs, scratch);
-    }
-
-  return jump_insn;
-}
-
-/* Set the resources that are live at TARGET.
-
-   If TARGET is zero, we refer to the end of the current function and can
-   return our precomputed value.
-
-   Otherwise, we try to find out what is live by consulting the basic block
-   information.  This is tricky, because we must consider the actions of
-   reload and jump optimization, which occur after the basic block information
-   has been computed.
-
-   Accordingly, we proceed as follows::
-
-   We find the previous BARRIER and look at all immediately following labels
-   (with no intervening active insns) to see if any of them start a basic
-   block.  If we hit the start of the function first, we use block 0.
-
-   Once we have found a basic block and a corresponding first insns, we can
-   accurately compute the live status from basic_block_live_regs and
-   reg_renumber.  (By starting at a label following a BARRIER, we are immune
-   to actions taken by reload and jump.)  Then we scan all insns between
-   that point and our target.  For each CLOBBER (or for call-clobbered regs
-   when we pass a CALL_INSN), mark the appropriate registers are dead.  For
-   a SET, mark them as live.
-
-   We have to be careful when using REG_DEAD notes because they are not
-   updated by such things as find_equiv_reg.  So keep track of registers
-   marked as dead that haven't been assigned to, and mark them dead at the
-   next CODE_LABEL since reload and jump won't propagate values across labels.
-
-   If we cannot find the start of a basic block (should be a very rare
-   case, if it can happen at all), mark everything as potentially live.
-
-   Next, scan forward from TARGET looking for things set or clobbered
-   before they are used.  These are not live.
-
-   Because we can be called many times on the same target, save our results
-   in a hash table indexed by INSN_UID.  */
-
-static void
-mark_target_live_regs (target, res)
-     rtx target;
-     struct resources *res;
-{
-  int b = -1;
-  int i;
-  struct target_info *tinfo;
-  rtx insn, next;
-  rtx jump_insn = 0;
-  rtx jump_target;
-  HARD_REG_SET scratch;
-  struct resources set, needed;
-  int jump_count = 0;
-
-  /* Handle end of function.  */
-  if (target == 0)
-    {
-      *res = end_of_function_needs;
-      return;
-    }
-
-  /* We have to assume memory is needed, but the CC isn't.  */
-  res->memory = 1;
-  res->volatil = res->unch_memory = 0;
-  res->cc = 0;
-
-  /* See if we have computed this value already.  */
-  for (tinfo = target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME];
-       tinfo; tinfo = tinfo->next)
-    if (tinfo->uid == INSN_UID (target))
-      break;
-
-  /* Start by getting the basic block number.  If we have saved information,
-     we can get it from there unless the insn at the start of the basic block
-     has been deleted.  */
-  if (tinfo && tinfo->block != -1
-      && ! INSN_DELETED_P (basic_block_head[tinfo->block]))
-    b = tinfo->block;
-
-  if (b == -1)
-    b = find_basic_block (target);
-
-  if (tinfo)
-    {
-      /* If the information is up-to-date, use it.  Otherwise, we will
-        update it below.  */
-      if (b == tinfo->block && b != -1 && tinfo->bb_tick == bb_ticks[b])
-       {
-         COPY_HARD_REG_SET (res->regs, tinfo->live_regs);
-         return;
-       }
-    }
-  else
-    {
-      /* Allocate a place to put our results and chain it into the 
-        hash table.  */
-      tinfo = (struct target_info *) oballoc (sizeof (struct target_info));
-      tinfo->uid = INSN_UID (target);
-      tinfo->block = b;
-      tinfo->next = target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME];
-      target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME] = tinfo;
-    }
-
-  CLEAR_HARD_REG_SET (pending_dead_regs);
-
-  /* If we found a basic block, get the live registers from it and update
-     them with anything set or killed between its start and the insn before
-     TARGET.  Otherwise, we must assume everything is live.  */
-  if (b != -1)
-    {
-      regset regs_live = basic_block_live_at_start[b];
-      int j;
-      int regno;
-      rtx start_insn, stop_insn;
-
-      /* Compute hard regs live at start of block -- this is the real hard regs
-        marked live, plus live pseudo regs that have been renumbered to
-        hard regs.  */
-
-      REG_SET_TO_HARD_REG_SET (current_live_regs, regs_live);
-
-      EXECUTE_IF_SET_IN_REG_SET
-       (regs_live, FIRST_PSEUDO_REGISTER, i,
-        {
-          if ((regno = reg_renumber[i]) >= 0)
-            for (j = regno;
-                 j < regno + HARD_REGNO_NREGS (regno,
-                                               PSEUDO_REGNO_MODE (i));
-                 j++)
-              SET_HARD_REG_BIT (current_live_regs, j);
-        });
-
-      /* Get starting and ending insn, handling the case where each might
-        be a SEQUENCE.  */
-      start_insn = (b == 0 ? get_insns () : basic_block_head[b]);
-      stop_insn = target;
-
-      if (GET_CODE (start_insn) == INSN
-         && GET_CODE (PATTERN (start_insn)) == SEQUENCE)
-       start_insn = XVECEXP (PATTERN (start_insn), 0, 0);
-
-      if (GET_CODE (stop_insn) == INSN
-         && GET_CODE (PATTERN (stop_insn)) == SEQUENCE)
-       stop_insn = next_insn (PREV_INSN (stop_insn));
-
-      for (insn = start_insn; insn != stop_insn;
-          insn = next_insn_no_annul (insn))
-       {
-         rtx link;
-         rtx real_insn = insn;
-
-         /* If this insn is from the target of a branch, it isn't going to
-            be used in the sequel.  If it is used in both cases, this
-            test will not be true.  */
-         if (INSN_FROM_TARGET_P (insn))
-           continue;
-
-         /* If this insn is a USE made by update_block, we care about the
-            underlying insn.  */
-         if (GET_CODE (insn) == INSN && GET_CODE (PATTERN (insn)) == USE
-             && GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
-             real_insn = XEXP (PATTERN (insn), 0);
-
-         if (GET_CODE (real_insn) == CALL_INSN)
-           {
-             /* CALL clobbers all call-used regs that aren't fixed except
-                sp, ap, and fp.  Do this before setting the result of the
-                call live.  */
-             for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-               if (call_used_regs[i]
-                   && i != STACK_POINTER_REGNUM && i != FRAME_POINTER_REGNUM
-                   && i != ARG_POINTER_REGNUM
-#if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
-                   && i != HARD_FRAME_POINTER_REGNUM
-#endif
-#if ARG_POINTER_REGNUM != FRAME_POINTER_REGNUM
-                   && ! (i == ARG_POINTER_REGNUM && fixed_regs[i])
-#endif
-#ifdef PIC_OFFSET_TABLE_REGNUM
-                   && ! (i == PIC_OFFSET_TABLE_REGNUM && flag_pic)
-#endif
-                   )
-                 CLEAR_HARD_REG_BIT (current_live_regs, i);
-
-             /* A CALL_INSN sets any global register live, since it may
-                have been modified by the call.  */
-             for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-               if (global_regs[i])
-                 SET_HARD_REG_BIT (current_live_regs, i);
-           }
-
-         /* Mark anything killed in an insn to be deadened at the next
-            label.  Ignore USE insns; the only REG_DEAD notes will be for
-            parameters.  But they might be early.  A CALL_INSN will usually
-            clobber registers used for parameters.  It isn't worth bothering
-            with the unlikely case when it won't.  */
-         if ((GET_CODE (real_insn) == INSN
-              && GET_CODE (PATTERN (real_insn)) != USE
-              && GET_CODE (PATTERN (real_insn)) != CLOBBER)
-             || GET_CODE (real_insn) == JUMP_INSN
-             || GET_CODE (real_insn) == CALL_INSN)
-           {
-             for (link = REG_NOTES (real_insn); link; link = XEXP (link, 1))
-               if (REG_NOTE_KIND (link) == REG_DEAD
-                   && GET_CODE (XEXP (link, 0)) == REG
-                   && REGNO (XEXP (link, 0)) < FIRST_PSEUDO_REGISTER)
-                 {
-                   int first_regno = REGNO (XEXP (link, 0));
-                   int last_regno
-                     = (first_regno
-                        + HARD_REGNO_NREGS (first_regno,
-                                            GET_MODE (XEXP (link, 0))));
-                        
-                   for (i = first_regno; i < last_regno; i++)
-                     SET_HARD_REG_BIT (pending_dead_regs, i);
-                 }
-
-             note_stores (PATTERN (real_insn), update_live_status);
-
-             /* If any registers were unused after this insn, kill them.
-                These notes will always be accurate.  */
-             for (link = REG_NOTES (real_insn); link; link = XEXP (link, 1))
-               if (REG_NOTE_KIND (link) == REG_UNUSED
-                   && GET_CODE (XEXP (link, 0)) == REG
-                   && REGNO (XEXP (link, 0)) < FIRST_PSEUDO_REGISTER)
-                 {
-                   int first_regno = REGNO (XEXP (link, 0));
-                   int last_regno
-                     = (first_regno
-                        + HARD_REGNO_NREGS (first_regno,
-                                            GET_MODE (XEXP (link, 0))));
-                        
-                   for (i = first_regno; i < last_regno; i++)
-                     CLEAR_HARD_REG_BIT (current_live_regs, i);
-                 }
-           }
-
-         else if (GET_CODE (real_insn) == CODE_LABEL)
-           {
-             /* A label clobbers the pending dead registers since neither
-                reload nor jump will propagate a value across a label.  */
-             AND_COMPL_HARD_REG_SET (current_live_regs, pending_dead_regs);
-             CLEAR_HARD_REG_SET (pending_dead_regs);
-           }
-
-         /* The beginning of the epilogue corresponds to the end of the
-            RTL chain when there are no epilogue insns.  Certain resources
-            are implicitly required at that point.  */
-         else if (GET_CODE (real_insn) == NOTE
-                  && NOTE_LINE_NUMBER (real_insn) == NOTE_INSN_EPILOGUE_BEG)
-           IOR_HARD_REG_SET (current_live_regs, start_of_epilogue_needs.regs);
-       }
-
-      COPY_HARD_REG_SET (res->regs, current_live_regs);
-      tinfo->block = b;
-      tinfo->bb_tick = bb_ticks[b];
-    }
-  else
-    /* We didn't find the start of a basic block.  Assume everything
-       in use.  This should happen only extremely rarely.  */
-    SET_HARD_REG_SET (res->regs);
-
-  CLEAR_RESOURCE (&set);
-  CLEAR_RESOURCE (&needed);
-
-  jump_insn = find_dead_or_set_registers (target, res, &jump_target, 0,
-                                         set, needed);
-
-  /* If we hit an unconditional branch, we have another way of finding out
-     what is live: we can see what is live at the branch target and include
-     anything used but not set before the branch.  The only things that are
-     live are those that are live using the above test and the test below.  */
-
-  if (jump_insn)
-    {
-      struct resources new_resources;
-      rtx stop_insn = next_active_insn (jump_insn);
-
-      mark_target_live_regs (next_active_insn (jump_target), &new_resources);
-      CLEAR_RESOURCE (&set);
-      CLEAR_RESOURCE (&needed);
-
-      /* Include JUMP_INSN in the needed registers.  */
-      for (insn = target; insn != stop_insn; insn = next_active_insn (insn))
-       {
-         mark_referenced_resources (insn, &needed, 1);
-
-         COPY_HARD_REG_SET (scratch, needed.regs);
-         AND_COMPL_HARD_REG_SET (scratch, set.regs);
-         IOR_HARD_REG_SET (new_resources.regs, scratch);
-
-         mark_set_resources (insn, &set, 0, 1);
-       }
-
-      AND_HARD_REG_SET (res->regs, new_resources.regs);
-    }
-
-  COPY_HARD_REG_SET (tinfo->live_regs, res->regs);
-}
-\f
-/* Scan a function looking for insns that need a delay slot and find insns to
-   put into the delay slot.
-
-   NON_JUMPS_P is non-zero if we are to only try to fill non-jump insns (such
-   as calls).  We do these first since we don't want jump insns (that are
-   easier to fill) to get the only insns that could be used for non-jump insns.
-   When it is zero, only try to fill JUMP_INSNs.
-
-   When slots are filled in this manner, the insns (including the
-   delay_insn) are put together in a SEQUENCE rtx.  In this fashion,
-   it is possible to tell whether a delay slot has really been filled
-   or not.  `final' knows how to deal with this, by communicating
-   through FINAL_SEQUENCE.  */
-
-static void
-fill_simple_delay_slots (first, non_jumps_p)
-     rtx first;
-     int non_jumps_p;
-{
-  register rtx insn, pat, trial, next_trial;
-  register int i, j;
-  int num_unfilled_slots = unfilled_slots_next - unfilled_slots_base;
-  struct resources needed, set;
-  int slots_to_fill, slots_filled;
-  rtx delay_list;
+  int num_unfilled_slots = unfilled_slots_next - unfilled_slots_base;
+  struct resources needed, set;
+  int slots_to_fill, slots_filled;
+  rtx delay_list;
 
   for (i = 0; i < num_unfilled_slots; i++)
     {
@@ -2996,14 +2037,26 @@ fill_simple_delay_slots (first, non_jumps_p)
          || (GET_CODE (insn) == JUMP_INSN && non_jumps_p)
          || (GET_CODE (insn) != JUMP_INSN && ! non_jumps_p))
        continue;
-     
-      if (GET_CODE (insn) == JUMP_INSN)
-       flags = get_jump_flags (insn, JUMP_LABEL (insn));
-      else
-       flags = get_jump_flags (insn, NULL_RTX);
+
+      /* It may have been that this insn used to need delay slots, but
+        now doesn't; ignore in that case.  This can happen, for example,
+        on the HP PA RISC, where the number of delay slots depends on
+        what insns are nearby.  */
       slots_to_fill = num_delay_slots (insn);
+
+      /* Some machine description have defined instructions to have
+        delay slots only in certain circumstances which may depend on
+        nearby insns (which change due to reorg's actions).
+
+        For example, the PA port normally has delay slots for unconditional
+        jumps.
+
+        However, the PA port claims such jumps do not have a delay slot
+        if they are immediate successors of certain CALL_INSNs.  This
+        allows the port to favor filling the delay slot of the call with
+        the unconditional jump.  */
       if (slots_to_fill == 0)
-       abort ();
+       continue;
 
       /* This insn needs, or can use, some delay slots.  SLOTS_TO_FILL
         says how many.  After initialization, first try optimizing
@@ -3020,17 +2073,23 @@ fill_simple_delay_slots (first, non_jumps_p)
         insn must exist when it is subsequently scanned.
 
         This is tried on each insn with delay slots as some machines
-        have insns which perform calls, but are not represented as 
+        have insns which perform calls, but are not represented as
         CALL_INSNs.  */
 
       slots_filled = 0;
       delay_list = 0;
 
+      if (GET_CODE (insn) == JUMP_INSN)
+       flags = get_jump_flags (insn, JUMP_LABEL (insn));
+      else
+       flags = get_jump_flags (insn, NULL_RTX);
+
       if ((trial = next_active_insn (insn))
          && GET_CODE (trial) == JUMP_INSN
          && simplejump_p (trial)
          && eligible_for_delay (insn, slots_filled, trial, flags)
-         && no_labels_between_p (insn, trial))
+         && no_labels_between_p (insn, trial)
+         && ! can_throw_internal (trial))
        {
          rtx *tmp;
          slots_filled++;
@@ -3047,7 +2106,7 @@ fill_simple_delay_slots (first, non_jumps_p)
            tmp++;
 
          /* Remove the unconditional jump from consideration for delay slot
-            filling and unthread it.   */
+            filling and unthread it.  */
          if (*tmp == trial)
            *tmp = 0;
          {
@@ -3067,7 +2126,7 @@ fill_simple_delay_slots (first, non_jumps_p)
         forward in execution sequence), it must not need or set any resources
         that were set by later insns and must not set any resources that
         are needed for those insns.
-        
+
         The delay slot insn itself sets resources unless it is a call
         (in which case the called routine, not the insn itself, is doing
         the setting).  */
@@ -3076,7 +2135,7 @@ fill_simple_delay_slots (first, non_jumps_p)
        {
          CLEAR_RESOURCE (&needed);
          CLEAR_RESOURCE (&set);
-         mark_set_resources (insn, &set, 0, 0);
+         mark_set_resources (insn, &set, 0, MARK_SRC_DEST);
          mark_referenced_resources (insn, &needed, 0);
 
          for (trial = prev_nonnote_insn (insn); ! stop_search_p (trial, 1);
@@ -3091,17 +2150,16 @@ fill_simple_delay_slots (first, non_jumps_p)
              if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
                continue;
 
-             /* Check for resource conflict first, to avoid unnecessary 
+             /* Check for resource conflict first, to avoid unnecessary
                 splitting.  */
              if (! insn_references_resource_p (trial, &set, 1)
                  && ! insn_sets_resource_p (trial, &set, 1)
                  && ! insn_sets_resource_p (trial, &needed, 1)
 #ifdef HAVE_cc0
                  /* Can't separate set of cc0 from its use.  */
-                 && ! (reg_mentioned_p (cc0_rtx, pat)
-                       && ! sets_cc0_p (cc0_rtx, pat))
+                 && ! (reg_mentioned_p (cc0_rtx, pat) && ! sets_cc0_p (pat))
 #endif
-                 )
+                 && ! can_throw_internal (trial))
                {
                  trial = try_split (pat, trial, 1);
                  next_trial = prev_nonnote_insn (trial);
@@ -3116,14 +2174,14 @@ fill_simple_delay_slots (first, non_jumps_p)
                      delay_list = gen_rtx_INSN_LIST (VOIDmode,
                                                      trial, delay_list);
                      update_block (trial, trial);
-                     delete_insn (trial);
+                     delete_related_insns (trial);
                      if (slots_to_fill == ++slots_filled)
                        break;
                      continue;
                    }
                }
 
-             mark_set_resources (trial, &set, 0, 1);
+             mark_set_resources (trial, &set, 0, MARK_SRC_DEST_CALL);
              mark_referenced_resources (trial, &needed, 1);
            }
        }
@@ -3134,7 +2192,7 @@ fill_simple_delay_slots (first, non_jumps_p)
 #if defined(ANNUL_IFFALSE_SLOTS) || defined(ANNUL_IFTRUE_SLOTS)
       if (slots_filled != slots_to_fill
          && delay_list == 0
-         && GET_CODE (insn) == JUMP_INSN 
+         && GET_CODE (insn) == JUMP_INSN
          && (condjump_p (insn) || condjump_in_parallel_p (insn)))
        {
          delay_list = optimize_skip (insn);
@@ -3157,120 +2215,127 @@ fill_simple_delay_slots (first, non_jumps_p)
         fill_eager_delay_slots anyways, it was just deleted.  */
 
       if (slots_filled != slots_to_fill
-          && (GET_CODE (insn) != JUMP_INSN
+         /* If this instruction could throw an exception which is
+            caught in the same function, then it's not safe to fill
+            the delay slot with an instruction from beyond this
+            point.  For example, consider:
+
+               int i = 2;
+
+              try {
+                 f();
+                i = 3;
+               } catch (...) {}
+
+               return i;
+
+            Even though `i' is a local variable, we must be sure not
+            to put `i = 3' in the delay slot if `f' might throw an
+            exception.
+
+            Presumably, we should also check to see if we could get
+            back to this function via `setjmp'.  */
+         && ! can_throw_internal (insn)
+         && (GET_CODE (insn) != JUMP_INSN
              || ((condjump_p (insn) || condjump_in_parallel_p (insn))
-                  && ! simplejump_p (insn)
-                  && JUMP_LABEL (insn) != 0)))
+                 && ! simplejump_p (insn)
+                 && JUMP_LABEL (insn) != 0)))
        {
+         /* Invariant: If insn is a JUMP_INSN, the insn's jump
+            label.  Otherwise, zero.  */
          rtx target = 0;
          int maybe_never = 0;
-         struct resources needed_at_jump;
+         rtx pat, trial_delay;
 
          CLEAR_RESOURCE (&needed);
          CLEAR_RESOURCE (&set);
 
          if (GET_CODE (insn) == CALL_INSN)
            {
-             mark_set_resources (insn, &set, 0, 1);
+             mark_set_resources (insn, &set, 0, MARK_SRC_DEST_CALL);
              mark_referenced_resources (insn, &needed, 1);
              maybe_never = 1;
            }
-         else 
+         else
            {
-             mark_set_resources (insn, &set, 0, 1);
+             mark_set_resources (insn, &set, 0, MARK_SRC_DEST_CALL);
              mark_referenced_resources (insn, &needed, 1);
              if (GET_CODE (insn) == JUMP_INSN)
                target = JUMP_LABEL (insn);
            }
 
-         for (trial = next_nonnote_insn (insn); trial; trial = next_trial)
-           {
-             rtx pat, trial_delay;
-
-             next_trial = next_nonnote_insn (trial);
+         if (target == 0)
+           for (trial = next_nonnote_insn (insn); trial; trial = next_trial)
+             {
+               next_trial = next_nonnote_insn (trial);
 
-             if (GET_CODE (trial) == CODE_LABEL
-                 || GET_CODE (trial) == BARRIER)
-               break;
+               if (GET_CODE (trial) == CODE_LABEL
+                   || GET_CODE (trial) == BARRIER)
+                 break;
 
-             /* We must have an INSN, JUMP_INSN, or CALL_INSN.  */
-             pat = PATTERN (trial);
+               /* We must have an INSN, JUMP_INSN, or CALL_INSN.  */
+               pat = PATTERN (trial);
 
-             /* Stand-alone USE and CLOBBER are just for flow.  */
-             if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
-               continue;
+               /* Stand-alone USE and CLOBBER are just for flow.  */
+               if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
+                 continue;
 
-             /* If this already has filled delay slots, get the insn needing
-                the delay slots.  */
-             if (GET_CODE (pat) == SEQUENCE)
-               trial_delay = XVECEXP (pat, 0, 0);
-             else
-               trial_delay = trial;
+               /* If this already has filled delay slots, get the insn needing
+                  the delay slots.  */
+               if (GET_CODE (pat) == SEQUENCE)
+                 trial_delay = XVECEXP (pat, 0, 0);
+               else
+                 trial_delay = trial;
 
-             /* If this is a jump insn to our target, indicate that we have
-                seen another jump to it.  If we aren't handling a conditional
-                jump, stop our search. Otherwise, compute the needs at its
-                target and add them to NEEDED.  */
-             if (GET_CODE (trial_delay) == JUMP_INSN)
-               {
-                 if (target == 0)
-                   break;
-                 else if (JUMP_LABEL (trial_delay) != target)
-                   {
-                     mark_target_live_regs
-                       (next_active_insn (JUMP_LABEL (trial_delay)),
-                        &needed_at_jump);
-                     needed.memory |= needed_at_jump.memory;
-                     needed.unch_memory |= needed_at_jump.unch_memory;
-                     IOR_HARD_REG_SET (needed.regs, needed_at_jump.regs);
-                   }
-               }
+               /* Stop our search when seeing an unconditional jump.  */
+               if (GET_CODE (trial_delay) == JUMP_INSN)
+                 break;
 
-             /* See if we have a resource problem before we try to
-                split.   */
-             if (target == 0
-                 && GET_CODE (pat) != SEQUENCE
-                 && ! insn_references_resource_p (trial, &set, 1)
-                 && ! insn_sets_resource_p (trial, &set, 1)
-                 && ! insn_sets_resource_p (trial, &needed, 1)
+               /* See if we have a resource problem before we try to
+                  split.  */
+               if (GET_CODE (pat) != SEQUENCE
+                   && ! insn_references_resource_p (trial, &set, 1)
+                   && ! insn_sets_resource_p (trial, &set, 1)
+                   && ! insn_sets_resource_p (trial, &needed, 1)
 #ifdef HAVE_cc0
-                 && ! (reg_mentioned_p (cc0_rtx, pat) && ! sets_cc0_p (pat))
+                   && ! (reg_mentioned_p (cc0_rtx, pat) && ! sets_cc0_p (pat))
 #endif
-                 && ! (maybe_never && may_trap_p (pat))
-                 && (trial = try_split (pat, trial, 0))
-                 && eligible_for_delay (insn, slots_filled, trial, flags))
-               {
-                 next_trial = next_nonnote_insn (trial);
-                 delay_list = add_to_delay_list (trial, delay_list);
+                   && ! (maybe_never && may_trap_p (pat))
+                   && (trial = try_split (pat, trial, 0))
+                   && eligible_for_delay (insn, slots_filled, trial, flags)
+                   && ! can_throw_internal(trial))
+                 {
+                   next_trial = next_nonnote_insn (trial);
+                   delay_list = add_to_delay_list (trial, delay_list);
 
 #ifdef HAVE_cc0
-                 if (reg_mentioned_p (cc0_rtx, pat))
-                   link_cc0_insns (trial);
+                   if (reg_mentioned_p (cc0_rtx, pat))
+                     link_cc0_insns (trial);
 #endif
 
-                 delete_insn (trial);
-                 if (slots_to_fill == ++slots_filled)
-                   break;
-                 continue;
-               }
+                   delete_related_insns (trial);
+                   if (slots_to_fill == ++slots_filled)
+                     break;
+                   continue;
+                 }
 
-             mark_set_resources (trial, &set, 0, 1);
-             mark_referenced_resources (trial, &needed, 1);
+               mark_set_resources (trial, &set, 0, MARK_SRC_DEST_CALL);
+               mark_referenced_resources (trial, &needed, 1);
 
-             /* Ensure we don't put insns between the setting of cc and the
-                comparison by moving a setting of cc into an earlier delay
-                slot since these insns could clobber the condition code.  */
-             set.cc = 1;
+               /* Ensure we don't put insns between the setting of cc and the
+                  comparison by moving a setting of cc into an earlier delay
+                  slot since these insns could clobber the condition code.  */
+               set.cc = 1;
 
-             /* If this is a call or jump, we might not get here.  */
-             if (GET_CODE (trial_delay) == CALL_INSN
-                 || GET_CODE (trial_delay) == JUMP_INSN)
-               maybe_never = 1;
-           }
+               /* If this is a call or jump, we might not get here.  */
+               if (GET_CODE (trial_delay) == CALL_INSN
+                   || GET_CODE (trial_delay) == JUMP_INSN)
+                 maybe_never = 1;
+             }
 
          /* If there are slots left to fill and our search was stopped by an
             unconditional branch, try the insn at the branch target.  We can
-            redirect the branch if it works. 
+            redirect the branch if it works.
 
             Don't do this if the insn at the branch target is a branch.  */
          if (slots_to_fill != slots_filled
@@ -3290,7 +2355,8 @@ fill_simple_delay_slots (first, non_jumps_p)
 #endif
              && ! (maybe_never && may_trap_p (PATTERN (next_trial)))
              && (next_trial = try_split (PATTERN (next_trial), next_trial, 0))
-             && eligible_for_delay (insn, slots_filled, next_trial, flags))
+             && eligible_for_delay (insn, slots_filled, next_trial, flags)
+             && ! can_throw_internal (trial))
            {
              rtx new_label = next_active_insn (next_trial);
 
@@ -3299,7 +2365,7 @@ fill_simple_delay_slots (first, non_jumps_p)
              else
                new_label = find_end_label ();
 
-             delay_list 
+             delay_list
                = add_to_delay_list (copy_rtx (next_trial), delay_list);
              slots_filled++;
              reorg_redirect_jump (trial, new_label);
@@ -3322,12 +2388,12 @@ fill_simple_delay_slots (first, non_jumps_p)
                                    NULL, 1, 1,
                                    own_thread_p (JUMP_LABEL (insn),
                                                  JUMP_LABEL (insn), 0),
-                                   0, slots_to_fill, &slots_filled);
+                                   slots_to_fill, &slots_filled,
+                                   delay_list);
 
       if (delay_list)
        unfilled_slots_base[i]
-         = emit_delay_sequence (insn, delay_list,
-                                slots_filled, slots_to_fill);
+         = emit_delay_sequence (insn, delay_list, slots_filled);
 
       if (slots_to_fill == slots_filled)
        unfilled_slots_base[i] = 0;
@@ -3337,7 +2403,7 @@ fill_simple_delay_slots (first, non_jumps_p)
 
 #ifdef DELAY_SLOTS_FOR_EPILOGUE
   /* See if the epilogue needs any delay slots.  Try to fill them if so.
-     The only thing we can do is scan backwards from the end of the 
+     The only thing we can do is scan backwards from the end of the
      function.  If we did this in a previous pass, it is incorrect to do it
      again.  */
   if (current_function_epilogue_delay_list)
@@ -3361,16 +2427,15 @@ fill_simple_delay_slots (first, non_jumps_p)
 #if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
       SET_HARD_REG_BIT (needed.regs, HARD_FRAME_POINTER_REGNUM);
 #endif
-#ifdef EXIT_IGNORE_STACK
-      if (! EXIT_IGNORE_STACK)
-#endif
+      if (! EXIT_IGNORE_STACK
+         || current_function_sp_is_unchanging)
        SET_HARD_REG_BIT (needed.regs, STACK_POINTER_REGNUM);
     }
   else
     SET_HARD_REG_BIT (needed.regs, STACK_POINTER_REGNUM);
 
 #ifdef EPILOGUE_USES
-  for (i = 0; i <FIRST_PSEUDO_REGISTER; i++)
+  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
     {
       if (EPILOGUE_USES (i))
        SET_HARD_REG_BIT (needed.regs, i);
@@ -3393,7 +2458,7 @@ fill_simple_delay_slots (first, non_jumps_p)
          /* Don't want to mess with cc0 here.  */
          && ! reg_mentioned_p (cc0_rtx, pat)
 #endif
-         )
+         && ! can_throw_internal (trial))
        {
          trial = try_split (pat, trial, 1);
          if (ELIGIBLE_FOR_EPILOGUE_DELAY (trial, slots_filled))
@@ -3404,9 +2469,9 @@ fill_simple_delay_slots (first, non_jumps_p)
              current_function_epilogue_delay_list
                = gen_rtx_INSN_LIST (VOIDmode, trial,
                                     current_function_epilogue_delay_list);
-             mark_referenced_resources (trial, &end_of_function_needs, 1);
+             mark_end_of_function_resources (trial, 1);
              update_block (trial, trial);
-             delete_insn (trial);
+             delete_related_insns (trial);
 
              /* Clear deleted bit so final.c will output the insn.  */
              INSN_DELETED_P (trial) = 0;
@@ -3417,7 +2482,7 @@ fill_simple_delay_slots (first, non_jumps_p)
            }
        }
 
-      mark_set_resources (trial, &set, 0, 1);
+      mark_set_resources (trial, &set, 0, MARK_SRC_DEST_CALL);
       mark_referenced_resources (trial, &needed, 1);
     }
 
@@ -3437,7 +2502,7 @@ fill_simple_delay_slots (first, non_jumps_p)
    OPPOSITE_THREAD is the thread in the opposite direction.  It is used
    to see if any potential delay slot insns set things needed there.
 
-   LIKELY is non-zero if it is extremely likely that the branch will be
+   LIKELY is nonzero if it is extremely likely that the branch will be
    taken and THREAD_IF_TRUE is set.  This is used for the branch at the
    end of a loop back up to the top.
 
@@ -3450,19 +2515,12 @@ fill_simple_delay_slots (first, non_jumps_p)
    slot.  We then adjust the jump to point after the insns we have taken.  */
 
 static rtx
-fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
-                       thread_if_true, own_thread, own_opposite_thread,
-                       slots_to_fill, pslots_filled)
-     rtx insn;
-     rtx condition;
-     rtx thread, opposite_thread;
-     int likely;
-     int thread_if_true;
-     int own_thread, own_opposite_thread;
-     int slots_to_fill, *pslots_filled;
+fill_slots_from_thread (rtx insn, rtx condition, rtx thread,
+                       rtx opposite_thread, int likely, int thread_if_true,
+                       int own_thread, int slots_to_fill,
+                       int *pslots_filled, rtx delay_list)
 {
   rtx new_thread;
-  rtx delay_list = 0;
   struct resources opposite_needed, set, needed;
   rtx trial;
   int lose = 0;
@@ -3479,14 +2537,14 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
   /* If our thread is the end of subroutine, we can't get any delay
      insns from that.  */
   if (thread == 0)
-    return 0;
+    return delay_list;
 
   /* If this is an unconditional branch, nothing is needed at the
      opposite thread.  Otherwise, compute what is needed there.  */
   if (condition == const_true_rtx)
     CLEAR_RESOURCE (&opposite_needed);
   else
-    mark_target_live_regs (opposite_thread, &opposite_needed);
+    mark_target_live_regs (get_insns (), opposite_thread, &opposite_needed);
 
   /* If the insn at THREAD can be split, do it here to avoid having to
      update THREAD and NEW_THREAD if it is done in the loop below.  Also
@@ -3534,14 +2592,14 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
          && ! (reg_mentioned_p (cc0_rtx, pat)
                && (! own_thread || ! sets_cc0_p (pat)))
 #endif
-         )
+         && ! can_throw_internal (trial))
        {
          rtx prior_insn;
 
          /* If TRIAL is redundant with some insn before INSN, we don't
             actually need to add it to the delay list; we can merely pretend
             we did.  */
-         if (prior_insn = redundant_insn (trial, insn, delay_list))
+         if ((prior_insn = redundant_insn (trial, insn, delay_list)))
            {
              fix_reg_dead_note (prior_insn, insn);
              if (own_thread)
@@ -3554,7 +2612,7 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                        new_thread = thread;
                    }
 
-                 delete_insn (trial);
+                 delete_related_insns (trial);
                }
              else
                {
@@ -3568,9 +2626,10 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
          /* There are two ways we can win:  If TRIAL doesn't set anything
             needed at the opposite thread and can't trap, or if it can
             go into an annulled delay slot.  */
-         if (condition == const_true_rtx
-             || (! insn_sets_resource_p (trial, &opposite_needed, 1)
-                 && ! may_trap_p (pat)))
+         if (!must_annul
+             && (condition == const_true_rtx
+                 || (! insn_sets_resource_p (trial, &opposite_needed, 1)
+                     && ! may_trap_p (pat))))
            {
              old_trial = trial;
              trial = try_split (pat, trial, 0);
@@ -3598,9 +2657,11 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
              if (thread == old_trial)
                thread = trial;
              pat = PATTERN (trial);
-             if ((thread_if_true
-                  ? eligible_for_annul_false (insn, *pslots_filled, trial, flags)
-                  : eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
+             if ((must_annul || delay_list == NULL) && (thread_if_true
+                  ? check_annul_list_true_false (0, delay_list)
+                    && eligible_for_annul_false (insn, *pslots_filled, trial, flags)
+                  : check_annul_list_true_false (1, delay_list)
+                    && eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
                {
                  rtx temp;
 
@@ -3618,6 +2679,8 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                     starting point of this thread.  */
                  if (own_thread)
                    {
+                     rtx note;
+
                      update_block (trial, thread);
                      if (trial == thread)
                        {
@@ -3625,7 +2688,19 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                          if (new_thread == trial)
                            new_thread = thread;
                        }
-                     delete_insn (trial);
+
+                     /* We are moving this insn, not deleting it.  We must
+                        temporarily increment the use count on any referenced
+                        label lest it be deleted by delete_related_insns.  */
+                     note = find_reg_note (trial, REG_LABEL, 0);
+                     /* REG_LABEL could be NOTE_INSN_DELETED_LABEL too.  */
+                     if (note && GET_CODE (XEXP (note, 0)) == CODE_LABEL)
+                       LABEL_NUSES (XEXP (note, 0))++;
+
+                     delete_related_insns (trial);
+
+                     if (note && GET_CODE (XEXP (note, 0)) == CODE_LABEL)
+                       LABEL_NUSES (XEXP (note, 0))--;
                    }
                  else
                    new_thread = next_active_insn (trial);
@@ -3646,8 +2721,16 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                             && ! insn_sets_resource_p (new_thread, &needed, 1)
                             && ! insn_references_resource_p (new_thread,
                                                              &set, 1)
-                            && redundant_insn (new_thread, insn, delay_list))
-                       new_thread = next_active_insn (new_thread);
+                            && (prior_insn
+                                = redundant_insn (new_thread, insn,
+                                                  delay_list)))
+                       {
+                         /* We know we do not own the thread, so no need
+                            to call update_block and delete_insn.  */
+                         fix_reg_dead_note (prior_insn, insn);
+                         update_reg_unused_notes (prior_insn, new_thread);
+                         new_thread = next_active_insn (new_thread);
+                       }
                      break;
                    }
 
@@ -3658,7 +2741,7 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
 
       /* This insn can't go into a delay slot.  */
       lose = 1;
-      mark_set_resources (trial, &set, 0, 1);
+      mark_set_resources (trial, &set, 0, MARK_SRC_DEST_CALL);
       mark_referenced_resources (trial, &needed, 1);
 
       /* Ensure we don't put insns between the setting of cc and the comparison
@@ -3680,11 +2763,13 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
         that would make the replacement into the insn invalid.  We also can't
         do this if it modifies our source, because it might be an earlyclobber
         operand.  This latter test also prevents updating the contents of
-        a PRE_INC.  */
+        a PRE_INC.  We also can't do this if there's overlap of source and
+        destination.  Overlap may happen for larger-than-register-size modes.  */
 
       if (GET_CODE (trial) == INSN && GET_CODE (pat) == SET
          && GET_CODE (SET_SRC (pat)) == REG
-         && GET_CODE (SET_DEST (pat)) == REG)
+         && GET_CODE (SET_DEST (pat)) == REG
+         && !reg_overlap_mentioned_p (SET_DEST (pat), SET_SRC (pat)))
        {
          rtx next = next_nonnote_insn (trial);
 
@@ -3692,7 +2777,8 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
              && GET_CODE (PATTERN (next)) != USE
              && ! reg_set_p (SET_DEST (pat), next)
              && ! reg_set_p (SET_SRC (pat), next)
-             && reg_referenced_p (SET_DEST (pat), PATTERN (next)))
+             && reg_referenced_p (SET_DEST (pat), PATTERN (next))
+             && ! modified_in_p (SET_DEST (pat), next))
            validate_replace_rtx (SET_DEST (pat), SET_SRC (pat), next);
        }
     }
@@ -3706,12 +2792,18 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
       /* If this is the `true' thread, we will want to follow the jump,
         so we can only do this if we have taken everything up to here.  */
       if (thread_if_true && trial == new_thread)
-       delay_list
-         = steal_delay_list_from_target (insn, condition, PATTERN (trial),
-                                         delay_list, &set, &needed,
-                                         &opposite_needed, slots_to_fill,
-                                         pslots_filled, &must_annul,
-                                         &new_thread);
+       {
+         delay_list
+           = steal_delay_list_from_target (insn, condition, PATTERN (trial),
+                                           delay_list, &set, &needed,
+                                           &opposite_needed, slots_to_fill,
+                                           pslots_filled, &must_annul,
+                                           &new_thread);
+         /* If we owned the thread and are told that it branched
+            elsewhere, make sure we own the thread at the new location.  */
+         if (own_thread && trial != new_thread)
+           own_thread = own_thread_p (new_thread, new_thread, 0);
+       }
       else if (! thread_if_true)
        delay_list
          = steal_delay_list_from_fallthrough (insn, condition,
@@ -3739,14 +2831,17 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
       trial = new_thread;
       pat = PATTERN (trial);
 
-      if (GET_CODE (trial) != INSN || GET_CODE (pat) != SET
-         || ! eligible_for_delay (insn, 0, trial, flags))
+      if (GET_CODE (trial) != INSN
+         || GET_CODE (pat) != SET
+         || ! eligible_for_delay (insn, 0, trial, flags)
+         || can_throw_internal (trial))
        return 0;
 
       dest = SET_DEST (pat), src = SET_SRC (pat);
       if ((GET_CODE (src) == PLUS || GET_CODE (src) == MINUS)
          && rtx_equal_p (XEXP (src, 0), dest)
-         && ! reg_overlap_mentioned_p (dest, XEXP (src, 1)))
+         && ! reg_overlap_mentioned_p (dest, XEXP (src, 1))
+         && ! side_effects_p (pat))
        {
          rtx other = XEXP (src, 1);
          rtx new_arith;
@@ -3766,10 +2861,9 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                                   insn);
 
          if (recog_memoized (ninsn) < 0
-             || (insn_extract (ninsn),
-                 ! constrain_operands (INSN_CODE (ninsn), 1)))
+             || (extract_insn (ninsn), ! constrain_operands (1)))
            {
-             delete_insn (ninsn);
+             delete_related_insns (ninsn);
              return 0;
            }
 
@@ -3782,7 +2876,7 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
                  if (new_thread == trial)
                    new_thread = thread;
                }
-             delete_insn (trial);
+             delete_related_insns (trial);
            }
          else
            new_thread = next_active_insn (trial);
@@ -3841,11 +2935,10 @@ fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
    if safe.  */
 
 static void
-fill_eager_delay_slots (first)
-     rtx first;
+fill_eager_delay_slots (void)
 {
-  register rtx insn;
-  register int i;
+  rtx insn;
+  int i;
   int num_unfilled_slots = unfilled_slots_next - unfilled_slots_base;
 
   for (i = 0; i < num_unfilled_slots; i++)
@@ -3865,8 +2958,19 @@ fill_eager_delay_slots (first)
        continue;
 
       slots_to_fill = num_delay_slots (insn);
+      /* Some machine description have defined instructions to have
+        delay slots only in certain circumstances which may depend on
+        nearby insns (which change due to reorg's actions).
+
+        For example, the PA port normally has delay slots for unconditional
+        jumps.
+
+        However, the PA port claims such jumps do not have a delay slot
+        if they are immediate successors of certain CALL_INSNs.  This
+        allows the port to favor filling the delay slot of the call with
+        the unconditional jump.  */
       if (slots_to_fill == 0)
-       abort ();
+       continue;
 
       slots_filled = 0;
       target_label = JUMP_LABEL (insn);
@@ -3896,7 +3000,7 @@ fill_eager_delay_slots (first)
        }
 
       /* If this insn is expected to branch, first try to get insns from our
-        target, then our fallthrough insns.  If it is not, expected to branch,
+        target, then our fallthrough insns.  If it is not expected to branch,
         try the other order.  */
 
       if (prediction > 0)
@@ -3904,8 +3008,8 @@ fill_eager_delay_slots (first)
          delay_list
            = fill_slots_from_thread (insn, condition, insn_at_target,
                                      fallthrough_insn, prediction == 2, 1,
-                                     own_target, own_fallthrough,
-                                     slots_to_fill, &slots_filled);
+                                     own_target,
+                                     slots_to_fill, &slots_filled, delay_list);
 
          if (delay_list == 0 && own_fallthrough)
            {
@@ -3919,8 +3023,9 @@ fill_eager_delay_slots (first)
              delay_list
                = fill_slots_from_thread (insn, condition, fallthrough_insn,
                                          insn_at_target, 0, 0,
-                                         own_fallthrough, own_target,
-                                         slots_to_fill, &slots_filled);
+                                         own_fallthrough,
+                                         slots_to_fill, &slots_filled,
+                                         delay_list);
            }
        }
       else
@@ -3929,21 +3034,22 @@ fill_eager_delay_slots (first)
            delay_list
              = fill_slots_from_thread (insn, condition, fallthrough_insn,
                                        insn_at_target, 0, 0,
-                                       own_fallthrough, own_target,
-                                       slots_to_fill, &slots_filled);
+                                       own_fallthrough,
+                                       slots_to_fill, &slots_filled,
+                                       delay_list);
 
          if (delay_list == 0)
            delay_list
              = fill_slots_from_thread (insn, condition, insn_at_target,
                                        next_active_insn (insn), 0, 1,
-                                       own_target, own_fallthrough,
-                                       slots_to_fill, &slots_filled);
+                                       own_target,
+                                       slots_to_fill, &slots_filled,
+                                       delay_list);
        }
 
       if (delay_list)
        unfilled_slots_base[i]
-         = emit_delay_sequence (insn, delay_list,
-                                slots_filled, slots_to_fill);
+         = emit_delay_sequence (insn, delay_list, slots_filled);
 
       if (slots_to_fill == slots_filled)
        unfilled_slots_base[i] = 0;
@@ -3957,11 +3063,10 @@ fill_eager_delay_slots (first)
    threading.  */
 
 static void
-relax_delay_slots (first)
-     rtx first;
+relax_delay_slots (rtx first)
 {
-  register rtx insn, next, pat;
-  register rtx trial, delay_insn, target_label;
+  rtx insn, next, pat;
+  rtx trial, delay_insn, target_label;
 
   /* Look at every JUMP_INSN and see if we can improve it.  */
   for (insn = first; insn; insn = next)
@@ -3993,7 +3098,7 @@ relax_delay_slots (first)
          if (target_label != JUMP_LABEL (insn))
            reorg_redirect_jump (insn, target_label);
 
-         /* See if this jump branches around a unconditional jump.
+         /* See if this jump branches around an unconditional jump.
             If so, invert this jump and point it to the target of the
             second jump.  */
          if (next && GET_CODE (next) == JUMP_INSN
@@ -4014,9 +3119,9 @@ relax_delay_slots (first)
              if (label)
                ++LABEL_NUSES (label);
 
-             if (invert_jump (insn, label))
+             if (invert_jump (insn, label, 1))
                {
-                 delete_insn (next);
+                 delete_related_insns (next);
                  next = insn;
                }
 
@@ -4024,12 +3129,12 @@ relax_delay_slots (first)
                --LABEL_NUSES (label);
 
              if (--LABEL_NUSES (target_label) == 0)
-               delete_insn (target_label);
+               delete_related_insns (target_label);
 
              continue;
            }
        }
-         
+
       /* If this is an unconditional jump and the previous insn is a
         conditional jump, try reversing the condition of the previous
         insn and swapping our targets.  The next pass might be able to
@@ -4043,23 +3148,15 @@ relax_delay_slots (first)
          && (other = prev_active_insn (insn)) != 0
          && (condjump_p (other) || condjump_in_parallel_p (other))
          && no_labels_between_p (other, insn)
-         && 0 < mostly_true_jump (other,
+         && 0 > mostly_true_jump (other,
                                   get_branch_condition (other,
                                                         JUMP_LABEL (other))))
        {
          rtx other_target = JUMP_LABEL (other);
          target_label = JUMP_LABEL (insn);
 
-         /* Increment the count of OTHER_TARGET, so it doesn't get deleted
-            as we move the label.  */
-         if (other_target)
-           ++LABEL_NUSES (other_target);
-
-         if (invert_jump (other, target_label))
+         if (invert_jump (other, target_label, 0))
            reorg_redirect_jump (insn, other_target);
-
-         if (other_target)
-           --LABEL_NUSES (other_target);
        }
 
       /* Now look only at cases where we have filled a delay slot.  */
@@ -4080,6 +3177,49 @@ relax_delay_slots (first)
          continue;
        }
 
+      /* See if we have a RETURN insn with a filled delay slot followed
+        by a RETURN insn with an unfilled a delay slot.  If so, we can delete
+        the first RETURN (but not it's delay insn).  This gives the same
+        effect in fewer instructions.
+
+        Only do so if optimizing for size since this results in slower, but
+        smaller code.  */
+      if (optimize_size
+         && GET_CODE (PATTERN (delay_insn)) == RETURN
+         && next
+         && GET_CODE (next) == JUMP_INSN
+         && GET_CODE (PATTERN (next)) == RETURN)
+       {
+         rtx after;
+         int i;
+
+         /* Delete the RETURN and just execute the delay list insns.
+
+            We do this by deleting the INSN containing the SEQUENCE, then
+            re-emitting the insns separately, and then deleting the RETURN.
+            This allows the count of the jump target to be properly
+            decremented.  */
+
+         /* Clear the from target bit, since these insns are no longer
+            in delay slots.  */
+         for (i = 0; i < XVECLEN (pat, 0); i++)
+           INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)) = 0;
+
+         trial = PREV_INSN (insn);
+         delete_related_insns (insn);
+         if (GET_CODE (pat) != SEQUENCE)
+           abort ();
+         after = trial;
+         for (i = 0; i < XVECLEN (pat, 0); i++)
+           {
+             rtx this_insn = XVECEXP (pat, 0, i);
+             add_insn_after (this_insn, after);
+             after = this_insn;
+           }
+         delete_scheduled_jump (delay_insn);
+         continue;
+       }
+
       /* Now look only at the cases where we have a filled JUMP_INSN.  */
       if (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)) != JUMP_INSN
          || ! (condjump_p (XVECEXP (PATTERN (insn), 0, 0))
@@ -4102,7 +3242,7 @@ relax_delay_slots (first)
          if (trial == 0 && target_label != 0)
            trial = find_end_label ();
 
-         if (trial != target_label 
+         if (trial != target_label
              && redirect_with_delay_slots_safe_p (delay_insn, trial, insn))
            {
              reorg_redirect_jump (delay_insn, trial);
@@ -4113,7 +3253,8 @@ relax_delay_slots (first)
             insn, redirect the jump to the following insn process again.  */
          trial = next_active_insn (target_label);
          if (trial && GET_CODE (PATTERN (trial)) != SEQUENCE
-             && redundant_insn (trial, insn, 0))
+             && redundant_insn (trial, insn, 0)
+             && ! can_throw_internal (trial))
            {
              rtx tmp;
 
@@ -4124,10 +3265,10 @@ relax_delay_slots (first)
                tmp = find_end_label ();
 
              /* Insert the special USE insn and update dataflow info.  */
-              update_block (trial, tmp);
+             update_block (trial, tmp);
 
              /* Now emit a label before the special USE insn, and
-                redirect our jump to the new label.  */ 
+                redirect our jump to the new label.  */
              target_label = get_label_before (PREV_INSN (tmp));
              reorg_redirect_jump (delay_insn, target_label);
              next = insn;
@@ -4147,7 +3288,7 @@ relax_delay_slots (first)
              if (target_label == 0)
                target_label = find_end_label ();
 
-             if (redirect_with_delay_slots_safe_p (delay_insn, target_label, 
+             if (redirect_with_delay_slots_safe_p (delay_insn, target_label,
                                                    insn))
                {
                  reorg_redirect_jump (delay_insn, target_label);
@@ -4170,6 +3311,7 @@ relax_delay_slots (first)
 #endif
          )
        {
+         rtx after;
          int i;
 
          /* All this insn does is execute its delay list and jump to the
@@ -4187,8 +3329,16 @@ relax_delay_slots (first)
            INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)) = 0;
 
          trial = PREV_INSN (insn);
-         delete_insn (insn);
-         emit_insn_after (pat, trial);
+         delete_related_insns (insn);
+         if (GET_CODE (pat) != SEQUENCE)
+           abort ();
+         after = trial;
+         for (i = 0; i < XVECLEN (pat, 0); i++)
+           {
+             rtx this_insn = XVECEXP (pat, 0, i);
+             add_insn_after (this_insn, after);
+             after = this_insn;
+           }
          delete_scheduled_jump (delay_insn);
          continue;
        }
@@ -4202,7 +3352,7 @@ relax_delay_slots (first)
          && XVECLEN (pat, 0) == 2
          && rtx_equal_p (PATTERN (next), PATTERN (XVECEXP (pat, 0, 1))))
        {
-         delete_insn (insn);
+         delete_related_insns (insn);
          continue;
        }
 
@@ -4223,7 +3373,9 @@ relax_delay_slots (first)
          if (label == 0)
            label = find_end_label ();
 
-         if (redirect_with_delay_slots_safe_p (delay_insn, label, insn))
+         /* find_end_label can generate a new label. Check this first.  */
+         if (no_labels_between_p (insn, next)
+             && redirect_with_delay_slots_safe_p (delay_insn, label, insn))
            {
              /* Be careful how we do this to avoid deleting code or labels
                 that are momentarily dead.  See similar optimization in
@@ -4231,7 +3383,7 @@ relax_delay_slots (first)
              if (old_label)
                ++LABEL_NUSES (old_label);
 
-             if (invert_jump (delay_insn, label))
+             if (invert_jump (delay_insn, label, 1))
                {
                  int i;
 
@@ -4244,12 +3396,12 @@ relax_delay_slots (first)
                      INSN_FROM_TARGET_P (slot) = ! INSN_FROM_TARGET_P (slot);
                    }
 
-                 delete_insn (next);
+                 delete_related_insns (next);
                  next = insn;
                }
 
              if (old_label && --LABEL_NUSES (old_label) == 0)
-               delete_insn (old_label);
+               delete_related_insns (old_label);
              continue;
            }
        }
@@ -4276,13 +3428,23 @@ relax_delay_slots (first)
    RETURN as well.  */
 
 static void
-make_return_insns (first)
-     rtx first;
+make_return_insns (rtx first)
 {
   rtx insn, jump_insn, pat;
   rtx real_return_label = end_of_function_label;
   int slots, i;
 
+#ifdef DELAY_SLOTS_FOR_EPILOGUE
+  /* If a previous pass filled delay slots in the epilogue, things get a
+     bit more complicated, as those filler insns would generally (without
+     data flow analysis) have to be executed after any existing branch
+     delay slot filler insns.  It is also unknown whether such a
+     transformation would actually be profitable.  Note that the existing
+     code only cares for branches with (some) filled delay slots.  */
+  if (current_function_epilogue_delay_list != NULL)
+    return;
+#endif
+
   /* See if there is a RETURN insn in the function other than the one we
      made for END_OF_FUNCTION_LABEL.  If so, set up anything we can't change
      into a RETURN to jump to it.  */
@@ -4292,7 +3454,7 @@ make_return_insns (first)
        real_return_label = get_label_before (insn);
        break;
       }
-  
+
   /* Show an extra usage of REAL_RETURN_LABEL so it won't go away if it
      was equal to END_OF_FUNCTION_LABEL.  */
   LABEL_NUSES (real_return_label)++;
@@ -4350,7 +3512,8 @@ make_return_insns (first)
                   ? eligible_for_annul_true (jump_insn, i - 1,
                                              XVECEXP (pat, 0, i), flags) :
 #endif
-                  eligible_for_delay (jump_insn, i -1, XVECEXP (pat, 0, i), flags)))
+                  eligible_for_delay (jump_insn, i - 1,
+                                      XVECEXP (pat, 0, i), flags)))
              break;
        }
       else
@@ -4367,7 +3530,7 @@ make_return_insns (first)
        {
          rtx prev = PREV_INSN (insn);
 
-         delete_insn (insn);
+         delete_related_insns (insn);
          for (i = 1; i < XVECLEN (pat, 0); i++)
            prev = emit_insn_after (PATTERN (XVECEXP (pat, 0, i)), prev);
 
@@ -4386,19 +3549,17 @@ make_return_insns (first)
   /* Now delete REAL_RETURN_LABEL if we never used it.  Then try to fill any
      new delay slots we have created.  */
   if (--LABEL_NUSES (real_return_label) == 0)
-    delete_insn (real_return_label);
+    delete_related_insns (real_return_label);
 
-  fill_simple_delay_slots (first, 1);
-  fill_simple_delay_slots (first, 0);
+  fill_simple_delay_slots (1);
+  fill_simple_delay_slots (0);
 }
 #endif
 \f
 /* Try to find insns to place in delay slots.  */
 
 void
-dbr_schedule (first, file)
-     rtx first;
-     FILE *file;
+dbr_schedule (rtx first, FILE *file)
 {
   rtx insn, next, epilogue_insn = 0;
   int i;
@@ -4414,7 +3575,7 @@ dbr_schedule (first, file)
   flag_no_peephole = old_flag_no_peephole;
 #endif
 
-  /* If the current function has no insns other than the prologue and 
+  /* If the current function has no insns other than the prologue and
      epilogue, then do not try to fill any delay slots.  */
   if (n_basic_blocks == 0)
     return;
@@ -4430,15 +3591,15 @@ dbr_schedule (first, file)
        epilogue_insn = insn;
     }
 
-  uid_to_ruid = (int *) alloca ((max_uid + 1) * sizeof (int *));
+  uid_to_ruid = xmalloc ((max_uid + 1) * sizeof (int));
   for (i = 0, insn = first; insn; i++, insn = NEXT_INSN (insn))
     uid_to_ruid[INSN_UID (insn)] = i;
-  
+
   /* Initialize the list of insns that need filling.  */
   if (unfilled_firstobj == 0)
     {
       gcc_obstack_init (&unfilled_slots_obstack);
-      unfilled_firstobj = (rtx *) obstack_alloc (&unfilled_slots_obstack, 0);
+      unfilled_firstobj = obstack_alloc (&unfilled_slots_obstack, 0);
     }
 
   for (insn = next_active_insn (first); insn; insn = next_active_insn (insn))
@@ -4453,95 +3614,27 @@ dbr_schedule (first, file)
          && (GET_CODE (PATTERN (insn)) == ADDR_VEC
              || GET_CODE (PATTERN (insn)) == ADDR_DIFF_VEC))
        continue;
-    
+
       if (num_delay_slots (insn) > 0)
        obstack_ptr_grow (&unfilled_slots_obstack, insn);
 
       /* Ensure all jumps go to the last of a set of consecutive labels.  */
-      if (GET_CODE (insn) == JUMP_INSN 
+      if (GET_CODE (insn) == JUMP_INSN
          && (condjump_p (insn) || condjump_in_parallel_p (insn))
          && JUMP_LABEL (insn) != 0
          && ((target = prev_label (next_active_insn (JUMP_LABEL (insn))))
              != JUMP_LABEL (insn)))
-       redirect_jump (insn, target);
-    }
-
-  /* Indicate what resources are required to be valid at the end of the current
-     function.  The condition code never is and memory always is.  If the
-     frame pointer is needed, it is and so is the stack pointer unless
-     EXIT_IGNORE_STACK is non-zero.  If the frame pointer is not needed, the
-     stack pointer is.  Registers used to return the function value are
-     needed.  Registers holding global variables are needed.  */
-
-  end_of_function_needs.cc = 0;
-  end_of_function_needs.memory = 1;
-  end_of_function_needs.unch_memory = 0;
-  CLEAR_HARD_REG_SET (end_of_function_needs.regs);
-
-  if (frame_pointer_needed)
-    {
-      SET_HARD_REG_BIT (end_of_function_needs.regs, FRAME_POINTER_REGNUM);
-#if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
-      SET_HARD_REG_BIT (end_of_function_needs.regs, HARD_FRAME_POINTER_REGNUM);
-#endif
-#ifdef EXIT_IGNORE_STACK
-      if (! EXIT_IGNORE_STACK)
-#endif
-       SET_HARD_REG_BIT (end_of_function_needs.regs, STACK_POINTER_REGNUM);
+       redirect_jump (insn, target, 1);
     }
-  else
-    SET_HARD_REG_BIT (end_of_function_needs.regs, STACK_POINTER_REGNUM);
-
-  if (current_function_return_rtx != 0)
-    mark_referenced_resources (current_function_return_rtx,
-                              &end_of_function_needs, 1);
 
-  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-    if (global_regs[i]
-#ifdef EPILOGUE_USES
-       || EPILOGUE_USES (i)
-#endif
-       )
-      SET_HARD_REG_BIT (end_of_function_needs.regs, i);
-
-  /* The registers required to be live at the end of the function are
-     represented in the flow information as being dead just prior to
-     reaching the end of the function.  For example, the return of a value
-     might be represented by a USE of the return register immediately
-     followed by an unconditional jump to the return label where the
-     return label is the end of the RTL chain.  The end of the RTL chain
-     is then taken to mean that the return register is live.
-
-     This sequence is no longer maintained when epilogue instructions are
-     added to the RTL chain.  To reconstruct the original meaning, the
-     start of the epilogue (NOTE_INSN_EPILOGUE_BEG) is regarded as the
-     point where these registers become live (start_of_epilogue_needs).
-     If epilogue instructions are present, the registers set by those
-     instructions won't have been processed by flow.  Thus, those
-     registers are additionally required at the end of the RTL chain
-     (end_of_function_needs).  */
-
-  start_of_epilogue_needs = end_of_function_needs;
-
-  while (epilogue_insn = next_nonnote_insn (epilogue_insn))
-    mark_set_resources (epilogue_insn, &end_of_function_needs, 0, 1);
+  init_resource_info (epilogue_insn);
 
   /* Show we haven't computed an end-of-function label yet.  */
   end_of_function_label = 0;
 
-  /* Allocate and initialize the tables used by mark_target_live_regs.  */
-  target_hash_table
-    = (struct target_info **) alloca ((TARGET_HASH_PRIME
-                                      * sizeof (struct target_info *)));
-  bzero ((char *) target_hash_table,
-        TARGET_HASH_PRIME * sizeof (struct target_info *));
-
-  bb_ticks = (int *) alloca (n_basic_blocks * sizeof (int));
-  bzero ((char *) bb_ticks, n_basic_blocks * sizeof (int));
-
   /* Initialize the statistics for this function.  */
-  bzero ((char *) num_insns_needing_delays, sizeof num_insns_needing_delays);
-  bzero ((char *) num_filled_delays, sizeof num_filled_delays);
+  memset (num_insns_needing_delays, 0, sizeof num_insns_needing_delays);
+  memset (num_filled_delays, 0, sizeof num_filled_delays);
 
   /* Now do the delay slot filling.  Try everything twice in case earlier
      changes make more slots fillable.  */
@@ -4550,9 +3643,9 @@ dbr_schedule (first, file)
        reorg_pass_number < MAX_REORG_PASSES;
        reorg_pass_number++)
     {
-      fill_simple_delay_slots (first, 1);
-      fill_simple_delay_slots (first, 0);
-      fill_eager_delay_slots (first);
+      fill_simple_delay_slots (1);
+      fill_simple_delay_slots (0);
+      fill_eager_delay_slots ();
       relax_delay_slots (first);
     }
 
@@ -4563,15 +3656,15 @@ dbr_schedule (first, file)
       next = NEXT_INSN (insn);
 
       if (GET_CODE (insn) == INSN && GET_CODE (PATTERN (insn)) == USE
-         && GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
-       next = delete_insn (insn);
+         && INSN_P (XEXP (PATTERN (insn), 0)))
+       next = delete_related_insns (insn);
     }
 
   /* If we made an end of function label, indicate that it is now
      safe to delete it by undoing our prior adjustment to LABEL_NUSES.
      If it is now unused, delete it.  */
   if (end_of_function_label && --LABEL_NUSES (end_of_function_label) == 0)
-    delete_insn (end_of_function_label);
+    delete_related_insns (end_of_function_label);
 
 #ifdef HAVE_return
   if (HAVE_return && end_of_function_label != 0)
@@ -4581,15 +3674,13 @@ dbr_schedule (first, file)
   obstack_free (&unfilled_slots_obstack, unfilled_firstobj);
 
   /* It is not clear why the line below is needed, but it does seem to be.  */
-  unfilled_firstobj = (rtx *) obstack_alloc (&unfilled_slots_obstack, 0);
-
-  /* Reposition the prologue and epilogue notes in case we moved the
-     prologue/epilogue insns.  */
-  reposition_prologue_and_epilogue_notes (first);
+  unfilled_firstobj = obstack_alloc (&unfilled_slots_obstack, 0);
 
   if (file)
     {
-      register int i, j, need_comma;
+      int i, j, need_comma;
+      int total_delay_slots[MAX_DELAY_HISTOGRAM + 1];
+      int total_annul_slots[MAX_DELAY_HISTOGRAM + 1];
 
       for (reorg_pass_number = 0;
           reorg_pass_number < MAX_REORG_PASSES;
@@ -4604,7 +3695,7 @@ dbr_schedule (first, file)
              fprintf (file, ";; %d insns needing delay slots\n;; ",
                       num_insns_needing_delays[i][reorg_pass_number]);
 
-             for (j = 0; j < MAX_DELAY_HISTOGRAM; j++)
+             for (j = 0; j < MAX_DELAY_HISTOGRAM + 1; j++)
                if (num_filled_delays[i][j][reorg_pass_number])
                  {
                    if (need_comma)
@@ -4616,6 +3707,58 @@ dbr_schedule (first, file)
              fprintf (file, "\n");
            }
        }
+      memset (total_delay_slots, 0, sizeof total_delay_slots);
+      memset (total_annul_slots, 0, sizeof total_annul_slots);
+      for (insn = first; insn; insn = NEXT_INSN (insn))
+       {
+         if (! INSN_DELETED_P (insn)
+             && GET_CODE (insn) == INSN
+             && GET_CODE (PATTERN (insn)) != USE
+             && GET_CODE (PATTERN (insn)) != CLOBBER)
+           {
+             if (GET_CODE (PATTERN (insn)) == SEQUENCE)
+               {
+                 j = XVECLEN (PATTERN (insn), 0) - 1;
+                 if (j > MAX_DELAY_HISTOGRAM)
+                   j = MAX_DELAY_HISTOGRAM;
+                 if (INSN_ANNULLED_BRANCH_P (XVECEXP (PATTERN (insn), 0, 0)))
+                   total_annul_slots[j]++;
+                 else
+                   total_delay_slots[j]++;
+               }
+             else if (num_delay_slots (insn) > 0)
+               total_delay_slots[0]++;
+           }
+       }
+      fprintf (file, ";; Reorg totals: ");
+      need_comma = 0;
+      for (j = 0; j < MAX_DELAY_HISTOGRAM + 1; j++)
+       {
+         if (total_delay_slots[j])
+           {
+             if (need_comma)
+               fprintf (file, ", ");
+             need_comma = 1;
+             fprintf (file, "%d got %d delays", total_delay_slots[j], j);
+           }
+       }
+      fprintf (file, "\n");
+#if defined (ANNUL_IFTRUE_SLOTS) || defined (ANNUL_IFFALSE_SLOTS)
+      fprintf (file, ";; Reorg annuls: ");
+      need_comma = 0;
+      for (j = 0; j < MAX_DELAY_HISTOGRAM + 1; j++)
+       {
+         if (total_annul_slots[j])
+           {
+             if (need_comma)
+               fprintf (file, ", ");
+             need_comma = 1;
+             fprintf (file, "%d got %d delays", total_annul_slots[j], j);
+           }
+       }
+      fprintf (file, "\n");
+#endif
+      fprintf (file, "\n");
     }
 
   /* For all JUMP insns, fill in branch prediction notes, so that during
@@ -4627,6 +3770,13 @@ dbr_schedule (first, file)
     {
       int pred_flags;
 
+      if (GET_CODE (insn) == INSN)
+       {
+         rtx pat = PATTERN (insn);
+
+         if (GET_CODE (pat) == SEQUENCE)
+           insn = XVECEXP (pat, 0, 0);
+       }
       if (GET_CODE (insn) != JUMP_INSN)
        continue;
 
@@ -4635,5 +3785,19 @@ dbr_schedule (first, file)
                                            GEN_INT (pred_flags),
                                            REG_NOTES (insn));
     }
+  free_resource_info ();
+  free (uid_to_ruid);
+#ifdef DELAY_SLOTS_FOR_EPILOGUE
+  /* SPARC assembler, for instance, emit warning when debug info is output
+     into the delay slot.  */
+  {
+    rtx link;
+
+    for (link = current_function_epilogue_delay_list;
+         link;
+         link = XEXP (link, 1))
+      INSN_LOCATOR (XEXP (link, 0)) = 0;
+  }
+#endif
 }
 #endif /* DELAY_SLOTS */