OSDN Git Service

* c-common.c, c-decl.c, c-format.c, c-typeck.c: Use %D for
[pf3gnuchains/gcc-fork.git] / gcc / lcm.c
index c43b1b1..4f2f406 100644 (file)
--- a/gcc/lcm.c
+++ b/gcc/lcm.c
@@ -1,5 +1,6 @@
 /* Generic partial redundancy elimination with lazy code motion support.
-   Copyright (C) 1998, 1999, 2000, 2001, 2002 Free Software Foundation, Inc.
+   Copyright (C) 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005
+   Free Software Foundation, Inc.
 
 This file is part of GCC.
 
@@ -63,38 +64,29 @@ Software Foundation, 59 Temple Place - Suite 330, Boston, MA
 #include "basic-block.h"
 #include "output.h"
 #include "tm_p.h"
+#include "function.h"
 
 /* We want target macros for the mode switching code to be able to refer
    to instruction attribute values.  */
 #include "insn-attr.h"
 
 /* Edge based LCM routines.  */
-static void compute_antinout_edge      PARAMS ((sbitmap *, sbitmap *,
-                                                sbitmap *, sbitmap *));
-static void compute_earliest           PARAMS ((struct edge_list *, int,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *));
-static void compute_laterin            PARAMS ((struct edge_list *, sbitmap *,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *));
-static void compute_insert_delete      PARAMS ((struct edge_list *edge_list,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *));
+static void compute_antinout_edge (sbitmap *, sbitmap *, sbitmap *, sbitmap *);
+static void compute_earliest (struct edge_list *, int, sbitmap *, sbitmap *,
+                             sbitmap *, sbitmap *, sbitmap *);
+static void compute_laterin (struct edge_list *, sbitmap *, sbitmap *,
+                            sbitmap *, sbitmap *);
+static void compute_insert_delete (struct edge_list *edge_list, sbitmap *,
+                                  sbitmap *, sbitmap *, sbitmap *, sbitmap *);
 
 /* Edge based LCM routines on a reverse flowgraph.  */
-static void compute_farthest           PARAMS ((struct edge_list *, int,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap*, sbitmap *,
-                                                sbitmap *));
-static void compute_nearerout          PARAMS ((struct edge_list *, sbitmap *,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *));
-static void compute_rev_insert_delete  PARAMS ((struct edge_list *edge_list,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *, sbitmap *,
-                                                sbitmap *));
+static void compute_farthest (struct edge_list *, int, sbitmap *, sbitmap *,
+                             sbitmap*, sbitmap *, sbitmap *);
+static void compute_nearerout (struct edge_list *, sbitmap *, sbitmap *,
+                              sbitmap *, sbitmap *);
+static void compute_rev_insert_delete (struct edge_list *edge_list, sbitmap *,
+                                      sbitmap *, sbitmap *, sbitmap *,
+                                      sbitmap *);
 \f
 /* Edge based lcm routines.  */
 
@@ -103,22 +95,19 @@ static void compute_rev_insert_delete      PARAMS ((struct edge_list *edge_list,
    Other than that, its pretty much identical to compute_antinout.  */
 
 static void
-compute_antinout_edge (antloc, transp, antin, antout)
-     sbitmap *antloc;
-     sbitmap *transp;
-     sbitmap *antin;
-     sbitmap *antout;
+compute_antinout_edge (sbitmap *antloc, sbitmap *transp, sbitmap *antin,
+                      sbitmap *antout)
 {
   basic_block bb;
   edge e;
   basic_block *worklist, *qin, *qout, *qend;
   unsigned int qlen;
+  edge_iterator ei;
 
   /* Allocate a worklist array/queue.  Entries are only added to the
      list if they were not already on the list.  So the size is
      bounded by the number of basic blocks.  */
-  qin = qout = worklist
-    = (basic_block *) xmalloc (sizeof (basic_block) * n_basic_blocks);
+  qin = qout = worklist = xmalloc (sizeof (basic_block) * n_basic_blocks);
 
   /* We want a maximal solution, so make an optimistic initialization of
      ANTIN.  */
@@ -128,7 +117,7 @@ compute_antinout_edge (antloc, transp, antin, antout)
      optimistic initialization of ANTIN above.  */
   FOR_EACH_BB_REVERSE (bb)
     {
-      *qin++ =bb;
+      *qin++ = bb;
       bb->aux = bb;
     }
 
@@ -138,7 +127,7 @@ compute_antinout_edge (antloc, transp, antin, antout)
 
   /* Mark blocks which are predecessors of the exit block so that we
      can easily identify them below.  */
-  for (e = EXIT_BLOCK_PTR->pred; e; e = e->pred_next)
+  FOR_EACH_EDGE (e, ei, EXIT_BLOCK_PTR->preds)
     e->src->aux = EXIT_BLOCK_PTR;
 
   /* Iterate until the worklist is empty.  */
@@ -169,7 +158,7 @@ compute_antinout_edge (antloc, transp, antin, antout)
        /* If the in state of this block changed, then we need
           to add the predecessors of this block to the worklist
           if they are not already on the worklist.  */
-       for (e = bb->pred; e; e = e->pred_next)
+       FOR_EACH_EDGE (e, ei, bb->preds)
          if (!e->src->aux && e->src != ENTRY_BLOCK_PTR)
            {
              *qin++ = e->src;
@@ -188,10 +177,9 @@ compute_antinout_edge (antloc, transp, antin, antout)
 /* Compute the earliest vector for edge based lcm.  */
 
 static void
-compute_earliest (edge_list, n_exprs, antin, antout, avout, kill, earliest)
-     struct edge_list *edge_list;
-     int n_exprs;
-     sbitmap *antin, *antout, *avout, *kill, *earliest;
+compute_earliest (struct edge_list *edge_list, int n_exprs, sbitmap *antin,
+                 sbitmap *antout, sbitmap *avout, sbitmap *kill,
+                 sbitmap *earliest)
 {
   sbitmap difference, temp_bitmap;
   int x, num_edges;
@@ -257,14 +245,14 @@ compute_earliest (edge_list, n_exprs, antin, antout, avout, kill, earliest)
      to compute it.  */
 
 static void
-compute_laterin (edge_list, earliest, antloc, later, laterin)
-     struct edge_list *edge_list;
-     sbitmap *earliest, *antloc, *later, *laterin;
+compute_laterin (struct edge_list *edge_list, sbitmap *earliest,
+                sbitmap *antloc, sbitmap *later, sbitmap *laterin)
 {
   int num_edges, i;
   edge e;
   basic_block *worklist, *qin, *qout, *qend, bb;
   unsigned int qlen;
+  edge_iterator ei;
 
   num_edges = NUM_EDGES (edge_list);
 
@@ -272,7 +260,7 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
      list if they were not already on the list.  So the size is
      bounded by the number of basic blocks.  */
   qin = qout = worklist
-    = (basic_block *) xmalloc (sizeof (basic_block) * (n_basic_blocks + 1));
+    = xmalloc (sizeof (basic_block) * (n_basic_blocks + 1));
 
   /* Initialize a mapping from each edge to its index.  */
   for (i = 0; i < num_edges; i++)
@@ -294,7 +282,7 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
      do not want to be overly optimistic.  Consider an outgoing edge from
      the entry block.  That edge should always have a LATER value the
      same as EARLIEST for that edge.  */
-  for (e = ENTRY_BLOCK_PTR->succ; e; e = e->succ_next)
+  FOR_EACH_EDGE (e, ei, ENTRY_BLOCK_PTR->succs)
     sbitmap_copy (later[(size_t) e->aux], earliest[(size_t) e->aux]);
 
   /* Add all the blocks to the worklist.  This prevents an early exit from
@@ -304,10 +292,11 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
       *qin++ = bb;
       bb->aux = bb;
     }
-  qin = worklist;
+
   /* Note that we do not use the last allocated element for our queue,
      as EXIT_BLOCK is never inserted into it. In fact the above allocation
-     of n_basic_blocks + 1 elements is not encessary.  */
+     of n_basic_blocks + 1 elements is not necessary.  */
+  qin = worklist;
   qend = &worklist[n_basic_blocks];
   qlen = n_basic_blocks;
 
@@ -323,11 +312,12 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
 
       /* Compute the intersection of LATERIN for each incoming edge to B.  */
       sbitmap_ones (laterin[bb->index]);
-      for (e = bb->pred; e != NULL; e = e->pred_next)
-       sbitmap_a_and_b (laterin[bb->index], laterin[bb->index], later[(size_t)e->aux]);
+      FOR_EACH_EDGE (e, ei, bb->preds)
+       sbitmap_a_and_b (laterin[bb->index], laterin[bb->index],
+                        later[(size_t)e->aux]);
 
       /* Calculate LATER for all outgoing edges.  */
-      for (e = bb->succ; e != NULL; e = e->succ_next)
+      FOR_EACH_EDGE (e, ei, bb->succs)
        if (sbitmap_union_of_diff_cg (later[(size_t) e->aux],
                                      earliest[(size_t) e->aux],
                                      laterin[e->src->index],
@@ -348,7 +338,7 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
      for the EXIT block.  We allocated an extra entry in the LATERIN array
      for just this purpose.  */
   sbitmap_ones (laterin[last_basic_block]);
-  for (e = EXIT_BLOCK_PTR->pred; e != NULL; e = e->pred_next)
+  FOR_EACH_EDGE (e, ei, EXIT_BLOCK_PTR->preds)
     sbitmap_a_and_b (laterin[last_basic_block],
                     laterin[last_basic_block],
                     later[(size_t) e->aux]);
@@ -360,16 +350,16 @@ compute_laterin (edge_list, earliest, antloc, later, laterin)
 /* Compute the insertion and deletion points for edge based LCM.  */
 
 static void
-compute_insert_delete (edge_list, antloc, later, laterin,
-                      insert, delete)
-     struct edge_list *edge_list;
-     sbitmap *antloc, *later, *laterin, *insert, *delete;
+compute_insert_delete (struct edge_list *edge_list, sbitmap *antloc,
+                      sbitmap *later, sbitmap *laterin, sbitmap *insert,
+                      sbitmap *delete)
 {
   int x;
   basic_block bb;
 
   FOR_EACH_BB (bb)
-    sbitmap_difference (delete[bb->index], antloc[bb->index], laterin[bb->index]);
+    sbitmap_difference (delete[bb->index], antloc[bb->index],
+                       laterin[bb->index]);
 
   for (x = 0; x < NUM_EDGES (edge_list); x++)
     {
@@ -387,15 +377,9 @@ compute_insert_delete (edge_list, antloc, later, laterin,
    map the insert vector to what edge an expression should be inserted on.  */
 
 struct edge_list *
-pre_edge_lcm (file, n_exprs, transp, avloc, antloc, kill, insert, delete)
-     FILE *file ATTRIBUTE_UNUSED;
-     int n_exprs;
-     sbitmap *transp;
-     sbitmap *avloc;
-     sbitmap *antloc;
-     sbitmap *kill;
-     sbitmap **insert;
-     sbitmap **delete;
+pre_edge_lcm (FILE *file ATTRIBUTE_UNUSED, int n_exprs, sbitmap *transp,
+             sbitmap *avloc, sbitmap *antloc, sbitmap *kill,
+             sbitmap **insert, sbitmap **delete)
 {
   sbitmap *antin, *antout, *earliest;
   sbitmap *avin, *avout;
@@ -490,18 +474,18 @@ pre_edge_lcm (file, n_exprs, transp, avloc, antloc, kill, insert, delete)
    Return the number of passes we performed to iterate to a solution.  */
 
 void
-compute_available (avloc, kill, avout, avin)
-     sbitmap *avloc, *kill, *avout, *avin;
+compute_available (sbitmap *avloc, sbitmap *kill, sbitmap *avout,
+                  sbitmap *avin)
 {
   edge e;
   basic_block *worklist, *qin, *qout, *qend, bb;
   unsigned int qlen;
+  edge_iterator ei;
 
   /* Allocate a worklist array/queue.  Entries are only added to the
      list if they were not already on the list.  So the size is
      bounded by the number of basic blocks.  */
-  qin = qout = worklist
-    = (basic_block *) xmalloc (sizeof (basic_block) * n_basic_blocks);
+  qin = qout = worklist = xmalloc (sizeof (basic_block) * n_basic_blocks);
 
   /* We want a maximal solution.  */
   sbitmap_vector_ones (avout, last_basic_block);
@@ -520,7 +504,7 @@ compute_available (avloc, kill, avout, avin)
 
   /* Mark blocks which are successors of the entry block so that we
      can easily identify them below.  */
-  for (e = ENTRY_BLOCK_PTR->succ; e; e = e->succ_next)
+  FOR_EACH_EDGE (e, ei, ENTRY_BLOCK_PTR->succs)
     e->dest->aux = ENTRY_BLOCK_PTR;
 
   /* Iterate until the worklist is empty.  */
@@ -548,11 +532,12 @@ compute_available (avloc, kill, avout, avin)
          sbitmap_intersection_of_preds (avin[bb->index], avout, bb->index);
        }
 
-      if (sbitmap_union_of_diff_cg (avout[bb->index], avloc[bb->index], avin[bb->index], kill[bb->index]))
+      if (sbitmap_union_of_diff_cg (avout[bb->index], avloc[bb->index],
+                                   avin[bb->index], kill[bb->index]))
        /* If the out state of this block changed, then we need
           to add the successors of this block to the worklist
           if they are not already on the worklist.  */
-       for (e = bb->succ; e; e = e->succ_next)
+       FOR_EACH_EDGE (e, ei, bb->succs)
          if (!e->dest->aux && e->dest != EXIT_BLOCK_PTR)
            {
              *qin++ = e->dest;
@@ -572,11 +557,9 @@ compute_available (avloc, kill, avout, avin)
 /* Compute the farthest vector for edge based lcm.  */
 
 static void
-compute_farthest (edge_list, n_exprs, st_avout, st_avin, st_antin,
-                 kill, farthest)
-     struct edge_list *edge_list;
-     int n_exprs;
-     sbitmap *st_avout, *st_avin, *st_antin, *kill, *farthest;
+compute_farthest (struct edge_list *edge_list, int n_exprs,
+                 sbitmap *st_avout, sbitmap *st_avin, sbitmap *st_antin,
+                 sbitmap *kill, sbitmap *farthest)
 {
   sbitmap difference, temp_bitmap;
   int x, num_edges;
@@ -618,21 +601,20 @@ compute_farthest (edge_list, n_exprs, st_avout, st_avin, st_antin,
    implementation can be found before compute_laterin.  */
 
 static void
-compute_nearerout (edge_list, farthest, st_avloc, nearer, nearerout)
-     struct edge_list *edge_list;
-     sbitmap *farthest, *st_avloc, *nearer, *nearerout;
+compute_nearerout (struct edge_list *edge_list, sbitmap *farthest,
+                  sbitmap *st_avloc, sbitmap *nearer, sbitmap *nearerout)
 {
   int num_edges, i;
   edge e;
   basic_block *worklist, *tos, bb;
+  edge_iterator ei;
 
   num_edges = NUM_EDGES (edge_list);
 
   /* Allocate a worklist array/queue.  Entries are only added to the
      list if they were not already on the list.  So the size is
      bounded by the number of basic blocks.  */
-  tos = worklist
-    = (basic_block *) xmalloc (sizeof (basic_block) * (n_basic_blocks + 1));
+  tos = worklist = xmalloc (sizeof (basic_block) * (n_basic_blocks + 1));
 
   /* Initialize NEARER for each edge and build a mapping from an edge to
      its index.  */
@@ -646,7 +628,7 @@ compute_nearerout (edge_list, farthest, st_avloc, nearer, nearerout)
      do not want to be overly optimistic.  Consider an incoming edge to
      the exit block.  That edge should always have a NEARER value the
      same as FARTHEST for that edge.  */
-  for (e = EXIT_BLOCK_PTR->pred; e; e = e->pred_next)
+  FOR_EACH_EDGE (e, ei, EXIT_BLOCK_PTR->preds)
     sbitmap_copy (nearer[(size_t)e->aux], farthest[(size_t)e->aux]);
 
   /* Add all the blocks to the worklist.  This prevents an early exit
@@ -666,12 +648,12 @@ compute_nearerout (edge_list, farthest, st_avloc, nearer, nearerout)
 
       /* Compute the intersection of NEARER for each outgoing edge from B.  */
       sbitmap_ones (nearerout[bb->index]);
-      for (e = bb->succ; e != NULL; e = e->succ_next)
+      FOR_EACH_EDGE (e, ei, bb->succs)
        sbitmap_a_and_b (nearerout[bb->index], nearerout[bb->index],
                         nearer[(size_t) e->aux]);
 
       /* Calculate NEARER for all incoming edges.  */
-      for (e = bb->pred; e != NULL; e = e->pred_next)
+      FOR_EACH_EDGE (e, ei, bb->preds)
        if (sbitmap_union_of_diff_cg (nearer[(size_t) e->aux],
                                      farthest[(size_t) e->aux],
                                      nearerout[e->dest->index],
@@ -689,7 +671,7 @@ compute_nearerout (edge_list, farthest, st_avloc, nearer, nearerout)
      for the ENTRY block.  We allocated an extra entry in the NEAREROUT array
      for just this purpose.  */
   sbitmap_ones (nearerout[last_basic_block]);
-  for (e = ENTRY_BLOCK_PTR->succ; e != NULL; e = e->succ_next)
+  FOR_EACH_EDGE (e, ei, ENTRY_BLOCK_PTR->succs)
     sbitmap_a_and_b (nearerout[last_basic_block],
                     nearerout[last_basic_block],
                     nearer[(size_t) e->aux]);
@@ -701,16 +683,16 @@ compute_nearerout (edge_list, farthest, st_avloc, nearer, nearerout)
 /* Compute the insertion and deletion points for edge based LCM.  */
 
 static void
-compute_rev_insert_delete (edge_list, st_avloc, nearer, nearerout,
-                          insert, delete)
-     struct edge_list *edge_list;
-     sbitmap *st_avloc, *nearer, *nearerout, *insert, *delete;
+compute_rev_insert_delete (struct edge_list *edge_list, sbitmap *st_avloc,
+                          sbitmap *nearer, sbitmap *nearerout,
+                          sbitmap *insert, sbitmap *delete)
 {
   int x;
   basic_block bb;
 
   FOR_EACH_BB (bb)
-    sbitmap_difference (delete[bb->index], st_avloc[bb->index], nearerout[bb->index]);
+    sbitmap_difference (delete[bb->index], st_avloc[bb->index],
+                       nearerout[bb->index]);
 
   for (x = 0; x < NUM_EDGES (edge_list); x++)
     {
@@ -728,16 +710,9 @@ compute_rev_insert_delete (edge_list, st_avloc, nearer, nearerout,
    an expression should be inserted on.  */
 
 struct edge_list *
-pre_edge_rev_lcm (file, n_exprs, transp, st_avloc, st_antloc, kill,
-                 insert, delete)
-     FILE *file ATTRIBUTE_UNUSED;
-     int n_exprs;
-     sbitmap *transp;
-     sbitmap *st_avloc;
-     sbitmap *st_antloc;
-     sbitmap *kill;
-     sbitmap **insert;
-     sbitmap **delete;
+pre_edge_rev_lcm (FILE *file ATTRIBUTE_UNUSED, int n_exprs, sbitmap *transp,
+                 sbitmap *st_avloc, sbitmap *st_antloc, sbitmap *kill,
+                 sbitmap **insert, sbitmap **delete)
 {
   sbitmap *st_antin, *st_antout;
   sbitmap *st_avout, *st_avin, *farthest;
@@ -748,8 +723,8 @@ pre_edge_rev_lcm (file, n_exprs, transp, st_avloc, st_antloc, kill,
   edge_list = create_edge_list ();
   num_edges = NUM_EDGES (edge_list);
 
-  st_antin = (sbitmap *) sbitmap_vector_alloc (last_basic_block, n_exprs);
-  st_antout = (sbitmap *) sbitmap_vector_alloc (last_basic_block, n_exprs);
+  st_antin = sbitmap_vector_alloc (last_basic_block, n_exprs);
+  st_antout = sbitmap_vector_alloc (last_basic_block, n_exprs);
   sbitmap_vector_zero (st_antin, last_basic_block);
   sbitmap_vector_zero (st_antout, last_basic_block);
   compute_antinout_edge (st_antloc, transp, st_antin, st_antout);
@@ -849,9 +824,9 @@ pre_edge_rev_lcm (file, n_exprs, transp, st_avloc, st_antloc, kill,
 
    The LCM algorithm is then run over the flow graph to determine where to
    place the sets to the highest-priority value in respect of first the first
-   insn in any one block.  Any adjustments required to the transparancy
+   insn in any one block.  Any adjustments required to the transparency
    vectors are made, then the next iteration starts for the next-lower
-   priority mode, till for each entity all modes are exhasted.
+   priority mode, till for each entity all modes are exhausted.
 
    More details are located in the code for optimize_mode_switching().  */
 
@@ -883,14 +858,12 @@ struct bb_info
 static sbitmap *antic;
 static sbitmap *transp;
 static sbitmap *comp;
-static sbitmap *delete;
-static sbitmap *insert;
-
-static struct seginfo * new_seginfo PARAMS ((int, rtx, int, HARD_REG_SET));
-static void add_seginfo PARAMS ((struct bb_info *, struct seginfo *));
-static void reg_dies PARAMS ((rtx, HARD_REG_SET));
-static void reg_becomes_live PARAMS ((rtx, rtx, void *));
-static void make_preds_opaque PARAMS ((basic_block, int));
+
+static struct seginfo * new_seginfo (int, rtx, int, HARD_REG_SET);
+static void add_seginfo (struct bb_info *, struct seginfo *);
+static void reg_dies (rtx, HARD_REG_SET);
+static void reg_becomes_live (rtx, rtx, void *);
+static void make_preds_opaque (basic_block, int);
 #endif
 \f
 #ifdef OPTIMIZE_MODE_SWITCHING
@@ -899,11 +872,7 @@ static void make_preds_opaque PARAMS ((basic_block, int));
    with the MODE, INSN, and basic block BB parameters.  */
 
 static struct seginfo *
-new_seginfo (mode, insn, bb, regs_live)
-     int mode;
-     rtx insn;
-     int bb;
-     HARD_REG_SET regs_live;
+new_seginfo (int mode, rtx insn, int bb, HARD_REG_SET regs_live)
 {
   struct seginfo *ptr;
   ptr = xmalloc (sizeof (struct seginfo));
@@ -920,9 +889,7 @@ new_seginfo (mode, insn, bb, regs_live)
    INFO is the structure to be linked in.  */
 
 static void
-add_seginfo (head, info)
-     struct bb_info *head;
-     struct seginfo *info;
+add_seginfo (struct bb_info *head, struct seginfo *info)
 {
   struct seginfo *ptr;
 
@@ -944,13 +911,12 @@ add_seginfo (head, info)
    we are currently handling mode-switching for.  */
 
 static void
-make_preds_opaque (b, j)
-     basic_block b;
-     int j;
+make_preds_opaque (basic_block b, int j)
 {
   edge e;
+  edge_iterator ei;
 
-  for (e = b->pred; e; e = e->pred_next)
+  FOR_EACH_EDGE (e, ei, b->preds)
     {
       basic_block pb = e->src;
 
@@ -965,18 +931,16 @@ make_preds_opaque (b, j)
 /* Record in LIVE that register REG died.  */
 
 static void
-reg_dies (reg, live)
-     rtx reg;
-     HARD_REG_SET live;
+reg_dies (rtx reg, HARD_REG_SET live)
 {
   int regno, nregs;
 
-  if (GET_CODE (reg) != REG)
+  if (!REG_P (reg))
     return;
 
   regno = REGNO (reg);
   if (regno < FIRST_PSEUDO_REGISTER)
-    for (nregs = HARD_REGNO_NREGS (regno, GET_MODE (reg)) - 1; nregs >= 0;
+    for (nregs = hard_regno_nregs[regno][GET_MODE (reg)] - 1; nregs >= 0;
         nregs--)
       CLEAR_HARD_REG_BIT (live, regno + nregs);
 }
@@ -985,32 +949,208 @@ reg_dies (reg, live)
    This is called via note_stores.  */
 
 static void
-reg_becomes_live (reg, setter, live)
-     rtx reg;
-     rtx setter ATTRIBUTE_UNUSED;
-     void *live;
+reg_becomes_live (rtx reg, rtx setter ATTRIBUTE_UNUSED, void *live)
 {
   int regno, nregs;
 
   if (GET_CODE (reg) == SUBREG)
     reg = SUBREG_REG (reg);
 
-  if (GET_CODE (reg) != REG)
+  if (!REG_P (reg))
     return;
 
   regno = REGNO (reg);
   if (regno < FIRST_PSEUDO_REGISTER)
-    for (nregs = HARD_REGNO_NREGS (regno, GET_MODE (reg)) - 1; nregs >= 0;
+    for (nregs = hard_regno_nregs[regno][GET_MODE (reg)] - 1; nregs >= 0;
         nregs--)
       SET_HARD_REG_BIT (* (HARD_REG_SET *) live, regno + nregs);
 }
 
+/* Make sure if MODE_ENTRY is defined the MODE_EXIT is defined
+   and vice versa.  */
+#if defined (MODE_ENTRY) != defined (MODE_EXIT)
+ #error "Both MODE_ENTRY and MODE_EXIT must be defined"
+#endif
+
+#if defined (MODE_ENTRY) && defined (MODE_EXIT)
+/* Split the fallthrough edge to the exit block, so that we can note
+   that there NORMAL_MODE is required.  Return the new block if it's
+   inserted before the exit block.  Otherwise return null.  */
+
+static basic_block
+create_pre_exit (int n_entities, int *entity_map, const int *num_modes)
+{
+  edge eg;
+  edge_iterator ei;
+  basic_block pre_exit;
+
+  /* The only non-call predecessor at this stage is a block with a
+     fallthrough edge; there can be at most one, but there could be
+     none at all, e.g. when exit is called.  */
+  pre_exit = 0;
+  FOR_EACH_EDGE (eg, ei, EXIT_BLOCK_PTR->preds)
+    if (eg->flags & EDGE_FALLTHRU)
+      {
+       basic_block src_bb = eg->src;
+       regset live_at_end = src_bb->global_live_at_end;
+       rtx last_insn, ret_reg;
+
+       gcc_assert (!pre_exit);
+       /* If this function returns a value at the end, we have to
+          insert the final mode switch before the return value copy
+          to its hard register.  */
+       if (EDGE_COUNT (EXIT_BLOCK_PTR->preds) == 1
+           && GET_CODE ((last_insn = BB_END (src_bb))) == INSN
+           && GET_CODE (PATTERN (last_insn)) == USE
+           && GET_CODE ((ret_reg = XEXP (PATTERN (last_insn), 0))) == REG)
+         {
+           int ret_start = REGNO (ret_reg);
+           int nregs = hard_regno_nregs[ret_start][GET_MODE (ret_reg)];
+           int ret_end = ret_start + nregs;
+           int short_block = 0;
+           int maybe_builtin_apply = 0;
+           int forced_late_switch = 0;
+           rtx before_return_copy;
+
+           do
+             {
+               rtx return_copy = PREV_INSN (last_insn);
+               rtx return_copy_pat, copy_reg;
+               int copy_start, copy_num;
+               int j;
+
+               if (INSN_P (return_copy))
+                 {
+                   if (GET_CODE (PATTERN (return_copy)) == USE
+                       && GET_CODE (XEXP (PATTERN (return_copy), 0)) == REG
+                       && (FUNCTION_VALUE_REGNO_P
+                           (REGNO (XEXP (PATTERN (return_copy), 0)))))
+                     {
+                       maybe_builtin_apply = 1;
+                       last_insn = return_copy;
+                       continue;
+                     }
+                   /* If the return register is not (in its entirety)
+                      likely spilled, the return copy might be
+                      partially or completely optimized away.  */
+                   return_copy_pat = single_set (return_copy);
+                   if (!return_copy_pat)
+                     {
+                       return_copy_pat = PATTERN (return_copy);
+                       if (GET_CODE (return_copy_pat) != CLOBBER)
+                         break;
+                     }
+                   copy_reg = SET_DEST (return_copy_pat);
+                   if (GET_CODE (copy_reg) == REG)
+                     copy_start = REGNO (copy_reg);
+                   else if (GET_CODE (copy_reg) == SUBREG
+                            && GET_CODE (SUBREG_REG (copy_reg)) == REG)
+                     copy_start = REGNO (SUBREG_REG (copy_reg));
+                   else
+                     break;
+                   if (copy_start >= FIRST_PSEUDO_REGISTER)
+                     break;
+                   copy_num
+                     = hard_regno_nregs[copy_start][GET_MODE (copy_reg)];
+
+                   /* If the return register is not likely spilled, - as is
+                      the case for floating point on SH4 - then it might
+                      be set by an arithmetic operation that needs a
+                      different mode than the exit block.  */
+                   for (j = n_entities - 1; j >= 0; j--)
+                     {
+                       int e = entity_map[j];
+                       int mode = MODE_NEEDED (e, return_copy);
+
+                       if (mode != num_modes[e] && mode != MODE_EXIT (e))
+                         break;
+                     }
+                   if (j >= 0)
+                     {
+                       /* For the SH4, floating point loads depend on fpscr,
+                          thus we might need to put the final mode switch
+                          after the return value copy.  That is still OK,
+                          because a floating point return value does not
+                          conflict with address reloads.  */
+                       if (copy_start >= ret_start
+                           && copy_start + copy_num <= ret_end
+                           && OBJECT_P (SET_SRC (return_copy_pat)))
+                         forced_late_switch = 1;
+                       break;
+                     }
+
+                   if (copy_start >= ret_start
+                       && copy_start + copy_num <= ret_end)
+                     nregs -= copy_num;
+                   else if (!maybe_builtin_apply
+                            || !FUNCTION_VALUE_REGNO_P (copy_start))
+                     break;
+                   last_insn = return_copy;
+                 }
+               /* ??? Exception handling can lead to the return value
+                  copy being already separated from the return value use,
+                  as in  unwind-dw2.c .
+                  Similarly, conditionally returning without a value,
+                  and conditionally using builtin_return can lead to an
+                  isolated use.  */
+               if (return_copy == BB_HEAD (src_bb))
+                 {
+                   short_block = 1;
+                   break;
+                 }
+               last_insn = return_copy;
+             }
+           while (nregs);
+           /* If we didn't see a full return value copy, verify that there
+              is a plausible reason for this.  If some, but not all of the
+              return register is likely spilled, we can expect that there
+              is a copy for the likely spilled part.  */
+           if (nregs
+               && ! forced_late_switch
+               && ! short_block
+               && CLASS_LIKELY_SPILLED_P (REGNO_REG_CLASS (ret_start))
+               && nregs == hard_regno_nregs[ret_start][GET_MODE (ret_reg)]
+               /* For multi-hard-register floating point values,
+                  sometimes the likely-spilled part is ordinarily copied
+                  first, then the other part is set with an arithmetic
+                  operation.  This doesn't actually cause reload failures,
+                  so let it pass.  */
+               && (GET_MODE_CLASS (GET_MODE (ret_reg)) == MODE_INT
+                   || nregs == 1))
+             abort ();
+           if (INSN_P (last_insn))
+             {
+               before_return_copy
+                 = emit_note_before (NOTE_INSN_DELETED, last_insn);
+               /* Instructions preceding LAST_INSN in the same block might
+                  require a different mode than MODE_EXIT, so if we might
+                  have such instructions, keep them in a separate block
+                  from pre_exit.  */
+               if (last_insn != BB_HEAD (src_bb))
+                 src_bb = split_block (src_bb,
+                                       PREV_INSN (before_return_copy))->dest;
+             }
+           else
+             before_return_copy = last_insn;
+           pre_exit = split_block (src_bb, before_return_copy)->src;
+         }
+       else
+         {
+           pre_exit = split_edge (eg);
+           COPY_REG_SET (pre_exit->global_live_at_start, live_at_end);
+           COPY_REG_SET (pre_exit->global_live_at_end, live_at_end);
+         }
+      }
+
+  return pre_exit;
+}
+#endif
+
 /* Find all insns that need a particular mode setting, and insert the
    necessary mode switches.  Return true if we did work.  */
 
 int
-optimize_mode_switching (file)
-     FILE *file;
+optimize_mode_switching (FILE *file)
 {
   rtx insn;
   int e;
@@ -1038,12 +1178,11 @@ optimize_mode_switching (file)
        /* Create the list of segments within each basic block.
           If NORMAL_MODE is defined, allow for two extra
           blocks split from the entry and exit block.  */
-#ifdef NORMAL_MODE
-       entry_exit_extra = 2;
+#if defined (MODE_ENTRY) && defined (MODE_EXIT)
+       entry_exit_extra = 3;
 #endif
        bb_info[n_entities]
-         = (struct bb_info *) xcalloc (last_basic_block + entry_exit_extra,
-                                       sizeof **bb_info);
+         = xcalloc (last_basic_block + entry_exit_extra, sizeof **bb_info);
        entity_map[n_entities++] = e;
        if (num_modes[e] > max_num_modes)
          max_num_modes = num_modes[e];
@@ -1052,28 +1191,11 @@ optimize_mode_switching (file)
   if (! n_entities)
     return 0;
 
-#ifdef NORMAL_MODE
-  {
-    /* Split the edge from the entry block and the fallthrough edge to the
-       exit block, so that we can note that there NORMAL_MODE is supplied /
-       required.  */
-    edge eg;
-    post_entry = split_edge (ENTRY_BLOCK_PTR->succ);
-    /* The only non-call predecessor at this stage is a block with a
-       fallthrough edge; there can be at most one, but there could be
-       none at all, e.g. when exit is called.  */
-    for (pre_exit = 0, eg = EXIT_BLOCK_PTR->pred; eg; eg = eg->pred_next)
-      if (eg->flags & EDGE_FALLTHRU)
-       {
-         regset live_at_end = eg->src->global_live_at_end;
-
-         if (pre_exit)
-           abort ();
-         pre_exit = split_edge (eg);
-         COPY_REG_SET (pre_exit->global_live_at_start, live_at_end);
-         COPY_REG_SET (pre_exit->global_live_at_end, live_at_end);
-       }
-  }
+#if defined (MODE_ENTRY) && defined (MODE_EXIT)
+  /* Split the edge from the entry block, so that we can note that
+     there NORMAL_MODE is supplied.  */
+  post_entry = split_edge (single_succ_edge (ENTRY_BLOCK_PTR));
+  pre_exit = create_pre_exit (n_entities, entity_map, num_modes);
 #endif
 
   /* Create the bitmap vectors.  */
@@ -1101,8 +1223,8 @@ optimize_mode_switching (file)
 
          REG_SET_TO_HARD_REG_SET (live_now,
                                   bb->global_live_at_start);
-         for (insn = bb->head;
-              insn != NULL && insn != NEXT_INSN (bb->end);
+         for (insn = BB_HEAD (bb);
+              insn != NULL && insn != NEXT_INSN (BB_END (bb));
               insn = NEXT_INSN (insn))
            {
              if (INSN_P (insn))
@@ -1117,7 +1239,9 @@ optimize_mode_switching (file)
                      add_seginfo (info + bb->index, ptr);
                      RESET_BIT (transp[bb->index], j);
                    }
-
+#ifdef MODE_AFTER
+                 last_mode = MODE_AFTER (last_mode, insn);
+#endif
                  /* Update LIVE_NOW.  */
                  for (link = REG_NOTES (insn); link; link = XEXP (link, 1))
                    if (REG_NOTE_KIND (link) == REG_DEAD)
@@ -1134,13 +1258,13 @@ optimize_mode_switching (file)
          /* Check for blocks without ANY mode requirements.  */
          if (last_mode == no_mode)
            {
-             ptr = new_seginfo (no_mode, bb->end, bb->index, live_now);
+             ptr = new_seginfo (no_mode, BB_END (bb), bb->index, live_now);
              add_seginfo (info + bb->index, ptr);
            }
        }
-#ifdef NORMAL_MODE
+#if defined (MODE_ENTRY) && defined (MODE_EXIT)
       {
-       int mode = NORMAL_MODE (e);
+       int mode = MODE_ENTRY (e);
 
        if (mode != no_mode)
          {
@@ -1158,7 +1282,7 @@ optimize_mode_switching (file)
            info[bb->index].computing = mode;
 
            if (pre_exit)
-             info[pre_exit->index].seginfo->mode = mode;
+             info[pre_exit->index].seginfo->mode = MODE_EXIT (e);
          }
       }
 #endif /* NORMAL_MODE */
@@ -1168,6 +1292,8 @@ optimize_mode_switching (file)
   for (i = 0; i < max_num_modes; i++)
     {
       int current_mode[N_ENTITIES];
+      sbitmap *delete;
+      sbitmap *insert;
 
       /* Set the anticipatable and computing arrays.  */
       sbitmap_vector_zero (antic, last_basic_block);
@@ -1242,8 +1368,8 @@ optimize_mode_switching (file)
              if (eg->flags & EDGE_ABNORMAL)
                {
                  emited = true;
-                 if (GET_CODE (src_bb->end) == JUMP_INSN)
-                   emit_insn_before (mode_set, src_bb->end);
+                 if (JUMP_P (BB_END (src_bb)))
+                   emit_insn_before (mode_set, BB_END (src_bb));
                  /* It doesn't make sense to switch to normal mode
                     after a CALL_INSN, so we're going to abort if we
                     find one.  The cases in which a CALL_INSN may
@@ -1255,8 +1381,8 @@ optimize_mode_switching (file)
                     the call (it wouldn't make sense, anyway).  In
                     the case of EH edges, EH entry points also start
                     in normal mode, so a similar reasoning applies.  */
-                 else if (GET_CODE (src_bb->end) == INSN)
-                   emit_insn_after (mode_set, src_bb->end);
+                 else if (NONJUMP_INSN_P (BB_END (src_bb)))
+                   emit_insn_after (mode_set, BB_END (src_bb));
                  else
                    abort ();
                  bb_info[j][src_bb->index].computing = mode;
@@ -1278,6 +1404,8 @@ optimize_mode_switching (file)
              }
        }
 
+      sbitmap_vector_free (delete);
+      sbitmap_vector_free (insert);
       clear_aux_for_edges ();
       free_edge_list (edge_list);
     }
@@ -1302,17 +1430,17 @@ optimize_mode_switching (file)
                  mode_set = get_insns ();
                  end_sequence ();
 
-                 /* Do not bother to insert empty sequence.  */
-                 if (mode_set == NULL_RTX)
-                   continue;
-
-                 emited = true;
-                 if (GET_CODE (ptr->insn_ptr) == NOTE
-                     && (NOTE_LINE_NUMBER (ptr->insn_ptr)
-                         == NOTE_INSN_BASIC_BLOCK))
-                   emit_insn_after (mode_set, ptr->insn_ptr);
-                 else
-                   emit_insn_before (mode_set, ptr->insn_ptr);
+                 /* Insert MODE_SET only if it is nonempty.  */
+                 if (mode_set != NULL_RTX)
+                   {
+                     emited = true;
+                     if (NOTE_P (ptr->insn_ptr)
+                         && (NOTE_LINE_NUMBER (ptr->insn_ptr)
+                             == NOTE_INSN_BASIC_BLOCK))
+                       emit_insn_after (mode_set, ptr->insn_ptr);
+                     else
+                       emit_insn_before (mode_set, ptr->insn_ptr);
+                   }
                }
 
              free (ptr);
@@ -1328,13 +1456,11 @@ optimize_mode_switching (file)
   sbitmap_vector_free (antic);
   sbitmap_vector_free (transp);
   sbitmap_vector_free (comp);
-  sbitmap_vector_free (delete);
-  sbitmap_vector_free (insert);
 
   if (need_commit)
     commit_edge_insertions ();
 
-#ifdef NORMAL_MODE
+#if defined (MODE_ENTRY) && defined (MODE_EXIT)
   cleanup_cfg (CLEANUP_NO_INSN_DEL);
 #else
   if (!need_commit && !emited)