OSDN Git Service

Add fix test from irix_stdio_dummy_va_list
[pf3gnuchains/gcc-fork.git] / gcc / alias.c
index ae86638..8792da6 100644 (file)
@@ -1,5 +1,5 @@
 /* Alias analysis for GNU C
-   Copyright (C) 1997, 1998, 1999, 2000 Free Software Foundation, Inc.
+   Copyright (C) 1997, 1998, 1999, 2000, 2001 Free Software Foundation, Inc.
    Contributed by John Carr (jfc@mit.edu).
 
 This file is part of GNU CC.
@@ -25,10 +25,10 @@ Boston, MA 02111-1307, USA.  */
 #include "tree.h"
 #include "tm_p.h"
 #include "function.h"
-#include "insn-flags.h"
 #include "expr.h"
 #include "regs.h"
 #include "hard-reg-set.h"
+#include "basic-block.h"
 #include "flags.h"
 #include "output.h"
 #include "toplev.h"
@@ -87,23 +87,27 @@ typedef struct alias_set_entry
 
 static int rtx_equal_for_memref_p      PARAMS ((rtx, rtx));
 static rtx find_symbolic_term          PARAMS ((rtx));
-static rtx get_addr                    PARAMS ((rtx));
+rtx get_addr                           PARAMS ((rtx));
 static int memrefs_conflict_p          PARAMS ((int, rtx, int, rtx,
                                                 HOST_WIDE_INT));
 static void record_set                 PARAMS ((rtx, rtx, void *));
 static rtx find_base_term              PARAMS ((rtx));
 static int base_alias_check            PARAMS ((rtx, rtx, enum machine_mode,
                                                 enum machine_mode));
+static int handled_component_p         PARAMS ((tree));
+static int can_address_p               PARAMS ((tree));
 static rtx find_base_value             PARAMS ((rtx));
 static int mems_in_disjoint_alias_sets_p PARAMS ((rtx, rtx));
 static int insert_subset_children       PARAMS ((splay_tree_node, void*));
 static tree find_base_decl            PARAMS ((tree));
 static alias_set_entry get_alias_set_entry PARAMS ((HOST_WIDE_INT));
 static rtx fixed_scalar_and_varying_struct_p PARAMS ((rtx, rtx, rtx, rtx,
-                                                     int (*) (rtx)));
+                                                     int (*) (rtx, int)));
 static int aliases_everything_p         PARAMS ((rtx));
 static int write_dependence_p           PARAMS ((rtx, rtx, int));
-static int nonlocal_reference_p         PARAMS ((rtx));
+static int nonlocal_mentioned_p         PARAMS ((rtx));
+
+static int loop_p                       PARAMS ((void));
 
 /* Set up all info needed to perform alias analysis on memory references.  */
 
@@ -145,7 +149,8 @@ static rtx *new_reg_base_value;
 static unsigned int reg_base_value_size; /* size of reg_base_value array */
 
 #define REG_BASE_VALUE(X) \
-  (REGNO (X) < reg_base_value_size ? reg_base_value[REGNO (X)] : 0)
+  (REGNO (X) < reg_base_value_size \
+   ? reg_base_value[REGNO (X)] : 0)
 
 /* Vector of known invariant relationships between registers.  Set in
    loop unrolling.  Indexed by register number, if nonzero the value
@@ -208,8 +213,6 @@ mems_in_disjoint_alias_sets_p (mem1, mem2)
      rtx mem1;
      rtx mem2;
 {
-  alias_set_entry ase;
-
 #ifdef ENABLE_CHECKING 
 /* Perform a basic sanity check.  Namely, that there are no alias sets
    if we're not using strict aliasing.  This helps to catch bugs
@@ -223,58 +226,121 @@ mems_in_disjoint_alias_sets_p (mem1, mem2)
     abort ();
 #endif
 
-  /* The code used in varargs macros are often not conforming ANSI C,
-     which can trick the compiler into making incorrect aliasing
-     assumptions in these functions.  So, we don't use alias sets in
-     such a function.  FIXME: This should be moved into the front-end;
-     it is a language-dependent notion, and there's no reason not to
-     still use these checks to handle globals.  */
-  if (current_function_stdarg || current_function_varargs)
-    return 0;
+  return ! alias_sets_conflict_p (MEM_ALIAS_SET (mem1), MEM_ALIAS_SET (mem2));
+}
 
-  /* If have no alias set information for one of the MEMs, we have to assume
-     it can alias anything.  */
-  if (MEM_ALIAS_SET (mem1) == 0 || MEM_ALIAS_SET (mem2) == 0)
-    return 0;
+/* Insert the NODE into the splay tree given by DATA.  Used by
+   record_alias_subset via splay_tree_foreach.  */
 
-  /* If the two alias sets are the same, they may alias.  */
-  if (MEM_ALIAS_SET (mem1) == MEM_ALIAS_SET (mem2))
-    return 0;
+static int
+insert_subset_children (node, data)
+     splay_tree_node node;
+     void *data;
+{
+  splay_tree_insert ((splay_tree) data, node->key, node->value);
+
+  return 0;
+}
+
+/* Return 1 if the two specified alias sets may conflict.  */
+
+int
+alias_sets_conflict_p (set1, set2)
+     HOST_WIDE_INT set1, set2;
+{
+  alias_set_entry ase;
+
+  /* If have no alias set information for one of the operands, we have
+     to assume it can alias anything.  */
+  if (set1 == 0 || set2 == 0
+      /* If the two alias sets are the same, they may alias.  */
+      || set1 == set2)
+    return 1;
 
   /* See if the first alias set is a subset of the second.  */
-  ase = get_alias_set_entry (MEM_ALIAS_SET (mem1));
+  ase = get_alias_set_entry (set1);
   if (ase != 0
       && (ase->has_zero_child
          || splay_tree_lookup (ase->children,
-                               (splay_tree_key) MEM_ALIAS_SET (mem2))))
-    return  0;
+                               (splay_tree_key) set2)))
+    return 1;
 
   /* Now do the same, but with the alias sets reversed.  */
-  ase = get_alias_set_entry (MEM_ALIAS_SET (mem2));
+  ase = get_alias_set_entry (set2);
   if (ase != 0
       && (ase->has_zero_child
          || splay_tree_lookup (ase->children,
-                               (splay_tree_key) MEM_ALIAS_SET (mem1))))
-    return  0;
+                               (splay_tree_key) set1)))
+    return 1;
 
-  /* The two MEMs are in distinct alias sets, and neither one is the
+  /* The two alias sets are distinct and neither one is the
      child of the other.  Therefore, they cannot alias.  */
-  return 1;
+  return 0;
 }
+\f
+/* Return 1 if TYPE is a RECORD_TYPE, UNION_TYPE, or QUAL_UNION_TYPE and has
+   has any readonly fields.  If any of the fields have types that
+   contain readonly fields, return true as well.  */
 
-/* Insert the NODE into the splay tree given by DATA.  Used by
-   record_alias_subset via splay_tree_foreach.  */
-
-static int
-insert_subset_children (node, data)
-     splay_tree_node node;
-     void *data;
+int
+readonly_fields_p (type)
+     tree type;
 {
-  splay_tree_insert ((splay_tree) data, node->key, node->value);
+  tree field;
+
+  if (TREE_CODE (type) != RECORD_TYPE && TREE_CODE (type) != UNION_TYPE
+      && TREE_CODE (type) != QUAL_UNION_TYPE)
+    return 0;
+
+  for (field = TYPE_FIELDS (type); field != 0; field = TREE_CHAIN (field))
+    if (TREE_CODE (field) == FIELD_DECL
+       && (TREE_READONLY (field)
+           || readonly_fields_p (TREE_TYPE (field))))
+      return 1;
 
   return 0;
 }
 \f
+/* Return 1 if any MEM object of type T1 will always conflict (using the
+   dependency routines in this file) with any MEM object of type T2.
+   This is used when allocating temporary storage.  If T1 and/or T2 are
+   NULL_TREE, it means we know nothing about the storage.  */
+
+int
+objects_must_conflict_p (t1, t2)
+     tree t1, t2;
+{
+  /* If neither has a type specified, we don't know if they'll conflict
+     because we may be using them to store objects of various types, for
+     example the argument and local variables areas of inlined functions.  */
+  if (t1 == 0 && t2 == 0)
+    return 0;
+
+  /* If one or the other has readonly fields or is readonly,
+     then they may not conflict.  */
+  if ((t1 != 0 && readonly_fields_p (t1))
+      || (t2 != 0 && readonly_fields_p (t2))
+      || (t1 != 0 && TYPE_READONLY (t1))
+      || (t2 != 0 && TYPE_READONLY (t2)))
+    return 0;
+
+  /* If they are the same type, they must conflict.  */
+  if (t1 == t2
+      /* Likewise if both are volatile.  */
+      || (t1 != 0 && TYPE_VOLATILE (t1) && t2 != 0 && TYPE_VOLATILE (t2)))
+    return 1;
+
+  /* If one is aggregate and the other is scalar then they may not
+     conflict.  */
+  if ((t1 != 0 && AGGREGATE_TYPE_P (t1))
+      != (t2 != 0 && AGGREGATE_TYPE_P (t2)))
+    return 0;
+
+  /* Otherwise they conflict only if the alias sets conflict. */
+  return alias_sets_conflict_p (t1 ? get_alias_set (t1) : 0,
+                               t2 ? get_alias_set (t2) : 0);
+}
+\f
 /* T is an expression with pointer type.  Find the DECL on which this
    expression is based.  (For example, in `a[i]' this would be `a'.)
    If there is no such DECL, or a unique decl cannot be determined,
@@ -335,6 +401,58 @@ find_base_decl (t)
     }
 }
 
+/* Return 1 if T is an expression that get_inner_reference handles.  */
+
+static int
+handled_component_p (t)
+     tree t;
+{
+  switch (TREE_CODE (t))
+    {
+    case BIT_FIELD_REF:
+    case COMPONENT_REF:
+    case ARRAY_REF:
+    case NON_LVALUE_EXPR:
+      return 1;
+
+    case NOP_EXPR:
+    case CONVERT_EXPR:
+      return (TYPE_MODE (TREE_TYPE (t))
+             == TYPE_MODE (TREE_TYPE (TREE_OPERAND (t, 0))));
+
+    default:
+      return 0;
+    }
+}
+
+/* Return 1 if all the nested component references handled by
+   get_inner_reference in T are such that we can address the object in T.  */
+
+static int
+can_address_p (t)
+     tree t;
+{
+  /* If we're at the end, it is vacuously addressable.  */
+  if (! handled_component_p (t))
+    return 1;
+
+  /* Bitfields are never addressable.  */
+  else if (TREE_CODE (t) == BIT_FIELD_REF)
+    return 0;
+
+  else if (TREE_CODE (t) == COMPONENT_REF
+          && ! DECL_NONADDRESSABLE_P (TREE_OPERAND (t, 1))
+          && can_address_p (TREE_OPERAND (t, 0)))
+    return 1;
+
+  else if (TREE_CODE (t) == ARRAY_REF
+          && ! TYPE_NONALIASED_COMPONENT (TREE_TYPE (TREE_OPERAND (t, 0)))
+          && can_address_p (TREE_OPERAND (t, 0)))
+    return 1;
+
+  return 0;
+}
+
 /* Return the alias set for T, which may be either a type or an
    expression.  Call language-specific routine for help, if needed.  */
 
@@ -374,35 +492,9 @@ get_alias_set (t)
       /* Now loop the same way as get_inner_reference and get the alias
         set to use.  Pick up the outermost object that we could have
         a pointer to.  */
-      while (1)
-       {
-         /* Unnamed bitfields are not an addressable object.  */
-         if (TREE_CODE (t) == BIT_FIELD_REF)
-           ;
-         else if (TREE_CODE (t) == COMPONENT_REF)
-           {
-             if (! DECL_NONADDRESSABLE_P (TREE_OPERAND (t, 1)))
-               /* Stop at an adressable decl.  */
-               break;
-           }
-         else if (TREE_CODE (t) == ARRAY_REF)
-           {
-             if (! TYPE_NONALIASED_COMPONENT
-                 (TREE_TYPE (TREE_OPERAND (t, 0))))
-               /* Stop at an addresssable array element.  */
-               break;
-           }
-         else if (TREE_CODE (t) != NON_LVALUE_EXPR
-                  && ! ((TREE_CODE (t) == NOP_EXPR
-                     || TREE_CODE (t) == CONVERT_EXPR)
-                    && (TYPE_MODE (TREE_TYPE (t))
-                        == TYPE_MODE (TREE_TYPE (TREE_OPERAND (t, 0))))))
-           /* Stop if not one of above and not mode-preserving conversion. */
-           break;
+      while (handled_component_p (t) && ! can_address_p (t))
+       t = TREE_OPERAND (t, 0);
 
-         t = TREE_OPERAND (t, 0);
-       }
-                  
       if (TREE_CODE (t) == INDIRECT_REF)
        {
          /* Check for accesses through restrict-qualified pointers.  */
@@ -454,7 +546,7 @@ get_alias_set (t)
 
   /* If this is an aggregate type, we must record any component aliasing
      information.  */
-  if (AGGREGATE_TYPE_P (t))
+  if (AGGREGATE_TYPE_P (t) || TREE_CODE (t) == COMPLEX_TYPE)
     record_component_aliases (t);
 
   return set;
@@ -561,6 +653,10 @@ record_component_aliases (type)
          record_alias_subset (superset, get_alias_set (TREE_TYPE (field)));
       break;
 
+    case COMPLEX_TYPE:
+      record_alias_subset (superset, get_alias_set (TREE_TYPE (type)));
+      break;
+
     default:
       break;
     }
@@ -600,6 +696,7 @@ static rtx
 find_base_value (src)
      register rtx src;
 {
+  unsigned int regno;
   switch (GET_CODE (src))
     {
     case SYMBOL_REF:
@@ -607,12 +704,13 @@ find_base_value (src)
       return src;
 
     case REG:
+      regno = REGNO (src);
       /* At the start of a function, argument registers have known base
         values which may be lost later.  Returning an ADDRESS
         expression here allows optimization based on argument values
         even when the argument registers are used for other purposes.  */
-      if (REGNO (src) < FIRST_PSEUDO_REGISTER && copying_arguments)
-       return new_reg_base_value[REGNO (src)];
+      if (regno < FIRST_PSEUDO_REGISTER && copying_arguments)
+       return new_reg_base_value[regno];
 
       /* If a pseudo has a known base value, return it.  Do not do this
         for hard regs since it can result in a circular dependency
@@ -620,10 +718,10 @@ find_base_value (src)
 
         The test above is not sufficient because the scheduler may move
         a copy out of an arg reg past the NOTE_INSN_FUNCTION_BEGIN.  */
-      if (REGNO (src) >= FIRST_PSEUDO_REGISTER
-         && (unsigned) REGNO (src) < reg_base_value_size
-         && reg_base_value[REGNO (src)])
-       return reg_base_value[REGNO (src)];
+      if (regno >= FIRST_PSEUDO_REGISTER
+         && regno < reg_base_value_size
+         && reg_base_value[regno])
+       return reg_base_value[regno];
 
       return src;
 
@@ -677,9 +775,9 @@ find_base_value (src)
        /* This might not be necessary anymore:
           If either operand is a REG that is a known pointer, then it
           is the base.  */
-       else if (GET_CODE (src_0) == REG && REGNO_POINTER_FLAG (REGNO (src_0)))
+       else if (GET_CODE (src_0) == REG && REG_POINTER (src_0))
          return find_base_value (src_0);
-       else if (GET_CODE (src_1) == REG && REGNO_POINTER_FLAG (REGNO (src_1)))
+       else if (GET_CODE (src_1) == REG && REG_POINTER (src_1))
          return find_base_value (src_1);
 
        return 0;
@@ -697,6 +795,10 @@ find_base_value (src)
        return find_base_value (XEXP (src, 0));
       return 0;
 
+    case TRUNCATE:
+      if (GET_MODE_SIZE (GET_MODE (src)) < GET_MODE_SIZE (Pmode))
+       break;
+      /* Fall through.  */
     case ZERO_EXTEND:
     case SIGN_EXTEND:  /* used for NT/Alpha pointers */
     case HIGH:
@@ -770,11 +872,26 @@ record_set (dest, set, data)
     switch (GET_CODE (src))
       {
       case LO_SUM:
-      case PLUS:
       case MINUS:
        if (XEXP (src, 0) != dest && XEXP (src, 1) != dest)
          new_reg_base_value[regno] = 0;
        break;
+      case PLUS:
+       /* If the value we add in the PLUS is also a valid base value,
+          this might be the actual base value, and the original value
+          an index.  */
+       {
+         rtx other = NULL_RTX;
+
+         if (XEXP (src, 0) == dest)
+           other = XEXP (src, 1);
+         else if (XEXP (src, 1) == dest)
+           other = XEXP (src, 0);
+
+         if (! other || find_base_value (other))
+           new_reg_base_value[regno] = 0;
+         break;
+       }
       case AND:
        if (XEXP (src, 0) != dest || GET_CODE (XEXP (src, 1)) != CONST_INT)
          new_reg_base_value[regno] = 0;
@@ -926,8 +1043,8 @@ rtx_equal_for_memref_p (x, y)
       return 0;
 
     case ADDRESSOF:
-      return (REGNO (XEXP (x, 0)) == REGNO (XEXP (y, 0))
-             && XINT (x, 1) == XINT (y, 1));
+      return (XINT (x, 1) == XINT (y, 1)
+             && rtx_equal_for_memref_p (XEXP (x, 0), XEXP (y, 0)));
 
     default:
       break;
@@ -1033,6 +1150,11 @@ find_base_term (x)
   cselib_val *val;
   struct elt_loc_list *l;
 
+#if defined (FIND_BASE_TERM)
+  /* Try machine-dependent ways to find the base term.  */
+  x = FIND_BASE_TERM (x);
+#endif
+
   switch (GET_CODE (x))
     {
     case REG:
@@ -1078,12 +1200,15 @@ find_base_term (x)
           is a shift or multiply, then it must be the index register and the
           other operand is the base register.  */
        
+       if (tmp1 == pic_offset_table_rtx && CONSTANT_P (tmp2))
+         return find_base_term (tmp2);
+
        /* If either operand is known to be a pointer, then use it
           to determine the base term.  */
-       if (REG_P (tmp1) && REGNO_POINTER_FLAG (REGNO (tmp1)))
+       if (REG_P (tmp1) && REG_POINTER (tmp1))
          return find_base_term (tmp1);
 
-       if (REG_P (tmp2) && REGNO_POINTER_FLAG (REGNO (tmp2)))
+       if (REG_P (tmp2) && REG_POINTER (tmp2))
          return find_base_term (tmp2);
 
        /* Neither operand was known to be a pointer.  Go ahead and find the
@@ -1123,6 +1248,9 @@ find_base_term (x)
     case LABEL_REF:
       return x;
 
+    case ADDRESSOF:
+      return REG_BASE_VALUE (frame_pointer_rtx);
+
     default:
       return 0;
     }
@@ -1212,7 +1340,7 @@ base_alias_check (x, y, x_mode, y_mode)
    it unchanged unless it is a value; in the latter case we call cselib to get
    a more useful rtx.  */
 
-static rtx
+rtx
 get_addr (x)
      rtx x;
 {
@@ -1446,6 +1574,18 @@ memrefs_conflict_p (xsize, x, ysize, y, c)
       return memrefs_conflict_p (xsize, x, ysize, XEXP (y, 0), c);
     }
 
+  if (GET_CODE (x) == ADDRESSOF)
+    {
+      if (y == frame_pointer_rtx
+         || GET_CODE (y) == ADDRESSOF)
+       return xsize <= 0 || ysize <= 0;
+    }
+  if (GET_CODE (y) == ADDRESSOF)
+    {
+      if (x == frame_pointer_rtx)
+       return xsize <= 0 || ysize <= 0;
+    }
+
   if (CONSTANT_P (x))
     {
       if (GET_CODE (x) == CONST_INT && GET_CODE (y) == CONST_INT)
@@ -1469,10 +1609,9 @@ memrefs_conflict_p (xsize, x, ysize, y, c)
                                   canon_rtx (XEXP (y, 0)), c);
 
       if (CONSTANT_P (y))
-       return (xsize < 0 || ysize < 0
+       return (xsize <= 0 || ysize <= 0
                || (rtx_equal_for_memref_p (x, y)
-                   && (xsize == 0 || ysize == 0
-                       || (c >= 0 && xsize > c) || (c < 0 && ysize+c > 0))));
+                   && ((c >= 0 && xsize > c) || (c < 0 && ysize+c > 0))));
 
       return 1;
     }
@@ -1521,19 +1660,19 @@ static rtx
 fixed_scalar_and_varying_struct_p (mem1, mem2, mem1_addr, mem2_addr, varies_p)
      rtx mem1, mem2;
      rtx mem1_addr, mem2_addr;
-     int (*varies_p) PARAMS ((rtx));
+     int (*varies_p) PARAMS ((rtx, int));
 {  
   if (! flag_strict_aliasing)
     return NULL_RTX;
 
   if (MEM_SCALAR_P (mem1) && MEM_IN_STRUCT_P (mem2) 
-      && !varies_p (mem1_addr) && varies_p (mem2_addr))
+      && !varies_p (mem1_addr, 1) && varies_p (mem2_addr, 1))
     /* MEM1 is a scalar at a fixed address; MEM2 is a struct at a
        varying address.  */
     return mem1;
 
   if (MEM_IN_STRUCT_P (mem1) && MEM_SCALAR_P (mem2) 
-      && varies_p (mem1_addr) && !varies_p (mem2_addr))
+      && varies_p (mem1_addr, 1) && !varies_p (mem2_addr, 1))
     /* MEM2 is a scalar at a fixed address; MEM1 is a struct at a
        varying address.  */
     return mem2;
@@ -1563,7 +1702,7 @@ true_dependence (mem, mem_mode, x, varies)
      rtx mem;
      enum machine_mode mem_mode;
      rtx x;
-     int (*varies) PARAMS ((rtx));
+     int (*varies) PARAMS ((rtx, int));
 {
   register rtx x_addr, mem_addr;
   rtx base;
@@ -1574,6 +1713,78 @@ true_dependence (mem, mem_mode, x, varies)
   if (DIFFERENT_ALIAS_SETS_P (x, mem))
     return 0;
 
+  /* Unchanging memory can't conflict with non-unchanging memory.
+     A non-unchanging read can conflict with a non-unchanging write.
+     An unchanging read can conflict with an unchanging write since
+     there may be a single store to this address to initialize it.
+     Note that an unchanging store can conflict with a non-unchanging read
+     since we have to make conservative assumptions when we have a
+     record with readonly fields and we are copying the whole thing.
+     Just fall through to the code below to resolve potential conflicts.
+     This won't handle all cases optimally, but the possible performance
+     loss should be negligible.  */
+  if (RTX_UNCHANGING_P (x) && ! RTX_UNCHANGING_P (mem))
+    return 0;
+
+  if (mem_mode == VOIDmode)
+    mem_mode = GET_MODE (mem);
+
+  x_addr = get_addr (XEXP (x, 0));
+  mem_addr = get_addr (XEXP (mem, 0));
+
+  base = find_base_term (x_addr);
+  if (base && (GET_CODE (base) == LABEL_REF
+              || (GET_CODE (base) == SYMBOL_REF
+                  && CONSTANT_POOL_ADDRESS_P (base))))
+    return 0;
+
+  if (! base_alias_check (x_addr, mem_addr, GET_MODE (x), mem_mode))
+    return 0;
+
+  x_addr = canon_rtx (x_addr);
+  mem_addr = canon_rtx (mem_addr);
+
+  if (! memrefs_conflict_p (GET_MODE_SIZE (mem_mode), mem_addr,
+                           SIZE_FOR_MODE (x), x_addr, 0))
+    return 0;
+
+  if (aliases_everything_p (x))
+    return 1;
+
+  /* We cannot use aliases_everyting_p to test MEM, since we must look
+     at MEM_MODE, rather than GET_MODE (MEM).  */
+  if (mem_mode == QImode || GET_CODE (mem_addr) == AND)
+    return 1;
+
+  /* In true_dependence we also allow BLKmode to alias anything.  Why
+     don't we do this in anti_dependence and output_dependence?  */
+  if (mem_mode == BLKmode || GET_MODE (x) == BLKmode)
+    return 1;
+
+  return ! fixed_scalar_and_varying_struct_p (mem, x, mem_addr, x_addr,
+                                             varies);
+}
+
+/* Canonical true dependence: X is read after store in MEM takes place.
+   Variant of true_dependece which assumes MEM has already been 
+   canonicalized (hence we no longer do that here).  
+   The mem_addr argument has been added, since true_dependence computed 
+   this value prior to canonicalizing.  */
+
+int
+canon_true_dependence (mem, mem_mode, mem_addr, x, varies)
+     rtx mem, mem_addr, x;
+     enum machine_mode mem_mode;
+     int (*varies) PARAMS ((rtx, int));
+{
+  register rtx x_addr;
+
+  if (MEM_VOLATILE_P (x) && MEM_VOLATILE_P (mem))
+    return 1;
+
+  if (DIFFERENT_ALIAS_SETS_P (x, mem))
+    return 0;
+
   /* If X is an unchanging read, then it can't possibly conflict with any
      non-unchanging store.  It may conflict with an unchanging write though,
      because there may be a single store to this address to initialize it.
@@ -1584,24 +1795,12 @@ true_dependence (mem, mem_mode, x, varies)
   if (RTX_UNCHANGING_P (x) && ! RTX_UNCHANGING_P (mem))
     return 0;
 
-  base = find_base_term (x);
-  if (base && (GET_CODE (base) == LABEL_REF
-              || (GET_CODE (base) == SYMBOL_REF
-                  && CONSTANT_POOL_ADDRESS_P (base))))
-    return 0;
-
-  if (mem_mode == VOIDmode)
-    mem_mode = GET_MODE (mem);
-
   x_addr = get_addr (XEXP (x, 0));
-  mem_addr = get_addr (XEXP (mem, 0));
 
   if (! base_alias_check (x_addr, mem_addr, GET_MODE (x), mem_mode))
     return 0;
 
   x_addr = canon_rtx (x_addr);
-  mem_addr = canon_rtx (mem_addr);
-
   if (! memrefs_conflict_p (GET_MODE_SIZE (mem_mode), mem_addr,
                            SIZE_FOR_MODE (x), x_addr, 0))
     return 0;
@@ -1642,25 +1841,28 @@ write_dependence_p (mem, x, writep)
   if (DIFFERENT_ALIAS_SETS_P (x, mem))
     return 0;
 
+  /* Unchanging memory can't conflict with non-unchanging memory.  */
+  if (RTX_UNCHANGING_P (x) != RTX_UNCHANGING_P (mem))
+    return 0;
+
   /* If MEM is an unchanging read, then it can't possibly conflict with
      the store to X, because there is at most one store to MEM, and it must
      have occurred somewhere before MEM.  */
+  if (! writep && RTX_UNCHANGING_P (mem))
+    return 0;
+
+  x_addr = get_addr (XEXP (x, 0));
+  mem_addr = get_addr (XEXP (mem, 0));
+
   if (! writep)
     {
-      if (RTX_UNCHANGING_P (mem))
-       return 0;
-
-      base = find_base_term (mem);
+      base = find_base_term (mem_addr);
       if (base && (GET_CODE (base) == LABEL_REF
                   || (GET_CODE (base) == SYMBOL_REF
                       && CONSTANT_POOL_ADDRESS_P (base))))
        return 0;
     }
 
-
-  x_addr = get_addr (XEXP (x, 0));
-  mem_addr = get_addr (XEXP (mem, 0));
-
   if (! base_alias_check (x_addr, mem_addr, GET_MODE (x),
                          GET_MODE (mem)))
     return 0;
@@ -1700,11 +1902,11 @@ output_dependence (mem, x)
   return write_dependence_p (mem, x, /*writep=*/1);
 }
 
-/* Returns non-zero if X might refer to something which is not
+/* Returns non-zero if X mentions something which is not
    local to the function and is not constant.  */
 
 static int
-nonlocal_reference_p (x)
+nonlocal_mentioned_p (x)
      rtx x;
 {
   rtx base;
@@ -1735,7 +1937,7 @@ nonlocal_reference_p (x)
        {
          /* Global registers are not local.  */
          if (REGNO (SUBREG_REG (x)) < FIRST_PSEUDO_REGISTER
-             && global_regs[REGNO (SUBREG_REG (x)) + SUBREG_WORD (x)])
+             && global_regs[subreg_regno (x)])
            return 1;
          return 0;
        }
@@ -1764,13 +1966,7 @@ nonlocal_reference_p (x)
       return 1;
 
     case CALL:
-      /* Recursion introduces no additional considerations.  */
-      if (GET_CODE (XEXP (x, 0)) == MEM
-         && GET_CODE (XEXP (XEXP (x, 0), 0)) == SYMBOL_REF
-         && strcmp(XSTR (XEXP (XEXP (x, 0), 0), 0),
-                   IDENTIFIER_POINTER (
-                         DECL_ASSEMBLER_NAME (current_function_decl))) == 0)
-       return 0;
+      /* Non-constant calls and recursion are not local.  */
       return 1;
 
     case MEM:
@@ -1801,10 +1997,16 @@ nonlocal_reference_p (x)
        }
       return 1;
 
+    case UNSPEC_VOLATILE:
     case ASM_INPUT:
-    case ASM_OPERANDS:
       return 1;
 
+    case ASM_OPERANDS:
+      if (MEM_VOLATILE_P (x))
+       return 1;
+
+    /* FALLTHROUGH */
+
     default:
       break;
     }
@@ -1819,14 +2021,14 @@ nonlocal_reference_p (x)
       {
        if (fmt[i] == 'e' && XEXP (x, i))
          {
-           if (nonlocal_reference_p (XEXP (x, i)))
+           if (nonlocal_mentioned_p (XEXP (x, i)))
              return 1;
          }
        else if (fmt[i] == 'E')
          {
            register int j;
            for (j = 0; j < XVECLEN (x, i); j++)
-             if (nonlocal_reference_p (XVECEXP (x, i, j)))
+             if (nonlocal_mentioned_p (XVECEXP (x, i, j)))
                return 1;
          }
       }
@@ -1835,28 +2037,134 @@ nonlocal_reference_p (x)
   return 0;
 }
 
+/* Return non-zero if a loop (natural or otherwise) is present.
+   Inspired by Depth_First_Search_PP described in:
+
+     Advanced Compiler Design and Implementation
+     Steven Muchnick
+     Morgan Kaufmann, 1997
+
+   and heavily borrowed from flow_depth_first_order_compute.  */
+
+static int
+loop_p ()
+{
+  edge *stack;
+  int *pre;
+  int *post;
+  int sp;
+  int prenum = 1;
+  int postnum = 1;
+  sbitmap visited;
+
+  /* Allocate the preorder and postorder number arrays.  */
+  pre = (int *) xcalloc (n_basic_blocks, sizeof (int));
+  post = (int *) xcalloc (n_basic_blocks, sizeof (int));
+
+  /* Allocate stack for back-tracking up CFG.  */
+  stack = (edge *) xmalloc ((n_basic_blocks + 1) * sizeof (edge));
+  sp = 0;
+
+  /* Allocate bitmap to track nodes that have been visited.  */
+  visited = sbitmap_alloc (n_basic_blocks);
+
+  /* None of the nodes in the CFG have been visited yet.  */
+  sbitmap_zero (visited);
+
+  /* Push the first edge on to the stack.  */
+  stack[sp++] = ENTRY_BLOCK_PTR->succ;
+
+  while (sp)
+    {
+      edge e;
+      basic_block src;
+      basic_block dest;
+
+      /* Look at the edge on the top of the stack.  */
+      e = stack[sp - 1];
+      src = e->src;
+      dest = e->dest;
+
+      /* Check if the edge destination has been visited yet.  */
+      if (dest != EXIT_BLOCK_PTR && ! TEST_BIT (visited, dest->index))
+       {
+         /* Mark that we have visited the destination.  */
+         SET_BIT (visited, dest->index);
+
+         pre[dest->index] = prenum++;
+
+         if (dest->succ)
+           {
+             /* Since the DEST node has been visited for the first
+                time, check its successors.  */
+             stack[sp++] = dest->succ;
+           }
+         else
+           post[dest->index] = postnum++;
+       }
+      else
+       {
+         if (dest != EXIT_BLOCK_PTR
+             && pre[src->index] >= pre[dest->index]
+             && post[dest->index] == 0)
+           break;
+
+         if (! e->succ_next && src != ENTRY_BLOCK_PTR)
+           post[src->index] = postnum++;
+
+         if (e->succ_next)
+           stack[sp - 1] = e->succ_next;
+         else
+           sp--;
+       }
+    }
+
+  free (pre);
+  free (post);
+  free (stack);
+  sbitmap_free (visited);
+
+  return sp;
+}
+
 /* Mark the function if it is constant.  */
 
 void
 mark_constant_function ()
 {
   rtx insn;
+  int nonlocal_mentioned;
 
   if (TREE_PUBLIC (current_function_decl)
       || TREE_READONLY (current_function_decl)
+      || DECL_IS_PURE (current_function_decl)
       || TREE_THIS_VOLATILE (current_function_decl)
       || TYPE_MODE (TREE_TYPE (current_function_decl)) == VOIDmode)
     return;
 
+  /* A loop might not return which counts as a side effect.  */
+  if (loop_p ())
+    return;
+
+  nonlocal_mentioned = 0;
+
+  init_alias_analysis ();
+
   /* Determine if this is a constant function.  */
 
   for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
-    if (INSN_P (insn) && nonlocal_reference_p (insn))
-      return;
+    if (INSN_P (insn) && nonlocal_mentioned_p (insn))
+      {
+       nonlocal_mentioned = 1;
+       break;
+      }
+
+  end_alias_analysis ();
 
   /* Mark the function.  */
 
-  TREE_READONLY (current_function_decl) = 1;
+  if (! nonlocal_mentioned)
+    TREE_READONLY (current_function_decl) = 1;
 }
 
 
@@ -1907,8 +2215,7 @@ init_alias_analysis ()
      registers.  */
   reg_base_value_size = maxreg * 2;
   reg_base_value = (rtx *) xcalloc (reg_base_value_size, sizeof (rtx));
-  if (ggc_p)
-    ggc_add_rtx_root (reg_base_value, reg_base_value_size);
+  ggc_add_rtx_root (reg_base_value, reg_base_value_size);
 
   new_reg_base_value = (rtx *) xmalloc (reg_base_value_size * sizeof (rtx));
   reg_seen = (char *) xmalloc (reg_base_value_size);
@@ -1917,9 +2224,8 @@ init_alias_analysis ()
       /* ??? Why are we realloc'ing if we're just going to zero it?  */
       alias_invariant = (rtx *)xrealloc (alias_invariant,
                                         reg_base_value_size * sizeof (rtx));
-      bzero ((char *)alias_invariant, reg_base_value_size * sizeof (rtx));
+      memset ((char *)alias_invariant, 0, reg_base_value_size * sizeof (rtx));
     }
-    
 
   /* The basic idea is that each pass through this loop will use the
      "constant" information from the previous pass to propagate alias
@@ -1955,10 +2261,10 @@ init_alias_analysis ()
       copying_arguments = 1;
 
       /* Wipe the potential alias information clean for this pass.  */
-      bzero ((char *) new_reg_base_value, reg_base_value_size * sizeof (rtx));
+      memset ((char *) new_reg_base_value, 0, reg_base_value_size * sizeof (rtx));
 
       /* Wipe the reg_seen array clean.  */
-      bzero ((char *) reg_seen, reg_base_value_size);
+      memset ((char *) reg_seen, 0, reg_base_value_size);
 
       /* Mark all hard registers which may contain an address.
         The stack, frame and argument pointers may contain an address.
@@ -1983,15 +2289,6 @@ init_alias_analysis ()
       new_reg_base_value[HARD_FRAME_POINTER_REGNUM]
        = gen_rtx_ADDRESS (Pmode, hard_frame_pointer_rtx);
 #endif
-      if (struct_value_incoming_rtx
-         && GET_CODE (struct_value_incoming_rtx) == REG)
-       new_reg_base_value[REGNO (struct_value_incoming_rtx)]
-         = gen_rtx_ADDRESS (Pmode, struct_value_incoming_rtx);
-
-      if (static_chain_rtx
-         && GET_CODE (static_chain_rtx) == REG)
-       new_reg_base_value[REGNO (static_chain_rtx)]
-         = gen_rtx_ADDRESS (Pmode, static_chain_rtx);
 
       /* Walk the insns adding values to the new_reg_base_value array.  */
       for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
@@ -2025,17 +2322,42 @@ init_alias_analysis ()
 
              if (set != 0
                  && GET_CODE (SET_DEST (set)) == REG
-                 && REGNO (SET_DEST (set)) >= FIRST_PSEUDO_REGISTER
-                 && REG_NOTES (insn) != 0
-                 && (((note = find_reg_note (insn, REG_EQUAL, 0)) != 0
-                      && REG_N_SETS (REGNO (SET_DEST (set))) == 1)
-                     || (note = find_reg_note (insn, REG_EQUIV, NULL_RTX)) != 0)
-                 && GET_CODE (XEXP (note, 0)) != EXPR_LIST
-                 && ! reg_overlap_mentioned_p (SET_DEST (set), XEXP (note, 0)))
+                 && REGNO (SET_DEST (set)) >= FIRST_PSEUDO_REGISTER)
                {
-                 int regno = REGNO (SET_DEST (set));
-                 reg_known_value[regno] = XEXP (note, 0);
-                 reg_known_equiv_p[regno] = REG_NOTE_KIND (note) == REG_EQUIV;
+                 unsigned int regno = REGNO (SET_DEST (set));
+                 rtx src = SET_SRC (set);
+
+                 if (REG_NOTES (insn) != 0
+                     && (((note = find_reg_note (insn, REG_EQUAL, 0)) != 0
+                          && REG_N_SETS (regno) == 1)
+                         || (note = find_reg_note (insn, REG_EQUIV, NULL_RTX)) != 0)
+                     && GET_CODE (XEXP (note, 0)) != EXPR_LIST
+                     && ! rtx_varies_p (XEXP (note, 0), 1)
+                     && ! reg_overlap_mentioned_p (SET_DEST (set), XEXP (note, 0)))
+                   {
+                     reg_known_value[regno] = XEXP (note, 0);
+                     reg_known_equiv_p[regno] = REG_NOTE_KIND (note) == REG_EQUIV;
+                   }
+                 else if (REG_N_SETS (regno) == 1
+                          && GET_CODE (src) == PLUS
+                          && GET_CODE (XEXP (src, 0)) == REG
+                          && REGNO (XEXP (src, 0)) >= FIRST_PSEUDO_REGISTER
+                          && (reg_known_value[REGNO (XEXP (src, 0))])
+                          && GET_CODE (XEXP (src, 1)) == CONST_INT)
+                   {
+                     rtx op0 = XEXP (src, 0);
+                     op0 = reg_known_value[REGNO (op0)];
+                     reg_known_value[regno]
+                       = plus_constant_for_output (op0,
+                                                   INTVAL (XEXP (src, 1)));
+                     reg_known_equiv_p[regno] = 0;
+                   }
+                 else if (REG_N_SETS (regno) == 1
+                          && ! rtx_varies_p (src, 1))
+                   {
+                     reg_known_value[regno] = src;
+                     reg_known_equiv_p[regno] = 0;
+                   }
                }
            }
          else if (GET_CODE (insn) == NOTE
@@ -2110,8 +2432,7 @@ end_alias_analysis ()
   reg_known_equiv_p = 0;
   if (reg_base_value)
     {
-      if (ggc_p)
-       ggc_del_root (reg_base_value);
+      ggc_del_root (reg_base_value);
       free (reg_base_value);
       reg_base_value = 0;
     }