OSDN Git Service

2013-04-12 Hristian Kirtchev <kirtchev@adacore.com>
[pf3gnuchains/gcc-fork.git] / gcc / alias.c
1 /* Alias analysis for GNU C
2    Copyright (C) 1997-2013 Free Software Foundation, Inc.
3    Contributed by John Carr (jfc@mit.edu).
4
5 This file is part of GCC.
6
7 GCC is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 3, or (at your option) any later
10 version.
11
12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GCC; see the file COPYING3.  If not see
19 <http://www.gnu.org/licenses/>.  */
20
21 #include "config.h"
22 #include "system.h"
23 #include "coretypes.h"
24 #include "tm.h"
25 #include "rtl.h"
26 #include "tree.h"
27 #include "tm_p.h"
28 #include "function.h"
29 #include "alias.h"
30 #include "emit-rtl.h"
31 #include "regs.h"
32 #include "hard-reg-set.h"
33 #include "basic-block.h"
34 #include "flags.h"
35 #include "diagnostic-core.h"
36 #include "cselib.h"
37 #include "splay-tree.h"
38 #include "ggc.h"
39 #include "langhooks.h"
40 #include "timevar.h"
41 #include "dumpfile.h"
42 #include "target.h"
43 #include "cgraph.h"
44 #include "df.h"
45 #include "tree-ssa-alias.h"
46 #include "pointer-set.h"
47 #include "tree-flow.h"
48
49 /* The aliasing API provided here solves related but different problems:
50
51    Say there exists (in c)
52
53    struct X {
54      struct Y y1;
55      struct Z z2;
56    } x1, *px1,  *px2;
57
58    struct Y y2, *py;
59    struct Z z2, *pz;
60
61
62    py = &x1.y1;
63    px2 = &x1;
64
65    Consider the four questions:
66
67    Can a store to x1 interfere with px2->y1?
68    Can a store to x1 interfere with px2->z2?
69    Can a store to x1 change the value pointed to by with py?
70    Can a store to x1 change the value pointed to by with pz?
71
72    The answer to these questions can be yes, yes, yes, and maybe.
73
74    The first two questions can be answered with a simple examination
75    of the type system.  If structure X contains a field of type Y then
76    a store through a pointer to an X can overwrite any field that is
77    contained (recursively) in an X (unless we know that px1 != px2).
78
79    The last two questions can be solved in the same way as the first
80    two questions but this is too conservative.  The observation is
81    that in some cases we can know which (if any) fields are addressed
82    and if those addresses are used in bad ways.  This analysis may be
83    language specific.  In C, arbitrary operations may be applied to
84    pointers.  However, there is some indication that this may be too
85    conservative for some C++ types.
86
87    The pass ipa-type-escape does this analysis for the types whose
88    instances do not escape across the compilation boundary.
89
90    Historically in GCC, these two problems were combined and a single
91    data structure that was used to represent the solution to these
92    problems.  We now have two similar but different data structures,
93    The data structure to solve the last two questions is similar to
94    the first, but does not contain the fields whose address are never
95    taken.  For types that do escape the compilation unit, the data
96    structures will have identical information.
97 */
98
99 /* The alias sets assigned to MEMs assist the back-end in determining
100    which MEMs can alias which other MEMs.  In general, two MEMs in
101    different alias sets cannot alias each other, with one important
102    exception.  Consider something like:
103
104      struct S { int i; double d; };
105
106    a store to an `S' can alias something of either type `int' or type
107    `double'.  (However, a store to an `int' cannot alias a `double'
108    and vice versa.)  We indicate this via a tree structure that looks
109    like:
110            struct S
111             /   \
112            /     \
113          |/_     _\|
114          int    double
115
116    (The arrows are directed and point downwards.)
117     In this situation we say the alias set for `struct S' is the
118    `superset' and that those for `int' and `double' are `subsets'.
119
120    To see whether two alias sets can point to the same memory, we must
121    see if either alias set is a subset of the other. We need not trace
122    past immediate descendants, however, since we propagate all
123    grandchildren up one level.
124
125    Alias set zero is implicitly a superset of all other alias sets.
126    However, this is no actual entry for alias set zero.  It is an
127    error to attempt to explicitly construct a subset of zero.  */
128
129 struct GTY(()) alias_set_entry_d {
130   /* The alias set number, as stored in MEM_ALIAS_SET.  */
131   alias_set_type alias_set;
132
133   /* Nonzero if would have a child of zero: this effectively makes this
134      alias set the same as alias set zero.  */
135   int has_zero_child;
136
137   /* The children of the alias set.  These are not just the immediate
138      children, but, in fact, all descendants.  So, if we have:
139
140        struct T { struct S s; float f; }
141
142      continuing our example above, the children here will be all of
143      `int', `double', `float', and `struct S'.  */
144   splay_tree GTY((param1_is (int), param2_is (int))) children;
145 };
146 typedef struct alias_set_entry_d *alias_set_entry;
147
148 static int rtx_equal_for_memref_p (const_rtx, const_rtx);
149 static int memrefs_conflict_p (int, rtx, int, rtx, HOST_WIDE_INT);
150 static void record_set (rtx, const_rtx, void *);
151 static int base_alias_check (rtx, rtx, rtx, rtx, enum machine_mode,
152                              enum machine_mode);
153 static rtx find_base_value (rtx);
154 static int mems_in_disjoint_alias_sets_p (const_rtx, const_rtx);
155 static int insert_subset_children (splay_tree_node, void*);
156 static alias_set_entry get_alias_set_entry (alias_set_type);
157 static bool nonoverlapping_component_refs_p (const_rtx, const_rtx);
158 static tree decl_for_component_ref (tree);
159 static int write_dependence_p (const_rtx, const_rtx, int);
160
161 static void memory_modified_1 (rtx, const_rtx, void *);
162
163 /* Set up all info needed to perform alias analysis on memory references.  */
164
165 /* Returns the size in bytes of the mode of X.  */
166 #define SIZE_FOR_MODE(X) (GET_MODE_SIZE (GET_MODE (X)))
167
168 /* Cap the number of passes we make over the insns propagating alias
169    information through set chains.
170    ??? 10 is a completely arbitrary choice.  This should be based on the
171    maximum loop depth in the CFG, but we do not have this information
172    available (even if current_loops _is_ available).  */
173 #define MAX_ALIAS_LOOP_PASSES 10
174
175 /* reg_base_value[N] gives an address to which register N is related.
176    If all sets after the first add or subtract to the current value
177    or otherwise modify it so it does not point to a different top level
178    object, reg_base_value[N] is equal to the address part of the source
179    of the first set.
180
181    A base address can be an ADDRESS, SYMBOL_REF, or LABEL_REF.  ADDRESS
182    expressions represent three types of base:
183
184      1. incoming arguments.  There is just one ADDRESS to represent all
185         arguments, since we do not know at this level whether accesses
186         based on different arguments can alias.  The ADDRESS has id 0.
187
188      2. stack_pointer_rtx, frame_pointer_rtx, hard_frame_pointer_rtx
189         (if distinct from frame_pointer_rtx) and arg_pointer_rtx.
190         Each of these rtxes has a separate ADDRESS associated with it,
191         each with a negative id.
192
193         GCC is (and is required to be) precise in which register it
194         chooses to access a particular region of stack.  We can therefore
195         assume that accesses based on one of these rtxes do not alias
196         accesses based on another of these rtxes.
197
198      3. bases that are derived from malloc()ed memory (REG_NOALIAS).
199         Each such piece of memory has a separate ADDRESS associated
200         with it, each with an id greater than 0.
201
202    Accesses based on one ADDRESS do not alias accesses based on other
203    ADDRESSes.  Accesses based on ADDRESSes in groups (2) and (3) do not
204    alias globals either; the ADDRESSes have Pmode to indicate this.
205    The ADDRESS in group (1) _may_ alias globals; it has VOIDmode to
206    indicate this.  */
207
208 static GTY(()) vec<rtx, va_gc> *reg_base_value;
209 static rtx *new_reg_base_value;
210
211 /* The single VOIDmode ADDRESS that represents all argument bases.
212    It has id 0.  */
213 static GTY(()) rtx arg_base_value;
214
215 /* Used to allocate unique ids to each REG_NOALIAS ADDRESS.  */
216 static int unique_id;
217
218 /* We preserve the copy of old array around to avoid amount of garbage
219    produced.  About 8% of garbage produced were attributed to this
220    array.  */
221 static GTY((deletable)) vec<rtx, va_gc> *old_reg_base_value;
222
223 /* Values of XINT (address, 0) of Pmode ADDRESS rtxes for special
224    registers.  */
225 #define UNIQUE_BASE_VALUE_SP    -1
226 #define UNIQUE_BASE_VALUE_ARGP  -2
227 #define UNIQUE_BASE_VALUE_FP    -3
228 #define UNIQUE_BASE_VALUE_HFP   -4
229
230 #define static_reg_base_value \
231   (this_target_rtl->x_static_reg_base_value)
232
233 #define REG_BASE_VALUE(X)                                       \
234   (REGNO (X) < vec_safe_length (reg_base_value)                 \
235    ? (*reg_base_value)[REGNO (X)] : 0)
236
237 /* Vector indexed by N giving the initial (unchanging) value known for
238    pseudo-register N.  This vector is initialized in init_alias_analysis,
239    and does not change until end_alias_analysis is called.  */
240 static GTY(()) vec<rtx, va_gc> *reg_known_value;
241
242 /* Vector recording for each reg_known_value whether it is due to a
243    REG_EQUIV note.  Future passes (viz., reload) may replace the
244    pseudo with the equivalent expression and so we account for the
245    dependences that would be introduced if that happens.
246
247    The REG_EQUIV notes created in assign_parms may mention the arg
248    pointer, and there are explicit insns in the RTL that modify the
249    arg pointer.  Thus we must ensure that such insns don't get
250    scheduled across each other because that would invalidate the
251    REG_EQUIV notes.  One could argue that the REG_EQUIV notes are
252    wrong, but solving the problem in the scheduler will likely give
253    better code, so we do it here.  */
254 static sbitmap reg_known_equiv_p;
255
256 /* True when scanning insns from the start of the rtl to the
257    NOTE_INSN_FUNCTION_BEG note.  */
258 static bool copying_arguments;
259
260
261 /* The splay-tree used to store the various alias set entries.  */
262 static GTY (()) vec<alias_set_entry, va_gc> *alias_sets;
263 \f
264 /* Build a decomposed reference object for querying the alias-oracle
265    from the MEM rtx and store it in *REF.
266    Returns false if MEM is not suitable for the alias-oracle.  */
267
268 static bool
269 ao_ref_from_mem (ao_ref *ref, const_rtx mem)
270 {
271   tree expr = MEM_EXPR (mem);
272   tree base;
273
274   if (!expr)
275     return false;
276
277   ao_ref_init (ref, expr);
278
279   /* Get the base of the reference and see if we have to reject or
280      adjust it.  */
281   base = ao_ref_base (ref);
282   if (base == NULL_TREE)
283     return false;
284
285   /* The tree oracle doesn't like bases that are neither decls
286      nor indirect references of SSA names.  */
287   if (!(DECL_P (base)
288         || (TREE_CODE (base) == MEM_REF
289             && TREE_CODE (TREE_OPERAND (base, 0)) == SSA_NAME)
290         || (TREE_CODE (base) == TARGET_MEM_REF
291             && TREE_CODE (TMR_BASE (base)) == SSA_NAME)))
292     return false;
293
294   /* If this is a reference based on a partitioned decl replace the
295      base with a MEM_REF of the pointer representative we
296      created during stack slot partitioning.  */
297   if (TREE_CODE (base) == VAR_DECL
298       && ! is_global_var (base)
299       && cfun->gimple_df->decls_to_pointers != NULL)
300     {
301       void *namep;
302       namep = pointer_map_contains (cfun->gimple_df->decls_to_pointers, base);
303       if (namep)
304         ref->base = build_simple_mem_ref (*(tree *)namep);
305     }
306
307   ref->ref_alias_set = MEM_ALIAS_SET (mem);
308
309   /* If MEM_OFFSET or MEM_SIZE are unknown what we got from MEM_EXPR
310      is conservative, so trust it.  */
311   if (!MEM_OFFSET_KNOWN_P (mem)
312       || !MEM_SIZE_KNOWN_P (mem))
313     return true;
314
315   /* If the base decl is a parameter we can have negative MEM_OFFSET in
316      case of promoted subregs on bigendian targets.  Trust the MEM_EXPR
317      here.  */
318   if (MEM_OFFSET (mem) < 0
319       && (MEM_SIZE (mem) + MEM_OFFSET (mem)) * BITS_PER_UNIT == ref->size)
320     return true;
321
322   /* Otherwise continue and refine size and offset we got from analyzing
323      MEM_EXPR by using MEM_SIZE and MEM_OFFSET.  */
324
325   ref->offset += MEM_OFFSET (mem) * BITS_PER_UNIT;
326   ref->size = MEM_SIZE (mem) * BITS_PER_UNIT;
327
328   /* The MEM may extend into adjacent fields, so adjust max_size if
329      necessary.  */
330   if (ref->max_size != -1
331       && ref->size > ref->max_size)
332     ref->max_size = ref->size;
333
334   /* If MEM_OFFSET and MEM_SIZE get us outside of the base object of
335      the MEM_EXPR punt.  This happens for STRICT_ALIGNMENT targets a lot.  */
336   if (MEM_EXPR (mem) != get_spill_slot_decl (false)
337       && (ref->offset < 0
338           || (DECL_P (ref->base)
339               && (!host_integerp (DECL_SIZE (ref->base), 1)
340                   || (TREE_INT_CST_LOW (DECL_SIZE ((ref->base)))
341                       < (unsigned HOST_WIDE_INT)(ref->offset + ref->size))))))
342     return false;
343
344   return true;
345 }
346
347 /* Query the alias-oracle on whether the two memory rtx X and MEM may
348    alias.  If TBAA_P is set also apply TBAA.  Returns true if the
349    two rtxen may alias, false otherwise.  */
350
351 static bool
352 rtx_refs_may_alias_p (const_rtx x, const_rtx mem, bool tbaa_p)
353 {
354   ao_ref ref1, ref2;
355
356   if (!ao_ref_from_mem (&ref1, x)
357       || !ao_ref_from_mem (&ref2, mem))
358     return true;
359
360   return refs_may_alias_p_1 (&ref1, &ref2,
361                              tbaa_p
362                              && MEM_ALIAS_SET (x) != 0
363                              && MEM_ALIAS_SET (mem) != 0);
364 }
365
366 /* Returns a pointer to the alias set entry for ALIAS_SET, if there is
367    such an entry, or NULL otherwise.  */
368
369 static inline alias_set_entry
370 get_alias_set_entry (alias_set_type alias_set)
371 {
372   return (*alias_sets)[alias_set];
373 }
374
375 /* Returns nonzero if the alias sets for MEM1 and MEM2 are such that
376    the two MEMs cannot alias each other.  */
377
378 static inline int
379 mems_in_disjoint_alias_sets_p (const_rtx mem1, const_rtx mem2)
380 {
381 /* Perform a basic sanity check.  Namely, that there are no alias sets
382    if we're not using strict aliasing.  This helps to catch bugs
383    whereby someone uses PUT_CODE, but doesn't clear MEM_ALIAS_SET, or
384    where a MEM is allocated in some way other than by the use of
385    gen_rtx_MEM, and the MEM_ALIAS_SET is not cleared.  If we begin to
386    use alias sets to indicate that spilled registers cannot alias each
387    other, we might need to remove this check.  */
388   gcc_assert (flag_strict_aliasing
389               || (!MEM_ALIAS_SET (mem1) && !MEM_ALIAS_SET (mem2)));
390
391   return ! alias_sets_conflict_p (MEM_ALIAS_SET (mem1), MEM_ALIAS_SET (mem2));
392 }
393
394 /* Insert the NODE into the splay tree given by DATA.  Used by
395    record_alias_subset via splay_tree_foreach.  */
396
397 static int
398 insert_subset_children (splay_tree_node node, void *data)
399 {
400   splay_tree_insert ((splay_tree) data, node->key, node->value);
401
402   return 0;
403 }
404
405 /* Return true if the first alias set is a subset of the second.  */
406
407 bool
408 alias_set_subset_of (alias_set_type set1, alias_set_type set2)
409 {
410   alias_set_entry ase;
411
412   /* Everything is a subset of the "aliases everything" set.  */
413   if (set2 == 0)
414     return true;
415
416   /* Otherwise, check if set1 is a subset of set2.  */
417   ase = get_alias_set_entry (set2);
418   if (ase != 0
419       && (ase->has_zero_child
420           || splay_tree_lookup (ase->children,
421                                 (splay_tree_key) set1)))
422     return true;
423   return false;
424 }
425
426 /* Return 1 if the two specified alias sets may conflict.  */
427
428 int
429 alias_sets_conflict_p (alias_set_type set1, alias_set_type set2)
430 {
431   alias_set_entry ase;
432
433   /* The easy case.  */
434   if (alias_sets_must_conflict_p (set1, set2))
435     return 1;
436
437   /* See if the first alias set is a subset of the second.  */
438   ase = get_alias_set_entry (set1);
439   if (ase != 0
440       && (ase->has_zero_child
441           || splay_tree_lookup (ase->children,
442                                 (splay_tree_key) set2)))
443     return 1;
444
445   /* Now do the same, but with the alias sets reversed.  */
446   ase = get_alias_set_entry (set2);
447   if (ase != 0
448       && (ase->has_zero_child
449           || splay_tree_lookup (ase->children,
450                                 (splay_tree_key) set1)))
451     return 1;
452
453   /* The two alias sets are distinct and neither one is the
454      child of the other.  Therefore, they cannot conflict.  */
455   return 0;
456 }
457
458 /* Return 1 if the two specified alias sets will always conflict.  */
459
460 int
461 alias_sets_must_conflict_p (alias_set_type set1, alias_set_type set2)
462 {
463   if (set1 == 0 || set2 == 0 || set1 == set2)
464     return 1;
465
466   return 0;
467 }
468
469 /* Return 1 if any MEM object of type T1 will always conflict (using the
470    dependency routines in this file) with any MEM object of type T2.
471    This is used when allocating temporary storage.  If T1 and/or T2 are
472    NULL_TREE, it means we know nothing about the storage.  */
473
474 int
475 objects_must_conflict_p (tree t1, tree t2)
476 {
477   alias_set_type set1, set2;
478
479   /* If neither has a type specified, we don't know if they'll conflict
480      because we may be using them to store objects of various types, for
481      example the argument and local variables areas of inlined functions.  */
482   if (t1 == 0 && t2 == 0)
483     return 0;
484
485   /* If they are the same type, they must conflict.  */
486   if (t1 == t2
487       /* Likewise if both are volatile.  */
488       || (t1 != 0 && TYPE_VOLATILE (t1) && t2 != 0 && TYPE_VOLATILE (t2)))
489     return 1;
490
491   set1 = t1 ? get_alias_set (t1) : 0;
492   set2 = t2 ? get_alias_set (t2) : 0;
493
494   /* We can't use alias_sets_conflict_p because we must make sure
495      that every subtype of t1 will conflict with every subtype of
496      t2 for which a pair of subobjects of these respective subtypes
497      overlaps on the stack.  */
498   return alias_sets_must_conflict_p (set1, set2);
499 }
500 \f
501 /* Return true if all nested component references handled by
502    get_inner_reference in T are such that we should use the alias set
503    provided by the object at the heart of T.
504
505    This is true for non-addressable components (which don't have their
506    own alias set), as well as components of objects in alias set zero.
507    This later point is a special case wherein we wish to override the
508    alias set used by the component, but we don't have per-FIELD_DECL
509    assignable alias sets.  */
510
511 bool
512 component_uses_parent_alias_set (const_tree t)
513 {
514   while (1)
515     {
516       /* If we're at the end, it vacuously uses its own alias set.  */
517       if (!handled_component_p (t))
518         return false;
519
520       switch (TREE_CODE (t))
521         {
522         case COMPONENT_REF:
523           if (DECL_NONADDRESSABLE_P (TREE_OPERAND (t, 1)))
524             return true;
525           break;
526
527         case ARRAY_REF:
528         case ARRAY_RANGE_REF:
529           if (TYPE_NONALIASED_COMPONENT (TREE_TYPE (TREE_OPERAND (t, 0))))
530             return true;
531           break;
532
533         case REALPART_EXPR:
534         case IMAGPART_EXPR:
535           break;
536
537         default:
538           /* Bitfields and casts are never addressable.  */
539           return true;
540         }
541
542       t = TREE_OPERAND (t, 0);
543       if (get_alias_set (TREE_TYPE (t)) == 0)
544         return true;
545     }
546 }
547
548 /* Return the alias set for the memory pointed to by T, which may be
549    either a type or an expression.  Return -1 if there is nothing
550    special about dereferencing T.  */
551
552 static alias_set_type
553 get_deref_alias_set_1 (tree t)
554 {
555   /* If we're not doing any alias analysis, just assume everything
556      aliases everything else.  */
557   if (!flag_strict_aliasing)
558     return 0;
559
560   /* All we care about is the type.  */
561   if (! TYPE_P (t))
562     t = TREE_TYPE (t);
563
564   /* If we have an INDIRECT_REF via a void pointer, we don't
565      know anything about what that might alias.  Likewise if the
566      pointer is marked that way.  */
567   if (TREE_CODE (TREE_TYPE (t)) == VOID_TYPE
568       || TYPE_REF_CAN_ALIAS_ALL (t))
569     return 0;
570
571   return -1;
572 }
573
574 /* Return the alias set for the memory pointed to by T, which may be
575    either a type or an expression.  */
576
577 alias_set_type
578 get_deref_alias_set (tree t)
579 {
580   alias_set_type set = get_deref_alias_set_1 (t);
581
582   /* Fall back to the alias-set of the pointed-to type.  */
583   if (set == -1)
584     {
585       if (! TYPE_P (t))
586         t = TREE_TYPE (t);
587       set = get_alias_set (TREE_TYPE (t));
588     }
589
590   return set;
591 }
592
593 /* Return the alias set for T, which may be either a type or an
594    expression.  Call language-specific routine for help, if needed.  */
595
596 alias_set_type
597 get_alias_set (tree t)
598 {
599   alias_set_type set;
600
601   /* If we're not doing any alias analysis, just assume everything
602      aliases everything else.  Also return 0 if this or its type is
603      an error.  */
604   if (! flag_strict_aliasing || t == error_mark_node
605       || (! TYPE_P (t)
606           && (TREE_TYPE (t) == 0 || TREE_TYPE (t) == error_mark_node)))
607     return 0;
608
609   /* We can be passed either an expression or a type.  This and the
610      language-specific routine may make mutually-recursive calls to each other
611      to figure out what to do.  At each juncture, we see if this is a tree
612      that the language may need to handle specially.  First handle things that
613      aren't types.  */
614   if (! TYPE_P (t))
615     {
616       tree inner;
617
618       /* Give the language a chance to do something with this tree
619          before we look at it.  */
620       STRIP_NOPS (t);
621       set = lang_hooks.get_alias_set (t);
622       if (set != -1)
623         return set;
624
625       /* Get the base object of the reference.  */
626       inner = t;
627       while (handled_component_p (inner))
628         {
629           /* If there is a VIEW_CONVERT_EXPR in the chain we cannot use
630              the type of any component references that wrap it to
631              determine the alias-set.  */
632           if (TREE_CODE (inner) == VIEW_CONVERT_EXPR)
633             t = TREE_OPERAND (inner, 0);
634           inner = TREE_OPERAND (inner, 0);
635         }
636
637       /* Handle pointer dereferences here, they can override the
638          alias-set.  */
639       if (INDIRECT_REF_P (inner))
640         {
641           set = get_deref_alias_set_1 (TREE_OPERAND (inner, 0));
642           if (set != -1)
643             return set;
644         }
645       else if (TREE_CODE (inner) == TARGET_MEM_REF)
646         return get_deref_alias_set (TMR_OFFSET (inner));
647       else if (TREE_CODE (inner) == MEM_REF)
648         {
649           set = get_deref_alias_set_1 (TREE_OPERAND (inner, 1));
650           if (set != -1)
651             return set;
652         }
653
654       /* If the innermost reference is a MEM_REF that has a
655          conversion embedded treat it like a VIEW_CONVERT_EXPR above,
656          using the memory access type for determining the alias-set.  */
657      if (TREE_CODE (inner) == MEM_REF
658          && TYPE_MAIN_VARIANT (TREE_TYPE (inner))
659             != TYPE_MAIN_VARIANT
660                (TREE_TYPE (TREE_TYPE (TREE_OPERAND (inner, 1)))))
661        return get_deref_alias_set (TREE_OPERAND (inner, 1));
662
663       /* Otherwise, pick up the outermost object that we could have a pointer
664          to, processing conversions as above.  */
665       while (component_uses_parent_alias_set (t))
666         {
667           t = TREE_OPERAND (t, 0);
668           STRIP_NOPS (t);
669         }
670
671       /* If we've already determined the alias set for a decl, just return
672          it.  This is necessary for C++ anonymous unions, whose component
673          variables don't look like union members (boo!).  */
674       if (TREE_CODE (t) == VAR_DECL
675           && DECL_RTL_SET_P (t) && MEM_P (DECL_RTL (t)))
676         return MEM_ALIAS_SET (DECL_RTL (t));
677
678       /* Now all we care about is the type.  */
679       t = TREE_TYPE (t);
680     }
681
682   /* Variant qualifiers don't affect the alias set, so get the main
683      variant.  */
684   t = TYPE_MAIN_VARIANT (t);
685
686   /* Always use the canonical type as well.  If this is a type that
687      requires structural comparisons to identify compatible types
688      use alias set zero.  */
689   if (TYPE_STRUCTURAL_EQUALITY_P (t))
690     {
691       /* Allow the language to specify another alias set for this
692          type.  */
693       set = lang_hooks.get_alias_set (t);
694       if (set != -1)
695         return set;
696       return 0;
697     }
698
699   t = TYPE_CANONICAL (t);
700
701   /* The canonical type should not require structural equality checks.  */
702   gcc_checking_assert (!TYPE_STRUCTURAL_EQUALITY_P (t));
703
704   /* If this is a type with a known alias set, return it.  */
705   if (TYPE_ALIAS_SET_KNOWN_P (t))
706     return TYPE_ALIAS_SET (t);
707
708   /* We don't want to set TYPE_ALIAS_SET for incomplete types.  */
709   if (!COMPLETE_TYPE_P (t))
710     {
711       /* For arrays with unknown size the conservative answer is the
712          alias set of the element type.  */
713       if (TREE_CODE (t) == ARRAY_TYPE)
714         return get_alias_set (TREE_TYPE (t));
715
716       /* But return zero as a conservative answer for incomplete types.  */
717       return 0;
718     }
719
720   /* See if the language has special handling for this type.  */
721   set = lang_hooks.get_alias_set (t);
722   if (set != -1)
723     return set;
724
725   /* There are no objects of FUNCTION_TYPE, so there's no point in
726      using up an alias set for them.  (There are, of course, pointers
727      and references to functions, but that's different.)  */
728   else if (TREE_CODE (t) == FUNCTION_TYPE || TREE_CODE (t) == METHOD_TYPE)
729     set = 0;
730
731   /* Unless the language specifies otherwise, let vector types alias
732      their components.  This avoids some nasty type punning issues in
733      normal usage.  And indeed lets vectors be treated more like an
734      array slice.  */
735   else if (TREE_CODE (t) == VECTOR_TYPE)
736     set = get_alias_set (TREE_TYPE (t));
737
738   /* Unless the language specifies otherwise, treat array types the
739      same as their components.  This avoids the asymmetry we get
740      through recording the components.  Consider accessing a
741      character(kind=1) through a reference to a character(kind=1)[1:1].
742      Or consider if we want to assign integer(kind=4)[0:D.1387] and
743      integer(kind=4)[4] the same alias set or not.
744      Just be pragmatic here and make sure the array and its element
745      type get the same alias set assigned.  */
746   else if (TREE_CODE (t) == ARRAY_TYPE && !TYPE_NONALIASED_COMPONENT (t))
747     set = get_alias_set (TREE_TYPE (t));
748
749   /* From the former common C and C++ langhook implementation:
750
751      Unfortunately, there is no canonical form of a pointer type.
752      In particular, if we have `typedef int I', then `int *', and
753      `I *' are different types.  So, we have to pick a canonical
754      representative.  We do this below.
755
756      Technically, this approach is actually more conservative that
757      it needs to be.  In particular, `const int *' and `int *'
758      should be in different alias sets, according to the C and C++
759      standard, since their types are not the same, and so,
760      technically, an `int **' and `const int **' cannot point at
761      the same thing.
762
763      But, the standard is wrong.  In particular, this code is
764      legal C++:
765
766      int *ip;
767      int **ipp = &ip;
768      const int* const* cipp = ipp;
769      And, it doesn't make sense for that to be legal unless you
770      can dereference IPP and CIPP.  So, we ignore cv-qualifiers on
771      the pointed-to types.  This issue has been reported to the
772      C++ committee.
773
774      In addition to the above canonicalization issue, with LTO
775      we should also canonicalize `T (*)[]' to `T *' avoiding
776      alias issues with pointer-to element types and pointer-to
777      array types.
778
779      Likewise we need to deal with the situation of incomplete
780      pointed-to types and make `*(struct X **)&a' and
781      `*(struct X {} **)&a' alias.  Otherwise we will have to
782      guarantee that all pointer-to incomplete type variants
783      will be replaced by pointer-to complete type variants if
784      they are available.
785
786      With LTO the convenient situation of using `void *' to
787      access and store any pointer type will also become
788      more apparent (and `void *' is just another pointer-to
789      incomplete type).  Assigning alias-set zero to `void *'
790      and all pointer-to incomplete types is a not appealing
791      solution.  Assigning an effective alias-set zero only
792      affecting pointers might be - by recording proper subset
793      relationships of all pointer alias-sets.
794
795      Pointer-to function types are another grey area which
796      needs caution.  Globbing them all into one alias-set
797      or the above effective zero set would work.
798
799      For now just assign the same alias-set to all pointers.
800      That's simple and avoids all the above problems.  */
801   else if (POINTER_TYPE_P (t)
802            && t != ptr_type_node)
803     set = get_alias_set (ptr_type_node);
804
805   /* Otherwise make a new alias set for this type.  */
806   else
807     {
808       /* Each canonical type gets its own alias set, so canonical types
809          shouldn't form a tree.  It doesn't really matter for types
810          we handle specially above, so only check it where it possibly
811          would result in a bogus alias set.  */
812       gcc_checking_assert (TYPE_CANONICAL (t) == t);
813
814       set = new_alias_set ();
815     }
816
817   TYPE_ALIAS_SET (t) = set;
818
819   /* If this is an aggregate type or a complex type, we must record any
820      component aliasing information.  */
821   if (AGGREGATE_TYPE_P (t) || TREE_CODE (t) == COMPLEX_TYPE)
822     record_component_aliases (t);
823
824   return set;
825 }
826
827 /* Return a brand-new alias set.  */
828
829 alias_set_type
830 new_alias_set (void)
831 {
832   if (flag_strict_aliasing)
833     {
834       if (alias_sets == 0)
835         vec_safe_push (alias_sets, (alias_set_entry) 0);
836       vec_safe_push (alias_sets, (alias_set_entry) 0);
837       return alias_sets->length () - 1;
838     }
839   else
840     return 0;
841 }
842
843 /* Indicate that things in SUBSET can alias things in SUPERSET, but that
844    not everything that aliases SUPERSET also aliases SUBSET.  For example,
845    in C, a store to an `int' can alias a load of a structure containing an
846    `int', and vice versa.  But it can't alias a load of a 'double' member
847    of the same structure.  Here, the structure would be the SUPERSET and
848    `int' the SUBSET.  This relationship is also described in the comment at
849    the beginning of this file.
850
851    This function should be called only once per SUPERSET/SUBSET pair.
852
853    It is illegal for SUPERSET to be zero; everything is implicitly a
854    subset of alias set zero.  */
855
856 void
857 record_alias_subset (alias_set_type superset, alias_set_type subset)
858 {
859   alias_set_entry superset_entry;
860   alias_set_entry subset_entry;
861
862   /* It is possible in complex type situations for both sets to be the same,
863      in which case we can ignore this operation.  */
864   if (superset == subset)
865     return;
866
867   gcc_assert (superset);
868
869   superset_entry = get_alias_set_entry (superset);
870   if (superset_entry == 0)
871     {
872       /* Create an entry for the SUPERSET, so that we have a place to
873          attach the SUBSET.  */
874       superset_entry = ggc_alloc_cleared_alias_set_entry_d ();
875       superset_entry->alias_set = superset;
876       superset_entry->children
877         = splay_tree_new_ggc (splay_tree_compare_ints,
878                               ggc_alloc_splay_tree_scalar_scalar_splay_tree_s,
879                               ggc_alloc_splay_tree_scalar_scalar_splay_tree_node_s);
880       superset_entry->has_zero_child = 0;
881       (*alias_sets)[superset] = superset_entry;
882     }
883
884   if (subset == 0)
885     superset_entry->has_zero_child = 1;
886   else
887     {
888       subset_entry = get_alias_set_entry (subset);
889       /* If there is an entry for the subset, enter all of its children
890          (if they are not already present) as children of the SUPERSET.  */
891       if (subset_entry)
892         {
893           if (subset_entry->has_zero_child)
894             superset_entry->has_zero_child = 1;
895
896           splay_tree_foreach (subset_entry->children, insert_subset_children,
897                               superset_entry->children);
898         }
899
900       /* Enter the SUBSET itself as a child of the SUPERSET.  */
901       splay_tree_insert (superset_entry->children,
902                          (splay_tree_key) subset, 0);
903     }
904 }
905
906 /* Record that component types of TYPE, if any, are part of that type for
907    aliasing purposes.  For record types, we only record component types
908    for fields that are not marked non-addressable.  For array types, we
909    only record the component type if it is not marked non-aliased.  */
910
911 void
912 record_component_aliases (tree type)
913 {
914   alias_set_type superset = get_alias_set (type);
915   tree field;
916
917   if (superset == 0)
918     return;
919
920   switch (TREE_CODE (type))
921     {
922     case RECORD_TYPE:
923     case UNION_TYPE:
924     case QUAL_UNION_TYPE:
925       /* Recursively record aliases for the base classes, if there are any.  */
926       if (TYPE_BINFO (type))
927         {
928           int i;
929           tree binfo, base_binfo;
930
931           for (binfo = TYPE_BINFO (type), i = 0;
932                BINFO_BASE_ITERATE (binfo, i, base_binfo); i++)
933             record_alias_subset (superset,
934                                  get_alias_set (BINFO_TYPE (base_binfo)));
935         }
936       for (field = TYPE_FIELDS (type); field != 0; field = DECL_CHAIN (field))
937         if (TREE_CODE (field) == FIELD_DECL && !DECL_NONADDRESSABLE_P (field))
938           record_alias_subset (superset, get_alias_set (TREE_TYPE (field)));
939       break;
940
941     case COMPLEX_TYPE:
942       record_alias_subset (superset, get_alias_set (TREE_TYPE (type)));
943       break;
944
945     /* VECTOR_TYPE and ARRAY_TYPE share the alias set with their
946        element type.  */
947
948     default:
949       break;
950     }
951 }
952
953 /* Allocate an alias set for use in storing and reading from the varargs
954    spill area.  */
955
956 static GTY(()) alias_set_type varargs_set = -1;
957
958 alias_set_type
959 get_varargs_alias_set (void)
960 {
961 #if 1
962   /* We now lower VA_ARG_EXPR, and there's currently no way to attach the
963      varargs alias set to an INDIRECT_REF (FIXME!), so we can't
964      consistently use the varargs alias set for loads from the varargs
965      area.  So don't use it anywhere.  */
966   return 0;
967 #else
968   if (varargs_set == -1)
969     varargs_set = new_alias_set ();
970
971   return varargs_set;
972 #endif
973 }
974
975 /* Likewise, but used for the fixed portions of the frame, e.g., register
976    save areas.  */
977
978 static GTY(()) alias_set_type frame_set = -1;
979
980 alias_set_type
981 get_frame_alias_set (void)
982 {
983   if (frame_set == -1)
984     frame_set = new_alias_set ();
985
986   return frame_set;
987 }
988
989 /* Create a new, unique base with id ID.  */
990
991 static rtx
992 unique_base_value (HOST_WIDE_INT id)
993 {
994   return gen_rtx_ADDRESS (Pmode, id);
995 }
996
997 /* Return true if accesses based on any other base value cannot alias
998    those based on X.  */
999
1000 static bool
1001 unique_base_value_p (rtx x)
1002 {
1003   return GET_CODE (x) == ADDRESS && GET_MODE (x) == Pmode;
1004 }
1005
1006 /* Return true if X is known to be a base value.  */
1007
1008 static bool
1009 known_base_value_p (rtx x)
1010 {
1011   switch (GET_CODE (x))
1012     {
1013     case LABEL_REF:
1014     case SYMBOL_REF:
1015       return true;
1016
1017     case ADDRESS:
1018       /* Arguments may or may not be bases; we don't know for sure.  */
1019       return GET_MODE (x) != VOIDmode;
1020
1021     default:
1022       return false;
1023     }
1024 }
1025
1026 /* Inside SRC, the source of a SET, find a base address.  */
1027
1028 static rtx
1029 find_base_value (rtx src)
1030 {
1031   unsigned int regno;
1032
1033 #if defined (FIND_BASE_TERM)
1034   /* Try machine-dependent ways to find the base term.  */
1035   src = FIND_BASE_TERM (src);
1036 #endif
1037
1038   switch (GET_CODE (src))
1039     {
1040     case SYMBOL_REF:
1041     case LABEL_REF:
1042       return src;
1043
1044     case REG:
1045       regno = REGNO (src);
1046       /* At the start of a function, argument registers have known base
1047          values which may be lost later.  Returning an ADDRESS
1048          expression here allows optimization based on argument values
1049          even when the argument registers are used for other purposes.  */
1050       if (regno < FIRST_PSEUDO_REGISTER && copying_arguments)
1051         return new_reg_base_value[regno];
1052
1053       /* If a pseudo has a known base value, return it.  Do not do this
1054          for non-fixed hard regs since it can result in a circular
1055          dependency chain for registers which have values at function entry.
1056
1057          The test above is not sufficient because the scheduler may move
1058          a copy out of an arg reg past the NOTE_INSN_FUNCTION_BEGIN.  */
1059       if ((regno >= FIRST_PSEUDO_REGISTER || fixed_regs[regno])
1060           && regno < vec_safe_length (reg_base_value))
1061         {
1062           /* If we're inside init_alias_analysis, use new_reg_base_value
1063              to reduce the number of relaxation iterations.  */
1064           if (new_reg_base_value && new_reg_base_value[regno]
1065               && DF_REG_DEF_COUNT (regno) == 1)
1066             return new_reg_base_value[regno];
1067
1068           if ((*reg_base_value)[regno])
1069             return (*reg_base_value)[regno];
1070         }
1071
1072       return 0;
1073
1074     case MEM:
1075       /* Check for an argument passed in memory.  Only record in the
1076          copying-arguments block; it is too hard to track changes
1077          otherwise.  */
1078       if (copying_arguments
1079           && (XEXP (src, 0) == arg_pointer_rtx
1080               || (GET_CODE (XEXP (src, 0)) == PLUS
1081                   && XEXP (XEXP (src, 0), 0) == arg_pointer_rtx)))
1082         return arg_base_value;
1083       return 0;
1084
1085     case CONST:
1086       src = XEXP (src, 0);
1087       if (GET_CODE (src) != PLUS && GET_CODE (src) != MINUS)
1088         break;
1089
1090       /* ... fall through ...  */
1091
1092     case PLUS:
1093     case MINUS:
1094       {
1095         rtx temp, src_0 = XEXP (src, 0), src_1 = XEXP (src, 1);
1096
1097         /* If either operand is a REG that is a known pointer, then it
1098            is the base.  */
1099         if (REG_P (src_0) && REG_POINTER (src_0))
1100           return find_base_value (src_0);
1101         if (REG_P (src_1) && REG_POINTER (src_1))
1102           return find_base_value (src_1);
1103
1104         /* If either operand is a REG, then see if we already have
1105            a known value for it.  */
1106         if (REG_P (src_0))
1107           {
1108             temp = find_base_value (src_0);
1109             if (temp != 0)
1110               src_0 = temp;
1111           }
1112
1113         if (REG_P (src_1))
1114           {
1115             temp = find_base_value (src_1);
1116             if (temp!= 0)
1117               src_1 = temp;
1118           }
1119
1120         /* If either base is named object or a special address
1121            (like an argument or stack reference), then use it for the
1122            base term.  */
1123         if (src_0 != 0 && known_base_value_p (src_0))
1124           return src_0;
1125
1126         if (src_1 != 0 && known_base_value_p (src_1))
1127           return src_1;
1128
1129         /* Guess which operand is the base address:
1130            If either operand is a symbol, then it is the base.  If
1131            either operand is a CONST_INT, then the other is the base.  */
1132         if (CONST_INT_P (src_1) || CONSTANT_P (src_0))
1133           return find_base_value (src_0);
1134         else if (CONST_INT_P (src_0) || CONSTANT_P (src_1))
1135           return find_base_value (src_1);
1136
1137         return 0;
1138       }
1139
1140     case LO_SUM:
1141       /* The standard form is (lo_sum reg sym) so look only at the
1142          second operand.  */
1143       return find_base_value (XEXP (src, 1));
1144
1145     case AND:
1146       /* If the second operand is constant set the base
1147          address to the first operand.  */
1148       if (CONST_INT_P (XEXP (src, 1)) && INTVAL (XEXP (src, 1)) != 0)
1149         return find_base_value (XEXP (src, 0));
1150       return 0;
1151
1152     case TRUNCATE:
1153       /* As we do not know which address space the pointer is referring to, we can
1154          handle this only if the target does not support different pointer or
1155          address modes depending on the address space.  */
1156       if (!target_default_pointer_address_modes_p ())
1157         break;
1158       if (GET_MODE_SIZE (GET_MODE (src)) < GET_MODE_SIZE (Pmode))
1159         break;
1160       /* Fall through.  */
1161     case HIGH:
1162     case PRE_INC:
1163     case PRE_DEC:
1164     case POST_INC:
1165     case POST_DEC:
1166     case PRE_MODIFY:
1167     case POST_MODIFY:
1168       return find_base_value (XEXP (src, 0));
1169
1170     case ZERO_EXTEND:
1171     case SIGN_EXTEND:   /* used for NT/Alpha pointers */
1172       /* As we do not know which address space the pointer is referring to, we can
1173          handle this only if the target does not support different pointer or
1174          address modes depending on the address space.  */
1175       if (!target_default_pointer_address_modes_p ())
1176         break;
1177
1178       {
1179         rtx temp = find_base_value (XEXP (src, 0));
1180
1181         if (temp != 0 && CONSTANT_P (temp))
1182           temp = convert_memory_address (Pmode, temp);
1183
1184         return temp;
1185       }
1186
1187     default:
1188       break;
1189     }
1190
1191   return 0;
1192 }
1193
1194 /* Called from init_alias_analysis indirectly through note_stores,
1195    or directly if DEST is a register with a REG_NOALIAS note attached.
1196    SET is null in the latter case.  */
1197
1198 /* While scanning insns to find base values, reg_seen[N] is nonzero if
1199    register N has been set in this function.  */
1200 static sbitmap reg_seen;
1201
1202 static void
1203 record_set (rtx dest, const_rtx set, void *data ATTRIBUTE_UNUSED)
1204 {
1205   unsigned regno;
1206   rtx src;
1207   int n;
1208
1209   if (!REG_P (dest))
1210     return;
1211
1212   regno = REGNO (dest);
1213
1214   gcc_checking_assert (regno < reg_base_value->length ());
1215
1216   /* If this spans multiple hard registers, then we must indicate that every
1217      register has an unusable value.  */
1218   if (regno < FIRST_PSEUDO_REGISTER)
1219     n = hard_regno_nregs[regno][GET_MODE (dest)];
1220   else
1221     n = 1;
1222   if (n != 1)
1223     {
1224       while (--n >= 0)
1225         {
1226           bitmap_set_bit (reg_seen, regno + n);
1227           new_reg_base_value[regno + n] = 0;
1228         }
1229       return;
1230     }
1231
1232   if (set)
1233     {
1234       /* A CLOBBER wipes out any old value but does not prevent a previously
1235          unset register from acquiring a base address (i.e. reg_seen is not
1236          set).  */
1237       if (GET_CODE (set) == CLOBBER)
1238         {
1239           new_reg_base_value[regno] = 0;
1240           return;
1241         }
1242       src = SET_SRC (set);
1243     }
1244   else
1245     {
1246       /* There's a REG_NOALIAS note against DEST.  */
1247       if (bitmap_bit_p (reg_seen, regno))
1248         {
1249           new_reg_base_value[regno] = 0;
1250           return;
1251         }
1252       bitmap_set_bit (reg_seen, regno);
1253       new_reg_base_value[regno] = unique_base_value (unique_id++);
1254       return;
1255     }
1256
1257   /* If this is not the first set of REGNO, see whether the new value
1258      is related to the old one.  There are two cases of interest:
1259
1260         (1) The register might be assigned an entirely new value
1261             that has the same base term as the original set.
1262
1263         (2) The set might be a simple self-modification that
1264             cannot change REGNO's base value.
1265
1266      If neither case holds, reject the original base value as invalid.
1267      Note that the following situation is not detected:
1268
1269          extern int x, y;  int *p = &x; p += (&y-&x);
1270
1271      ANSI C does not allow computing the difference of addresses
1272      of distinct top level objects.  */
1273   if (new_reg_base_value[regno] != 0
1274       && find_base_value (src) != new_reg_base_value[regno])
1275     switch (GET_CODE (src))
1276       {
1277       case LO_SUM:
1278       case MINUS:
1279         if (XEXP (src, 0) != dest && XEXP (src, 1) != dest)
1280           new_reg_base_value[regno] = 0;
1281         break;
1282       case PLUS:
1283         /* If the value we add in the PLUS is also a valid base value,
1284            this might be the actual base value, and the original value
1285            an index.  */
1286         {
1287           rtx other = NULL_RTX;
1288
1289           if (XEXP (src, 0) == dest)
1290             other = XEXP (src, 1);
1291           else if (XEXP (src, 1) == dest)
1292             other = XEXP (src, 0);
1293
1294           if (! other || find_base_value (other))
1295             new_reg_base_value[regno] = 0;
1296           break;
1297         }
1298       case AND:
1299         if (XEXP (src, 0) != dest || !CONST_INT_P (XEXP (src, 1)))
1300           new_reg_base_value[regno] = 0;
1301         break;
1302       default:
1303         new_reg_base_value[regno] = 0;
1304         break;
1305       }
1306   /* If this is the first set of a register, record the value.  */
1307   else if ((regno >= FIRST_PSEUDO_REGISTER || ! fixed_regs[regno])
1308            && ! bitmap_bit_p (reg_seen, regno) && new_reg_base_value[regno] == 0)
1309     new_reg_base_value[regno] = find_base_value (src);
1310
1311   bitmap_set_bit (reg_seen, regno);
1312 }
1313
1314 /* Return REG_BASE_VALUE for REGNO.  Selective scheduler uses this to avoid
1315    using hard registers with non-null REG_BASE_VALUE for renaming.  */
1316 rtx
1317 get_reg_base_value (unsigned int regno)
1318 {
1319   return (*reg_base_value)[regno];
1320 }
1321
1322 /* If a value is known for REGNO, return it.  */
1323
1324 rtx
1325 get_reg_known_value (unsigned int regno)
1326 {
1327   if (regno >= FIRST_PSEUDO_REGISTER)
1328     {
1329       regno -= FIRST_PSEUDO_REGISTER;
1330       if (regno < vec_safe_length (reg_known_value))
1331         return (*reg_known_value)[regno];
1332     }
1333   return NULL;
1334 }
1335
1336 /* Set it.  */
1337
1338 static void
1339 set_reg_known_value (unsigned int regno, rtx val)
1340 {
1341   if (regno >= FIRST_PSEUDO_REGISTER)
1342     {
1343       regno -= FIRST_PSEUDO_REGISTER;
1344       if (regno < vec_safe_length (reg_known_value))
1345         (*reg_known_value)[regno] = val;
1346     }
1347 }
1348
1349 /* Similarly for reg_known_equiv_p.  */
1350
1351 bool
1352 get_reg_known_equiv_p (unsigned int regno)
1353 {
1354   if (regno >= FIRST_PSEUDO_REGISTER)
1355     {
1356       regno -= FIRST_PSEUDO_REGISTER;
1357       if (regno < vec_safe_length (reg_known_value))
1358         return bitmap_bit_p (reg_known_equiv_p, regno);
1359     }
1360   return false;
1361 }
1362
1363 static void
1364 set_reg_known_equiv_p (unsigned int regno, bool val)
1365 {
1366   if (regno >= FIRST_PSEUDO_REGISTER)
1367     {
1368       regno -= FIRST_PSEUDO_REGISTER;
1369       if (regno < vec_safe_length (reg_known_value))
1370         {
1371           if (val)
1372             bitmap_set_bit (reg_known_equiv_p, regno);
1373           else
1374             bitmap_clear_bit (reg_known_equiv_p, regno);
1375         }
1376     }
1377 }
1378
1379
1380 /* Returns a canonical version of X, from the point of view alias
1381    analysis.  (For example, if X is a MEM whose address is a register,
1382    and the register has a known value (say a SYMBOL_REF), then a MEM
1383    whose address is the SYMBOL_REF is returned.)  */
1384
1385 rtx
1386 canon_rtx (rtx x)
1387 {
1388   /* Recursively look for equivalences.  */
1389   if (REG_P (x) && REGNO (x) >= FIRST_PSEUDO_REGISTER)
1390     {
1391       rtx t = get_reg_known_value (REGNO (x));
1392       if (t == x)
1393         return x;
1394       if (t)
1395         return canon_rtx (t);
1396     }
1397
1398   if (GET_CODE (x) == PLUS)
1399     {
1400       rtx x0 = canon_rtx (XEXP (x, 0));
1401       rtx x1 = canon_rtx (XEXP (x, 1));
1402
1403       if (x0 != XEXP (x, 0) || x1 != XEXP (x, 1))
1404         {
1405           if (CONST_INT_P (x0))
1406             return plus_constant (GET_MODE (x), x1, INTVAL (x0));
1407           else if (CONST_INT_P (x1))
1408             return plus_constant (GET_MODE (x), x0, INTVAL (x1));
1409           return gen_rtx_PLUS (GET_MODE (x), x0, x1);
1410         }
1411     }
1412
1413   /* This gives us much better alias analysis when called from
1414      the loop optimizer.   Note we want to leave the original
1415      MEM alone, but need to return the canonicalized MEM with
1416      all the flags with their original values.  */
1417   else if (MEM_P (x))
1418     x = replace_equiv_address_nv (x, canon_rtx (XEXP (x, 0)));
1419
1420   return x;
1421 }
1422
1423 /* Return 1 if X and Y are identical-looking rtx's.
1424    Expect that X and Y has been already canonicalized.
1425
1426    We use the data in reg_known_value above to see if two registers with
1427    different numbers are, in fact, equivalent.  */
1428
1429 static int
1430 rtx_equal_for_memref_p (const_rtx x, const_rtx y)
1431 {
1432   int i;
1433   int j;
1434   enum rtx_code code;
1435   const char *fmt;
1436
1437   if (x == 0 && y == 0)
1438     return 1;
1439   if (x == 0 || y == 0)
1440     return 0;
1441
1442   if (x == y)
1443     return 1;
1444
1445   code = GET_CODE (x);
1446   /* Rtx's of different codes cannot be equal.  */
1447   if (code != GET_CODE (y))
1448     return 0;
1449
1450   /* (MULT:SI x y) and (MULT:HI x y) are NOT equivalent.
1451      (REG:SI x) and (REG:HI x) are NOT equivalent.  */
1452
1453   if (GET_MODE (x) != GET_MODE (y))
1454     return 0;
1455
1456   /* Some RTL can be compared without a recursive examination.  */
1457   switch (code)
1458     {
1459     case REG:
1460       return REGNO (x) == REGNO (y);
1461
1462     case LABEL_REF:
1463       return XEXP (x, 0) == XEXP (y, 0);
1464
1465     case SYMBOL_REF:
1466       return XSTR (x, 0) == XSTR (y, 0);
1467
1468     case ENTRY_VALUE:
1469       /* This is magic, don't go through canonicalization et al.  */
1470       return rtx_equal_p (ENTRY_VALUE_EXP (x), ENTRY_VALUE_EXP (y));
1471
1472     case VALUE:
1473     CASE_CONST_UNIQUE:
1474       /* There's no need to compare the contents of CONST_DOUBLEs or
1475          CONST_INTs because pointer equality is a good enough
1476          comparison for these nodes.  */
1477       return 0;
1478
1479     default:
1480       break;
1481     }
1482
1483   /* canon_rtx knows how to handle plus.  No need to canonicalize.  */
1484   if (code == PLUS)
1485     return ((rtx_equal_for_memref_p (XEXP (x, 0), XEXP (y, 0))
1486              && rtx_equal_for_memref_p (XEXP (x, 1), XEXP (y, 1)))
1487             || (rtx_equal_for_memref_p (XEXP (x, 0), XEXP (y, 1))
1488                 && rtx_equal_for_memref_p (XEXP (x, 1), XEXP (y, 0))));
1489   /* For commutative operations, the RTX match if the operand match in any
1490      order.  Also handle the simple binary and unary cases without a loop.  */
1491   if (COMMUTATIVE_P (x))
1492     {
1493       rtx xop0 = canon_rtx (XEXP (x, 0));
1494       rtx yop0 = canon_rtx (XEXP (y, 0));
1495       rtx yop1 = canon_rtx (XEXP (y, 1));
1496
1497       return ((rtx_equal_for_memref_p (xop0, yop0)
1498                && rtx_equal_for_memref_p (canon_rtx (XEXP (x, 1)), yop1))
1499               || (rtx_equal_for_memref_p (xop0, yop1)
1500                   && rtx_equal_for_memref_p (canon_rtx (XEXP (x, 1)), yop0)));
1501     }
1502   else if (NON_COMMUTATIVE_P (x))
1503     {
1504       return (rtx_equal_for_memref_p (canon_rtx (XEXP (x, 0)),
1505                                       canon_rtx (XEXP (y, 0)))
1506               && rtx_equal_for_memref_p (canon_rtx (XEXP (x, 1)),
1507                                          canon_rtx (XEXP (y, 1))));
1508     }
1509   else if (UNARY_P (x))
1510     return rtx_equal_for_memref_p (canon_rtx (XEXP (x, 0)),
1511                                    canon_rtx (XEXP (y, 0)));
1512
1513   /* Compare the elements.  If any pair of corresponding elements
1514      fail to match, return 0 for the whole things.
1515
1516      Limit cases to types which actually appear in addresses.  */
1517
1518   fmt = GET_RTX_FORMAT (code);
1519   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
1520     {
1521       switch (fmt[i])
1522         {
1523         case 'i':
1524           if (XINT (x, i) != XINT (y, i))
1525             return 0;
1526           break;
1527
1528         case 'E':
1529           /* Two vectors must have the same length.  */
1530           if (XVECLEN (x, i) != XVECLEN (y, i))
1531             return 0;
1532
1533           /* And the corresponding elements must match.  */
1534           for (j = 0; j < XVECLEN (x, i); j++)
1535             if (rtx_equal_for_memref_p (canon_rtx (XVECEXP (x, i, j)),
1536                                         canon_rtx (XVECEXP (y, i, j))) == 0)
1537               return 0;
1538           break;
1539
1540         case 'e':
1541           if (rtx_equal_for_memref_p (canon_rtx (XEXP (x, i)),
1542                                       canon_rtx (XEXP (y, i))) == 0)
1543             return 0;
1544           break;
1545
1546           /* This can happen for asm operands.  */
1547         case 's':
1548           if (strcmp (XSTR (x, i), XSTR (y, i)))
1549             return 0;
1550           break;
1551
1552         /* This can happen for an asm which clobbers memory.  */
1553         case '0':
1554           break;
1555
1556           /* It is believed that rtx's at this level will never
1557              contain anything but integers and other rtx's,
1558              except for within LABEL_REFs and SYMBOL_REFs.  */
1559         default:
1560           gcc_unreachable ();
1561         }
1562     }
1563   return 1;
1564 }
1565
1566 static rtx
1567 find_base_term (rtx x)
1568 {
1569   cselib_val *val;
1570   struct elt_loc_list *l, *f;
1571   rtx ret;
1572
1573 #if defined (FIND_BASE_TERM)
1574   /* Try machine-dependent ways to find the base term.  */
1575   x = FIND_BASE_TERM (x);
1576 #endif
1577
1578   switch (GET_CODE (x))
1579     {
1580     case REG:
1581       return REG_BASE_VALUE (x);
1582
1583     case TRUNCATE:
1584       /* As we do not know which address space the pointer is referring to, we can
1585          handle this only if the target does not support different pointer or
1586          address modes depending on the address space.  */
1587       if (!target_default_pointer_address_modes_p ())
1588         return 0;
1589       if (GET_MODE_SIZE (GET_MODE (x)) < GET_MODE_SIZE (Pmode))
1590         return 0;
1591       /* Fall through.  */
1592     case HIGH:
1593     case PRE_INC:
1594     case PRE_DEC:
1595     case POST_INC:
1596     case POST_DEC:
1597     case PRE_MODIFY:
1598     case POST_MODIFY:
1599       return find_base_term (XEXP (x, 0));
1600
1601     case ZERO_EXTEND:
1602     case SIGN_EXTEND:   /* Used for Alpha/NT pointers */
1603       /* As we do not know which address space the pointer is referring to, we can
1604          handle this only if the target does not support different pointer or
1605          address modes depending on the address space.  */
1606       if (!target_default_pointer_address_modes_p ())
1607         return 0;
1608
1609       {
1610         rtx temp = find_base_term (XEXP (x, 0));
1611
1612         if (temp != 0 && CONSTANT_P (temp))
1613           temp = convert_memory_address (Pmode, temp);
1614
1615         return temp;
1616       }
1617
1618     case VALUE:
1619       val = CSELIB_VAL_PTR (x);
1620       ret = NULL_RTX;
1621
1622       if (!val)
1623         return ret;
1624
1625       if (cselib_sp_based_value_p (val))
1626         return static_reg_base_value[STACK_POINTER_REGNUM];
1627
1628       f = val->locs;
1629       /* Temporarily reset val->locs to avoid infinite recursion.  */
1630       val->locs = NULL;
1631
1632       for (l = f; l; l = l->next)
1633         if (GET_CODE (l->loc) == VALUE
1634             && CSELIB_VAL_PTR (l->loc)->locs
1635             && !CSELIB_VAL_PTR (l->loc)->locs->next
1636             && CSELIB_VAL_PTR (l->loc)->locs->loc == x)
1637           continue;
1638         else if ((ret = find_base_term (l->loc)) != 0)
1639           break;
1640
1641       val->locs = f;
1642       return ret;
1643
1644     case LO_SUM:
1645       /* The standard form is (lo_sum reg sym) so look only at the
1646          second operand.  */
1647       return find_base_term (XEXP (x, 1));
1648
1649     case CONST:
1650       x = XEXP (x, 0);
1651       if (GET_CODE (x) != PLUS && GET_CODE (x) != MINUS)
1652         return 0;
1653       /* Fall through.  */
1654     case PLUS:
1655     case MINUS:
1656       {
1657         rtx tmp1 = XEXP (x, 0);
1658         rtx tmp2 = XEXP (x, 1);
1659
1660         /* This is a little bit tricky since we have to determine which of
1661            the two operands represents the real base address.  Otherwise this
1662            routine may return the index register instead of the base register.
1663
1664            That may cause us to believe no aliasing was possible, when in
1665            fact aliasing is possible.
1666
1667            We use a few simple tests to guess the base register.  Additional
1668            tests can certainly be added.  For example, if one of the operands
1669            is a shift or multiply, then it must be the index register and the
1670            other operand is the base register.  */
1671
1672         if (tmp1 == pic_offset_table_rtx && CONSTANT_P (tmp2))
1673           return find_base_term (tmp2);
1674
1675         /* If either operand is known to be a pointer, then prefer it
1676            to determine the base term.  */
1677         if (REG_P (tmp1) && REG_POINTER (tmp1))
1678           ;
1679         else if (REG_P (tmp2) && REG_POINTER (tmp2))
1680           {
1681             rtx tem = tmp1;
1682             tmp1 = tmp2;
1683             tmp2 = tem;
1684           }
1685
1686         /* Go ahead and find the base term for both operands.  If either base
1687            term is from a pointer or is a named object or a special address
1688            (like an argument or stack reference), then use it for the
1689            base term.  */
1690         rtx base = find_base_term (tmp1);
1691         if (base != NULL_RTX
1692             && ((REG_P (tmp1) && REG_POINTER (tmp1))
1693                  || known_base_value_p (base)))
1694           return base;
1695         base = find_base_term (tmp2);
1696         if (base != NULL_RTX
1697             && ((REG_P (tmp2) && REG_POINTER (tmp2))
1698                  || known_base_value_p (base)))
1699           return base;
1700
1701         /* We could not determine which of the two operands was the
1702            base register and which was the index.  So we can determine
1703            nothing from the base alias check.  */
1704         return 0;
1705       }
1706
1707     case AND:
1708       if (CONST_INT_P (XEXP (x, 1)) && INTVAL (XEXP (x, 1)) != 0)
1709         return find_base_term (XEXP (x, 0));
1710       return 0;
1711
1712     case SYMBOL_REF:
1713     case LABEL_REF:
1714       return x;
1715
1716     default:
1717       return 0;
1718     }
1719 }
1720
1721 /* Return true if accesses to address X may alias accesses based
1722    on the stack pointer.  */
1723
1724 bool
1725 may_be_sp_based_p (rtx x)
1726 {
1727   rtx base = find_base_term (x);
1728   return !base || base == static_reg_base_value[STACK_POINTER_REGNUM];
1729 }
1730
1731 /* Return 0 if the addresses X and Y are known to point to different
1732    objects, 1 if they might be pointers to the same object.  */
1733
1734 static int
1735 base_alias_check (rtx x, rtx x_base, rtx y, rtx y_base,
1736                   enum machine_mode x_mode, enum machine_mode y_mode)
1737 {
1738   /* If the address itself has no known base see if a known equivalent
1739      value has one.  If either address still has no known base, nothing
1740      is known about aliasing.  */
1741   if (x_base == 0)
1742     {
1743       rtx x_c;
1744
1745       if (! flag_expensive_optimizations || (x_c = canon_rtx (x)) == x)
1746         return 1;
1747
1748       x_base = find_base_term (x_c);
1749       if (x_base == 0)
1750         return 1;
1751     }
1752
1753   if (y_base == 0)
1754     {
1755       rtx y_c;
1756       if (! flag_expensive_optimizations || (y_c = canon_rtx (y)) == y)
1757         return 1;
1758
1759       y_base = find_base_term (y_c);
1760       if (y_base == 0)
1761         return 1;
1762     }
1763
1764   /* If the base addresses are equal nothing is known about aliasing.  */
1765   if (rtx_equal_p (x_base, y_base))
1766     return 1;
1767
1768   /* The base addresses are different expressions.  If they are not accessed
1769      via AND, there is no conflict.  We can bring knowledge of object
1770      alignment into play here.  For example, on alpha, "char a, b;" can
1771      alias one another, though "char a; long b;" cannot.  AND addesses may
1772      implicitly alias surrounding objects; i.e. unaligned access in DImode
1773      via AND address can alias all surrounding object types except those
1774      with aligment 8 or higher.  */
1775   if (GET_CODE (x) == AND && GET_CODE (y) == AND)
1776     return 1;
1777   if (GET_CODE (x) == AND
1778       && (!CONST_INT_P (XEXP (x, 1))
1779           || (int) GET_MODE_UNIT_SIZE (y_mode) < -INTVAL (XEXP (x, 1))))
1780     return 1;
1781   if (GET_CODE (y) == AND
1782       && (!CONST_INT_P (XEXP (y, 1))
1783           || (int) GET_MODE_UNIT_SIZE (x_mode) < -INTVAL (XEXP (y, 1))))
1784     return 1;
1785
1786   /* Differing symbols not accessed via AND never alias.  */
1787   if (GET_CODE (x_base) != ADDRESS && GET_CODE (y_base) != ADDRESS)
1788     return 0;
1789
1790   if (unique_base_value_p (x_base) || unique_base_value_p (y_base))
1791     return 0;
1792
1793   return 1;
1794 }
1795
1796 /* Callback for for_each_rtx, that returns 1 upon encountering a VALUE
1797    whose UID is greater than the int uid that D points to.  */
1798
1799 static int
1800 refs_newer_value_cb (rtx *x, void *d)
1801 {
1802   if (GET_CODE (*x) == VALUE && CSELIB_VAL_PTR (*x)->uid > *(int *)d)
1803     return 1;
1804
1805   return 0;
1806 }
1807
1808 /* Return TRUE if EXPR refers to a VALUE whose uid is greater than
1809    that of V.  */
1810
1811 static bool
1812 refs_newer_value_p (rtx expr, rtx v)
1813 {
1814   int minuid = CSELIB_VAL_PTR (v)->uid;
1815
1816   return for_each_rtx (&expr, refs_newer_value_cb, &minuid);
1817 }
1818
1819 /* Convert the address X into something we can use.  This is done by returning
1820    it unchanged unless it is a value; in the latter case we call cselib to get
1821    a more useful rtx.  */
1822
1823 rtx
1824 get_addr (rtx x)
1825 {
1826   cselib_val *v;
1827   struct elt_loc_list *l;
1828
1829   if (GET_CODE (x) != VALUE)
1830     return x;
1831   v = CSELIB_VAL_PTR (x);
1832   if (v)
1833     {
1834       bool have_equivs = cselib_have_permanent_equivalences ();
1835       if (have_equivs)
1836         v = canonical_cselib_val (v);
1837       for (l = v->locs; l; l = l->next)
1838         if (CONSTANT_P (l->loc))
1839           return l->loc;
1840       for (l = v->locs; l; l = l->next)
1841         if (!REG_P (l->loc) && !MEM_P (l->loc)
1842             /* Avoid infinite recursion when potentially dealing with
1843                var-tracking artificial equivalences, by skipping the
1844                equivalences themselves, and not choosing expressions
1845                that refer to newer VALUEs.  */
1846             && (!have_equivs
1847                 || (GET_CODE (l->loc) != VALUE
1848                     && !refs_newer_value_p (l->loc, x))))
1849           return l->loc;
1850       if (have_equivs)
1851         {
1852           for (l = v->locs; l; l = l->next)
1853             if (REG_P (l->loc)
1854                 || (GET_CODE (l->loc) != VALUE
1855                     && !refs_newer_value_p (l->loc, x)))
1856               return l->loc;
1857           /* Return the canonical value.  */
1858           return v->val_rtx;
1859         }
1860       if (v->locs)
1861         return v->locs->loc;
1862     }
1863   return x;
1864 }
1865
1866 /*  Return the address of the (N_REFS + 1)th memory reference to ADDR
1867     where SIZE is the size in bytes of the memory reference.  If ADDR
1868     is not modified by the memory reference then ADDR is returned.  */
1869
1870 static rtx
1871 addr_side_effect_eval (rtx addr, int size, int n_refs)
1872 {
1873   int offset = 0;
1874
1875   switch (GET_CODE (addr))
1876     {
1877     case PRE_INC:
1878       offset = (n_refs + 1) * size;
1879       break;
1880     case PRE_DEC:
1881       offset = -(n_refs + 1) * size;
1882       break;
1883     case POST_INC:
1884       offset = n_refs * size;
1885       break;
1886     case POST_DEC:
1887       offset = -n_refs * size;
1888       break;
1889
1890     default:
1891       return addr;
1892     }
1893
1894   if (offset)
1895     addr = gen_rtx_PLUS (GET_MODE (addr), XEXP (addr, 0),
1896                          GEN_INT (offset));
1897   else
1898     addr = XEXP (addr, 0);
1899   addr = canon_rtx (addr);
1900
1901   return addr;
1902 }
1903
1904 /* Return TRUE if an object X sized at XSIZE bytes and another object
1905    Y sized at YSIZE bytes, starting C bytes after X, may overlap.  If
1906    any of the sizes is zero, assume an overlap, otherwise use the
1907    absolute value of the sizes as the actual sizes.  */
1908
1909 static inline bool
1910 offset_overlap_p (HOST_WIDE_INT c, int xsize, int ysize)
1911 {
1912   return (xsize == 0 || ysize == 0
1913           || (c >= 0
1914               ? (abs (xsize) > c)
1915               : (abs (ysize) > -c)));
1916 }
1917
1918 /* Return one if X and Y (memory addresses) reference the
1919    same location in memory or if the references overlap.
1920    Return zero if they do not overlap, else return
1921    minus one in which case they still might reference the same location.
1922
1923    C is an offset accumulator.  When
1924    C is nonzero, we are testing aliases between X and Y + C.
1925    XSIZE is the size in bytes of the X reference,
1926    similarly YSIZE is the size in bytes for Y.
1927    Expect that canon_rtx has been already called for X and Y.
1928
1929    If XSIZE or YSIZE is zero, we do not know the amount of memory being
1930    referenced (the reference was BLKmode), so make the most pessimistic
1931    assumptions.
1932
1933    If XSIZE or YSIZE is negative, we may access memory outside the object
1934    being referenced as a side effect.  This can happen when using AND to
1935    align memory references, as is done on the Alpha.
1936
1937    Nice to notice that varying addresses cannot conflict with fp if no
1938    local variables had their addresses taken, but that's too hard now.
1939
1940    ???  Contrary to the tree alias oracle this does not return
1941    one for X + non-constant and Y + non-constant when X and Y are equal.
1942    If that is fixed the TBAA hack for union type-punning can be removed.  */
1943
1944 static int
1945 memrefs_conflict_p (int xsize, rtx x, int ysize, rtx y, HOST_WIDE_INT c)
1946 {
1947   if (GET_CODE (x) == VALUE)
1948     {
1949       if (REG_P (y))
1950         {
1951           struct elt_loc_list *l = NULL;
1952           if (CSELIB_VAL_PTR (x))
1953             for (l = canonical_cselib_val (CSELIB_VAL_PTR (x))->locs;
1954                  l; l = l->next)
1955               if (REG_P (l->loc) && rtx_equal_for_memref_p (l->loc, y))
1956                 break;
1957           if (l)
1958             x = y;
1959           else
1960             x = get_addr (x);
1961         }
1962       /* Don't call get_addr if y is the same VALUE.  */
1963       else if (x != y)
1964         x = get_addr (x);
1965     }
1966   if (GET_CODE (y) == VALUE)
1967     {
1968       if (REG_P (x))
1969         {
1970           struct elt_loc_list *l = NULL;
1971           if (CSELIB_VAL_PTR (y))
1972             for (l = canonical_cselib_val (CSELIB_VAL_PTR (y))->locs;
1973                  l; l = l->next)
1974               if (REG_P (l->loc) && rtx_equal_for_memref_p (l->loc, x))
1975                 break;
1976           if (l)
1977             y = x;
1978           else
1979             y = get_addr (y);
1980         }
1981       /* Don't call get_addr if x is the same VALUE.  */
1982       else if (y != x)
1983         y = get_addr (y);
1984     }
1985   if (GET_CODE (x) == HIGH)
1986     x = XEXP (x, 0);
1987   else if (GET_CODE (x) == LO_SUM)
1988     x = XEXP (x, 1);
1989   else
1990     x = addr_side_effect_eval (x, abs (xsize), 0);
1991   if (GET_CODE (y) == HIGH)
1992     y = XEXP (y, 0);
1993   else if (GET_CODE (y) == LO_SUM)
1994     y = XEXP (y, 1);
1995   else
1996     y = addr_side_effect_eval (y, abs (ysize), 0);
1997
1998   if (rtx_equal_for_memref_p (x, y))
1999     {
2000       return offset_overlap_p (c, xsize, ysize);
2001     }
2002
2003   /* This code used to check for conflicts involving stack references and
2004      globals but the base address alias code now handles these cases.  */
2005
2006   if (GET_CODE (x) == PLUS)
2007     {
2008       /* The fact that X is canonicalized means that this
2009          PLUS rtx is canonicalized.  */
2010       rtx x0 = XEXP (x, 0);
2011       rtx x1 = XEXP (x, 1);
2012
2013       if (GET_CODE (y) == PLUS)
2014         {
2015           /* The fact that Y is canonicalized means that this
2016              PLUS rtx is canonicalized.  */
2017           rtx y0 = XEXP (y, 0);
2018           rtx y1 = XEXP (y, 1);
2019
2020           if (rtx_equal_for_memref_p (x1, y1))
2021             return memrefs_conflict_p (xsize, x0, ysize, y0, c);
2022           if (rtx_equal_for_memref_p (x0, y0))
2023             return memrefs_conflict_p (xsize, x1, ysize, y1, c);
2024           if (CONST_INT_P (x1))
2025             {
2026               if (CONST_INT_P (y1))
2027                 return memrefs_conflict_p (xsize, x0, ysize, y0,
2028                                            c - INTVAL (x1) + INTVAL (y1));
2029               else
2030                 return memrefs_conflict_p (xsize, x0, ysize, y,
2031                                            c - INTVAL (x1));
2032             }
2033           else if (CONST_INT_P (y1))
2034             return memrefs_conflict_p (xsize, x, ysize, y0, c + INTVAL (y1));
2035
2036           return -1;
2037         }
2038       else if (CONST_INT_P (x1))
2039         return memrefs_conflict_p (xsize, x0, ysize, y, c - INTVAL (x1));
2040     }
2041   else if (GET_CODE (y) == PLUS)
2042     {
2043       /* The fact that Y is canonicalized means that this
2044          PLUS rtx is canonicalized.  */
2045       rtx y0 = XEXP (y, 0);
2046       rtx y1 = XEXP (y, 1);
2047
2048       if (CONST_INT_P (y1))
2049         return memrefs_conflict_p (xsize, x, ysize, y0, c + INTVAL (y1));
2050       else
2051         return -1;
2052     }
2053
2054   if (GET_CODE (x) == GET_CODE (y))
2055     switch (GET_CODE (x))
2056       {
2057       case MULT:
2058         {
2059           /* Handle cases where we expect the second operands to be the
2060              same, and check only whether the first operand would conflict
2061              or not.  */
2062           rtx x0, y0;
2063           rtx x1 = canon_rtx (XEXP (x, 1));
2064           rtx y1 = canon_rtx (XEXP (y, 1));
2065           if (! rtx_equal_for_memref_p (x1, y1))
2066             return -1;
2067           x0 = canon_rtx (XEXP (x, 0));
2068           y0 = canon_rtx (XEXP (y, 0));
2069           if (rtx_equal_for_memref_p (x0, y0))
2070             return offset_overlap_p (c, xsize, ysize);
2071
2072           /* Can't properly adjust our sizes.  */
2073           if (!CONST_INT_P (x1))
2074             return -1;
2075           xsize /= INTVAL (x1);
2076           ysize /= INTVAL (x1);
2077           c /= INTVAL (x1);
2078           return memrefs_conflict_p (xsize, x0, ysize, y0, c);
2079         }
2080
2081       default:
2082         break;
2083       }
2084
2085   /* Deal with alignment ANDs by adjusting offset and size so as to
2086      cover the maximum range, without taking any previously known
2087      alignment into account.  Make a size negative after such an
2088      adjustments, so that, if we end up with e.g. two SYMBOL_REFs, we
2089      assume a potential overlap, because they may end up in contiguous
2090      memory locations and the stricter-alignment access may span over
2091      part of both.  */
2092   if (GET_CODE (x) == AND && CONST_INT_P (XEXP (x, 1)))
2093     {
2094       HOST_WIDE_INT sc = INTVAL (XEXP (x, 1));
2095       unsigned HOST_WIDE_INT uc = sc;
2096       if (sc < 0 && -uc == (uc & -uc))
2097         {
2098           if (xsize > 0)
2099             xsize = -xsize;
2100           if (xsize)
2101             xsize += sc + 1;
2102           c -= sc + 1;
2103           return memrefs_conflict_p (xsize, canon_rtx (XEXP (x, 0)),
2104                                      ysize, y, c);
2105         }
2106     }
2107   if (GET_CODE (y) == AND && CONST_INT_P (XEXP (y, 1)))
2108     {
2109       HOST_WIDE_INT sc = INTVAL (XEXP (y, 1));
2110       unsigned HOST_WIDE_INT uc = sc;
2111       if (sc < 0 && -uc == (uc & -uc))
2112         {
2113           if (ysize > 0)
2114             ysize = -ysize;
2115           if (ysize)
2116             ysize += sc + 1;
2117           c += sc + 1;
2118           return memrefs_conflict_p (xsize, x,
2119                                      ysize, canon_rtx (XEXP (y, 0)), c);
2120         }
2121     }
2122
2123   if (CONSTANT_P (x))
2124     {
2125       if (CONST_INT_P (x) && CONST_INT_P (y))
2126         {
2127           c += (INTVAL (y) - INTVAL (x));
2128           return offset_overlap_p (c, xsize, ysize);
2129         }
2130
2131       if (GET_CODE (x) == CONST)
2132         {
2133           if (GET_CODE (y) == CONST)
2134             return memrefs_conflict_p (xsize, canon_rtx (XEXP (x, 0)),
2135                                        ysize, canon_rtx (XEXP (y, 0)), c);
2136           else
2137             return memrefs_conflict_p (xsize, canon_rtx (XEXP (x, 0)),
2138                                        ysize, y, c);
2139         }
2140       if (GET_CODE (y) == CONST)
2141         return memrefs_conflict_p (xsize, x, ysize,
2142                                    canon_rtx (XEXP (y, 0)), c);
2143
2144       /* Assume a potential overlap for symbolic addresses that went
2145          through alignment adjustments (i.e., that have negative
2146          sizes), because we can't know how far they are from each
2147          other.  */
2148       if (CONSTANT_P (y))
2149         return (xsize < 0 || ysize < 0 || offset_overlap_p (c, xsize, ysize));
2150
2151       return -1;
2152     }
2153
2154   return -1;
2155 }
2156
2157 /* Functions to compute memory dependencies.
2158
2159    Since we process the insns in execution order, we can build tables
2160    to keep track of what registers are fixed (and not aliased), what registers
2161    are varying in known ways, and what registers are varying in unknown
2162    ways.
2163
2164    If both memory references are volatile, then there must always be a
2165    dependence between the two references, since their order can not be
2166    changed.  A volatile and non-volatile reference can be interchanged
2167    though.
2168
2169    We also must allow AND addresses, because they may generate accesses
2170    outside the object being referenced.  This is used to generate aligned
2171    addresses from unaligned addresses, for instance, the alpha
2172    storeqi_unaligned pattern.  */
2173
2174 /* Read dependence: X is read after read in MEM takes place.  There can
2175    only be a dependence here if both reads are volatile, or if either is
2176    an explicit barrier.  */
2177
2178 int
2179 read_dependence (const_rtx mem, const_rtx x)
2180 {
2181   if (MEM_VOLATILE_P (x) && MEM_VOLATILE_P (mem))
2182     return true;
2183   if (MEM_ALIAS_SET (x) == ALIAS_SET_MEMORY_BARRIER
2184       || MEM_ALIAS_SET (mem) == ALIAS_SET_MEMORY_BARRIER)
2185     return true;
2186   return false;
2187 }
2188
2189 /* Return true if we can determine that the fields referenced cannot
2190    overlap for any pair of objects.  */
2191
2192 static bool
2193 nonoverlapping_component_refs_p (const_rtx rtlx, const_rtx rtly)
2194 {
2195   const_tree x = MEM_EXPR (rtlx), y = MEM_EXPR (rtly);
2196   const_tree fieldx, fieldy, typex, typey, orig_y;
2197
2198   if (!flag_strict_aliasing
2199       || !x || !y
2200       || TREE_CODE (x) != COMPONENT_REF
2201       || TREE_CODE (y) != COMPONENT_REF)
2202     return false;
2203
2204   do
2205     {
2206       /* The comparison has to be done at a common type, since we don't
2207          know how the inheritance hierarchy works.  */
2208       orig_y = y;
2209       do
2210         {
2211           fieldx = TREE_OPERAND (x, 1);
2212           typex = TYPE_MAIN_VARIANT (DECL_FIELD_CONTEXT (fieldx));
2213
2214           y = orig_y;
2215           do
2216             {
2217               fieldy = TREE_OPERAND (y, 1);
2218               typey = TYPE_MAIN_VARIANT (DECL_FIELD_CONTEXT (fieldy));
2219
2220               if (typex == typey)
2221                 goto found;
2222
2223               y = TREE_OPERAND (y, 0);
2224             }
2225           while (y && TREE_CODE (y) == COMPONENT_REF);
2226
2227           x = TREE_OPERAND (x, 0);
2228         }
2229       while (x && TREE_CODE (x) == COMPONENT_REF);
2230       /* Never found a common type.  */
2231       return false;
2232
2233     found:
2234       /* If we're left with accessing different fields of a structure, then no
2235          possible overlap, unless they are both bitfields.  */
2236       if (TREE_CODE (typex) == RECORD_TYPE && fieldx != fieldy)
2237         return !(DECL_BIT_FIELD (fieldx) && DECL_BIT_FIELD (fieldy));
2238
2239       /* The comparison on the current field failed.  If we're accessing
2240          a very nested structure, look at the next outer level.  */
2241       x = TREE_OPERAND (x, 0);
2242       y = TREE_OPERAND (y, 0);
2243     }
2244   while (x && y
2245          && TREE_CODE (x) == COMPONENT_REF
2246          && TREE_CODE (y) == COMPONENT_REF);
2247
2248   return false;
2249 }
2250
2251 /* Look at the bottom of the COMPONENT_REF list for a DECL, and return it.  */
2252
2253 static tree
2254 decl_for_component_ref (tree x)
2255 {
2256   do
2257     {
2258       x = TREE_OPERAND (x, 0);
2259     }
2260   while (x && TREE_CODE (x) == COMPONENT_REF);
2261
2262   return x && DECL_P (x) ? x : NULL_TREE;
2263 }
2264
2265 /* Walk up the COMPONENT_REF list in X and adjust *OFFSET to compensate
2266    for the offset of the field reference.  *KNOWN_P says whether the
2267    offset is known.  */
2268
2269 static void
2270 adjust_offset_for_component_ref (tree x, bool *known_p,
2271                                  HOST_WIDE_INT *offset)
2272 {
2273   if (!*known_p)
2274     return;
2275   do
2276     {
2277       tree xoffset = component_ref_field_offset (x);
2278       tree field = TREE_OPERAND (x, 1);
2279
2280       if (! host_integerp (xoffset, 1))
2281         {
2282           *known_p = false;
2283           return;
2284         }
2285       *offset += (tree_low_cst (xoffset, 1)
2286                   + (tree_low_cst (DECL_FIELD_BIT_OFFSET (field), 1)
2287                      / BITS_PER_UNIT));
2288
2289       x = TREE_OPERAND (x, 0);
2290     }
2291   while (x && TREE_CODE (x) == COMPONENT_REF);
2292 }
2293
2294 /* Return nonzero if we can determine the exprs corresponding to memrefs
2295    X and Y and they do not overlap. 
2296    If LOOP_VARIANT is set, skip offset-based disambiguation */
2297
2298 int
2299 nonoverlapping_memrefs_p (const_rtx x, const_rtx y, bool loop_invariant)
2300 {
2301   tree exprx = MEM_EXPR (x), expry = MEM_EXPR (y);
2302   rtx rtlx, rtly;
2303   rtx basex, basey;
2304   bool moffsetx_known_p, moffsety_known_p;
2305   HOST_WIDE_INT moffsetx = 0, moffsety = 0;
2306   HOST_WIDE_INT offsetx = 0, offsety = 0, sizex, sizey, tem;
2307
2308   /* Unless both have exprs, we can't tell anything.  */
2309   if (exprx == 0 || expry == 0)
2310     return 0;
2311
2312   /* For spill-slot accesses make sure we have valid offsets.  */
2313   if ((exprx == get_spill_slot_decl (false)
2314        && ! MEM_OFFSET_KNOWN_P (x))
2315       || (expry == get_spill_slot_decl (false)
2316           && ! MEM_OFFSET_KNOWN_P (y)))
2317     return 0;
2318
2319   /* If the field reference test failed, look at the DECLs involved.  */
2320   moffsetx_known_p = MEM_OFFSET_KNOWN_P (x);
2321   if (moffsetx_known_p)
2322     moffsetx = MEM_OFFSET (x);
2323   if (TREE_CODE (exprx) == COMPONENT_REF)
2324     {
2325       tree t = decl_for_component_ref (exprx);
2326       if (! t)
2327         return 0;
2328       adjust_offset_for_component_ref (exprx, &moffsetx_known_p, &moffsetx);
2329       exprx = t;
2330     }
2331
2332   moffsety_known_p = MEM_OFFSET_KNOWN_P (y);
2333   if (moffsety_known_p)
2334     moffsety = MEM_OFFSET (y);
2335   if (TREE_CODE (expry) == COMPONENT_REF)
2336     {
2337       tree t = decl_for_component_ref (expry);
2338       if (! t)
2339         return 0;
2340       adjust_offset_for_component_ref (expry, &moffsety_known_p, &moffsety);
2341       expry = t;
2342     }
2343
2344   if (! DECL_P (exprx) || ! DECL_P (expry))
2345     return 0;
2346
2347   /* With invalid code we can end up storing into the constant pool.
2348      Bail out to avoid ICEing when creating RTL for this.
2349      See gfortran.dg/lto/20091028-2_0.f90.  */
2350   if (TREE_CODE (exprx) == CONST_DECL
2351       || TREE_CODE (expry) == CONST_DECL)
2352     return 1;
2353
2354   rtlx = DECL_RTL (exprx);
2355   rtly = DECL_RTL (expry);
2356
2357   /* If either RTL is not a MEM, it must be a REG or CONCAT, meaning they
2358      can't overlap unless they are the same because we never reuse that part
2359      of the stack frame used for locals for spilled pseudos.  */
2360   if ((!MEM_P (rtlx) || !MEM_P (rtly))
2361       && ! rtx_equal_p (rtlx, rtly))
2362     return 1;
2363
2364   /* If we have MEMs referring to different address spaces (which can
2365      potentially overlap), we cannot easily tell from the addresses
2366      whether the references overlap.  */
2367   if (MEM_P (rtlx) && MEM_P (rtly)
2368       && MEM_ADDR_SPACE (rtlx) != MEM_ADDR_SPACE (rtly))
2369     return 0;
2370
2371   /* Get the base and offsets of both decls.  If either is a register, we
2372      know both are and are the same, so use that as the base.  The only
2373      we can avoid overlap is if we can deduce that they are nonoverlapping
2374      pieces of that decl, which is very rare.  */
2375   basex = MEM_P (rtlx) ? XEXP (rtlx, 0) : rtlx;
2376   if (GET_CODE (basex) == PLUS && CONST_INT_P (XEXP (basex, 1)))
2377     offsetx = INTVAL (XEXP (basex, 1)), basex = XEXP (basex, 0);
2378
2379   basey = MEM_P (rtly) ? XEXP (rtly, 0) : rtly;
2380   if (GET_CODE (basey) == PLUS && CONST_INT_P (XEXP (basey, 1)))
2381     offsety = INTVAL (XEXP (basey, 1)), basey = XEXP (basey, 0);
2382
2383   /* If the bases are different, we know they do not overlap if both
2384      are constants or if one is a constant and the other a pointer into the
2385      stack frame.  Otherwise a different base means we can't tell if they
2386      overlap or not.  */
2387   if (! rtx_equal_p (basex, basey))
2388     return ((CONSTANT_P (basex) && CONSTANT_P (basey))
2389             || (CONSTANT_P (basex) && REG_P (basey)
2390                 && REGNO_PTR_FRAME_P (REGNO (basey)))
2391             || (CONSTANT_P (basey) && REG_P (basex)
2392                 && REGNO_PTR_FRAME_P (REGNO (basex))));
2393
2394   /* Offset based disambiguation not appropriate for loop invariant */
2395   if (loop_invariant)
2396     return 0;              
2397
2398   sizex = (!MEM_P (rtlx) ? (int) GET_MODE_SIZE (GET_MODE (rtlx))
2399            : MEM_SIZE_KNOWN_P (rtlx) ? MEM_SIZE (rtlx)
2400            : -1);
2401   sizey = (!MEM_P (rtly) ? (int) GET_MODE_SIZE (GET_MODE (rtly))
2402            : MEM_SIZE_KNOWN_P (rtly) ? MEM_SIZE (rtly)
2403            : -1);
2404
2405   /* If we have an offset for either memref, it can update the values computed
2406      above.  */
2407   if (moffsetx_known_p)
2408     offsetx += moffsetx, sizex -= moffsetx;
2409   if (moffsety_known_p)
2410     offsety += moffsety, sizey -= moffsety;
2411
2412   /* If a memref has both a size and an offset, we can use the smaller size.
2413      We can't do this if the offset isn't known because we must view this
2414      memref as being anywhere inside the DECL's MEM.  */
2415   if (MEM_SIZE_KNOWN_P (x) && moffsetx_known_p)
2416     sizex = MEM_SIZE (x);
2417   if (MEM_SIZE_KNOWN_P (y) && moffsety_known_p)
2418     sizey = MEM_SIZE (y);
2419
2420   /* Put the values of the memref with the lower offset in X's values.  */
2421   if (offsetx > offsety)
2422     {
2423       tem = offsetx, offsetx = offsety, offsety = tem;
2424       tem = sizex, sizex = sizey, sizey = tem;
2425     }
2426
2427   /* If we don't know the size of the lower-offset value, we can't tell
2428      if they conflict.  Otherwise, we do the test.  */
2429   return sizex >= 0 && offsety >= offsetx + sizex;
2430 }
2431
2432 /* Helper for true_dependence and canon_true_dependence.
2433    Checks for true dependence: X is read after store in MEM takes place.
2434
2435    If MEM_CANONICALIZED is FALSE, then X_ADDR and MEM_ADDR should be
2436    NULL_RTX, and the canonical addresses of MEM and X are both computed
2437    here.  If MEM_CANONICALIZED, then MEM must be already canonicalized.
2438
2439    If X_ADDR is non-NULL, it is used in preference of XEXP (x, 0).
2440
2441    Returns 1 if there is a true dependence, 0 otherwise.  */
2442
2443 static int
2444 true_dependence_1 (const_rtx mem, enum machine_mode mem_mode, rtx mem_addr,
2445                    const_rtx x, rtx x_addr, bool mem_canonicalized)
2446 {
2447   rtx base;
2448   int ret;
2449
2450   gcc_checking_assert (mem_canonicalized ? (mem_addr != NULL_RTX)
2451                        : (mem_addr == NULL_RTX && x_addr == NULL_RTX));
2452
2453   if (MEM_VOLATILE_P (x) && MEM_VOLATILE_P (mem))
2454     return 1;
2455
2456   /* (mem:BLK (scratch)) is a special mechanism to conflict with everything.
2457      This is used in epilogue deallocation functions, and in cselib.  */
2458   if (GET_MODE (x) == BLKmode && GET_CODE (XEXP (x, 0)) == SCRATCH)
2459     return 1;
2460   if (GET_MODE (mem) == BLKmode && GET_CODE (XEXP (mem, 0)) == SCRATCH)
2461     return 1;
2462   if (MEM_ALIAS_SET (x) == ALIAS_SET_MEMORY_BARRIER
2463       || MEM_ALIAS_SET (mem) == ALIAS_SET_MEMORY_BARRIER)
2464     return 1;
2465
2466   /* Read-only memory is by definition never modified, and therefore can't
2467      conflict with anything.  We don't expect to find read-only set on MEM,
2468      but stupid user tricks can produce them, so don't die.  */
2469   if (MEM_READONLY_P (x))
2470     return 0;
2471
2472   /* If we have MEMs referring to different address spaces (which can
2473      potentially overlap), we cannot easily tell from the addresses
2474      whether the references overlap.  */
2475   if (MEM_ADDR_SPACE (mem) != MEM_ADDR_SPACE (x))
2476     return 1;
2477
2478   if (! mem_addr)
2479     {
2480       mem_addr = XEXP (mem, 0);
2481       if (mem_mode == VOIDmode)
2482         mem_mode = GET_MODE (mem);
2483     }
2484
2485   if (! x_addr)
2486     {
2487       x_addr = XEXP (x, 0);
2488       if (!((GET_CODE (x_addr) == VALUE
2489              && GET_CODE (mem_addr) != VALUE
2490              && reg_mentioned_p (x_addr, mem_addr))
2491             || (GET_CODE (x_addr) != VALUE
2492                 && GET_CODE (mem_addr) == VALUE
2493                 && reg_mentioned_p (mem_addr, x_addr))))
2494         {
2495           x_addr = get_addr (x_addr);
2496           if (! mem_canonicalized)
2497             mem_addr = get_addr (mem_addr);
2498         }
2499     }
2500
2501   base = find_base_term (x_addr);
2502   if (base && (GET_CODE (base) == LABEL_REF
2503                || (GET_CODE (base) == SYMBOL_REF
2504                    && CONSTANT_POOL_ADDRESS_P (base))))
2505     return 0;
2506
2507   rtx mem_base = find_base_term (mem_addr);
2508   if (! base_alias_check (x_addr, base, mem_addr, mem_base,
2509                           GET_MODE (x), mem_mode))
2510     return 0;
2511
2512   x_addr = canon_rtx (x_addr);
2513   if (!mem_canonicalized)
2514     mem_addr = canon_rtx (mem_addr);
2515
2516   if ((ret = memrefs_conflict_p (GET_MODE_SIZE (mem_mode), mem_addr,
2517                                  SIZE_FOR_MODE (x), x_addr, 0)) != -1)
2518     return ret;
2519
2520   if (mems_in_disjoint_alias_sets_p (x, mem))
2521     return 0;
2522
2523   if (nonoverlapping_memrefs_p (mem, x, false))
2524     return 0;
2525
2526   if (nonoverlapping_component_refs_p (mem, x))
2527     return 0;
2528
2529   return rtx_refs_may_alias_p (x, mem, true);
2530 }
2531
2532 /* True dependence: X is read after store in MEM takes place.  */
2533
2534 int
2535 true_dependence (const_rtx mem, enum machine_mode mem_mode, const_rtx x)
2536 {
2537   return true_dependence_1 (mem, mem_mode, NULL_RTX,
2538                             x, NULL_RTX, /*mem_canonicalized=*/false);
2539 }
2540
2541 /* Canonical true dependence: X is read after store in MEM takes place.
2542    Variant of true_dependence which assumes MEM has already been
2543    canonicalized (hence we no longer do that here).
2544    The mem_addr argument has been added, since true_dependence_1 computed
2545    this value prior to canonicalizing.  */
2546
2547 int
2548 canon_true_dependence (const_rtx mem, enum machine_mode mem_mode, rtx mem_addr,
2549                        const_rtx x, rtx x_addr)
2550 {
2551   return true_dependence_1 (mem, mem_mode, mem_addr,
2552                             x, x_addr, /*mem_canonicalized=*/true);
2553 }
2554
2555 /* Returns nonzero if a write to X might alias a previous read from
2556    (or, if WRITEP is nonzero, a write to) MEM.  */
2557
2558 static int
2559 write_dependence_p (const_rtx mem, const_rtx x, int writep)
2560 {
2561   rtx x_addr, mem_addr;
2562   rtx base;
2563   int ret;
2564
2565   if (MEM_VOLATILE_P (x) && MEM_VOLATILE_P (mem))
2566     return 1;
2567
2568   /* (mem:BLK (scratch)) is a special mechanism to conflict with everything.
2569      This is used in epilogue deallocation functions.  */
2570   if (GET_MODE (x) == BLKmode && GET_CODE (XEXP (x, 0)) == SCRATCH)
2571     return 1;
2572   if (GET_MODE (mem) == BLKmode && GET_CODE (XEXP (mem, 0)) == SCRATCH)
2573     return 1;
2574   if (MEM_ALIAS_SET (x) == ALIAS_SET_MEMORY_BARRIER
2575       || MEM_ALIAS_SET (mem) == ALIAS_SET_MEMORY_BARRIER)
2576     return 1;
2577
2578   /* A read from read-only memory can't conflict with read-write memory.  */
2579   if (!writep && MEM_READONLY_P (mem))
2580     return 0;
2581
2582   /* If we have MEMs referring to different address spaces (which can
2583      potentially overlap), we cannot easily tell from the addresses
2584      whether the references overlap.  */
2585   if (MEM_ADDR_SPACE (mem) != MEM_ADDR_SPACE (x))
2586     return 1;
2587
2588   x_addr = XEXP (x, 0);
2589   mem_addr = XEXP (mem, 0);
2590   if (!((GET_CODE (x_addr) == VALUE
2591          && GET_CODE (mem_addr) != VALUE
2592          && reg_mentioned_p (x_addr, mem_addr))
2593         || (GET_CODE (x_addr) != VALUE
2594             && GET_CODE (mem_addr) == VALUE
2595             && reg_mentioned_p (mem_addr, x_addr))))
2596     {
2597       x_addr = get_addr (x_addr);
2598       mem_addr = get_addr (mem_addr);
2599     }
2600
2601   base = find_base_term (mem_addr);
2602   if (! writep
2603       && base
2604       && (GET_CODE (base) == LABEL_REF
2605           || (GET_CODE (base) == SYMBOL_REF
2606               && CONSTANT_POOL_ADDRESS_P (base))))
2607     return 0;
2608
2609   rtx x_base = find_base_term (x_addr);
2610   if (! base_alias_check (x_addr, x_base, mem_addr, base, GET_MODE (x),
2611                           GET_MODE (mem)))
2612     return 0;
2613
2614   x_addr = canon_rtx (x_addr);
2615   mem_addr = canon_rtx (mem_addr);
2616
2617   if ((ret = memrefs_conflict_p (SIZE_FOR_MODE (mem), mem_addr,
2618                                  SIZE_FOR_MODE (x), x_addr, 0)) != -1)
2619     return ret;
2620
2621   if (nonoverlapping_memrefs_p (x, mem, false))
2622     return 0;
2623
2624   return rtx_refs_may_alias_p (x, mem, false);
2625 }
2626
2627 /* Anti dependence: X is written after read in MEM takes place.  */
2628
2629 int
2630 anti_dependence (const_rtx mem, const_rtx x)
2631 {
2632   return write_dependence_p (mem, x, /*writep=*/0);
2633 }
2634
2635 /* Output dependence: X is written after store in MEM takes place.  */
2636
2637 int
2638 output_dependence (const_rtx mem, const_rtx x)
2639 {
2640   return write_dependence_p (mem, x, /*writep=*/1);
2641 }
2642 \f
2643
2644
2645 /* Check whether X may be aliased with MEM.  Don't do offset-based
2646   memory disambiguation & TBAA.  */
2647 int
2648 may_alias_p (const_rtx mem, const_rtx x)
2649 {
2650   rtx x_addr, mem_addr;
2651
2652   if (MEM_VOLATILE_P (x) && MEM_VOLATILE_P (mem))
2653     return 1;
2654
2655   /* (mem:BLK (scratch)) is a special mechanism to conflict with everything.
2656      This is used in epilogue deallocation functions.  */
2657   if (GET_MODE (x) == BLKmode && GET_CODE (XEXP (x, 0)) == SCRATCH)
2658     return 1;
2659   if (GET_MODE (mem) == BLKmode && GET_CODE (XEXP (mem, 0)) == SCRATCH)
2660     return 1;
2661   if (MEM_ALIAS_SET (x) == ALIAS_SET_MEMORY_BARRIER
2662       || MEM_ALIAS_SET (mem) == ALIAS_SET_MEMORY_BARRIER)
2663     return 1;
2664
2665   /* Read-only memory is by definition never modified, and therefore can't
2666      conflict with anything.  We don't expect to find read-only set on MEM,
2667      but stupid user tricks can produce them, so don't die.  */
2668   if (MEM_READONLY_P (x))
2669     return 0;
2670
2671   /* If we have MEMs referring to different address spaces (which can
2672      potentially overlap), we cannot easily tell from the addresses
2673      whether the references overlap.  */
2674   if (MEM_ADDR_SPACE (mem) != MEM_ADDR_SPACE (x))
2675     return 1;
2676
2677   x_addr = XEXP (x, 0);
2678   mem_addr = XEXP (mem, 0);
2679   if (!((GET_CODE (x_addr) == VALUE
2680          && GET_CODE (mem_addr) != VALUE
2681          && reg_mentioned_p (x_addr, mem_addr))
2682         || (GET_CODE (x_addr) != VALUE
2683             && GET_CODE (mem_addr) == VALUE
2684             && reg_mentioned_p (mem_addr, x_addr))))
2685     {
2686       x_addr = get_addr (x_addr);
2687       mem_addr = get_addr (mem_addr);
2688     }
2689
2690   rtx x_base = find_base_term (x_addr);
2691   rtx mem_base = find_base_term (mem_addr);
2692   if (! base_alias_check (x_addr, x_base, mem_addr, mem_base,
2693                           GET_MODE (x), GET_MODE (mem_addr)))
2694     return 0;
2695
2696   x_addr = canon_rtx (x_addr);
2697   mem_addr = canon_rtx (mem_addr);
2698
2699   if (nonoverlapping_memrefs_p (mem, x, true))
2700     return 0;
2701
2702   /* TBAA not valid for loop_invarint */
2703   return rtx_refs_may_alias_p (x, mem, false);
2704 }
2705
2706 void
2707 init_alias_target (void)
2708 {
2709   int i;
2710
2711   if (!arg_base_value)
2712     arg_base_value = gen_rtx_ADDRESS (VOIDmode, 0);
2713
2714   memset (static_reg_base_value, 0, sizeof static_reg_base_value);
2715
2716   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
2717     /* Check whether this register can hold an incoming pointer
2718        argument.  FUNCTION_ARG_REGNO_P tests outgoing register
2719        numbers, so translate if necessary due to register windows.  */
2720     if (FUNCTION_ARG_REGNO_P (OUTGOING_REGNO (i))
2721         && HARD_REGNO_MODE_OK (i, Pmode))
2722       static_reg_base_value[i] = arg_base_value;
2723
2724   static_reg_base_value[STACK_POINTER_REGNUM]
2725     = unique_base_value (UNIQUE_BASE_VALUE_SP);
2726   static_reg_base_value[ARG_POINTER_REGNUM]
2727     = unique_base_value (UNIQUE_BASE_VALUE_ARGP);
2728   static_reg_base_value[FRAME_POINTER_REGNUM]
2729     = unique_base_value (UNIQUE_BASE_VALUE_FP);
2730 #if !HARD_FRAME_POINTER_IS_FRAME_POINTER
2731   static_reg_base_value[HARD_FRAME_POINTER_REGNUM]
2732     = unique_base_value (UNIQUE_BASE_VALUE_HFP);
2733 #endif
2734 }
2735
2736 /* Set MEMORY_MODIFIED when X modifies DATA (that is assumed
2737    to be memory reference.  */
2738 static bool memory_modified;
2739 static void
2740 memory_modified_1 (rtx x, const_rtx pat ATTRIBUTE_UNUSED, void *data)
2741 {
2742   if (MEM_P (x))
2743     {
2744       if (anti_dependence (x, (const_rtx)data) || output_dependence (x, (const_rtx)data))
2745         memory_modified = true;
2746     }
2747 }
2748
2749
2750 /* Return true when INSN possibly modify memory contents of MEM
2751    (i.e. address can be modified).  */
2752 bool
2753 memory_modified_in_insn_p (const_rtx mem, const_rtx insn)
2754 {
2755   if (!INSN_P (insn))
2756     return false;
2757   memory_modified = false;
2758   note_stores (PATTERN (insn), memory_modified_1, CONST_CAST_RTX(mem));
2759   return memory_modified;
2760 }
2761
2762 /* Return TRUE if the destination of a set is rtx identical to
2763    ITEM.  */
2764 static inline bool
2765 set_dest_equal_p (const_rtx set, const_rtx item)
2766 {
2767   rtx dest = SET_DEST (set);
2768   return rtx_equal_p (dest, item);
2769 }
2770
2771 /* Like memory_modified_in_insn_p, but return TRUE if INSN will
2772    *DEFINITELY* modify the memory contents of MEM.  */
2773 bool
2774 memory_must_be_modified_in_insn_p (const_rtx mem, const_rtx insn)
2775 {
2776   if (!INSN_P (insn))
2777     return false;
2778   insn = PATTERN (insn);
2779   if (GET_CODE (insn) == SET)
2780     return set_dest_equal_p (insn, mem);
2781   else if (GET_CODE (insn) == PARALLEL)
2782     {
2783       int i;
2784       for (i = 0; i < XVECLEN (insn, 0); i++)
2785         {
2786           rtx sub = XVECEXP (insn, 0, i);
2787           if (GET_CODE (sub) == SET
2788               &&  set_dest_equal_p (sub, mem))
2789             return true;
2790         }
2791     }
2792   return false;
2793 }
2794
2795 /* Initialize the aliasing machinery.  Initialize the REG_KNOWN_VALUE
2796    array.  */
2797
2798 void
2799 init_alias_analysis (void)
2800 {
2801   unsigned int maxreg = max_reg_num ();
2802   int changed, pass;
2803   int i;
2804   unsigned int ui;
2805   rtx insn, val;
2806   int rpo_cnt;
2807   int *rpo;
2808
2809   timevar_push (TV_ALIAS_ANALYSIS);
2810
2811   vec_safe_grow_cleared (reg_known_value, maxreg - FIRST_PSEUDO_REGISTER);
2812   reg_known_equiv_p = sbitmap_alloc (maxreg - FIRST_PSEUDO_REGISTER);
2813   bitmap_clear (reg_known_equiv_p);
2814
2815   /* If we have memory allocated from the previous run, use it.  */
2816   if (old_reg_base_value)
2817     reg_base_value = old_reg_base_value;
2818
2819   if (reg_base_value)
2820     reg_base_value->truncate (0);
2821
2822   vec_safe_grow_cleared (reg_base_value, maxreg);
2823
2824   new_reg_base_value = XNEWVEC (rtx, maxreg);
2825   reg_seen = sbitmap_alloc (maxreg);
2826
2827   /* The basic idea is that each pass through this loop will use the
2828      "constant" information from the previous pass to propagate alias
2829      information through another level of assignments.
2830
2831      The propagation is done on the CFG in reverse post-order, to propagate
2832      things forward as far as possible in each iteration.
2833
2834      This could get expensive if the assignment chains are long.  Maybe
2835      we should throttle the number of iterations, possibly based on
2836      the optimization level or flag_expensive_optimizations.
2837
2838      We could propagate more information in the first pass by making use
2839      of DF_REG_DEF_COUNT to determine immediately that the alias information
2840      for a pseudo is "constant".
2841
2842      A program with an uninitialized variable can cause an infinite loop
2843      here.  Instead of doing a full dataflow analysis to detect such problems
2844      we just cap the number of iterations for the loop.
2845
2846      The state of the arrays for the set chain in question does not matter
2847      since the program has undefined behavior.  */
2848
2849   rpo = XNEWVEC (int, n_basic_blocks);
2850   rpo_cnt = pre_and_rev_post_order_compute (NULL, rpo, false);
2851
2852   pass = 0;
2853   do
2854     {
2855       /* Assume nothing will change this iteration of the loop.  */
2856       changed = 0;
2857
2858       /* We want to assign the same IDs each iteration of this loop, so
2859          start counting from one each iteration of the loop.  */
2860       unique_id = 1;
2861
2862       /* We're at the start of the function each iteration through the
2863          loop, so we're copying arguments.  */
2864       copying_arguments = true;
2865
2866       /* Wipe the potential alias information clean for this pass.  */
2867       memset (new_reg_base_value, 0, maxreg * sizeof (rtx));
2868
2869       /* Wipe the reg_seen array clean.  */
2870       bitmap_clear (reg_seen);
2871
2872       /* Mark all hard registers which may contain an address.
2873          The stack, frame and argument pointers may contain an address.
2874          An argument register which can hold a Pmode value may contain
2875          an address even if it is not in BASE_REGS.
2876
2877          The address expression is VOIDmode for an argument and
2878          Pmode for other registers.  */
2879
2880       memcpy (new_reg_base_value, static_reg_base_value,
2881               FIRST_PSEUDO_REGISTER * sizeof (rtx));
2882
2883       /* Walk the insns adding values to the new_reg_base_value array.  */
2884       for (i = 0; i < rpo_cnt; i++)
2885         {
2886           basic_block bb = BASIC_BLOCK (rpo[i]);
2887           FOR_BB_INSNS (bb, insn)
2888             {
2889               if (NONDEBUG_INSN_P (insn))
2890                 {
2891                   rtx note, set;
2892
2893 #if defined (HAVE_prologue) || defined (HAVE_epilogue)
2894                   /* The prologue/epilogue insns are not threaded onto the
2895                      insn chain until after reload has completed.  Thus,
2896                      there is no sense wasting time checking if INSN is in
2897                      the prologue/epilogue until after reload has completed.  */
2898                   if (reload_completed
2899                       && prologue_epilogue_contains (insn))
2900                     continue;
2901 #endif
2902
2903                   /* If this insn has a noalias note, process it,  Otherwise,
2904                      scan for sets.  A simple set will have no side effects
2905                      which could change the base value of any other register.  */
2906
2907                   if (GET_CODE (PATTERN (insn)) == SET
2908                       && REG_NOTES (insn) != 0
2909                       && find_reg_note (insn, REG_NOALIAS, NULL_RTX))
2910                     record_set (SET_DEST (PATTERN (insn)), NULL_RTX, NULL);
2911                   else
2912                     note_stores (PATTERN (insn), record_set, NULL);
2913
2914                   set = single_set (insn);
2915
2916                   if (set != 0
2917                       && REG_P (SET_DEST (set))
2918                       && REGNO (SET_DEST (set)) >= FIRST_PSEUDO_REGISTER)
2919                     {
2920                       unsigned int regno = REGNO (SET_DEST (set));
2921                       rtx src = SET_SRC (set);
2922                       rtx t;
2923
2924                       note = find_reg_equal_equiv_note (insn);
2925                       if (note && REG_NOTE_KIND (note) == REG_EQUAL
2926                           && DF_REG_DEF_COUNT (regno) != 1)
2927                         note = NULL_RTX;
2928
2929                       if (note != NULL_RTX
2930                           && GET_CODE (XEXP (note, 0)) != EXPR_LIST
2931                           && ! rtx_varies_p (XEXP (note, 0), 1)
2932                           && ! reg_overlap_mentioned_p (SET_DEST (set),
2933                                                         XEXP (note, 0)))
2934                         {
2935                           set_reg_known_value (regno, XEXP (note, 0));
2936                           set_reg_known_equiv_p (regno,
2937                                                  REG_NOTE_KIND (note) == REG_EQUIV);
2938                         }
2939                       else if (DF_REG_DEF_COUNT (regno) == 1
2940                                && GET_CODE (src) == PLUS
2941                                && REG_P (XEXP (src, 0))
2942                                && (t = get_reg_known_value (REGNO (XEXP (src, 0))))
2943                                && CONST_INT_P (XEXP (src, 1)))
2944                         {
2945                           t = plus_constant (GET_MODE (src), t,
2946                                              INTVAL (XEXP (src, 1)));
2947                           set_reg_known_value (regno, t);
2948                           set_reg_known_equiv_p (regno, false);
2949                         }
2950                       else if (DF_REG_DEF_COUNT (regno) == 1
2951                                && ! rtx_varies_p (src, 1))
2952                         {
2953                           set_reg_known_value (regno, src);
2954                           set_reg_known_equiv_p (regno, false);
2955                         }
2956                     }
2957                 }
2958               else if (NOTE_P (insn)
2959                        && NOTE_KIND (insn) == NOTE_INSN_FUNCTION_BEG)
2960                 copying_arguments = false;
2961             }
2962         }
2963
2964       /* Now propagate values from new_reg_base_value to reg_base_value.  */
2965       gcc_assert (maxreg == (unsigned int) max_reg_num ());
2966
2967       for (ui = 0; ui < maxreg; ui++)
2968         {
2969           if (new_reg_base_value[ui]
2970               && new_reg_base_value[ui] != (*reg_base_value)[ui]
2971               && ! rtx_equal_p (new_reg_base_value[ui], (*reg_base_value)[ui]))
2972             {
2973               (*reg_base_value)[ui] = new_reg_base_value[ui];
2974               changed = 1;
2975             }
2976         }
2977     }
2978   while (changed && ++pass < MAX_ALIAS_LOOP_PASSES);
2979   XDELETEVEC (rpo);
2980
2981   /* Fill in the remaining entries.  */
2982   FOR_EACH_VEC_ELT (*reg_known_value, i, val)
2983     {
2984       int regno = i + FIRST_PSEUDO_REGISTER;
2985       if (! val)
2986         set_reg_known_value (regno, regno_reg_rtx[regno]);
2987     }
2988
2989   /* Clean up.  */
2990   free (new_reg_base_value);
2991   new_reg_base_value = 0;
2992   sbitmap_free (reg_seen);
2993   reg_seen = 0;
2994   timevar_pop (TV_ALIAS_ANALYSIS);
2995 }
2996
2997 /* Equate REG_BASE_VALUE (reg1) to REG_BASE_VALUE (reg2).
2998    Special API for var-tracking pass purposes.  */
2999
3000 void
3001 vt_equate_reg_base_value (const_rtx reg1, const_rtx reg2)
3002 {
3003   (*reg_base_value)[REGNO (reg1)] = REG_BASE_VALUE (reg2);
3004 }
3005
3006 void
3007 end_alias_analysis (void)
3008 {
3009   old_reg_base_value = reg_base_value;
3010   vec_free (reg_known_value);
3011   sbitmap_free (reg_known_equiv_p);
3012 }
3013
3014 #include "gt-alias.h"