OSDN Git Service

Daily bump.
[pf3gnuchains/gcc-fork.git] / gcc / cse.c
1 /* Common subexpression elimination for GNU compiler.
2    Copyright (C) 1987, 1988, 1989, 1992, 1993, 1994, 1995, 1996, 1997, 1998
3    1999, 2000, 2001, 2002, 2003, 2004, 2005 Free Software Foundation, Inc.
4
5 This file is part of GCC.
6
7 GCC is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GCC; see the file COPYING.  If not, write to the Free
19 Software Foundation, 51 Franklin Street, Fifth Floor, Boston, MA
20 02110-1301, USA.  */
21
22 #include "config.h"
23 /* stdio.h must precede rtl.h for FFS.  */
24 #include "system.h"
25 #include "coretypes.h"
26 #include "tm.h"
27 #include "rtl.h"
28 #include "tm_p.h"
29 #include "hard-reg-set.h"
30 #include "regs.h"
31 #include "basic-block.h"
32 #include "flags.h"
33 #include "real.h"
34 #include "insn-config.h"
35 #include "recog.h"
36 #include "function.h"
37 #include "expr.h"
38 #include "toplev.h"
39 #include "output.h"
40 #include "ggc.h"
41 #include "timevar.h"
42 #include "except.h"
43 #include "target.h"
44 #include "params.h"
45 #include "rtlhooks-def.h"
46 #include "tree-pass.h"
47
48 /* The basic idea of common subexpression elimination is to go
49    through the code, keeping a record of expressions that would
50    have the same value at the current scan point, and replacing
51    expressions encountered with the cheapest equivalent expression.
52
53    It is too complicated to keep track of the different possibilities
54    when control paths merge in this code; so, at each label, we forget all
55    that is known and start fresh.  This can be described as processing each
56    extended basic block separately.  We have a separate pass to perform
57    global CSE.
58
59    Note CSE can turn a conditional or computed jump into a nop or
60    an unconditional jump.  When this occurs we arrange to run the jump
61    optimizer after CSE to delete the unreachable code.
62
63    We use two data structures to record the equivalent expressions:
64    a hash table for most expressions, and a vector of "quantity
65    numbers" to record equivalent (pseudo) registers.
66
67    The use of the special data structure for registers is desirable
68    because it is faster.  It is possible because registers references
69    contain a fairly small number, the register number, taken from
70    a contiguously allocated series, and two register references are
71    identical if they have the same number.  General expressions
72    do not have any such thing, so the only way to retrieve the
73    information recorded on an expression other than a register
74    is to keep it in a hash table.
75
76 Registers and "quantity numbers":
77
78    At the start of each basic block, all of the (hardware and pseudo)
79    registers used in the function are given distinct quantity
80    numbers to indicate their contents.  During scan, when the code
81    copies one register into another, we copy the quantity number.
82    When a register is loaded in any other way, we allocate a new
83    quantity number to describe the value generated by this operation.
84    `REG_QTY (N)' records what quantity register N is currently thought
85    of as containing.
86
87    All real quantity numbers are greater than or equal to zero.
88    If register N has not been assigned a quantity, `REG_QTY (N)' will
89    equal -N - 1, which is always negative.
90
91    Quantity numbers below zero do not exist and none of the `qty_table'
92    entries should be referenced with a negative index.
93
94    We also maintain a bidirectional chain of registers for each
95    quantity number.  The `qty_table` members `first_reg' and `last_reg',
96    and `reg_eqv_table' members `next' and `prev' hold these chains.
97
98    The first register in a chain is the one whose lifespan is least local.
99    Among equals, it is the one that was seen first.
100    We replace any equivalent register with that one.
101
102    If two registers have the same quantity number, it must be true that
103    REG expressions with qty_table `mode' must be in the hash table for both
104    registers and must be in the same class.
105
106    The converse is not true.  Since hard registers may be referenced in
107    any mode, two REG expressions might be equivalent in the hash table
108    but not have the same quantity number if the quantity number of one
109    of the registers is not the same mode as those expressions.
110
111 Constants and quantity numbers
112
113    When a quantity has a known constant value, that value is stored
114    in the appropriate qty_table `const_rtx'.  This is in addition to
115    putting the constant in the hash table as is usual for non-regs.
116
117    Whether a reg or a constant is preferred is determined by the configuration
118    macro CONST_COSTS and will often depend on the constant value.  In any
119    event, expressions containing constants can be simplified, by fold_rtx.
120
121    When a quantity has a known nearly constant value (such as an address
122    of a stack slot), that value is stored in the appropriate qty_table
123    `const_rtx'.
124
125    Integer constants don't have a machine mode.  However, cse
126    determines the intended machine mode from the destination
127    of the instruction that moves the constant.  The machine mode
128    is recorded in the hash table along with the actual RTL
129    constant expression so that different modes are kept separate.
130
131 Other expressions:
132
133    To record known equivalences among expressions in general
134    we use a hash table called `table'.  It has a fixed number of buckets
135    that contain chains of `struct table_elt' elements for expressions.
136    These chains connect the elements whose expressions have the same
137    hash codes.
138
139    Other chains through the same elements connect the elements which
140    currently have equivalent values.
141
142    Register references in an expression are canonicalized before hashing
143    the expression.  This is done using `reg_qty' and qty_table `first_reg'.
144    The hash code of a register reference is computed using the quantity
145    number, not the register number.
146
147    When the value of an expression changes, it is necessary to remove from the
148    hash table not just that expression but all expressions whose values
149    could be different as a result.
150
151      1. If the value changing is in memory, except in special cases
152      ANYTHING referring to memory could be changed.  That is because
153      nobody knows where a pointer does not point.
154      The function `invalidate_memory' removes what is necessary.
155
156      The special cases are when the address is constant or is
157      a constant plus a fixed register such as the frame pointer
158      or a static chain pointer.  When such addresses are stored in,
159      we can tell exactly which other such addresses must be invalidated
160      due to overlap.  `invalidate' does this.
161      All expressions that refer to non-constant
162      memory addresses are also invalidated.  `invalidate_memory' does this.
163
164      2. If the value changing is a register, all expressions
165      containing references to that register, and only those,
166      must be removed.
167
168    Because searching the entire hash table for expressions that contain
169    a register is very slow, we try to figure out when it isn't necessary.
170    Precisely, this is necessary only when expressions have been
171    entered in the hash table using this register, and then the value has
172    changed, and then another expression wants to be added to refer to
173    the register's new value.  This sequence of circumstances is rare
174    within any one basic block.
175
176    `REG_TICK' and `REG_IN_TABLE', accessors for members of
177    cse_reg_info, are used to detect this case.  REG_TICK (i) is
178    incremented whenever a value is stored in register i.
179    REG_IN_TABLE (i) holds -1 if no references to register i have been
180    entered in the table; otherwise, it contains the value REG_TICK (i)
181    had when the references were entered.  If we want to enter a
182    reference and REG_IN_TABLE (i) != REG_TICK (i), we must scan and
183    remove old references.  Until we want to enter a new entry, the
184    mere fact that the two vectors don't match makes the entries be
185    ignored if anyone tries to match them.
186
187    Registers themselves are entered in the hash table as well as in
188    the equivalent-register chains.  However, `REG_TICK' and
189    `REG_IN_TABLE' do not apply to expressions which are simple
190    register references.  These expressions are removed from the table
191    immediately when they become invalid, and this can be done even if
192    we do not immediately search for all the expressions that refer to
193    the register.
194
195    A CLOBBER rtx in an instruction invalidates its operand for further
196    reuse.  A CLOBBER or SET rtx whose operand is a MEM:BLK
197    invalidates everything that resides in memory.
198
199 Related expressions:
200
201    Constant expressions that differ only by an additive integer
202    are called related.  When a constant expression is put in
203    the table, the related expression with no constant term
204    is also entered.  These are made to point at each other
205    so that it is possible to find out if there exists any
206    register equivalent to an expression related to a given expression.  */
207
208 /* Length of qty_table vector.  We know in advance we will not need
209    a quantity number this big.  */
210
211 static int max_qty;
212
213 /* Next quantity number to be allocated.
214    This is 1 + the largest number needed so far.  */
215
216 static int next_qty;
217
218 /* Per-qty information tracking.
219
220    `first_reg' and `last_reg' track the head and tail of the
221    chain of registers which currently contain this quantity.
222
223    `mode' contains the machine mode of this quantity.
224
225    `const_rtx' holds the rtx of the constant value of this
226    quantity, if known.  A summations of the frame/arg pointer
227    and a constant can also be entered here.  When this holds
228    a known value, `const_insn' is the insn which stored the
229    constant value.
230
231    `comparison_{code,const,qty}' are used to track when a
232    comparison between a quantity and some constant or register has
233    been passed.  In such a case, we know the results of the comparison
234    in case we see it again.  These members record a comparison that
235    is known to be true.  `comparison_code' holds the rtx code of such
236    a comparison, else it is set to UNKNOWN and the other two
237    comparison members are undefined.  `comparison_const' holds
238    the constant being compared against, or zero if the comparison
239    is not against a constant.  `comparison_qty' holds the quantity
240    being compared against when the result is known.  If the comparison
241    is not with a register, `comparison_qty' is -1.  */
242
243 struct qty_table_elem
244 {
245   rtx const_rtx;
246   rtx const_insn;
247   rtx comparison_const;
248   int comparison_qty;
249   unsigned int first_reg, last_reg;
250   /* The sizes of these fields should match the sizes of the
251      code and mode fields of struct rtx_def (see rtl.h).  */
252   ENUM_BITFIELD(rtx_code) comparison_code : 16;
253   ENUM_BITFIELD(machine_mode) mode : 8;
254 };
255
256 /* The table of all qtys, indexed by qty number.  */
257 static struct qty_table_elem *qty_table;
258
259 /* Structure used to pass arguments via for_each_rtx to function
260    cse_change_cc_mode.  */
261 struct change_cc_mode_args
262 {
263   rtx insn;
264   rtx newreg;
265 };
266
267 #ifdef HAVE_cc0
268 /* For machines that have a CC0, we do not record its value in the hash
269    table since its use is guaranteed to be the insn immediately following
270    its definition and any other insn is presumed to invalidate it.
271
272    Instead, we store below the value last assigned to CC0.  If it should
273    happen to be a constant, it is stored in preference to the actual
274    assigned value.  In case it is a constant, we store the mode in which
275    the constant should be interpreted.  */
276
277 static rtx prev_insn_cc0;
278 static enum machine_mode prev_insn_cc0_mode;
279
280 /* Previous actual insn.  0 if at first insn of basic block.  */
281
282 static rtx prev_insn;
283 #endif
284
285 /* Insn being scanned.  */
286
287 static rtx this_insn;
288
289 /* Index by register number, gives the number of the next (or
290    previous) register in the chain of registers sharing the same
291    value.
292
293    Or -1 if this register is at the end of the chain.
294
295    If REG_QTY (N) == -N - 1, reg_eqv_table[N].next is undefined.  */
296
297 /* Per-register equivalence chain.  */
298 struct reg_eqv_elem
299 {
300   int next, prev;
301 };
302
303 /* The table of all register equivalence chains.  */
304 static struct reg_eqv_elem *reg_eqv_table;
305
306 struct cse_reg_info
307 {
308   /* The timestamp at which this register is initialized.  */
309   unsigned int timestamp;
310
311   /* The quantity number of the register's current contents.  */
312   int reg_qty;
313
314   /* The number of times the register has been altered in the current
315      basic block.  */
316   int reg_tick;
317
318   /* The REG_TICK value at which rtx's containing this register are
319      valid in the hash table.  If this does not equal the current
320      reg_tick value, such expressions existing in the hash table are
321      invalid.  */
322   int reg_in_table;
323
324   /* The SUBREG that was set when REG_TICK was last incremented.  Set
325      to -1 if the last store was to the whole register, not a subreg.  */
326   unsigned int subreg_ticked;
327 };
328
329 /* A table of cse_reg_info indexed by register numbers.  */
330 static struct cse_reg_info *cse_reg_info_table;
331
332 /* The size of the above table.  */
333 static unsigned int cse_reg_info_table_size;
334
335 /* The index of the first entry that has not been initialized.  */
336 static unsigned int cse_reg_info_table_first_uninitialized;
337
338 /* The timestamp at the beginning of the current run of
339    cse_basic_block.  We increment this variable at the beginning of
340    the current run of cse_basic_block.  The timestamp field of a
341    cse_reg_info entry matches the value of this variable if and only
342    if the entry has been initialized during the current run of
343    cse_basic_block.  */
344 static unsigned int cse_reg_info_timestamp;
345
346 /* A HARD_REG_SET containing all the hard registers for which there is
347    currently a REG expression in the hash table.  Note the difference
348    from the above variables, which indicate if the REG is mentioned in some
349    expression in the table.  */
350
351 static HARD_REG_SET hard_regs_in_table;
352
353 /* CUID of insn that starts the basic block currently being cse-processed.  */
354
355 static int cse_basic_block_start;
356
357 /* CUID of insn that ends the basic block currently being cse-processed.  */
358
359 static int cse_basic_block_end;
360
361 /* Vector mapping INSN_UIDs to cuids.
362    The cuids are like uids but increase monotonically always.
363    We use them to see whether a reg is used outside a given basic block.  */
364
365 static int *uid_cuid;
366
367 /* Highest UID in UID_CUID.  */
368 static int max_uid;
369
370 /* Get the cuid of an insn.  */
371
372 #define INSN_CUID(INSN) (uid_cuid[INSN_UID (INSN)])
373
374 /* Nonzero if this pass has made changes, and therefore it's
375    worthwhile to run the garbage collector.  */
376
377 static int cse_altered;
378
379 /* Nonzero if cse has altered conditional jump insns
380    in such a way that jump optimization should be redone.  */
381
382 static int cse_jumps_altered;
383
384 /* Nonzero if we put a LABEL_REF into the hash table for an INSN without a
385    REG_LABEL, we have to rerun jump after CSE to put in the note.  */
386 static int recorded_label_ref;
387
388 /* canon_hash stores 1 in do_not_record
389    if it notices a reference to CC0, PC, or some other volatile
390    subexpression.  */
391
392 static int do_not_record;
393
394 /* canon_hash stores 1 in hash_arg_in_memory
395    if it notices a reference to memory within the expression being hashed.  */
396
397 static int hash_arg_in_memory;
398
399 /* The hash table contains buckets which are chains of `struct table_elt's,
400    each recording one expression's information.
401    That expression is in the `exp' field.
402
403    The canon_exp field contains a canonical (from the point of view of
404    alias analysis) version of the `exp' field.
405
406    Those elements with the same hash code are chained in both directions
407    through the `next_same_hash' and `prev_same_hash' fields.
408
409    Each set of expressions with equivalent values
410    are on a two-way chain through the `next_same_value'
411    and `prev_same_value' fields, and all point with
412    the `first_same_value' field at the first element in
413    that chain.  The chain is in order of increasing cost.
414    Each element's cost value is in its `cost' field.
415
416    The `in_memory' field is nonzero for elements that
417    involve any reference to memory.  These elements are removed
418    whenever a write is done to an unidentified location in memory.
419    To be safe, we assume that a memory address is unidentified unless
420    the address is either a symbol constant or a constant plus
421    the frame pointer or argument pointer.
422
423    The `related_value' field is used to connect related expressions
424    (that differ by adding an integer).
425    The related expressions are chained in a circular fashion.
426    `related_value' is zero for expressions for which this
427    chain is not useful.
428
429    The `cost' field stores the cost of this element's expression.
430    The `regcost' field stores the value returned by approx_reg_cost for
431    this element's expression.
432
433    The `is_const' flag is set if the element is a constant (including
434    a fixed address).
435
436    The `flag' field is used as a temporary during some search routines.
437
438    The `mode' field is usually the same as GET_MODE (`exp'), but
439    if `exp' is a CONST_INT and has no machine mode then the `mode'
440    field is the mode it was being used as.  Each constant is
441    recorded separately for each mode it is used with.  */
442
443 struct table_elt
444 {
445   rtx exp;
446   rtx canon_exp;
447   struct table_elt *next_same_hash;
448   struct table_elt *prev_same_hash;
449   struct table_elt *next_same_value;
450   struct table_elt *prev_same_value;
451   struct table_elt *first_same_value;
452   struct table_elt *related_value;
453   int cost;
454   int regcost;
455   /* The size of this field should match the size
456      of the mode field of struct rtx_def (see rtl.h).  */
457   ENUM_BITFIELD(machine_mode) mode : 8;
458   char in_memory;
459   char is_const;
460   char flag;
461 };
462
463 /* We don't want a lot of buckets, because we rarely have very many
464    things stored in the hash table, and a lot of buckets slows
465    down a lot of loops that happen frequently.  */
466 #define HASH_SHIFT      5
467 #define HASH_SIZE       (1 << HASH_SHIFT)
468 #define HASH_MASK       (HASH_SIZE - 1)
469
470 /* Compute hash code of X in mode M.  Special-case case where X is a pseudo
471    register (hard registers may require `do_not_record' to be set).  */
472
473 #define HASH(X, M)      \
474  ((REG_P (X) && REGNO (X) >= FIRST_PSEUDO_REGISTER      \
475   ? (((unsigned) REG << 7) + (unsigned) REG_QTY (REGNO (X)))    \
476   : canon_hash (X, M)) & HASH_MASK)
477
478 /* Like HASH, but without side-effects.  */
479 #define SAFE_HASH(X, M) \
480  ((REG_P (X) && REGNO (X) >= FIRST_PSEUDO_REGISTER      \
481   ? (((unsigned) REG << 7) + (unsigned) REG_QTY (REGNO (X)))    \
482   : safe_hash (X, M)) & HASH_MASK)
483
484 /* Determine whether register number N is considered a fixed register for the
485    purpose of approximating register costs.
486    It is desirable to replace other regs with fixed regs, to reduce need for
487    non-fixed hard regs.
488    A reg wins if it is either the frame pointer or designated as fixed.  */
489 #define FIXED_REGNO_P(N)  \
490   ((N) == FRAME_POINTER_REGNUM || (N) == HARD_FRAME_POINTER_REGNUM \
491    || fixed_regs[N] || global_regs[N])
492
493 /* Compute cost of X, as stored in the `cost' field of a table_elt.  Fixed
494    hard registers and pointers into the frame are the cheapest with a cost
495    of 0.  Next come pseudos with a cost of one and other hard registers with
496    a cost of 2.  Aside from these special cases, call `rtx_cost'.  */
497
498 #define CHEAP_REGNO(N)                                                  \
499   (REGNO_PTR_FRAME_P(N)                                                 \
500    || (HARD_REGISTER_NUM_P (N)                                          \
501        && FIXED_REGNO_P (N) && REGNO_REG_CLASS (N) != NO_REGS))
502
503 #define COST(X) (REG_P (X) ? 0 : notreg_cost (X, SET))
504 #define COST_IN(X,OUTER) (REG_P (X) ? 0 : notreg_cost (X, OUTER))
505
506 /* Get the number of times this register has been updated in this
507    basic block.  */
508
509 #define REG_TICK(N) (get_cse_reg_info (N)->reg_tick)
510
511 /* Get the point at which REG was recorded in the table.  */
512
513 #define REG_IN_TABLE(N) (get_cse_reg_info (N)->reg_in_table)
514
515 /* Get the SUBREG set at the last increment to REG_TICK (-1 if not a
516    SUBREG).  */
517
518 #define SUBREG_TICKED(N) (get_cse_reg_info (N)->subreg_ticked)
519
520 /* Get the quantity number for REG.  */
521
522 #define REG_QTY(N) (get_cse_reg_info (N)->reg_qty)
523
524 /* Determine if the quantity number for register X represents a valid index
525    into the qty_table.  */
526
527 #define REGNO_QTY_VALID_P(N) (REG_QTY (N) >= 0)
528
529 static struct table_elt *table[HASH_SIZE];
530
531 /* Chain of `struct table_elt's made so far for this function
532    but currently removed from the table.  */
533
534 static struct table_elt *free_element_chain;
535
536 /* Set to the cost of a constant pool reference if one was found for a
537    symbolic constant.  If this was found, it means we should try to
538    convert constants into constant pool entries if they don't fit in
539    the insn.  */
540
541 static int constant_pool_entries_cost;
542 static int constant_pool_entries_regcost;
543
544 /* This data describes a block that will be processed by cse_basic_block.  */
545
546 struct cse_basic_block_data
547 {
548   /* Lowest CUID value of insns in block.  */
549   int low_cuid;
550   /* Highest CUID value of insns in block.  */
551   int high_cuid;
552   /* Total number of SETs in block.  */
553   int nsets;
554   /* Last insn in the block.  */
555   rtx last;
556   /* Size of current branch path, if any.  */
557   int path_size;
558   /* Current branch path, indicating which branches will be taken.  */
559   struct branch_path
560     {
561       /* The branch insn.  */
562       rtx branch;
563       /* Whether it should be taken or not.  AROUND is the same as taken
564          except that it is used when the destination label is not preceded
565        by a BARRIER.  */
566       enum taken {PATH_TAKEN, PATH_NOT_TAKEN, PATH_AROUND} status;
567     } *path;
568 };
569
570 static bool fixed_base_plus_p (rtx x);
571 static int notreg_cost (rtx, enum rtx_code);
572 static int approx_reg_cost_1 (rtx *, void *);
573 static int approx_reg_cost (rtx);
574 static int preferable (int, int, int, int);
575 static void new_basic_block (void);
576 static void make_new_qty (unsigned int, enum machine_mode);
577 static void make_regs_eqv (unsigned int, unsigned int);
578 static void delete_reg_equiv (unsigned int);
579 static int mention_regs (rtx);
580 static int insert_regs (rtx, struct table_elt *, int);
581 static void remove_from_table (struct table_elt *, unsigned);
582 static struct table_elt *lookup (rtx, unsigned, enum machine_mode);
583 static struct table_elt *lookup_for_remove (rtx, unsigned, enum machine_mode);
584 static rtx lookup_as_function (rtx, enum rtx_code);
585 static struct table_elt *insert (rtx, struct table_elt *, unsigned,
586                                  enum machine_mode);
587 static void merge_equiv_classes (struct table_elt *, struct table_elt *);
588 static void invalidate (rtx, enum machine_mode);
589 static int cse_rtx_varies_p (rtx, int);
590 static void remove_invalid_refs (unsigned int);
591 static void remove_invalid_subreg_refs (unsigned int, unsigned int,
592                                         enum machine_mode);
593 static void rehash_using_reg (rtx);
594 static void invalidate_memory (void);
595 static void invalidate_for_call (void);
596 static rtx use_related_value (rtx, struct table_elt *);
597
598 static inline unsigned canon_hash (rtx, enum machine_mode);
599 static inline unsigned safe_hash (rtx, enum machine_mode);
600 static unsigned hash_rtx_string (const char *);
601
602 static rtx canon_reg (rtx, rtx);
603 static void find_best_addr (rtx, rtx *, enum machine_mode);
604 static enum rtx_code find_comparison_args (enum rtx_code, rtx *, rtx *,
605                                            enum machine_mode *,
606                                            enum machine_mode *);
607 static rtx fold_rtx (rtx, rtx);
608 static rtx equiv_constant (rtx);
609 static void record_jump_equiv (rtx, int);
610 static void record_jump_cond (enum rtx_code, enum machine_mode, rtx, rtx,
611                               int);
612 static void cse_insn (rtx, rtx);
613 static void cse_end_of_basic_block (rtx, struct cse_basic_block_data *,
614                                     int, int);
615 static int addr_affects_sp_p (rtx);
616 static void invalidate_from_clobbers (rtx);
617 static rtx cse_process_notes (rtx, rtx);
618 static void invalidate_skipped_set (rtx, rtx, void *);
619 static void invalidate_skipped_block (rtx);
620 static rtx cse_basic_block (rtx, rtx, struct branch_path *);
621 static void count_reg_usage (rtx, int *, rtx, int);
622 static int check_for_label_ref (rtx *, void *);
623 extern void dump_class (struct table_elt*);
624 static void get_cse_reg_info_1 (unsigned int regno);
625 static struct cse_reg_info * get_cse_reg_info (unsigned int regno);
626 static int check_dependence (rtx *, void *);
627
628 static void flush_hash_table (void);
629 static bool insn_live_p (rtx, int *);
630 static bool set_live_p (rtx, rtx, int *);
631 static bool dead_libcall_p (rtx, int *);
632 static int cse_change_cc_mode (rtx *, void *);
633 static void cse_change_cc_mode_insn (rtx, rtx);
634 static void cse_change_cc_mode_insns (rtx, rtx, rtx);
635 static enum machine_mode cse_cc_succs (basic_block, rtx, rtx, bool);
636 \f
637
638 #undef RTL_HOOKS_GEN_LOWPART
639 #define RTL_HOOKS_GEN_LOWPART           gen_lowpart_if_possible
640
641 static const struct rtl_hooks cse_rtl_hooks = RTL_HOOKS_INITIALIZER;
642 \f
643 /* Nonzero if X has the form (PLUS frame-pointer integer).  We check for
644    virtual regs here because the simplify_*_operation routines are called
645    by integrate.c, which is called before virtual register instantiation.  */
646
647 static bool
648 fixed_base_plus_p (rtx x)
649 {
650   switch (GET_CODE (x))
651     {
652     case REG:
653       if (x == frame_pointer_rtx || x == hard_frame_pointer_rtx)
654         return true;
655       if (x == arg_pointer_rtx && fixed_regs[ARG_POINTER_REGNUM])
656         return true;
657       if (REGNO (x) >= FIRST_VIRTUAL_REGISTER
658           && REGNO (x) <= LAST_VIRTUAL_REGISTER)
659         return true;
660       return false;
661
662     case PLUS:
663       if (GET_CODE (XEXP (x, 1)) != CONST_INT)
664         return false;
665       return fixed_base_plus_p (XEXP (x, 0));
666
667     default:
668       return false;
669     }
670 }
671
672 /* Dump the expressions in the equivalence class indicated by CLASSP.
673    This function is used only for debugging.  */
674 void
675 dump_class (struct table_elt *classp)
676 {
677   struct table_elt *elt;
678
679   fprintf (stderr, "Equivalence chain for ");
680   print_rtl (stderr, classp->exp);
681   fprintf (stderr, ": \n");
682
683   for (elt = classp->first_same_value; elt; elt = elt->next_same_value)
684     {
685       print_rtl (stderr, elt->exp);
686       fprintf (stderr, "\n");
687     }
688 }
689
690 /* Subroutine of approx_reg_cost; called through for_each_rtx.  */
691
692 static int
693 approx_reg_cost_1 (rtx *xp, void *data)
694 {
695   rtx x = *xp;
696   int *cost_p = data;
697
698   if (x && REG_P (x))
699     {
700       unsigned int regno = REGNO (x);
701
702       if (! CHEAP_REGNO (regno))
703         {
704           if (regno < FIRST_PSEUDO_REGISTER)
705             {
706               if (SMALL_REGISTER_CLASSES)
707                 return 1;
708               *cost_p += 2;
709             }
710           else
711             *cost_p += 1;
712         }
713     }
714
715   return 0;
716 }
717
718 /* Return an estimate of the cost of the registers used in an rtx.
719    This is mostly the number of different REG expressions in the rtx;
720    however for some exceptions like fixed registers we use a cost of
721    0.  If any other hard register reference occurs, return MAX_COST.  */
722
723 static int
724 approx_reg_cost (rtx x)
725 {
726   int cost = 0;
727
728   if (for_each_rtx (&x, approx_reg_cost_1, (void *) &cost))
729     return MAX_COST;
730
731   return cost;
732 }
733
734 /* Returns a canonical version of X for the address, from the point of view,
735    that all multiplications are represented as MULT instead of the multiply
736    by a power of 2 being represented as ASHIFT.  */
737
738 static rtx
739 canon_for_address (rtx x)
740 {
741   enum rtx_code code;
742   enum machine_mode mode;
743   rtx new = 0;
744   int i;
745   const char *fmt;
746   
747   if (!x)
748     return x;
749   
750   code = GET_CODE (x);
751   mode = GET_MODE (x);
752   
753   switch (code)
754     {
755     case ASHIFT:
756       if (GET_CODE (XEXP (x, 1)) == CONST_INT
757           && INTVAL (XEXP (x, 1)) < GET_MODE_BITSIZE (mode)
758           && INTVAL (XEXP (x, 1)) >= 0)
759         {
760           new = canon_for_address (XEXP (x, 0));
761           new = gen_rtx_MULT (mode, new,
762                               gen_int_mode ((HOST_WIDE_INT) 1
763                                             << INTVAL (XEXP (x, 1)),
764                                             mode));
765         }
766       break;
767     default:
768       break;
769       
770     }
771   if (new)
772     return new;
773   
774   /* Now recursively process each operand of this operation.  */
775   fmt = GET_RTX_FORMAT (code);
776   for (i = 0; i < GET_RTX_LENGTH (code); i++)
777     if (fmt[i] == 'e')
778       {
779         new = canon_for_address (XEXP (x, i));
780         XEXP (x, i) = new;
781       }
782   return x;
783 }
784
785 /* Return a negative value if an rtx A, whose costs are given by COST_A
786    and REGCOST_A, is more desirable than an rtx B.
787    Return a positive value if A is less desirable, or 0 if the two are
788    equally good.  */
789 static int
790 preferable (int cost_a, int regcost_a, int cost_b, int regcost_b)
791 {
792   /* First, get rid of cases involving expressions that are entirely
793      unwanted.  */
794   if (cost_a != cost_b)
795     {
796       if (cost_a == MAX_COST)
797         return 1;
798       if (cost_b == MAX_COST)
799         return -1;
800     }
801
802   /* Avoid extending lifetimes of hardregs.  */
803   if (regcost_a != regcost_b)
804     {
805       if (regcost_a == MAX_COST)
806         return 1;
807       if (regcost_b == MAX_COST)
808         return -1;
809     }
810
811   /* Normal operation costs take precedence.  */
812   if (cost_a != cost_b)
813     return cost_a - cost_b;
814   /* Only if these are identical consider effects on register pressure.  */
815   if (regcost_a != regcost_b)
816     return regcost_a - regcost_b;
817   return 0;
818 }
819
820 /* Internal function, to compute cost when X is not a register; called
821    from COST macro to keep it simple.  */
822
823 static int
824 notreg_cost (rtx x, enum rtx_code outer)
825 {
826   return ((GET_CODE (x) == SUBREG
827            && REG_P (SUBREG_REG (x))
828            && GET_MODE_CLASS (GET_MODE (x)) == MODE_INT
829            && GET_MODE_CLASS (GET_MODE (SUBREG_REG (x))) == MODE_INT
830            && (GET_MODE_SIZE (GET_MODE (x))
831                < GET_MODE_SIZE (GET_MODE (SUBREG_REG (x))))
832            && subreg_lowpart_p (x)
833            && TRULY_NOOP_TRUNCATION (GET_MODE_BITSIZE (GET_MODE (x)),
834                                      GET_MODE_BITSIZE (GET_MODE (SUBREG_REG (x)))))
835           ? 0
836           : rtx_cost (x, outer) * 2);
837 }
838
839 \f
840 /* Initialize CSE_REG_INFO_TABLE.  */
841
842 static void
843 init_cse_reg_info (unsigned int nregs)
844 {
845   /* Do we need to grow the table?  */
846   if (nregs > cse_reg_info_table_size)
847     {
848       unsigned int new_size;
849
850       if (cse_reg_info_table_size < 2048)
851         {
852           /* Compute a new size that is a power of 2 and no smaller
853              than the large of NREGS and 64.  */
854           new_size = (cse_reg_info_table_size
855                       ? cse_reg_info_table_size : 64);
856
857           while (new_size < nregs)
858             new_size *= 2;
859         }
860       else
861         {
862           /* If we need a big table, allocate just enough to hold
863              NREGS registers.  */
864           new_size = nregs;
865         }
866
867       /* Reallocate the table with NEW_SIZE entries.  */
868       if (cse_reg_info_table)
869         free (cse_reg_info_table);
870       cse_reg_info_table = xmalloc (sizeof (struct cse_reg_info)
871                                      * new_size);
872       cse_reg_info_table_size = new_size;
873       cse_reg_info_table_first_uninitialized = 0;
874     }
875
876   /* Do we have all of the first NREGS entries initialized?  */
877   if (cse_reg_info_table_first_uninitialized < nregs)
878     {
879       unsigned int old_timestamp = cse_reg_info_timestamp - 1;
880       unsigned int i;
881
882       /* Put the old timestamp on newly allocated entries so that they
883          will all be considered out of date.  We do not touch those
884          entries beyond the first NREGS entries to be nice to the
885          virtual memory.  */
886       for (i = cse_reg_info_table_first_uninitialized; i < nregs; i++)
887         cse_reg_info_table[i].timestamp = old_timestamp;
888
889       cse_reg_info_table_first_uninitialized = nregs;
890     }
891 }
892
893 /* Given REGNO, initialize the cse_reg_info entry for REGNO.  */
894
895 static void
896 get_cse_reg_info_1 (unsigned int regno)
897 {
898   /* Set TIMESTAMP field to CSE_REG_INFO_TIMESTAMP so that this
899      entry will be considered to have been initialized.  */
900   cse_reg_info_table[regno].timestamp = cse_reg_info_timestamp;
901
902   /* Initialize the rest of the entry.  */
903   cse_reg_info_table[regno].reg_tick = 1;
904   cse_reg_info_table[regno].reg_in_table = -1;
905   cse_reg_info_table[regno].subreg_ticked = -1;
906   cse_reg_info_table[regno].reg_qty = -regno - 1;
907 }
908
909 /* Find a cse_reg_info entry for REGNO.  */
910
911 static inline struct cse_reg_info *
912 get_cse_reg_info (unsigned int regno)
913 {
914   struct cse_reg_info *p = &cse_reg_info_table[regno];
915
916   /* If this entry has not been initialized, go ahead and initialize
917      it.  */
918   if (p->timestamp != cse_reg_info_timestamp)
919     get_cse_reg_info_1 (regno);
920
921   return p;
922 }
923
924 /* Clear the hash table and initialize each register with its own quantity,
925    for a new basic block.  */
926
927 static void
928 new_basic_block (void)
929 {
930   int i;
931
932   next_qty = 0;
933
934   /* Invalidate cse_reg_info_table.  */
935   cse_reg_info_timestamp++;
936
937   /* Clear out hash table state for this pass.  */
938   CLEAR_HARD_REG_SET (hard_regs_in_table);
939
940   /* The per-quantity values used to be initialized here, but it is
941      much faster to initialize each as it is made in `make_new_qty'.  */
942
943   for (i = 0; i < HASH_SIZE; i++)
944     {
945       struct table_elt *first;
946
947       first = table[i];
948       if (first != NULL)
949         {
950           struct table_elt *last = first;
951
952           table[i] = NULL;
953
954           while (last->next_same_hash != NULL)
955             last = last->next_same_hash;
956
957           /* Now relink this hash entire chain into
958              the free element list.  */
959
960           last->next_same_hash = free_element_chain;
961           free_element_chain = first;
962         }
963     }
964
965 #ifdef HAVE_cc0
966   prev_insn = 0;
967   prev_insn_cc0 = 0;
968 #endif
969 }
970
971 /* Say that register REG contains a quantity in mode MODE not in any
972    register before and initialize that quantity.  */
973
974 static void
975 make_new_qty (unsigned int reg, enum machine_mode mode)
976 {
977   int q;
978   struct qty_table_elem *ent;
979   struct reg_eqv_elem *eqv;
980
981   gcc_assert (next_qty < max_qty);
982
983   q = REG_QTY (reg) = next_qty++;
984   ent = &qty_table[q];
985   ent->first_reg = reg;
986   ent->last_reg = reg;
987   ent->mode = mode;
988   ent->const_rtx = ent->const_insn = NULL_RTX;
989   ent->comparison_code = UNKNOWN;
990
991   eqv = &reg_eqv_table[reg];
992   eqv->next = eqv->prev = -1;
993 }
994
995 /* Make reg NEW equivalent to reg OLD.
996    OLD is not changing; NEW is.  */
997
998 static void
999 make_regs_eqv (unsigned int new, unsigned int old)
1000 {
1001   unsigned int lastr, firstr;
1002   int q = REG_QTY (old);
1003   struct qty_table_elem *ent;
1004
1005   ent = &qty_table[q];
1006
1007   /* Nothing should become eqv until it has a "non-invalid" qty number.  */
1008   gcc_assert (REGNO_QTY_VALID_P (old));
1009
1010   REG_QTY (new) = q;
1011   firstr = ent->first_reg;
1012   lastr = ent->last_reg;
1013
1014   /* Prefer fixed hard registers to anything.  Prefer pseudo regs to other
1015      hard regs.  Among pseudos, if NEW will live longer than any other reg
1016      of the same qty, and that is beyond the current basic block,
1017      make it the new canonical replacement for this qty.  */
1018   if (! (firstr < FIRST_PSEUDO_REGISTER && FIXED_REGNO_P (firstr))
1019       /* Certain fixed registers might be of the class NO_REGS.  This means
1020          that not only can they not be allocated by the compiler, but
1021          they cannot be used in substitutions or canonicalizations
1022          either.  */
1023       && (new >= FIRST_PSEUDO_REGISTER || REGNO_REG_CLASS (new) != NO_REGS)
1024       && ((new < FIRST_PSEUDO_REGISTER && FIXED_REGNO_P (new))
1025           || (new >= FIRST_PSEUDO_REGISTER
1026               && (firstr < FIRST_PSEUDO_REGISTER
1027                   || ((uid_cuid[REGNO_LAST_UID (new)] > cse_basic_block_end
1028                        || (uid_cuid[REGNO_FIRST_UID (new)]
1029                            < cse_basic_block_start))
1030                       && (uid_cuid[REGNO_LAST_UID (new)]
1031                           > uid_cuid[REGNO_LAST_UID (firstr)]))))))
1032     {
1033       reg_eqv_table[firstr].prev = new;
1034       reg_eqv_table[new].next = firstr;
1035       reg_eqv_table[new].prev = -1;
1036       ent->first_reg = new;
1037     }
1038   else
1039     {
1040       /* If NEW is a hard reg (known to be non-fixed), insert at end.
1041          Otherwise, insert before any non-fixed hard regs that are at the
1042          end.  Registers of class NO_REGS cannot be used as an
1043          equivalent for anything.  */
1044       while (lastr < FIRST_PSEUDO_REGISTER && reg_eqv_table[lastr].prev >= 0
1045              && (REGNO_REG_CLASS (lastr) == NO_REGS || ! FIXED_REGNO_P (lastr))
1046              && new >= FIRST_PSEUDO_REGISTER)
1047         lastr = reg_eqv_table[lastr].prev;
1048       reg_eqv_table[new].next = reg_eqv_table[lastr].next;
1049       if (reg_eqv_table[lastr].next >= 0)
1050         reg_eqv_table[reg_eqv_table[lastr].next].prev = new;
1051       else
1052         qty_table[q].last_reg = new;
1053       reg_eqv_table[lastr].next = new;
1054       reg_eqv_table[new].prev = lastr;
1055     }
1056 }
1057
1058 /* Remove REG from its equivalence class.  */
1059
1060 static void
1061 delete_reg_equiv (unsigned int reg)
1062 {
1063   struct qty_table_elem *ent;
1064   int q = REG_QTY (reg);
1065   int p, n;
1066
1067   /* If invalid, do nothing.  */
1068   if (! REGNO_QTY_VALID_P (reg))
1069     return;
1070
1071   ent = &qty_table[q];
1072
1073   p = reg_eqv_table[reg].prev;
1074   n = reg_eqv_table[reg].next;
1075
1076   if (n != -1)
1077     reg_eqv_table[n].prev = p;
1078   else
1079     ent->last_reg = p;
1080   if (p != -1)
1081     reg_eqv_table[p].next = n;
1082   else
1083     ent->first_reg = n;
1084
1085   REG_QTY (reg) = -reg - 1;
1086 }
1087
1088 /* Remove any invalid expressions from the hash table
1089    that refer to any of the registers contained in expression X.
1090
1091    Make sure that newly inserted references to those registers
1092    as subexpressions will be considered valid.
1093
1094    mention_regs is not called when a register itself
1095    is being stored in the table.
1096
1097    Return 1 if we have done something that may have changed the hash code
1098    of X.  */
1099
1100 static int
1101 mention_regs (rtx x)
1102 {
1103   enum rtx_code code;
1104   int i, j;
1105   const char *fmt;
1106   int changed = 0;
1107
1108   if (x == 0)
1109     return 0;
1110
1111   code = GET_CODE (x);
1112   if (code == REG)
1113     {
1114       unsigned int regno = REGNO (x);
1115       unsigned int endregno
1116         = regno + (regno >= FIRST_PSEUDO_REGISTER ? 1
1117                    : hard_regno_nregs[regno][GET_MODE (x)]);
1118       unsigned int i;
1119
1120       for (i = regno; i < endregno; i++)
1121         {
1122           if (REG_IN_TABLE (i) >= 0 && REG_IN_TABLE (i) != REG_TICK (i))
1123             remove_invalid_refs (i);
1124
1125           REG_IN_TABLE (i) = REG_TICK (i);
1126           SUBREG_TICKED (i) = -1;
1127         }
1128
1129       return 0;
1130     }
1131
1132   /* If this is a SUBREG, we don't want to discard other SUBREGs of the same
1133      pseudo if they don't use overlapping words.  We handle only pseudos
1134      here for simplicity.  */
1135   if (code == SUBREG && REG_P (SUBREG_REG (x))
1136       && REGNO (SUBREG_REG (x)) >= FIRST_PSEUDO_REGISTER)
1137     {
1138       unsigned int i = REGNO (SUBREG_REG (x));
1139
1140       if (REG_IN_TABLE (i) >= 0 && REG_IN_TABLE (i) != REG_TICK (i))
1141         {
1142           /* If REG_IN_TABLE (i) differs from REG_TICK (i) by one, and
1143              the last store to this register really stored into this
1144              subreg, then remove the memory of this subreg.
1145              Otherwise, remove any memory of the entire register and
1146              all its subregs from the table.  */
1147           if (REG_TICK (i) - REG_IN_TABLE (i) > 1
1148               || SUBREG_TICKED (i) != REGNO (SUBREG_REG (x)))
1149             remove_invalid_refs (i);
1150           else
1151             remove_invalid_subreg_refs (i, SUBREG_BYTE (x), GET_MODE (x));
1152         }
1153
1154       REG_IN_TABLE (i) = REG_TICK (i);
1155       SUBREG_TICKED (i) = REGNO (SUBREG_REG (x));
1156       return 0;
1157     }
1158
1159   /* If X is a comparison or a COMPARE and either operand is a register
1160      that does not have a quantity, give it one.  This is so that a later
1161      call to record_jump_equiv won't cause X to be assigned a different
1162      hash code and not found in the table after that call.
1163
1164      It is not necessary to do this here, since rehash_using_reg can
1165      fix up the table later, but doing this here eliminates the need to
1166      call that expensive function in the most common case where the only
1167      use of the register is in the comparison.  */
1168
1169   if (code == COMPARE || COMPARISON_P (x))
1170     {
1171       if (REG_P (XEXP (x, 0))
1172           && ! REGNO_QTY_VALID_P (REGNO (XEXP (x, 0))))
1173         if (insert_regs (XEXP (x, 0), NULL, 0))
1174           {
1175             rehash_using_reg (XEXP (x, 0));
1176             changed = 1;
1177           }
1178
1179       if (REG_P (XEXP (x, 1))
1180           && ! REGNO_QTY_VALID_P (REGNO (XEXP (x, 1))))
1181         if (insert_regs (XEXP (x, 1), NULL, 0))
1182           {
1183             rehash_using_reg (XEXP (x, 1));
1184             changed = 1;
1185           }
1186     }
1187
1188   fmt = GET_RTX_FORMAT (code);
1189   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
1190     if (fmt[i] == 'e')
1191       changed |= mention_regs (XEXP (x, i));
1192     else if (fmt[i] == 'E')
1193       for (j = 0; j < XVECLEN (x, i); j++)
1194         changed |= mention_regs (XVECEXP (x, i, j));
1195
1196   return changed;
1197 }
1198
1199 /* Update the register quantities for inserting X into the hash table
1200    with a value equivalent to CLASSP.
1201    (If the class does not contain a REG, it is irrelevant.)
1202    If MODIFIED is nonzero, X is a destination; it is being modified.
1203    Note that delete_reg_equiv should be called on a register
1204    before insert_regs is done on that register with MODIFIED != 0.
1205
1206    Nonzero value means that elements of reg_qty have changed
1207    so X's hash code may be different.  */
1208
1209 static int
1210 insert_regs (rtx x, struct table_elt *classp, int modified)
1211 {
1212   if (REG_P (x))
1213     {
1214       unsigned int regno = REGNO (x);
1215       int qty_valid;
1216
1217       /* If REGNO is in the equivalence table already but is of the
1218          wrong mode for that equivalence, don't do anything here.  */
1219
1220       qty_valid = REGNO_QTY_VALID_P (regno);
1221       if (qty_valid)
1222         {
1223           struct qty_table_elem *ent = &qty_table[REG_QTY (regno)];
1224
1225           if (ent->mode != GET_MODE (x))
1226             return 0;
1227         }
1228
1229       if (modified || ! qty_valid)
1230         {
1231           if (classp)
1232             for (classp = classp->first_same_value;
1233                  classp != 0;
1234                  classp = classp->next_same_value)
1235               if (REG_P (classp->exp)
1236                   && GET_MODE (classp->exp) == GET_MODE (x))
1237                 {
1238                   unsigned c_regno = REGNO (classp->exp);
1239
1240                   gcc_assert (REGNO_QTY_VALID_P (c_regno));
1241
1242                   /* Suppose that 5 is hard reg and 100 and 101 are
1243                      pseudos.  Consider
1244
1245                      (set (reg:si 100) (reg:si 5))
1246                      (set (reg:si 5) (reg:si 100))
1247                      (set (reg:di 101) (reg:di 5))
1248
1249                      We would now set REG_QTY (101) = REG_QTY (5), but the
1250                      entry for 5 is in SImode.  When we use this later in
1251                      copy propagation, we get the register in wrong mode.  */
1252                   if (qty_table[REG_QTY (c_regno)].mode != GET_MODE (x))
1253                     continue;
1254
1255                   make_regs_eqv (regno, c_regno);
1256                   return 1;
1257                 }
1258
1259           /* Mention_regs for a SUBREG checks if REG_TICK is exactly one larger
1260              than REG_IN_TABLE to find out if there was only a single preceding
1261              invalidation - for the SUBREG - or another one, which would be
1262              for the full register.  However, if we find here that REG_TICK
1263              indicates that the register is invalid, it means that it has
1264              been invalidated in a separate operation.  The SUBREG might be used
1265              now (then this is a recursive call), or we might use the full REG
1266              now and a SUBREG of it later.  So bump up REG_TICK so that
1267              mention_regs will do the right thing.  */
1268           if (! modified
1269               && REG_IN_TABLE (regno) >= 0
1270               && REG_TICK (regno) == REG_IN_TABLE (regno) + 1)
1271             REG_TICK (regno)++;
1272           make_new_qty (regno, GET_MODE (x));
1273           return 1;
1274         }
1275
1276       return 0;
1277     }
1278
1279   /* If X is a SUBREG, we will likely be inserting the inner register in the
1280      table.  If that register doesn't have an assigned quantity number at
1281      this point but does later, the insertion that we will be doing now will
1282      not be accessible because its hash code will have changed.  So assign
1283      a quantity number now.  */
1284
1285   else if (GET_CODE (x) == SUBREG && REG_P (SUBREG_REG (x))
1286            && ! REGNO_QTY_VALID_P (REGNO (SUBREG_REG (x))))
1287     {
1288       insert_regs (SUBREG_REG (x), NULL, 0);
1289       mention_regs (x);
1290       return 1;
1291     }
1292   else
1293     return mention_regs (x);
1294 }
1295 \f
1296 /* Look in or update the hash table.  */
1297
1298 /* Remove table element ELT from use in the table.
1299    HASH is its hash code, made using the HASH macro.
1300    It's an argument because often that is known in advance
1301    and we save much time not recomputing it.  */
1302
1303 static void
1304 remove_from_table (struct table_elt *elt, unsigned int hash)
1305 {
1306   if (elt == 0)
1307     return;
1308
1309   /* Mark this element as removed.  See cse_insn.  */
1310   elt->first_same_value = 0;
1311
1312   /* Remove the table element from its equivalence class.  */
1313
1314   {
1315     struct table_elt *prev = elt->prev_same_value;
1316     struct table_elt *next = elt->next_same_value;
1317
1318     if (next)
1319       next->prev_same_value = prev;
1320
1321     if (prev)
1322       prev->next_same_value = next;
1323     else
1324       {
1325         struct table_elt *newfirst = next;
1326         while (next)
1327           {
1328             next->first_same_value = newfirst;
1329             next = next->next_same_value;
1330           }
1331       }
1332   }
1333
1334   /* Remove the table element from its hash bucket.  */
1335
1336   {
1337     struct table_elt *prev = elt->prev_same_hash;
1338     struct table_elt *next = elt->next_same_hash;
1339
1340     if (next)
1341       next->prev_same_hash = prev;
1342
1343     if (prev)
1344       prev->next_same_hash = next;
1345     else if (table[hash] == elt)
1346       table[hash] = next;
1347     else
1348       {
1349         /* This entry is not in the proper hash bucket.  This can happen
1350            when two classes were merged by `merge_equiv_classes'.  Search
1351            for the hash bucket that it heads.  This happens only very
1352            rarely, so the cost is acceptable.  */
1353         for (hash = 0; hash < HASH_SIZE; hash++)
1354           if (table[hash] == elt)
1355             table[hash] = next;
1356       }
1357   }
1358
1359   /* Remove the table element from its related-value circular chain.  */
1360
1361   if (elt->related_value != 0 && elt->related_value != elt)
1362     {
1363       struct table_elt *p = elt->related_value;
1364
1365       while (p->related_value != elt)
1366         p = p->related_value;
1367       p->related_value = elt->related_value;
1368       if (p->related_value == p)
1369         p->related_value = 0;
1370     }
1371
1372   /* Now add it to the free element chain.  */
1373   elt->next_same_hash = free_element_chain;
1374   free_element_chain = elt;
1375 }
1376
1377 /* Look up X in the hash table and return its table element,
1378    or 0 if X is not in the table.
1379
1380    MODE is the machine-mode of X, or if X is an integer constant
1381    with VOIDmode then MODE is the mode with which X will be used.
1382
1383    Here we are satisfied to find an expression whose tree structure
1384    looks like X.  */
1385
1386 static struct table_elt *
1387 lookup (rtx x, unsigned int hash, enum machine_mode mode)
1388 {
1389   struct table_elt *p;
1390
1391   for (p = table[hash]; p; p = p->next_same_hash)
1392     if (mode == p->mode && ((x == p->exp && REG_P (x))
1393                             || exp_equiv_p (x, p->exp, !REG_P (x), false)))
1394       return p;
1395
1396   return 0;
1397 }
1398
1399 /* Like `lookup' but don't care whether the table element uses invalid regs.
1400    Also ignore discrepancies in the machine mode of a register.  */
1401
1402 static struct table_elt *
1403 lookup_for_remove (rtx x, unsigned int hash, enum machine_mode mode)
1404 {
1405   struct table_elt *p;
1406
1407   if (REG_P (x))
1408     {
1409       unsigned int regno = REGNO (x);
1410
1411       /* Don't check the machine mode when comparing registers;
1412          invalidating (REG:SI 0) also invalidates (REG:DF 0).  */
1413       for (p = table[hash]; p; p = p->next_same_hash)
1414         if (REG_P (p->exp)
1415             && REGNO (p->exp) == regno)
1416           return p;
1417     }
1418   else
1419     {
1420       for (p = table[hash]; p; p = p->next_same_hash)
1421         if (mode == p->mode
1422             && (x == p->exp || exp_equiv_p (x, p->exp, 0, false)))
1423           return p;
1424     }
1425
1426   return 0;
1427 }
1428
1429 /* Look for an expression equivalent to X and with code CODE.
1430    If one is found, return that expression.  */
1431
1432 static rtx
1433 lookup_as_function (rtx x, enum rtx_code code)
1434 {
1435   struct table_elt *p
1436     = lookup (x, SAFE_HASH (x, VOIDmode), GET_MODE (x));
1437
1438   /* If we are looking for a CONST_INT, the mode doesn't really matter, as
1439      long as we are narrowing.  So if we looked in vain for a mode narrower
1440      than word_mode before, look for word_mode now.  */
1441   if (p == 0 && code == CONST_INT
1442       && GET_MODE_SIZE (GET_MODE (x)) < GET_MODE_SIZE (word_mode))
1443     {
1444       x = copy_rtx (x);
1445       PUT_MODE (x, word_mode);
1446       p = lookup (x, SAFE_HASH (x, VOIDmode), word_mode);
1447     }
1448
1449   if (p == 0)
1450     return 0;
1451
1452   for (p = p->first_same_value; p; p = p->next_same_value)
1453     if (GET_CODE (p->exp) == code
1454         /* Make sure this is a valid entry in the table.  */
1455         && exp_equiv_p (p->exp, p->exp, 1, false))
1456       return p->exp;
1457
1458   return 0;
1459 }
1460
1461 /* Insert X in the hash table, assuming HASH is its hash code
1462    and CLASSP is an element of the class it should go in
1463    (or 0 if a new class should be made).
1464    It is inserted at the proper position to keep the class in
1465    the order cheapest first.
1466
1467    MODE is the machine-mode of X, or if X is an integer constant
1468    with VOIDmode then MODE is the mode with which X will be used.
1469
1470    For elements of equal cheapness, the most recent one
1471    goes in front, except that the first element in the list
1472    remains first unless a cheaper element is added.  The order of
1473    pseudo-registers does not matter, as canon_reg will be called to
1474    find the cheapest when a register is retrieved from the table.
1475
1476    The in_memory field in the hash table element is set to 0.
1477    The caller must set it nonzero if appropriate.
1478
1479    You should call insert_regs (X, CLASSP, MODIFY) before calling here,
1480    and if insert_regs returns a nonzero value
1481    you must then recompute its hash code before calling here.
1482
1483    If necessary, update table showing constant values of quantities.  */
1484
1485 #define CHEAPER(X, Y) \
1486  (preferable ((X)->cost, (X)->regcost, (Y)->cost, (Y)->regcost) < 0)
1487
1488 static struct table_elt *
1489 insert (rtx x, struct table_elt *classp, unsigned int hash, enum machine_mode mode)
1490 {
1491   struct table_elt *elt;
1492
1493   /* If X is a register and we haven't made a quantity for it,
1494      something is wrong.  */
1495   gcc_assert (!REG_P (x) || REGNO_QTY_VALID_P (REGNO (x)));
1496
1497   /* If X is a hard register, show it is being put in the table.  */
1498   if (REG_P (x) && REGNO (x) < FIRST_PSEUDO_REGISTER)
1499     {
1500       unsigned int regno = REGNO (x);
1501       unsigned int endregno = regno + hard_regno_nregs[regno][GET_MODE (x)];
1502       unsigned int i;
1503
1504       for (i = regno; i < endregno; i++)
1505         SET_HARD_REG_BIT (hard_regs_in_table, i);
1506     }
1507
1508   /* Put an element for X into the right hash bucket.  */
1509
1510   elt = free_element_chain;
1511   if (elt)
1512     free_element_chain = elt->next_same_hash;
1513   else
1514     elt = xmalloc (sizeof (struct table_elt));
1515
1516   elt->exp = x;
1517   elt->canon_exp = NULL_RTX;
1518   elt->cost = COST (x);
1519   elt->regcost = approx_reg_cost (x);
1520   elt->next_same_value = 0;
1521   elt->prev_same_value = 0;
1522   elt->next_same_hash = table[hash];
1523   elt->prev_same_hash = 0;
1524   elt->related_value = 0;
1525   elt->in_memory = 0;
1526   elt->mode = mode;
1527   elt->is_const = (CONSTANT_P (x) || fixed_base_plus_p (x));
1528
1529   if (table[hash])
1530     table[hash]->prev_same_hash = elt;
1531   table[hash] = elt;
1532
1533   /* Put it into the proper value-class.  */
1534   if (classp)
1535     {
1536       classp = classp->first_same_value;
1537       if (CHEAPER (elt, classp))
1538         /* Insert at the head of the class.  */
1539         {
1540           struct table_elt *p;
1541           elt->next_same_value = classp;
1542           classp->prev_same_value = elt;
1543           elt->first_same_value = elt;
1544
1545           for (p = classp; p; p = p->next_same_value)
1546             p->first_same_value = elt;
1547         }
1548       else
1549         {
1550           /* Insert not at head of the class.  */
1551           /* Put it after the last element cheaper than X.  */
1552           struct table_elt *p, *next;
1553
1554           for (p = classp; (next = p->next_same_value) && CHEAPER (next, elt);
1555                p = next);
1556
1557           /* Put it after P and before NEXT.  */
1558           elt->next_same_value = next;
1559           if (next)
1560             next->prev_same_value = elt;
1561
1562           elt->prev_same_value = p;
1563           p->next_same_value = elt;
1564           elt->first_same_value = classp;
1565         }
1566     }
1567   else
1568     elt->first_same_value = elt;
1569
1570   /* If this is a constant being set equivalent to a register or a register
1571      being set equivalent to a constant, note the constant equivalence.
1572
1573      If this is a constant, it cannot be equivalent to a different constant,
1574      and a constant is the only thing that can be cheaper than a register.  So
1575      we know the register is the head of the class (before the constant was
1576      inserted).
1577
1578      If this is a register that is not already known equivalent to a
1579      constant, we must check the entire class.
1580
1581      If this is a register that is already known equivalent to an insn,
1582      update the qtys `const_insn' to show that `this_insn' is the latest
1583      insn making that quantity equivalent to the constant.  */
1584
1585   if (elt->is_const && classp && REG_P (classp->exp)
1586       && !REG_P (x))
1587     {
1588       int exp_q = REG_QTY (REGNO (classp->exp));
1589       struct qty_table_elem *exp_ent = &qty_table[exp_q];
1590
1591       exp_ent->const_rtx = gen_lowpart (exp_ent->mode, x);
1592       exp_ent->const_insn = this_insn;
1593     }
1594
1595   else if (REG_P (x)
1596            && classp
1597            && ! qty_table[REG_QTY (REGNO (x))].const_rtx
1598            && ! elt->is_const)
1599     {
1600       struct table_elt *p;
1601
1602       for (p = classp; p != 0; p = p->next_same_value)
1603         {
1604           if (p->is_const && !REG_P (p->exp))
1605             {
1606               int x_q = REG_QTY (REGNO (x));
1607               struct qty_table_elem *x_ent = &qty_table[x_q];
1608
1609               x_ent->const_rtx
1610                 = gen_lowpart (GET_MODE (x), p->exp);
1611               x_ent->const_insn = this_insn;
1612               break;
1613             }
1614         }
1615     }
1616
1617   else if (REG_P (x)
1618            && qty_table[REG_QTY (REGNO (x))].const_rtx
1619            && GET_MODE (x) == qty_table[REG_QTY (REGNO (x))].mode)
1620     qty_table[REG_QTY (REGNO (x))].const_insn = this_insn;
1621
1622   /* If this is a constant with symbolic value,
1623      and it has a term with an explicit integer value,
1624      link it up with related expressions.  */
1625   if (GET_CODE (x) == CONST)
1626     {
1627       rtx subexp = get_related_value (x);
1628       unsigned subhash;
1629       struct table_elt *subelt, *subelt_prev;
1630
1631       if (subexp != 0)
1632         {
1633           /* Get the integer-free subexpression in the hash table.  */
1634           subhash = SAFE_HASH (subexp, mode);
1635           subelt = lookup (subexp, subhash, mode);
1636           if (subelt == 0)
1637             subelt = insert (subexp, NULL, subhash, mode);
1638           /* Initialize SUBELT's circular chain if it has none.  */
1639           if (subelt->related_value == 0)
1640             subelt->related_value = subelt;
1641           /* Find the element in the circular chain that precedes SUBELT.  */
1642           subelt_prev = subelt;
1643           while (subelt_prev->related_value != subelt)
1644             subelt_prev = subelt_prev->related_value;
1645           /* Put new ELT into SUBELT's circular chain just before SUBELT.
1646              This way the element that follows SUBELT is the oldest one.  */
1647           elt->related_value = subelt_prev->related_value;
1648           subelt_prev->related_value = elt;
1649         }
1650     }
1651
1652   return elt;
1653 }
1654 \f
1655 /* Given two equivalence classes, CLASS1 and CLASS2, put all the entries from
1656    CLASS2 into CLASS1.  This is done when we have reached an insn which makes
1657    the two classes equivalent.
1658
1659    CLASS1 will be the surviving class; CLASS2 should not be used after this
1660    call.
1661
1662    Any invalid entries in CLASS2 will not be copied.  */
1663
1664 static void
1665 merge_equiv_classes (struct table_elt *class1, struct table_elt *class2)
1666 {
1667   struct table_elt *elt, *next, *new;
1668
1669   /* Ensure we start with the head of the classes.  */
1670   class1 = class1->first_same_value;
1671   class2 = class2->first_same_value;
1672
1673   /* If they were already equal, forget it.  */
1674   if (class1 == class2)
1675     return;
1676
1677   for (elt = class2; elt; elt = next)
1678     {
1679       unsigned int hash;
1680       rtx exp = elt->exp;
1681       enum machine_mode mode = elt->mode;
1682
1683       next = elt->next_same_value;
1684
1685       /* Remove old entry, make a new one in CLASS1's class.
1686          Don't do this for invalid entries as we cannot find their
1687          hash code (it also isn't necessary).  */
1688       if (REG_P (exp) || exp_equiv_p (exp, exp, 1, false))
1689         {
1690           bool need_rehash = false;
1691
1692           hash_arg_in_memory = 0;
1693           hash = HASH (exp, mode);
1694
1695           if (REG_P (exp))
1696             {
1697               need_rehash = REGNO_QTY_VALID_P (REGNO (exp));
1698               delete_reg_equiv (REGNO (exp));
1699             }
1700
1701           remove_from_table (elt, hash);
1702
1703           if (insert_regs (exp, class1, 0) || need_rehash)
1704             {
1705               rehash_using_reg (exp);
1706               hash = HASH (exp, mode);
1707             }
1708           new = insert (exp, class1, hash, mode);
1709           new->in_memory = hash_arg_in_memory;
1710         }
1711     }
1712 }
1713 \f
1714 /* Flush the entire hash table.  */
1715
1716 static void
1717 flush_hash_table (void)
1718 {
1719   int i;
1720   struct table_elt *p;
1721
1722   for (i = 0; i < HASH_SIZE; i++)
1723     for (p = table[i]; p; p = table[i])
1724       {
1725         /* Note that invalidate can remove elements
1726            after P in the current hash chain.  */
1727         if (REG_P (p->exp))
1728           invalidate (p->exp, p->mode);
1729         else
1730           remove_from_table (p, i);
1731       }
1732 }
1733 \f
1734 /* Function called for each rtx to check whether true dependence exist.  */
1735 struct check_dependence_data
1736 {
1737   enum machine_mode mode;
1738   rtx exp;
1739   rtx addr;
1740 };
1741
1742 static int
1743 check_dependence (rtx *x, void *data)
1744 {
1745   struct check_dependence_data *d = (struct check_dependence_data *) data;
1746   if (*x && MEM_P (*x))
1747     return canon_true_dependence (d->exp, d->mode, d->addr, *x,
1748                                   cse_rtx_varies_p);
1749   else
1750     return 0;
1751 }
1752 \f
1753 /* Remove from the hash table, or mark as invalid, all expressions whose
1754    values could be altered by storing in X.  X is a register, a subreg, or
1755    a memory reference with nonvarying address (because, when a memory
1756    reference with a varying address is stored in, all memory references are
1757    removed by invalidate_memory so specific invalidation is superfluous).
1758    FULL_MODE, if not VOIDmode, indicates that this much should be
1759    invalidated instead of just the amount indicated by the mode of X.  This
1760    is only used for bitfield stores into memory.
1761
1762    A nonvarying address may be just a register or just a symbol reference,
1763    or it may be either of those plus a numeric offset.  */
1764
1765 static void
1766 invalidate (rtx x, enum machine_mode full_mode)
1767 {
1768   int i;
1769   struct table_elt *p;
1770   rtx addr;
1771
1772   switch (GET_CODE (x))
1773     {
1774     case REG:
1775       {
1776         /* If X is a register, dependencies on its contents are recorded
1777            through the qty number mechanism.  Just change the qty number of
1778            the register, mark it as invalid for expressions that refer to it,
1779            and remove it itself.  */
1780         unsigned int regno = REGNO (x);
1781         unsigned int hash = HASH (x, GET_MODE (x));
1782
1783         /* Remove REGNO from any quantity list it might be on and indicate
1784            that its value might have changed.  If it is a pseudo, remove its
1785            entry from the hash table.
1786
1787            For a hard register, we do the first two actions above for any
1788            additional hard registers corresponding to X.  Then, if any of these
1789            registers are in the table, we must remove any REG entries that
1790            overlap these registers.  */
1791
1792         delete_reg_equiv (regno);
1793         REG_TICK (regno)++;
1794         SUBREG_TICKED (regno) = -1;
1795
1796         if (regno >= FIRST_PSEUDO_REGISTER)
1797           {
1798             /* Because a register can be referenced in more than one mode,
1799                we might have to remove more than one table entry.  */
1800             struct table_elt *elt;
1801
1802             while ((elt = lookup_for_remove (x, hash, GET_MODE (x))))
1803               remove_from_table (elt, hash);
1804           }
1805         else
1806           {
1807             HOST_WIDE_INT in_table
1808               = TEST_HARD_REG_BIT (hard_regs_in_table, regno);
1809             unsigned int endregno
1810               = regno + hard_regno_nregs[regno][GET_MODE (x)];
1811             unsigned int tregno, tendregno, rn;
1812             struct table_elt *p, *next;
1813
1814             CLEAR_HARD_REG_BIT (hard_regs_in_table, regno);
1815
1816             for (rn = regno + 1; rn < endregno; rn++)
1817               {
1818                 in_table |= TEST_HARD_REG_BIT (hard_regs_in_table, rn);
1819                 CLEAR_HARD_REG_BIT (hard_regs_in_table, rn);
1820                 delete_reg_equiv (rn);
1821                 REG_TICK (rn)++;
1822                 SUBREG_TICKED (rn) = -1;
1823               }
1824
1825             if (in_table)
1826               for (hash = 0; hash < HASH_SIZE; hash++)
1827                 for (p = table[hash]; p; p = next)
1828                   {
1829                     next = p->next_same_hash;
1830
1831                     if (!REG_P (p->exp)
1832                         || REGNO (p->exp) >= FIRST_PSEUDO_REGISTER)
1833                       continue;
1834
1835                     tregno = REGNO (p->exp);
1836                     tendregno
1837                       = tregno + hard_regno_nregs[tregno][GET_MODE (p->exp)];
1838                     if (tendregno > regno && tregno < endregno)
1839                       remove_from_table (p, hash);
1840                   }
1841           }
1842       }
1843       return;
1844
1845     case SUBREG:
1846       invalidate (SUBREG_REG (x), VOIDmode);
1847       return;
1848
1849     case PARALLEL:
1850       for (i = XVECLEN (x, 0) - 1; i >= 0; --i)
1851         invalidate (XVECEXP (x, 0, i), VOIDmode);
1852       return;
1853
1854     case EXPR_LIST:
1855       /* This is part of a disjoint return value; extract the location in
1856          question ignoring the offset.  */
1857       invalidate (XEXP (x, 0), VOIDmode);
1858       return;
1859
1860     case MEM:
1861       addr = canon_rtx (get_addr (XEXP (x, 0)));
1862       /* Calculate the canonical version of X here so that
1863          true_dependence doesn't generate new RTL for X on each call.  */
1864       x = canon_rtx (x);
1865
1866       /* Remove all hash table elements that refer to overlapping pieces of
1867          memory.  */
1868       if (full_mode == VOIDmode)
1869         full_mode = GET_MODE (x);
1870
1871       for (i = 0; i < HASH_SIZE; i++)
1872         {
1873           struct table_elt *next;
1874
1875           for (p = table[i]; p; p = next)
1876             {
1877               next = p->next_same_hash;
1878               if (p->in_memory)
1879                 {
1880                   struct check_dependence_data d;
1881
1882                   /* Just canonicalize the expression once;
1883                      otherwise each time we call invalidate
1884                      true_dependence will canonicalize the
1885                      expression again.  */
1886                   if (!p->canon_exp)
1887                     p->canon_exp = canon_rtx (p->exp);
1888                   d.exp = x;
1889                   d.addr = addr;
1890                   d.mode = full_mode;
1891                   if (for_each_rtx (&p->canon_exp, check_dependence, &d))
1892                     remove_from_table (p, i);
1893                 }
1894             }
1895         }
1896       return;
1897
1898     default:
1899       gcc_unreachable ();
1900     }
1901 }
1902 \f
1903 /* Remove all expressions that refer to register REGNO,
1904    since they are already invalid, and we are about to
1905    mark that register valid again and don't want the old
1906    expressions to reappear as valid.  */
1907
1908 static void
1909 remove_invalid_refs (unsigned int regno)
1910 {
1911   unsigned int i;
1912   struct table_elt *p, *next;
1913
1914   for (i = 0; i < HASH_SIZE; i++)
1915     for (p = table[i]; p; p = next)
1916       {
1917         next = p->next_same_hash;
1918         if (!REG_P (p->exp)
1919             && refers_to_regno_p (regno, regno + 1, p->exp, (rtx *) 0))
1920           remove_from_table (p, i);
1921       }
1922 }
1923
1924 /* Likewise for a subreg with subreg_reg REGNO, subreg_byte OFFSET,
1925    and mode MODE.  */
1926 static void
1927 remove_invalid_subreg_refs (unsigned int regno, unsigned int offset,
1928                             enum machine_mode mode)
1929 {
1930   unsigned int i;
1931   struct table_elt *p, *next;
1932   unsigned int end = offset + (GET_MODE_SIZE (mode) - 1);
1933
1934   for (i = 0; i < HASH_SIZE; i++)
1935     for (p = table[i]; p; p = next)
1936       {
1937         rtx exp = p->exp;
1938         next = p->next_same_hash;
1939
1940         if (!REG_P (exp)
1941             && (GET_CODE (exp) != SUBREG
1942                 || !REG_P (SUBREG_REG (exp))
1943                 || REGNO (SUBREG_REG (exp)) != regno
1944                 || (((SUBREG_BYTE (exp)
1945                       + (GET_MODE_SIZE (GET_MODE (exp)) - 1)) >= offset)
1946                     && SUBREG_BYTE (exp) <= end))
1947             && refers_to_regno_p (regno, regno + 1, p->exp, (rtx *) 0))
1948           remove_from_table (p, i);
1949       }
1950 }
1951 \f
1952 /* Recompute the hash codes of any valid entries in the hash table that
1953    reference X, if X is a register, or SUBREG_REG (X) if X is a SUBREG.
1954
1955    This is called when we make a jump equivalence.  */
1956
1957 static void
1958 rehash_using_reg (rtx x)
1959 {
1960   unsigned int i;
1961   struct table_elt *p, *next;
1962   unsigned hash;
1963
1964   if (GET_CODE (x) == SUBREG)
1965     x = SUBREG_REG (x);
1966
1967   /* If X is not a register or if the register is known not to be in any
1968      valid entries in the table, we have no work to do.  */
1969
1970   if (!REG_P (x)
1971       || REG_IN_TABLE (REGNO (x)) < 0
1972       || REG_IN_TABLE (REGNO (x)) != REG_TICK (REGNO (x)))
1973     return;
1974
1975   /* Scan all hash chains looking for valid entries that mention X.
1976      If we find one and it is in the wrong hash chain, move it.  */
1977
1978   for (i = 0; i < HASH_SIZE; i++)
1979     for (p = table[i]; p; p = next)
1980       {
1981         next = p->next_same_hash;
1982         if (reg_mentioned_p (x, p->exp)
1983             && exp_equiv_p (p->exp, p->exp, 1, false)
1984             && i != (hash = SAFE_HASH (p->exp, p->mode)))
1985           {
1986             if (p->next_same_hash)
1987               p->next_same_hash->prev_same_hash = p->prev_same_hash;
1988
1989             if (p->prev_same_hash)
1990               p->prev_same_hash->next_same_hash = p->next_same_hash;
1991             else
1992               table[i] = p->next_same_hash;
1993
1994             p->next_same_hash = table[hash];
1995             p->prev_same_hash = 0;
1996             if (table[hash])
1997               table[hash]->prev_same_hash = p;
1998             table[hash] = p;
1999           }
2000       }
2001 }
2002 \f
2003 /* Remove from the hash table any expression that is a call-clobbered
2004    register.  Also update their TICK values.  */
2005
2006 static void
2007 invalidate_for_call (void)
2008 {
2009   unsigned int regno, endregno;
2010   unsigned int i;
2011   unsigned hash;
2012   struct table_elt *p, *next;
2013   int in_table = 0;
2014
2015   /* Go through all the hard registers.  For each that is clobbered in
2016      a CALL_INSN, remove the register from quantity chains and update
2017      reg_tick if defined.  Also see if any of these registers is currently
2018      in the table.  */
2019
2020   for (regno = 0; regno < FIRST_PSEUDO_REGISTER; regno++)
2021     if (TEST_HARD_REG_BIT (regs_invalidated_by_call, regno))
2022       {
2023         delete_reg_equiv (regno);
2024         if (REG_TICK (regno) >= 0)
2025           {
2026             REG_TICK (regno)++;
2027             SUBREG_TICKED (regno) = -1;
2028           }
2029
2030         in_table |= (TEST_HARD_REG_BIT (hard_regs_in_table, regno) != 0);
2031       }
2032
2033   /* In the case where we have no call-clobbered hard registers in the
2034      table, we are done.  Otherwise, scan the table and remove any
2035      entry that overlaps a call-clobbered register.  */
2036
2037   if (in_table)
2038     for (hash = 0; hash < HASH_SIZE; hash++)
2039       for (p = table[hash]; p; p = next)
2040         {
2041           next = p->next_same_hash;
2042
2043           if (!REG_P (p->exp)
2044               || REGNO (p->exp) >= FIRST_PSEUDO_REGISTER)
2045             continue;
2046
2047           regno = REGNO (p->exp);
2048           endregno = regno + hard_regno_nregs[regno][GET_MODE (p->exp)];
2049
2050           for (i = regno; i < endregno; i++)
2051             if (TEST_HARD_REG_BIT (regs_invalidated_by_call, i))
2052               {
2053                 remove_from_table (p, hash);
2054                 break;
2055               }
2056         }
2057 }
2058 \f
2059 /* Given an expression X of type CONST,
2060    and ELT which is its table entry (or 0 if it
2061    is not in the hash table),
2062    return an alternate expression for X as a register plus integer.
2063    If none can be found, return 0.  */
2064
2065 static rtx
2066 use_related_value (rtx x, struct table_elt *elt)
2067 {
2068   struct table_elt *relt = 0;
2069   struct table_elt *p, *q;
2070   HOST_WIDE_INT offset;
2071
2072   /* First, is there anything related known?
2073      If we have a table element, we can tell from that.
2074      Otherwise, must look it up.  */
2075
2076   if (elt != 0 && elt->related_value != 0)
2077     relt = elt;
2078   else if (elt == 0 && GET_CODE (x) == CONST)
2079     {
2080       rtx subexp = get_related_value (x);
2081       if (subexp != 0)
2082         relt = lookup (subexp,
2083                        SAFE_HASH (subexp, GET_MODE (subexp)),
2084                        GET_MODE (subexp));
2085     }
2086
2087   if (relt == 0)
2088     return 0;
2089
2090   /* Search all related table entries for one that has an
2091      equivalent register.  */
2092
2093   p = relt;
2094   while (1)
2095     {
2096       /* This loop is strange in that it is executed in two different cases.
2097          The first is when X is already in the table.  Then it is searching
2098          the RELATED_VALUE list of X's class (RELT).  The second case is when
2099          X is not in the table.  Then RELT points to a class for the related
2100          value.
2101
2102          Ensure that, whatever case we are in, that we ignore classes that have
2103          the same value as X.  */
2104
2105       if (rtx_equal_p (x, p->exp))
2106         q = 0;
2107       else
2108         for (q = p->first_same_value; q; q = q->next_same_value)
2109           if (REG_P (q->exp))
2110             break;
2111
2112       if (q)
2113         break;
2114
2115       p = p->related_value;
2116
2117       /* We went all the way around, so there is nothing to be found.
2118          Alternatively, perhaps RELT was in the table for some other reason
2119          and it has no related values recorded.  */
2120       if (p == relt || p == 0)
2121         break;
2122     }
2123
2124   if (q == 0)
2125     return 0;
2126
2127   offset = (get_integer_term (x) - get_integer_term (p->exp));
2128   /* Note: OFFSET may be 0 if P->xexp and X are related by commutativity.  */
2129   return plus_constant (q->exp, offset);
2130 }
2131 \f
2132 /* Hash a string.  Just add its bytes up.  */
2133 static inline unsigned
2134 hash_rtx_string (const char *ps)
2135 {
2136   unsigned hash = 0;
2137   const unsigned char *p = (const unsigned char *) ps;
2138
2139   if (p)
2140     while (*p)
2141       hash += *p++;
2142
2143   return hash;
2144 }
2145
2146 /* Hash an rtx.  We are careful to make sure the value is never negative.
2147    Equivalent registers hash identically.
2148    MODE is used in hashing for CONST_INTs only;
2149    otherwise the mode of X is used.
2150
2151    Store 1 in DO_NOT_RECORD_P if any subexpression is volatile.
2152
2153    If HASH_ARG_IN_MEMORY_P is not NULL, store 1 in it if X contains
2154    a MEM rtx which does not have the RTX_UNCHANGING_P bit set.
2155
2156    Note that cse_insn knows that the hash code of a MEM expression
2157    is just (int) MEM plus the hash code of the address.  */
2158
2159 unsigned
2160 hash_rtx (rtx x, enum machine_mode mode, int *do_not_record_p,
2161           int *hash_arg_in_memory_p, bool have_reg_qty)
2162 {
2163   int i, j;
2164   unsigned hash = 0;
2165   enum rtx_code code;
2166   const char *fmt;
2167
2168   /* Used to turn recursion into iteration.  We can't rely on GCC's
2169      tail-recursion elimination since we need to keep accumulating values
2170      in HASH.  */
2171  repeat:
2172   if (x == 0)
2173     return hash;
2174
2175   code = GET_CODE (x);
2176   switch (code)
2177     {
2178     case REG:
2179       {
2180         unsigned int regno = REGNO (x);
2181
2182         if (!reload_completed)
2183           {
2184             /* On some machines, we can't record any non-fixed hard register,
2185                because extending its life will cause reload problems.  We
2186                consider ap, fp, sp, gp to be fixed for this purpose.
2187
2188                We also consider CCmode registers to be fixed for this purpose;
2189                failure to do so leads to failure to simplify 0<100 type of
2190                conditionals.
2191
2192                On all machines, we can't record any global registers.
2193                Nor should we record any register that is in a small
2194                class, as defined by CLASS_LIKELY_SPILLED_P.  */
2195             bool record;
2196
2197             if (regno >= FIRST_PSEUDO_REGISTER)
2198               record = true;
2199             else if (x == frame_pointer_rtx
2200                      || x == hard_frame_pointer_rtx
2201                      || x == arg_pointer_rtx
2202                      || x == stack_pointer_rtx
2203                      || x == pic_offset_table_rtx)
2204               record = true;
2205             else if (global_regs[regno])
2206               record = false;
2207             else if (fixed_regs[regno])
2208               record = true;
2209             else if (GET_MODE_CLASS (GET_MODE (x)) == MODE_CC)
2210               record = true;
2211             else if (SMALL_REGISTER_CLASSES)
2212               record = false;
2213             else if (CLASS_LIKELY_SPILLED_P (REGNO_REG_CLASS (regno)))
2214               record = false;
2215             else
2216               record = true;
2217
2218             if (!record)
2219               {
2220                 *do_not_record_p = 1;
2221                 return 0;
2222               }
2223           }
2224
2225         hash += ((unsigned int) REG << 7);
2226         hash += (have_reg_qty ? (unsigned) REG_QTY (regno) : regno);
2227         return hash;
2228       }
2229
2230     /* We handle SUBREG of a REG specially because the underlying
2231        reg changes its hash value with every value change; we don't
2232        want to have to forget unrelated subregs when one subreg changes.  */
2233     case SUBREG:
2234       {
2235         if (REG_P (SUBREG_REG (x)))
2236           {
2237             hash += (((unsigned int) SUBREG << 7)
2238                      + REGNO (SUBREG_REG (x))
2239                      + (SUBREG_BYTE (x) / UNITS_PER_WORD));
2240             return hash;
2241           }
2242         break;
2243       }
2244
2245     case CONST_INT:
2246       hash += (((unsigned int) CONST_INT << 7) + (unsigned int) mode
2247                + (unsigned int) INTVAL (x));
2248       return hash;
2249
2250     case CONST_DOUBLE:
2251       /* This is like the general case, except that it only counts
2252          the integers representing the constant.  */
2253       hash += (unsigned int) code + (unsigned int) GET_MODE (x);
2254       if (GET_MODE (x) != VOIDmode)
2255         hash += real_hash (CONST_DOUBLE_REAL_VALUE (x));
2256       else
2257         hash += ((unsigned int) CONST_DOUBLE_LOW (x)
2258                  + (unsigned int) CONST_DOUBLE_HIGH (x));
2259       return hash;
2260
2261     case CONST_VECTOR:
2262       {
2263         int units;
2264         rtx elt;
2265
2266         units = CONST_VECTOR_NUNITS (x);
2267
2268         for (i = 0; i < units; ++i)
2269           {
2270             elt = CONST_VECTOR_ELT (x, i);
2271             hash += hash_rtx (elt, GET_MODE (elt), do_not_record_p,
2272                               hash_arg_in_memory_p, have_reg_qty);
2273           }
2274
2275         return hash;
2276       }
2277
2278       /* Assume there is only one rtx object for any given label.  */
2279     case LABEL_REF:
2280       /* We don't hash on the address of the CODE_LABEL to avoid bootstrap
2281          differences and differences between each stage's debugging dumps.  */
2282          hash += (((unsigned int) LABEL_REF << 7)
2283                   + CODE_LABEL_NUMBER (XEXP (x, 0)));
2284       return hash;
2285
2286     case SYMBOL_REF:
2287       {
2288         /* Don't hash on the symbol's address to avoid bootstrap differences.
2289            Different hash values may cause expressions to be recorded in
2290            different orders and thus different registers to be used in the
2291            final assembler.  This also avoids differences in the dump files
2292            between various stages.  */
2293         unsigned int h = 0;
2294         const unsigned char *p = (const unsigned char *) XSTR (x, 0);
2295
2296         while (*p)
2297           h += (h << 7) + *p++; /* ??? revisit */
2298
2299         hash += ((unsigned int) SYMBOL_REF << 7) + h;
2300         return hash;
2301       }
2302
2303     case MEM:
2304       /* We don't record if marked volatile or if BLKmode since we don't
2305          know the size of the move.  */
2306       if (MEM_VOLATILE_P (x) || GET_MODE (x) == BLKmode)
2307         {
2308           *do_not_record_p = 1;
2309           return 0;
2310         }
2311       if (hash_arg_in_memory_p && !MEM_READONLY_P (x))
2312         *hash_arg_in_memory_p = 1;
2313
2314       /* Now that we have already found this special case,
2315          might as well speed it up as much as possible.  */
2316       hash += (unsigned) MEM;
2317       x = XEXP (x, 0);
2318       goto repeat;
2319
2320     case USE:
2321       /* A USE that mentions non-volatile memory needs special
2322          handling since the MEM may be BLKmode which normally
2323          prevents an entry from being made.  Pure calls are
2324          marked by a USE which mentions BLKmode memory.
2325          See calls.c:emit_call_1.  */
2326       if (MEM_P (XEXP (x, 0))
2327           && ! MEM_VOLATILE_P (XEXP (x, 0)))
2328         {
2329           hash += (unsigned) USE;
2330           x = XEXP (x, 0);
2331
2332           if (hash_arg_in_memory_p && !MEM_READONLY_P (x))
2333             *hash_arg_in_memory_p = 1;
2334
2335           /* Now that we have already found this special case,
2336              might as well speed it up as much as possible.  */
2337           hash += (unsigned) MEM;
2338           x = XEXP (x, 0);
2339           goto repeat;
2340         }
2341       break;
2342
2343     case PRE_DEC:
2344     case PRE_INC:
2345     case POST_DEC:
2346     case POST_INC:
2347     case PRE_MODIFY:
2348     case POST_MODIFY:
2349     case PC:
2350     case CC0:
2351     case CALL:
2352     case UNSPEC_VOLATILE:
2353       *do_not_record_p = 1;
2354       return 0;
2355
2356     case ASM_OPERANDS:
2357       if (MEM_VOLATILE_P (x))
2358         {
2359           *do_not_record_p = 1;
2360           return 0;
2361         }
2362       else
2363         {
2364           /* We don't want to take the filename and line into account.  */
2365           hash += (unsigned) code + (unsigned) GET_MODE (x)
2366             + hash_rtx_string (ASM_OPERANDS_TEMPLATE (x))
2367             + hash_rtx_string (ASM_OPERANDS_OUTPUT_CONSTRAINT (x))
2368             + (unsigned) ASM_OPERANDS_OUTPUT_IDX (x);
2369
2370           if (ASM_OPERANDS_INPUT_LENGTH (x))
2371             {
2372               for (i = 1; i < ASM_OPERANDS_INPUT_LENGTH (x); i++)
2373                 {
2374                   hash += (hash_rtx (ASM_OPERANDS_INPUT (x, i),
2375                                      GET_MODE (ASM_OPERANDS_INPUT (x, i)),
2376                                      do_not_record_p, hash_arg_in_memory_p,
2377                                      have_reg_qty)
2378                            + hash_rtx_string
2379                                 (ASM_OPERANDS_INPUT_CONSTRAINT (x, i)));
2380                 }
2381
2382               hash += hash_rtx_string (ASM_OPERANDS_INPUT_CONSTRAINT (x, 0));
2383               x = ASM_OPERANDS_INPUT (x, 0);
2384               mode = GET_MODE (x);
2385               goto repeat;
2386             }
2387
2388           return hash;
2389         }
2390       break;
2391
2392     default:
2393       break;
2394     }
2395
2396   i = GET_RTX_LENGTH (code) - 1;
2397   hash += (unsigned) code + (unsigned) GET_MODE (x);
2398   fmt = GET_RTX_FORMAT (code);
2399   for (; i >= 0; i--)
2400     {
2401       switch (fmt[i])
2402         {
2403         case 'e':
2404           /* If we are about to do the last recursive call
2405              needed at this level, change it into iteration.
2406              This function  is called enough to be worth it.  */
2407           if (i == 0)
2408             {
2409               x = XEXP (x, i);
2410               goto repeat;
2411             }
2412
2413           hash += hash_rtx (XEXP (x, i), 0, do_not_record_p,
2414                             hash_arg_in_memory_p, have_reg_qty);
2415           break;
2416
2417         case 'E':
2418           for (j = 0; j < XVECLEN (x, i); j++)
2419             hash += hash_rtx (XVECEXP (x, i, j), 0, do_not_record_p,
2420                               hash_arg_in_memory_p, have_reg_qty);
2421           break;
2422
2423         case 's':
2424           hash += hash_rtx_string (XSTR (x, i));
2425           break;
2426
2427         case 'i':
2428           hash += (unsigned int) XINT (x, i);
2429           break;
2430
2431         case '0': case 't':
2432           /* Unused.  */
2433           break;
2434
2435         default:
2436           gcc_unreachable ();
2437         }
2438     }
2439
2440   return hash;
2441 }
2442
2443 /* Hash an rtx X for cse via hash_rtx.
2444    Stores 1 in do_not_record if any subexpression is volatile.
2445    Stores 1 in hash_arg_in_memory if X contains a mem rtx which
2446    does not have the RTX_UNCHANGING_P bit set.  */
2447
2448 static inline unsigned
2449 canon_hash (rtx x, enum machine_mode mode)
2450 {
2451   return hash_rtx (x, mode, &do_not_record, &hash_arg_in_memory, true);
2452 }
2453
2454 /* Like canon_hash but with no side effects, i.e. do_not_record
2455    and hash_arg_in_memory are not changed.  */
2456
2457 static inline unsigned
2458 safe_hash (rtx x, enum machine_mode mode)
2459 {
2460   int dummy_do_not_record;
2461   return hash_rtx (x, mode, &dummy_do_not_record, NULL, true);
2462 }
2463 \f
2464 /* Return 1 iff X and Y would canonicalize into the same thing,
2465    without actually constructing the canonicalization of either one.
2466    If VALIDATE is nonzero,
2467    we assume X is an expression being processed from the rtl
2468    and Y was found in the hash table.  We check register refs
2469    in Y for being marked as valid.
2470
2471    If FOR_GCSE is true, we compare X and Y for equivalence for GCSE.  */
2472
2473 int
2474 exp_equiv_p (rtx x, rtx y, int validate, bool for_gcse)
2475 {
2476   int i, j;
2477   enum rtx_code code;
2478   const char *fmt;
2479
2480   /* Note: it is incorrect to assume an expression is equivalent to itself
2481      if VALIDATE is nonzero.  */
2482   if (x == y && !validate)
2483     return 1;
2484
2485   if (x == 0 || y == 0)
2486     return x == y;
2487
2488   code = GET_CODE (x);
2489   if (code != GET_CODE (y))
2490     return 0;
2491
2492   /* (MULT:SI x y) and (MULT:HI x y) are NOT equivalent.  */
2493   if (GET_MODE (x) != GET_MODE (y))
2494     return 0;
2495
2496   switch (code)
2497     {
2498     case PC:
2499     case CC0:
2500     case CONST_INT:
2501     case CONST_DOUBLE:
2502       return x == y;
2503
2504     case LABEL_REF:
2505       return XEXP (x, 0) == XEXP (y, 0);
2506
2507     case SYMBOL_REF:
2508       return XSTR (x, 0) == XSTR (y, 0);
2509
2510     case REG:
2511       if (for_gcse)
2512         return REGNO (x) == REGNO (y);
2513       else
2514         {
2515           unsigned int regno = REGNO (y);
2516           unsigned int i;
2517           unsigned int endregno
2518             = regno + (regno >= FIRST_PSEUDO_REGISTER ? 1
2519                        : hard_regno_nregs[regno][GET_MODE (y)]);
2520
2521           /* If the quantities are not the same, the expressions are not
2522              equivalent.  If there are and we are not to validate, they
2523              are equivalent.  Otherwise, ensure all regs are up-to-date.  */
2524
2525           if (REG_QTY (REGNO (x)) != REG_QTY (regno))
2526             return 0;
2527
2528           if (! validate)
2529             return 1;
2530
2531           for (i = regno; i < endregno; i++)
2532             if (REG_IN_TABLE (i) != REG_TICK (i))
2533               return 0;
2534
2535           return 1;
2536         }
2537
2538     case MEM:
2539       if (for_gcse)
2540         {
2541           /* Can't merge two expressions in different alias sets, since we
2542              can decide that the expression is transparent in a block when
2543              it isn't, due to it being set with the different alias set.  */
2544           if (MEM_ALIAS_SET (x) != MEM_ALIAS_SET (y))
2545             return 0;
2546
2547           /* A volatile mem should not be considered equivalent to any
2548              other.  */
2549           if (MEM_VOLATILE_P (x) || MEM_VOLATILE_P (y))
2550             return 0;
2551         }
2552       break;
2553
2554     /*  For commutative operations, check both orders.  */
2555     case PLUS:
2556     case MULT:
2557     case AND:
2558     case IOR:
2559     case XOR:
2560     case NE:
2561     case EQ:
2562       return ((exp_equiv_p (XEXP (x, 0), XEXP (y, 0),
2563                              validate, for_gcse)
2564                && exp_equiv_p (XEXP (x, 1), XEXP (y, 1),
2565                                 validate, for_gcse))
2566               || (exp_equiv_p (XEXP (x, 0), XEXP (y, 1),
2567                                 validate, for_gcse)
2568                   && exp_equiv_p (XEXP (x, 1), XEXP (y, 0),
2569                                    validate, for_gcse)));
2570
2571     case ASM_OPERANDS:
2572       /* We don't use the generic code below because we want to
2573          disregard filename and line numbers.  */
2574
2575       /* A volatile asm isn't equivalent to any other.  */
2576       if (MEM_VOLATILE_P (x) || MEM_VOLATILE_P (y))
2577         return 0;
2578
2579       if (GET_MODE (x) != GET_MODE (y)
2580           || strcmp (ASM_OPERANDS_TEMPLATE (x), ASM_OPERANDS_TEMPLATE (y))
2581           || strcmp (ASM_OPERANDS_OUTPUT_CONSTRAINT (x),
2582                      ASM_OPERANDS_OUTPUT_CONSTRAINT (y))
2583           || ASM_OPERANDS_OUTPUT_IDX (x) != ASM_OPERANDS_OUTPUT_IDX (y)
2584           || ASM_OPERANDS_INPUT_LENGTH (x) != ASM_OPERANDS_INPUT_LENGTH (y))
2585         return 0;
2586
2587       if (ASM_OPERANDS_INPUT_LENGTH (x))
2588         {
2589           for (i = ASM_OPERANDS_INPUT_LENGTH (x) - 1; i >= 0; i--)
2590             if (! exp_equiv_p (ASM_OPERANDS_INPUT (x, i),
2591                                ASM_OPERANDS_INPUT (y, i),
2592                                validate, for_gcse)
2593                 || strcmp (ASM_OPERANDS_INPUT_CONSTRAINT (x, i),
2594                            ASM_OPERANDS_INPUT_CONSTRAINT (y, i)))
2595               return 0;
2596         }
2597
2598       return 1;
2599
2600     default:
2601       break;
2602     }
2603
2604   /* Compare the elements.  If any pair of corresponding elements
2605      fail to match, return 0 for the whole thing.  */
2606
2607   fmt = GET_RTX_FORMAT (code);
2608   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
2609     {
2610       switch (fmt[i])
2611         {
2612         case 'e':
2613           if (! exp_equiv_p (XEXP (x, i), XEXP (y, i),
2614                               validate, for_gcse))
2615             return 0;
2616           break;
2617
2618         case 'E':
2619           if (XVECLEN (x, i) != XVECLEN (y, i))
2620             return 0;
2621           for (j = 0; j < XVECLEN (x, i); j++)
2622             if (! exp_equiv_p (XVECEXP (x, i, j), XVECEXP (y, i, j),
2623                                 validate, for_gcse))
2624               return 0;
2625           break;
2626
2627         case 's':
2628           if (strcmp (XSTR (x, i), XSTR (y, i)))
2629             return 0;
2630           break;
2631
2632         case 'i':
2633           if (XINT (x, i) != XINT (y, i))
2634             return 0;
2635           break;
2636
2637         case 'w':
2638           if (XWINT (x, i) != XWINT (y, i))
2639             return 0;
2640           break;
2641
2642         case '0':
2643         case 't':
2644           break;
2645
2646         default:
2647           gcc_unreachable ();
2648         }
2649     }
2650
2651   return 1;
2652 }
2653 \f
2654 /* Return 1 if X has a value that can vary even between two
2655    executions of the program.  0 means X can be compared reliably
2656    against certain constants or near-constants.  */
2657
2658 static int
2659 cse_rtx_varies_p (rtx x, int from_alias)
2660 {
2661   /* We need not check for X and the equivalence class being of the same
2662      mode because if X is equivalent to a constant in some mode, it
2663      doesn't vary in any mode.  */
2664
2665   if (REG_P (x)
2666       && REGNO_QTY_VALID_P (REGNO (x)))
2667     {
2668       int x_q = REG_QTY (REGNO (x));
2669       struct qty_table_elem *x_ent = &qty_table[x_q];
2670
2671       if (GET_MODE (x) == x_ent->mode
2672           && x_ent->const_rtx != NULL_RTX)
2673         return 0;
2674     }
2675
2676   if (GET_CODE (x) == PLUS
2677       && GET_CODE (XEXP (x, 1)) == CONST_INT
2678       && REG_P (XEXP (x, 0))
2679       && REGNO_QTY_VALID_P (REGNO (XEXP (x, 0))))
2680     {
2681       int x0_q = REG_QTY (REGNO (XEXP (x, 0)));
2682       struct qty_table_elem *x0_ent = &qty_table[x0_q];
2683
2684       if ((GET_MODE (XEXP (x, 0)) == x0_ent->mode)
2685           && x0_ent->const_rtx != NULL_RTX)
2686         return 0;
2687     }
2688
2689   /* This can happen as the result of virtual register instantiation, if
2690      the initial constant is too large to be a valid address.  This gives
2691      us a three instruction sequence, load large offset into a register,
2692      load fp minus a constant into a register, then a MEM which is the
2693      sum of the two `constant' registers.  */
2694   if (GET_CODE (x) == PLUS
2695       && REG_P (XEXP (x, 0))
2696       && REG_P (XEXP (x, 1))
2697       && REGNO_QTY_VALID_P (REGNO (XEXP (x, 0)))
2698       && REGNO_QTY_VALID_P (REGNO (XEXP (x, 1))))
2699     {
2700       int x0_q = REG_QTY (REGNO (XEXP (x, 0)));
2701       int x1_q = REG_QTY (REGNO (XEXP (x, 1)));
2702       struct qty_table_elem *x0_ent = &qty_table[x0_q];
2703       struct qty_table_elem *x1_ent = &qty_table[x1_q];
2704
2705       if ((GET_MODE (XEXP (x, 0)) == x0_ent->mode)
2706           && x0_ent->const_rtx != NULL_RTX
2707           && (GET_MODE (XEXP (x, 1)) == x1_ent->mode)
2708           && x1_ent->const_rtx != NULL_RTX)
2709         return 0;
2710     }
2711
2712   return rtx_varies_p (x, from_alias);
2713 }
2714 \f
2715 /* Subroutine of canon_reg.  Pass *XLOC through canon_reg, and validate
2716    the result if necessary.  INSN is as for canon_reg.  */
2717
2718 static void
2719 validate_canon_reg (rtx *xloc, rtx insn)
2720 {
2721   rtx new = canon_reg (*xloc, insn);
2722   int insn_code;
2723
2724   /* If replacing pseudo with hard reg or vice versa, ensure the
2725      insn remains valid.  Likewise if the insn has MATCH_DUPs.  */
2726   if (insn != 0 && new != 0
2727       && REG_P (new) && REG_P (*xloc)
2728       && (((REGNO (new) < FIRST_PSEUDO_REGISTER)
2729            != (REGNO (*xloc) < FIRST_PSEUDO_REGISTER))
2730           || GET_MODE (new) != GET_MODE (*xloc)
2731           || (insn_code = recog_memoized (insn)) < 0
2732           || insn_data[insn_code].n_dups > 0))
2733     validate_change (insn, xloc, new, 1);
2734   else
2735     *xloc = new;
2736 }
2737
2738 /* Canonicalize an expression:
2739    replace each register reference inside it
2740    with the "oldest" equivalent register.
2741
2742    If INSN is nonzero and we are replacing a pseudo with a hard register
2743    or vice versa, validate_change is used to ensure that INSN remains valid
2744    after we make our substitution.  The calls are made with IN_GROUP nonzero
2745    so apply_change_group must be called upon the outermost return from this
2746    function (unless INSN is zero).  The result of apply_change_group can
2747    generally be discarded since the changes we are making are optional.  */
2748
2749 static rtx
2750 canon_reg (rtx x, rtx insn)
2751 {
2752   int i;
2753   enum rtx_code code;
2754   const char *fmt;
2755
2756   if (x == 0)
2757     return x;
2758
2759   code = GET_CODE (x);
2760   switch (code)
2761     {
2762     case PC:
2763     case CC0:
2764     case CONST:
2765     case CONST_INT:
2766     case CONST_DOUBLE:
2767     case CONST_VECTOR:
2768     case SYMBOL_REF:
2769     case LABEL_REF:
2770     case ADDR_VEC:
2771     case ADDR_DIFF_VEC:
2772       return x;
2773
2774     case REG:
2775       {
2776         int first;
2777         int q;
2778         struct qty_table_elem *ent;
2779
2780         /* Never replace a hard reg, because hard regs can appear
2781            in more than one machine mode, and we must preserve the mode
2782            of each occurrence.  Also, some hard regs appear in
2783            MEMs that are shared and mustn't be altered.  Don't try to
2784            replace any reg that maps to a reg of class NO_REGS.  */
2785         if (REGNO (x) < FIRST_PSEUDO_REGISTER
2786             || ! REGNO_QTY_VALID_P (REGNO (x)))
2787           return x;
2788
2789         q = REG_QTY (REGNO (x));
2790         ent = &qty_table[q];
2791         first = ent->first_reg;
2792         return (first >= FIRST_PSEUDO_REGISTER ? regno_reg_rtx[first]
2793                 : REGNO_REG_CLASS (first) == NO_REGS ? x
2794                 : gen_rtx_REG (ent->mode, first));
2795       }
2796
2797     default:
2798       break;
2799     }
2800
2801   fmt = GET_RTX_FORMAT (code);
2802   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
2803     {
2804       int j;
2805
2806       if (fmt[i] == 'e')
2807         validate_canon_reg (&XEXP (x, i), insn);
2808       else if (fmt[i] == 'E')
2809         for (j = 0; j < XVECLEN (x, i); j++)
2810           validate_canon_reg (&XVECEXP (x, i, j), insn);
2811     }
2812
2813   return x;
2814 }
2815 \f
2816 /* LOC is a location within INSN that is an operand address (the contents of
2817    a MEM).  Find the best equivalent address to use that is valid for this
2818    insn.
2819
2820    On most CISC machines, complicated address modes are costly, and rtx_cost
2821    is a good approximation for that cost.  However, most RISC machines have
2822    only a few (usually only one) memory reference formats.  If an address is
2823    valid at all, it is often just as cheap as any other address.  Hence, for
2824    RISC machines, we use `address_cost' to compare the costs of various
2825    addresses.  For two addresses of equal cost, choose the one with the
2826    highest `rtx_cost' value as that has the potential of eliminating the
2827    most insns.  For equal costs, we choose the first in the equivalence
2828    class.  Note that we ignore the fact that pseudo registers are cheaper than
2829    hard registers here because we would also prefer the pseudo registers.  */
2830
2831 static void
2832 find_best_addr (rtx insn, rtx *loc, enum machine_mode mode)
2833 {
2834   struct table_elt *elt;
2835   rtx addr = *loc;
2836   struct table_elt *p;
2837   int found_better = 1;
2838   int save_do_not_record = do_not_record;
2839   int save_hash_arg_in_memory = hash_arg_in_memory;
2840   int addr_volatile;
2841   int regno;
2842   unsigned hash;
2843
2844   /* Do not try to replace constant addresses or addresses of local and
2845      argument slots.  These MEM expressions are made only once and inserted
2846      in many instructions, as well as being used to control symbol table
2847      output.  It is not safe to clobber them.
2848
2849      There are some uncommon cases where the address is already in a register
2850      for some reason, but we cannot take advantage of that because we have
2851      no easy way to unshare the MEM.  In addition, looking up all stack
2852      addresses is costly.  */
2853   if ((GET_CODE (addr) == PLUS
2854        && REG_P (XEXP (addr, 0))
2855        && GET_CODE (XEXP (addr, 1)) == CONST_INT
2856        && (regno = REGNO (XEXP (addr, 0)),
2857            regno == FRAME_POINTER_REGNUM || regno == HARD_FRAME_POINTER_REGNUM
2858            || regno == ARG_POINTER_REGNUM))
2859       || (REG_P (addr)
2860           && (regno = REGNO (addr), regno == FRAME_POINTER_REGNUM
2861               || regno == HARD_FRAME_POINTER_REGNUM
2862               || regno == ARG_POINTER_REGNUM))
2863       || CONSTANT_ADDRESS_P (addr))
2864     return;
2865
2866   /* If this address is not simply a register, try to fold it.  This will
2867      sometimes simplify the expression.  Many simplifications
2868      will not be valid, but some, usually applying the associative rule, will
2869      be valid and produce better code.  */
2870   if (!REG_P (addr))
2871     {
2872       rtx folded = canon_for_address (fold_rtx (addr, NULL_RTX));
2873
2874       if (folded != addr)
2875         {
2876           int addr_folded_cost = address_cost (folded, mode);
2877           int addr_cost = address_cost (addr, mode);
2878
2879           if ((addr_folded_cost < addr_cost
2880                || (addr_folded_cost == addr_cost
2881                    /* ??? The rtx_cost comparison is left over from an older
2882                       version of this code.  It is probably no longer helpful.*/
2883                    && (rtx_cost (folded, MEM) > rtx_cost (addr, MEM)
2884                        || approx_reg_cost (folded) < approx_reg_cost (addr))))
2885               && validate_change (insn, loc, folded, 0))
2886             addr = folded;
2887         }
2888     }
2889
2890   /* If this address is not in the hash table, we can't look for equivalences
2891      of the whole address.  Also, ignore if volatile.  */
2892
2893   do_not_record = 0;
2894   hash = HASH (addr, Pmode);
2895   addr_volatile = do_not_record;
2896   do_not_record = save_do_not_record;
2897   hash_arg_in_memory = save_hash_arg_in_memory;
2898
2899   if (addr_volatile)
2900     return;
2901
2902   elt = lookup (addr, hash, Pmode);
2903
2904   if (elt)
2905     {
2906       /* We need to find the best (under the criteria documented above) entry
2907          in the class that is valid.  We use the `flag' field to indicate
2908          choices that were invalid and iterate until we can't find a better
2909          one that hasn't already been tried.  */
2910
2911       for (p = elt->first_same_value; p; p = p->next_same_value)
2912         p->flag = 0;
2913
2914       while (found_better)
2915         {
2916           int best_addr_cost = address_cost (*loc, mode);
2917           int best_rtx_cost = (elt->cost + 1) >> 1;
2918           int exp_cost;
2919           struct table_elt *best_elt = elt;
2920
2921           found_better = 0;
2922           for (p = elt->first_same_value; p; p = p->next_same_value)
2923             if (! p->flag)
2924               {
2925                 if ((REG_P (p->exp)
2926                      || exp_equiv_p (p->exp, p->exp, 1, false))
2927                     && ((exp_cost = address_cost (p->exp, mode)) < best_addr_cost
2928                         || (exp_cost == best_addr_cost
2929                             && ((p->cost + 1) >> 1) > best_rtx_cost)))
2930                   {
2931                     found_better = 1;
2932                     best_addr_cost = exp_cost;
2933                     best_rtx_cost = (p->cost + 1) >> 1;
2934                     best_elt = p;
2935                   }
2936               }
2937
2938           if (found_better)
2939             {
2940               if (validate_change (insn, loc,
2941                                    canon_reg (copy_rtx (best_elt->exp),
2942                                               NULL_RTX), 0))
2943                 return;
2944               else
2945                 best_elt->flag = 1;
2946             }
2947         }
2948     }
2949
2950   /* If the address is a binary operation with the first operand a register
2951      and the second a constant, do the same as above, but looking for
2952      equivalences of the register.  Then try to simplify before checking for
2953      the best address to use.  This catches a few cases:  First is when we
2954      have REG+const and the register is another REG+const.  We can often merge
2955      the constants and eliminate one insn and one register.  It may also be
2956      that a machine has a cheap REG+REG+const.  Finally, this improves the
2957      code on the Alpha for unaligned byte stores.  */
2958
2959   if (flag_expensive_optimizations
2960       && ARITHMETIC_P (*loc)
2961       && REG_P (XEXP (*loc, 0)))
2962     {
2963       rtx op1 = XEXP (*loc, 1);
2964
2965       do_not_record = 0;
2966       hash = HASH (XEXP (*loc, 0), Pmode);
2967       do_not_record = save_do_not_record;
2968       hash_arg_in_memory = save_hash_arg_in_memory;
2969
2970       elt = lookup (XEXP (*loc, 0), hash, Pmode);
2971       if (elt == 0)
2972         return;
2973
2974       /* We need to find the best (under the criteria documented above) entry
2975          in the class that is valid.  We use the `flag' field to indicate
2976          choices that were invalid and iterate until we can't find a better
2977          one that hasn't already been tried.  */
2978
2979       for (p = elt->first_same_value; p; p = p->next_same_value)
2980         p->flag = 0;
2981
2982       while (found_better)
2983         {
2984           int best_addr_cost = address_cost (*loc, mode);
2985           int best_rtx_cost = (COST (*loc) + 1) >> 1;
2986           struct table_elt *best_elt = elt;
2987           rtx best_rtx = *loc;
2988           int count;
2989
2990           /* This is at worst case an O(n^2) algorithm, so limit our search
2991              to the first 32 elements on the list.  This avoids trouble
2992              compiling code with very long basic blocks that can easily
2993              call simplify_gen_binary so many times that we run out of
2994              memory.  */
2995
2996           found_better = 0;
2997           for (p = elt->first_same_value, count = 0;
2998                p && count < 32;
2999                p = p->next_same_value, count++)
3000             if (! p->flag
3001                 && (REG_P (p->exp)
3002                     || exp_equiv_p (p->exp, p->exp, 1, false)))
3003               {
3004                 rtx new = simplify_gen_binary (GET_CODE (*loc), Pmode,
3005                                                p->exp, op1);
3006                 int new_cost;
3007                 
3008                 /* Get the canonical version of the address so we can accept
3009                    more.  */
3010                 new = canon_for_address (new);
3011                 
3012                 new_cost = address_cost (new, mode);
3013
3014                 if (new_cost < best_addr_cost
3015                     || (new_cost == best_addr_cost
3016                         && (COST (new) + 1) >> 1 > best_rtx_cost))
3017                   {
3018                     found_better = 1;
3019                     best_addr_cost = new_cost;
3020                     best_rtx_cost = (COST (new) + 1) >> 1;
3021                     best_elt = p;
3022                     best_rtx = new;
3023                   }
3024               }
3025
3026           if (found_better)
3027             {
3028               if (validate_change (insn, loc,
3029                                    canon_reg (copy_rtx (best_rtx),
3030                                               NULL_RTX), 0))
3031                 return;
3032               else
3033                 best_elt->flag = 1;
3034             }
3035         }
3036     }
3037 }
3038 \f
3039 /* Given an operation (CODE, *PARG1, *PARG2), where code is a comparison
3040    operation (EQ, NE, GT, etc.), follow it back through the hash table and
3041    what values are being compared.
3042
3043    *PARG1 and *PARG2 are updated to contain the rtx representing the values
3044    actually being compared.  For example, if *PARG1 was (cc0) and *PARG2
3045    was (const_int 0), *PARG1 and *PARG2 will be set to the objects that were
3046    compared to produce cc0.
3047
3048    The return value is the comparison operator and is either the code of
3049    A or the code corresponding to the inverse of the comparison.  */
3050
3051 static enum rtx_code
3052 find_comparison_args (enum rtx_code code, rtx *parg1, rtx *parg2,
3053                       enum machine_mode *pmode1, enum machine_mode *pmode2)
3054 {
3055   rtx arg1, arg2;
3056
3057   arg1 = *parg1, arg2 = *parg2;
3058
3059   /* If ARG2 is const0_rtx, see what ARG1 is equivalent to.  */
3060
3061   while (arg2 == CONST0_RTX (GET_MODE (arg1)))
3062     {
3063       /* Set nonzero when we find something of interest.  */
3064       rtx x = 0;
3065       int reverse_code = 0;
3066       struct table_elt *p = 0;
3067
3068       /* If arg1 is a COMPARE, extract the comparison arguments from it.
3069          On machines with CC0, this is the only case that can occur, since
3070          fold_rtx will return the COMPARE or item being compared with zero
3071          when given CC0.  */
3072
3073       if (GET_CODE (arg1) == COMPARE && arg2 == const0_rtx)
3074         x = arg1;
3075
3076       /* If ARG1 is a comparison operator and CODE is testing for
3077          STORE_FLAG_VALUE, get the inner arguments.  */
3078
3079       else if (COMPARISON_P (arg1))
3080         {
3081 #ifdef FLOAT_STORE_FLAG_VALUE
3082           REAL_VALUE_TYPE fsfv;
3083 #endif
3084
3085           if (code == NE
3086               || (GET_MODE_CLASS (GET_MODE (arg1)) == MODE_INT
3087                   && code == LT && STORE_FLAG_VALUE == -1)
3088 #ifdef FLOAT_STORE_FLAG_VALUE
3089               || (GET_MODE_CLASS (GET_MODE (arg1)) == MODE_FLOAT
3090                   && (fsfv = FLOAT_STORE_FLAG_VALUE (GET_MODE (arg1)),
3091                       REAL_VALUE_NEGATIVE (fsfv)))
3092 #endif
3093               )
3094             x = arg1;
3095           else if (code == EQ
3096                    || (GET_MODE_CLASS (GET_MODE (arg1)) == MODE_INT
3097                        && code == GE && STORE_FLAG_VALUE == -1)
3098 #ifdef FLOAT_STORE_FLAG_VALUE
3099                    || (GET_MODE_CLASS (GET_MODE (arg1)) == MODE_FLOAT
3100                        && (fsfv = FLOAT_STORE_FLAG_VALUE (GET_MODE (arg1)),
3101                            REAL_VALUE_NEGATIVE (fsfv)))
3102 #endif
3103                    )
3104             x = arg1, reverse_code = 1;
3105         }
3106
3107       /* ??? We could also check for
3108
3109          (ne (and (eq (...) (const_int 1))) (const_int 0))
3110
3111          and related forms, but let's wait until we see them occurring.  */
3112
3113       if (x == 0)
3114         /* Look up ARG1 in the hash table and see if it has an equivalence
3115            that lets us see what is being compared.  */
3116         p = lookup (arg1, SAFE_HASH (arg1, GET_MODE (arg1)), GET_MODE (arg1));
3117       if (p)
3118         {
3119           p = p->first_same_value;
3120
3121           /* If what we compare is already known to be constant, that is as
3122              good as it gets.
3123              We need to break the loop in this case, because otherwise we
3124              can have an infinite loop when looking at a reg that is known
3125              to be a constant which is the same as a comparison of a reg
3126              against zero which appears later in the insn stream, which in
3127              turn is constant and the same as the comparison of the first reg
3128              against zero...  */
3129           if (p->is_const)
3130             break;
3131         }
3132
3133       for (; p; p = p->next_same_value)
3134         {
3135           enum machine_mode inner_mode = GET_MODE (p->exp);
3136 #ifdef FLOAT_STORE_FLAG_VALUE
3137           REAL_VALUE_TYPE fsfv;
3138 #endif
3139
3140           /* If the entry isn't valid, skip it.  */
3141           if (! exp_equiv_p (p->exp, p->exp, 1, false))
3142             continue;
3143
3144           if (GET_CODE (p->exp) == COMPARE
3145               /* Another possibility is that this machine has a compare insn
3146                  that includes the comparison code.  In that case, ARG1 would
3147                  be equivalent to a comparison operation that would set ARG1 to
3148                  either STORE_FLAG_VALUE or zero.  If this is an NE operation,
3149                  ORIG_CODE is the actual comparison being done; if it is an EQ,
3150                  we must reverse ORIG_CODE.  On machine with a negative value
3151                  for STORE_FLAG_VALUE, also look at LT and GE operations.  */
3152               || ((code == NE
3153                    || (code == LT
3154                        && GET_MODE_CLASS (inner_mode) == MODE_INT
3155                        && (GET_MODE_BITSIZE (inner_mode)
3156                            <= HOST_BITS_PER_WIDE_INT)
3157                        && (STORE_FLAG_VALUE
3158                            & ((HOST_WIDE_INT) 1
3159                               << (GET_MODE_BITSIZE (inner_mode) - 1))))
3160 #ifdef FLOAT_STORE_FLAG_VALUE
3161                    || (code == LT
3162                        && GET_MODE_CLASS (inner_mode) == MODE_FLOAT
3163                        && (fsfv = FLOAT_STORE_FLAG_VALUE (GET_MODE (arg1)),
3164                            REAL_VALUE_NEGATIVE (fsfv)))
3165 #endif
3166                    )
3167                   && COMPARISON_P (p->exp)))
3168             {
3169               x = p->exp;
3170               break;
3171             }
3172           else if ((code == EQ
3173                     || (code == GE
3174                         && GET_MODE_CLASS (inner_mode) == MODE_INT
3175                         && (GET_MODE_BITSIZE (inner_mode)
3176                             <= HOST_BITS_PER_WIDE_INT)
3177                         && (STORE_FLAG_VALUE
3178                             & ((HOST_WIDE_INT) 1
3179                                << (GET_MODE_BITSIZE (inner_mode) - 1))))
3180 #ifdef FLOAT_STORE_FLAG_VALUE
3181                     || (code == GE
3182                         && GET_MODE_CLASS (inner_mode) == MODE_FLOAT
3183                         && (fsfv = FLOAT_STORE_FLAG_VALUE (GET_MODE (arg1)),
3184                             REAL_VALUE_NEGATIVE (fsfv)))
3185 #endif
3186                     )
3187                    && COMPARISON_P (p->exp))
3188             {
3189               reverse_code = 1;
3190               x = p->exp;
3191               break;
3192             }
3193
3194           /* If this non-trapping address, e.g. fp + constant, the
3195              equivalent is a better operand since it may let us predict
3196              the value of the comparison.  */
3197           else if (!rtx_addr_can_trap_p (p->exp))
3198             {
3199               arg1 = p->exp;
3200               continue;
3201             }
3202         }
3203
3204       /* If we didn't find a useful equivalence for ARG1, we are done.
3205          Otherwise, set up for the next iteration.  */
3206       if (x == 0)
3207         break;
3208
3209       /* If we need to reverse the comparison, make sure that that is
3210          possible -- we can't necessarily infer the value of GE from LT
3211          with floating-point operands.  */
3212       if (reverse_code)
3213         {
3214           enum rtx_code reversed = reversed_comparison_code (x, NULL_RTX);
3215           if (reversed == UNKNOWN)
3216             break;
3217           else
3218             code = reversed;
3219         }
3220       else if (COMPARISON_P (x))
3221         code = GET_CODE (x);
3222       arg1 = XEXP (x, 0), arg2 = XEXP (x, 1);
3223     }
3224
3225   /* Return our results.  Return the modes from before fold_rtx
3226      because fold_rtx might produce const_int, and then it's too late.  */
3227   *pmode1 = GET_MODE (arg1), *pmode2 = GET_MODE (arg2);
3228   *parg1 = fold_rtx (arg1, 0), *parg2 = fold_rtx (arg2, 0);
3229
3230   return code;
3231 }
3232 \f
3233 /* Fold SUBREG.  */
3234
3235 static rtx
3236 fold_rtx_subreg (rtx x, rtx insn)
3237 {
3238   enum machine_mode mode = GET_MODE (x);
3239   rtx folded_arg0;
3240   rtx const_arg0;
3241   rtx new;
3242
3243   /* See if we previously assigned a constant value to this SUBREG.  */
3244   if ((new = lookup_as_function (x, CONST_INT)) != 0
3245       || (new = lookup_as_function (x, CONST_DOUBLE)) != 0)
3246     return new;
3247
3248   /* If this is a paradoxical SUBREG, we have no idea what value the
3249      extra bits would have.  However, if the operand is equivalent to
3250      a SUBREG whose operand is the same as our mode, and all the modes
3251      are within a word, we can just use the inner operand because
3252      these SUBREGs just say how to treat the register.
3253
3254      Similarly if we find an integer constant.  */
3255
3256   if (GET_MODE_SIZE (mode) > GET_MODE_SIZE (GET_MODE (SUBREG_REG (x))))
3257     {
3258       enum machine_mode imode = GET_MODE (SUBREG_REG (x));
3259       struct table_elt *elt;
3260
3261       if (GET_MODE_SIZE (mode) <= UNITS_PER_WORD
3262           && GET_MODE_SIZE (imode) <= UNITS_PER_WORD
3263           && (elt = lookup (SUBREG_REG (x), HASH (SUBREG_REG (x), imode),
3264                             imode)) != 0)
3265         for (elt = elt->first_same_value; elt; elt = elt->next_same_value)
3266           {
3267             if (CONSTANT_P (elt->exp)
3268                 && GET_MODE (elt->exp) == VOIDmode)
3269               return elt->exp;
3270
3271             if (GET_CODE (elt->exp) == SUBREG
3272                 && GET_MODE (SUBREG_REG (elt->exp)) == mode
3273                 && exp_equiv_p (elt->exp, elt->exp, 1, false))
3274               return copy_rtx (SUBREG_REG (elt->exp));
3275           }
3276
3277       return x;
3278     }
3279
3280   /* Fold SUBREG_REG.  If it changed, see if we can simplify the
3281      SUBREG.  We might be able to if the SUBREG is extracting a single
3282      word in an integral mode or extracting the low part.  */
3283
3284   folded_arg0 = fold_rtx (SUBREG_REG (x), insn);
3285   const_arg0 = equiv_constant (folded_arg0);
3286   if (const_arg0)
3287     folded_arg0 = const_arg0;
3288
3289   if (folded_arg0 != SUBREG_REG (x))
3290     {
3291       new = simplify_subreg (mode, folded_arg0,
3292                              GET_MODE (SUBREG_REG (x)), SUBREG_BYTE (x));
3293       if (new)
3294         return new;
3295     }
3296
3297   if (REG_P (folded_arg0)
3298       && GET_MODE_SIZE (mode) < GET_MODE_SIZE (GET_MODE (folded_arg0)))
3299     {
3300       struct table_elt *elt;
3301
3302       elt = lookup (folded_arg0,
3303                     HASH (folded_arg0, GET_MODE (folded_arg0)),
3304                     GET_MODE (folded_arg0));
3305
3306       if (elt)
3307         elt = elt->first_same_value;
3308
3309       if (subreg_lowpart_p (x))
3310         /* If this is a narrowing SUBREG and our operand is a REG, see
3311            if we can find an equivalence for REG that is an arithmetic
3312            operation in a wider mode where both operands are
3313            paradoxical SUBREGs from objects of our result mode.  In
3314            that case, we couldn-t report an equivalent value for that
3315            operation, since we don't know what the extra bits will be.
3316            But we can find an equivalence for this SUBREG by folding
3317            that operation in the narrow mode.  This allows us to fold
3318            arithmetic in narrow modes when the machine only supports
3319            word-sized arithmetic.
3320
3321            Also look for a case where we have a SUBREG whose operand
3322            is the same as our result.  If both modes are smaller than
3323            a word, we are simply interpreting a register in different
3324            modes and we can use the inner value.  */
3325
3326         for (; elt; elt = elt->next_same_value)
3327           {
3328             enum rtx_code eltcode = GET_CODE (elt->exp);
3329
3330             /* Just check for unary and binary operations.  */
3331             if (UNARY_P (elt->exp)
3332                 && eltcode != SIGN_EXTEND
3333                 && eltcode != ZERO_EXTEND
3334                 && GET_CODE (XEXP (elt->exp, 0)) == SUBREG
3335                 && GET_MODE (SUBREG_REG (XEXP (elt->exp, 0))) == mode
3336                 && (GET_MODE_CLASS (mode)
3337                     == GET_MODE_CLASS (GET_MODE (XEXP (elt->exp, 0)))))
3338               {
3339                 rtx op0 = SUBREG_REG (XEXP (elt->exp, 0));
3340
3341                 if (!REG_P (op0) && ! CONSTANT_P (op0))
3342                   op0 = fold_rtx (op0, NULL_RTX);
3343
3344                 op0 = equiv_constant (op0);
3345                 if (op0)
3346                   new = simplify_unary_operation (GET_CODE (elt->exp), mode,
3347                                                   op0, mode);
3348               }
3349             else if (ARITHMETIC_P (elt->exp)
3350                      && eltcode != DIV && eltcode != MOD
3351                      && eltcode != UDIV && eltcode != UMOD
3352                      && eltcode != ASHIFTRT && eltcode != LSHIFTRT
3353                      && eltcode != ROTATE && eltcode != ROTATERT
3354                      && ((GET_CODE (XEXP (elt->exp, 0)) == SUBREG
3355                           && (GET_MODE (SUBREG_REG (XEXP (elt->exp, 0)))
3356                               == mode))
3357                          || CONSTANT_P (XEXP (elt->exp, 0)))
3358                      && ((GET_CODE (XEXP (elt->exp, 1)) == SUBREG
3359                           && (GET_MODE (SUBREG_REG (XEXP (elt->exp, 1)))
3360                               == mode))
3361                          || CONSTANT_P (XEXP (elt->exp, 1))))
3362               {
3363                 rtx op0 = gen_lowpart_common (mode, XEXP (elt->exp, 0));
3364                 rtx op1 = gen_lowpart_common (mode, XEXP (elt->exp, 1));
3365
3366                 if (op0 && !REG_P (op0) && ! CONSTANT_P (op0))
3367                   op0 = fold_rtx (op0, NULL_RTX);
3368
3369                 if (op0)
3370                   op0 = equiv_constant (op0);
3371
3372                 if (op1 && !REG_P (op1) && ! CONSTANT_P (op1))
3373                   op1 = fold_rtx (op1, NULL_RTX);
3374
3375                 if (op1)
3376                   op1 = equiv_constant (op1);
3377
3378                 /* If we are looking for the low SImode part of
3379                    (ashift:DI c (const_int 32)), it doesn't work to
3380                    compute that in SImode, because a 32-bit shift in
3381                    SImode is unpredictable.  We know the value is
3382                    0.  */
3383                 if (op0 && op1
3384                     && GET_CODE (elt->exp) == ASHIFT
3385                     && GET_CODE (op1) == CONST_INT
3386                     && INTVAL (op1) >= GET_MODE_BITSIZE (mode))
3387                   {
3388                     if (INTVAL (op1)
3389                         < GET_MODE_BITSIZE (GET_MODE (elt->exp)))
3390                       /* If the count fits in the inner mode's width,
3391                          but exceeds the outer mode's width, the value
3392                          will get truncated to 0 by the subreg.  */
3393                       new = CONST0_RTX (mode);
3394                     else
3395                       /* If the count exceeds even the inner mode's width,
3396                          don't fold this expression.  */
3397                       new = 0;
3398                   }
3399                 else if (op0 && op1)
3400                   new = simplify_binary_operation (GET_CODE (elt->exp),
3401                                                    mode, op0, op1);
3402               }
3403
3404             else if (GET_CODE (elt->exp) == SUBREG
3405                      && GET_MODE (SUBREG_REG (elt->exp)) == mode
3406                      && (GET_MODE_SIZE (GET_MODE (folded_arg0))
3407                          <= UNITS_PER_WORD)
3408                      && exp_equiv_p (elt->exp, elt->exp, 1, false))
3409               new = copy_rtx (SUBREG_REG (elt->exp));
3410
3411             if (new)
3412               return new;
3413           }
3414       else
3415         /* A SUBREG resulting from a zero extension may fold to zero
3416            if it extracts higher bits than the ZERO_EXTEND's source
3417            bits.  FIXME: if combine tried to, er, combine these
3418            instructions, this transformation may be moved to
3419            simplify_subreg.  */
3420         for (; elt; elt = elt->next_same_value)
3421           {
3422             if (GET_CODE (elt->exp) == ZERO_EXTEND
3423                 && subreg_lsb (x)
3424                 >= GET_MODE_BITSIZE (GET_MODE (XEXP (elt->exp, 0))))
3425               return CONST0_RTX (mode);
3426           }
3427     }
3428
3429   return x;
3430 }
3431
3432 /* Fold MEM.  */
3433
3434 static rtx
3435 fold_rtx_mem (rtx x, rtx insn)
3436 {
3437   enum machine_mode mode = GET_MODE (x);
3438   rtx new;
3439
3440   /* If we are not actually processing an insn, don't try to find the
3441      best address.  Not only don't we care, but we could modify the
3442      MEM in an invalid way since we have no insn to validate
3443      against.  */
3444   if (insn != 0)
3445     find_best_addr (insn, &XEXP (x, 0), mode);
3446
3447   {
3448     /* Even if we don't fold in the insn itself, we can safely do so
3449        here, in hopes of getting a constant.  */
3450     rtx addr = fold_rtx (XEXP (x, 0), NULL_RTX);
3451     rtx base = 0;
3452     HOST_WIDE_INT offset = 0;
3453
3454     if (REG_P (addr)
3455         && REGNO_QTY_VALID_P (REGNO (addr)))
3456       {
3457         int addr_q = REG_QTY (REGNO (addr));
3458         struct qty_table_elem *addr_ent = &qty_table[addr_q];
3459
3460         if (GET_MODE (addr) == addr_ent->mode
3461             && addr_ent->const_rtx != NULL_RTX)
3462           addr = addr_ent->const_rtx;
3463       }
3464
3465     /* Call target hook to avoid the effects of -fpic etc....  */
3466     addr = targetm.delegitimize_address (addr);
3467
3468     /* If address is constant, split it into a base and integer
3469        offset.  */
3470     if (GET_CODE (addr) == SYMBOL_REF || GET_CODE (addr) == LABEL_REF)
3471       base = addr;
3472     else if (GET_CODE (addr) == CONST && GET_CODE (XEXP (addr, 0)) == PLUS
3473              && GET_CODE (XEXP (XEXP (addr, 0), 1)) == CONST_INT)
3474       {
3475         base = XEXP (XEXP (addr, 0), 0);
3476         offset = INTVAL (XEXP (XEXP (addr, 0), 1));
3477       }
3478     else if (GET_CODE (addr) == LO_SUM
3479              && GET_CODE (XEXP (addr, 1)) == SYMBOL_REF)
3480       base = XEXP (addr, 1);
3481
3482     /* If this is a constant pool reference, we can fold it into its
3483        constant to allow better value tracking.  */
3484     if (base && GET_CODE (base) == SYMBOL_REF
3485         && CONSTANT_POOL_ADDRESS_P (base))
3486       {
3487         rtx constant = get_pool_constant (base);
3488         enum machine_mode const_mode = get_pool_mode (base);
3489         rtx new;
3490
3491         if (CONSTANT_P (constant) && GET_CODE (constant) != CONST_INT)
3492           {
3493             constant_pool_entries_cost = COST (constant);
3494             constant_pool_entries_regcost = approx_reg_cost (constant);
3495           }
3496
3497         /* If we are loading the full constant, we have an
3498            equivalence.  */
3499         if (offset == 0 && mode == const_mode)
3500           return constant;
3501
3502         /* If this actually isn't a constant (weird!), we can't do
3503            anything.  Otherwise, handle the two most common cases:
3504            extracting a word from a multi-word constant, and
3505            extracting the low-order bits.  Other cases don't seem
3506            common enough to worry about.  */
3507         if (! CONSTANT_P (constant))
3508           return x;
3509
3510         if (GET_MODE_CLASS (mode) == MODE_INT
3511             && GET_MODE_SIZE (mode) == UNITS_PER_WORD
3512             && offset % UNITS_PER_WORD == 0
3513             && (new = operand_subword (constant,
3514                                        offset / UNITS_PER_WORD,
3515                                        0, const_mode)) != 0)
3516           return new;
3517
3518         if (((BYTES_BIG_ENDIAN
3519               && offset == GET_MODE_SIZE (GET_MODE (constant)) - 1)
3520              || (! BYTES_BIG_ENDIAN && offset == 0))
3521             && (new = gen_lowpart (mode, constant)) != 0)
3522           return new;
3523       }
3524
3525     /* If this is a reference to a label at a known position in a jump
3526        table, we also know its value.  */
3527     if (base && GET_CODE (base) == LABEL_REF)
3528       {
3529         rtx label = XEXP (base, 0);
3530         rtx table_insn = NEXT_INSN (label);
3531
3532         if (table_insn && JUMP_P (table_insn)
3533             && GET_CODE (PATTERN (table_insn)) == ADDR_VEC)
3534           {
3535             rtx table = PATTERN (table_insn);
3536
3537             if (offset >= 0
3538                 && (offset / GET_MODE_SIZE (GET_MODE (table))
3539                     < XVECLEN (table, 0)))
3540               {
3541                 rtx label = XVECEXP
3542                   (table, 0, offset / GET_MODE_SIZE (GET_MODE (table)));
3543                 rtx set;
3544
3545                 /* If we have an insn that loads the label from the
3546                    jumptable into a reg, we don't want to set the reg
3547                    to the label, because this may cause a reference to
3548                    the label to remain after the label is removed in
3549                    some very obscure cases (PR middle-end/18628).  */
3550                 if (!insn)
3551                   return label;
3552
3553                 set = single_set (insn);
3554
3555                 if (! set || SET_SRC (set) != x)
3556                   return x;
3557
3558                 /* If it's a jump, it's safe to reference the label.  */
3559                 if (SET_DEST (set) == pc_rtx)
3560                   return label;
3561
3562                 return x;
3563               }
3564           }
3565         if (table_insn && JUMP_P (table_insn)
3566             && GET_CODE (PATTERN (table_insn)) == ADDR_DIFF_VEC)
3567           {
3568             rtx table = PATTERN (table_insn);
3569
3570             if (offset >= 0
3571                 && (offset / GET_MODE_SIZE (GET_MODE (table))
3572                     < XVECLEN (table, 1)))
3573               {
3574                 offset /= GET_MODE_SIZE (GET_MODE (table));
3575                 new = gen_rtx_MINUS (Pmode, XVECEXP (table, 1, offset),
3576                                      XEXP (table, 0));
3577
3578                 if (GET_MODE (table) != Pmode)
3579                   new = gen_rtx_TRUNCATE (GET_MODE (table), new);
3580
3581                 /* Indicate this is a constant.  This isn't a valid
3582                    form of CONST, but it will only be used to fold the
3583                    next insns and then discarded, so it should be
3584                    safe.
3585
3586                    Note this expression must be explicitly discarded,
3587                    by cse_insn, else it may end up in a REG_EQUAL note
3588                    and "escape" to cause problems elsewhere.  */
3589                 return gen_rtx_CONST (GET_MODE (new), new);
3590               }
3591           }
3592       }
3593
3594     return x;
3595   }
3596 }
3597
3598 /* If X is a nontrivial arithmetic operation on an argument
3599    for which a constant value can be determined, return
3600    the result of operating on that value, as a constant.
3601    Otherwise, return X, possibly with one or more operands
3602    modified by recursive calls to this function.
3603
3604    If X is a register whose contents are known, we do NOT
3605    return those contents here.  equiv_constant is called to
3606    perform that task.
3607
3608    INSN is the insn that we may be modifying.  If it is 0, make a copy
3609    of X before modifying it.  */
3610
3611 static rtx
3612 fold_rtx (rtx x, rtx insn)
3613 {
3614   enum rtx_code code;
3615   enum machine_mode mode;
3616   const char *fmt;
3617   int i;
3618   rtx new = 0;
3619   int copied = 0;
3620   int must_swap = 0;
3621
3622   /* Folded equivalents of first two operands of X.  */
3623   rtx folded_arg0;
3624   rtx folded_arg1;
3625
3626   /* Constant equivalents of first three operands of X;
3627      0 when no such equivalent is known.  */
3628   rtx const_arg0;
3629   rtx const_arg1;
3630   rtx const_arg2;
3631
3632   /* The mode of the first operand of X.  We need this for sign and zero
3633      extends.  */
3634   enum machine_mode mode_arg0;
3635
3636   if (x == 0)
3637     return x;
3638
3639   mode = GET_MODE (x);
3640   code = GET_CODE (x);
3641   switch (code)
3642     {
3643     case CONST:
3644     case CONST_INT:
3645     case CONST_DOUBLE:
3646     case CONST_VECTOR:
3647     case SYMBOL_REF:
3648     case LABEL_REF:
3649     case REG:
3650     case PC:
3651       /* No use simplifying an EXPR_LIST
3652          since they are used only for lists of args
3653          in a function call's REG_EQUAL note.  */
3654     case EXPR_LIST:
3655       return x;
3656
3657 #ifdef HAVE_cc0
3658     case CC0:
3659       return prev_insn_cc0;
3660 #endif
3661
3662     case SUBREG:
3663       return fold_rtx_subreg (x, insn);
3664
3665     case NOT:
3666     case NEG:
3667       /* If we have (NOT Y), see if Y is known to be (NOT Z).
3668          If so, (NOT Y) simplifies to Z.  Similarly for NEG.  */
3669       new = lookup_as_function (XEXP (x, 0), code);
3670       if (new)
3671         return fold_rtx (copy_rtx (XEXP (new, 0)), insn);
3672       break;
3673
3674     case MEM:
3675       return fold_rtx_mem (x, insn);
3676
3677 #ifdef NO_FUNCTION_CSE
3678     case CALL:
3679       if (CONSTANT_P (XEXP (XEXP (x, 0), 0)))
3680         return x;
3681       break;
3682 #endif
3683
3684     case ASM_OPERANDS:
3685       if (insn)
3686         {
3687           for (i = ASM_OPERANDS_INPUT_LENGTH (x) - 1; i >= 0; i--)
3688             validate_change (insn, &ASM_OPERANDS_INPUT (x, i),
3689                              fold_rtx (ASM_OPERANDS_INPUT (x, i), insn), 0);
3690         }
3691       break;
3692
3693     default:
3694       break;
3695     }
3696
3697   const_arg0 = 0;
3698   const_arg1 = 0;
3699   const_arg2 = 0;
3700   mode_arg0 = VOIDmode;
3701
3702   /* Try folding our operands.
3703      Then see which ones have constant values known.  */
3704
3705   fmt = GET_RTX_FORMAT (code);
3706   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
3707     if (fmt[i] == 'e')
3708       {
3709         rtx arg = XEXP (x, i);
3710         rtx folded_arg = arg, const_arg = 0;
3711         enum machine_mode mode_arg = GET_MODE (arg);
3712         rtx cheap_arg, expensive_arg;
3713         rtx replacements[2];
3714         int j;
3715         int old_cost = COST_IN (XEXP (x, i), code);
3716
3717         /* Most arguments are cheap, so handle them specially.  */
3718         switch (GET_CODE (arg))
3719           {
3720           case REG:
3721             /* This is the same as calling equiv_constant; it is duplicated
3722                here for speed.  */
3723             if (REGNO_QTY_VALID_P (REGNO (arg)))
3724               {
3725                 int arg_q = REG_QTY (REGNO (arg));
3726                 struct qty_table_elem *arg_ent = &qty_table[arg_q];
3727
3728                 if (arg_ent->const_rtx != NULL_RTX
3729                     && !REG_P (arg_ent->const_rtx)
3730                     && GET_CODE (arg_ent->const_rtx) != PLUS)
3731                   const_arg
3732                     = gen_lowpart (GET_MODE (arg),
3733                                                arg_ent->const_rtx);
3734               }
3735             break;
3736
3737           case CONST:
3738           case CONST_INT:
3739           case SYMBOL_REF:
3740           case LABEL_REF:
3741           case CONST_DOUBLE:
3742           case CONST_VECTOR:
3743             const_arg = arg;
3744             break;
3745
3746 #ifdef HAVE_cc0
3747           case CC0:
3748             folded_arg = prev_insn_cc0;
3749             mode_arg = prev_insn_cc0_mode;
3750             const_arg = equiv_constant (folded_arg);
3751             break;
3752 #endif
3753
3754           default:
3755             folded_arg = fold_rtx (arg, insn);
3756             const_arg = equiv_constant (folded_arg);
3757           }
3758
3759         /* For the first three operands, see if the operand
3760            is constant or equivalent to a constant.  */
3761         switch (i)
3762           {
3763           case 0:
3764             folded_arg0 = folded_arg;
3765             const_arg0 = const_arg;
3766             mode_arg0 = mode_arg;
3767             break;
3768           case 1:
3769             folded_arg1 = folded_arg;
3770             const_arg1 = const_arg;
3771             break;
3772           case 2:
3773             const_arg2 = const_arg;
3774             break;
3775           }
3776
3777         /* Pick the least expensive of the folded argument and an
3778            equivalent constant argument.  */
3779         if (const_arg == 0 || const_arg == folded_arg
3780             || COST_IN (const_arg, code) > COST_IN (folded_arg, code))
3781           cheap_arg = folded_arg, expensive_arg = const_arg;
3782         else
3783           cheap_arg = const_arg, expensive_arg = folded_arg;
3784
3785         /* Try to replace the operand with the cheapest of the two
3786            possibilities.  If it doesn't work and this is either of the first
3787            two operands of a commutative operation, try swapping them.
3788            If THAT fails, try the more expensive, provided it is cheaper
3789            than what is already there.  */
3790
3791         if (cheap_arg == XEXP (x, i))
3792           continue;
3793
3794         if (insn == 0 && ! copied)
3795           {
3796             x = copy_rtx (x);
3797             copied = 1;
3798           }
3799
3800         /* Order the replacements from cheapest to most expensive.  */
3801         replacements[0] = cheap_arg;
3802         replacements[1] = expensive_arg;
3803
3804         for (j = 0; j < 2 && replacements[j]; j++)
3805           {
3806             int new_cost = COST_IN (replacements[j], code);
3807
3808             /* Stop if what existed before was cheaper.  Prefer constants
3809                in the case of a tie.  */
3810             if (new_cost > old_cost
3811                 || (new_cost == old_cost && CONSTANT_P (XEXP (x, i))))
3812               break;
3813
3814             /* It's not safe to substitute the operand of a conversion
3815                operator with a constant, as the conversion's identity
3816                depends upon the mode of its operand.  This optimization
3817                is handled by the call to simplify_unary_operation.  */
3818             if (GET_RTX_CLASS (code) == RTX_UNARY
3819                 && GET_MODE (replacements[j]) != mode_arg0
3820                 && (code == ZERO_EXTEND
3821                     || code == SIGN_EXTEND
3822                     || code == TRUNCATE
3823                     || code == FLOAT_TRUNCATE
3824                     || code == FLOAT_EXTEND
3825                     || code == FLOAT
3826                     || code == FIX
3827                     || code == UNSIGNED_FLOAT
3828                     || code == UNSIGNED_FIX))
3829               continue;
3830
3831             if (validate_change (insn, &XEXP (x, i), replacements[j], 0))
3832               break;
3833
3834             if (GET_RTX_CLASS (code) == RTX_COMM_COMPARE
3835                 || GET_RTX_CLASS (code) == RTX_COMM_ARITH)
3836               {
3837                 validate_change (insn, &XEXP (x, i), XEXP (x, 1 - i), 1);
3838                 validate_change (insn, &XEXP (x, 1 - i), replacements[j], 1);
3839
3840                 if (apply_change_group ())
3841                   {
3842                     /* Swap them back to be invalid so that this loop can
3843                        continue and flag them to be swapped back later.  */
3844                     rtx tem;
3845
3846                     tem = XEXP (x, 0); XEXP (x, 0) = XEXP (x, 1);
3847                                        XEXP (x, 1) = tem;
3848                     must_swap = 1;
3849                     break;
3850                   }
3851               }
3852           }
3853       }
3854
3855     else
3856       {
3857         if (fmt[i] == 'E')
3858           /* Don't try to fold inside of a vector of expressions.
3859              Doing nothing is harmless.  */
3860           {;}
3861       }
3862
3863   /* If a commutative operation, place a constant integer as the second
3864      operand unless the first operand is also a constant integer.  Otherwise,
3865      place any constant second unless the first operand is also a constant.  */
3866
3867   if (COMMUTATIVE_P (x))
3868     {
3869       if (must_swap
3870           || swap_commutative_operands_p (const_arg0 ? const_arg0
3871                                                      : XEXP (x, 0),
3872                                           const_arg1 ? const_arg1
3873                                                      : XEXP (x, 1)))
3874         {
3875           rtx tem = XEXP (x, 0);
3876
3877           if (insn == 0 && ! copied)
3878             {
3879               x = copy_rtx (x);
3880               copied = 1;
3881             }
3882
3883           validate_change (insn, &XEXP (x, 0), XEXP (x, 1), 1);
3884           validate_change (insn, &XEXP (x, 1), tem, 1);
3885           if (apply_change_group ())
3886             {
3887               tem = const_arg0, const_arg0 = const_arg1, const_arg1 = tem;
3888               tem = folded_arg0, folded_arg0 = folded_arg1, folded_arg1 = tem;
3889             }
3890         }
3891     }
3892
3893   /* If X is an arithmetic operation, see if we can simplify it.  */
3894
3895   switch (GET_RTX_CLASS (code))
3896     {
3897     case RTX_UNARY:
3898       {
3899         int is_const = 0;
3900
3901         /* We can't simplify extension ops unless we know the
3902            original mode.  */
3903         if ((code == ZERO_EXTEND || code == SIGN_EXTEND)
3904             && mode_arg0 == VOIDmode)
3905           break;
3906
3907         /* If we had a CONST, strip it off and put it back later if we
3908            fold.  */
3909         if (const_arg0 != 0 && GET_CODE (const_arg0) == CONST)
3910           is_const = 1, const_arg0 = XEXP (const_arg0, 0);
3911
3912         new = simplify_unary_operation (code, mode,
3913                                         const_arg0 ? const_arg0 : folded_arg0,
3914                                         mode_arg0);
3915         /* NEG of PLUS could be converted into MINUS, but that causes
3916            expressions of the form
3917            (CONST (MINUS (CONST_INT) (SYMBOL_REF)))
3918            which many ports mistakenly treat as LEGITIMATE_CONSTANT_P.
3919            FIXME: those ports should be fixed.  */
3920         if (new != 0 && is_const
3921             && GET_CODE (new) == PLUS
3922             && (GET_CODE (XEXP (new, 0)) == SYMBOL_REF
3923                 || GET_CODE (XEXP (new, 0)) == LABEL_REF)
3924             && GET_CODE (XEXP (new, 1)) == CONST_INT)
3925           new = gen_rtx_CONST (mode, new);
3926       }
3927       break;
3928
3929     case RTX_COMPARE:
3930     case RTX_COMM_COMPARE:
3931       /* See what items are actually being compared and set FOLDED_ARG[01]
3932          to those values and CODE to the actual comparison code.  If any are
3933          constant, set CONST_ARG0 and CONST_ARG1 appropriately.  We needn't
3934          do anything if both operands are already known to be constant.  */
3935
3936       /* ??? Vector mode comparisons are not supported yet.  */
3937       if (VECTOR_MODE_P (mode))
3938         break;
3939
3940       if (const_arg0 == 0 || const_arg1 == 0)
3941         {
3942           struct table_elt *p0, *p1;
3943           rtx true_rtx = const_true_rtx, false_rtx = const0_rtx;
3944           enum machine_mode mode_arg1;
3945
3946 #ifdef FLOAT_STORE_FLAG_VALUE
3947           if (GET_MODE_CLASS (mode) == MODE_FLOAT)
3948             {
3949               true_rtx = (CONST_DOUBLE_FROM_REAL_VALUE
3950                           (FLOAT_STORE_FLAG_VALUE (mode), mode));
3951               false_rtx = CONST0_RTX (mode);
3952             }
3953 #endif
3954
3955           code = find_comparison_args (code, &folded_arg0, &folded_arg1,
3956                                        &mode_arg0, &mode_arg1);
3957
3958           /* If the mode is VOIDmode or a MODE_CC mode, we don't know
3959              what kinds of things are being compared, so we can't do
3960              anything with this comparison.  */
3961
3962           if (mode_arg0 == VOIDmode || GET_MODE_CLASS (mode_arg0) == MODE_CC)
3963             break;
3964
3965           const_arg0 = equiv_constant (folded_arg0);
3966           const_arg1 = equiv_constant (folded_arg1);
3967
3968           /* If we do not now have two constants being compared, see
3969              if we can nevertheless deduce some things about the
3970              comparison.  */
3971           if (const_arg0 == 0 || const_arg1 == 0)
3972             {
3973               /* Some addresses are known to be nonzero.  We don't know
3974                  their sign, but equality comparisons are known.  */
3975               if (const_arg1 == const0_rtx
3976                   && nonzero_address_p (folded_arg0))
3977                 {
3978                   if (code == EQ)
3979                     return false_rtx;
3980                   else if (code == NE)
3981                     return true_rtx;
3982                 }
3983
3984               /* See if the two operands are the same.  */
3985
3986               if (folded_arg0 == folded_arg1
3987                   || (REG_P (folded_arg0)
3988                       && REG_P (folded_arg1)
3989                       && (REG_QTY (REGNO (folded_arg0))
3990                           == REG_QTY (REGNO (folded_arg1))))
3991                   || ((p0 = lookup (folded_arg0,
3992                                     SAFE_HASH (folded_arg0, mode_arg0),
3993                                     mode_arg0))
3994                       && (p1 = lookup (folded_arg1,
3995                                        SAFE_HASH (folded_arg1, mode_arg0),
3996                                        mode_arg0))
3997                       && p0->first_same_value == p1->first_same_value))
3998                 {
3999                   /* Sadly two equal NaNs are not equivalent.  */
4000                   if (!HONOR_NANS (mode_arg0))
4001                     return ((code == EQ || code == LE || code == GE
4002                              || code == LEU || code == GEU || code == UNEQ
4003                              || code == UNLE || code == UNGE
4004                              || code == ORDERED)
4005                             ? true_rtx : false_rtx);
4006                   /* Take care for the FP compares we can resolve.  */
4007                   if (code == UNEQ || code == UNLE || code == UNGE)
4008                     return true_rtx;
4009                   if (code == LTGT || code == LT || code == GT)
4010                     return false_rtx;
4011                 }
4012
4013               /* If FOLDED_ARG0 is a register, see if the comparison we are
4014                  doing now is either the same as we did before or the reverse
4015                  (we only check the reverse if not floating-point).  */
4016               else if (REG_P (folded_arg0))
4017                 {
4018                   int qty = REG_QTY (REGNO (folded_arg0));
4019
4020                   if (REGNO_QTY_VALID_P (REGNO (folded_arg0)))
4021                     {
4022                       struct qty_table_elem *ent = &qty_table[qty];
4023
4024                       if ((comparison_dominates_p (ent->comparison_code, code)
4025                            || (! FLOAT_MODE_P (mode_arg0)
4026                                && comparison_dominates_p (ent->comparison_code,
4027                                                           reverse_condition (code))))
4028                           && (rtx_equal_p (ent->comparison_const, folded_arg1)
4029                               || (const_arg1
4030                                   && rtx_equal_p (ent->comparison_const,
4031                                                   const_arg1))
4032                               || (REG_P (folded_arg1)
4033                                   && (REG_QTY (REGNO (folded_arg1)) == ent->comparison_qty))))
4034                         return (comparison_dominates_p (ent->comparison_code, code)
4035                                 ? true_rtx : false_rtx);
4036                     }
4037                 }
4038             }
4039         }
4040
4041       /* If we are comparing against zero, see if the first operand is
4042          equivalent to an IOR with a constant.  If so, we may be able to
4043          determine the result of this comparison.  */
4044
4045       if (const_arg1 == const0_rtx)
4046         {
4047           rtx y = lookup_as_function (folded_arg0, IOR);
4048           rtx inner_const;
4049
4050           if (y != 0
4051               && (inner_const = equiv_constant (XEXP (y, 1))) != 0
4052               && GET_CODE (inner_const) == CONST_INT
4053               && INTVAL (inner_const) != 0)
4054             {
4055               int sign_bitnum = GET_MODE_BITSIZE (mode_arg0) - 1;
4056               int has_sign = (HOST_BITS_PER_WIDE_INT >= sign_bitnum
4057                               && (INTVAL (inner_const)
4058                                   & ((HOST_WIDE_INT) 1 << sign_bitnum)));
4059               rtx true_rtx = const_true_rtx, false_rtx = const0_rtx;
4060
4061 #ifdef FLOAT_STORE_FLAG_VALUE
4062               if (GET_MODE_CLASS (mode) == MODE_FLOAT)
4063                 {
4064                   true_rtx = (CONST_DOUBLE_FROM_REAL_VALUE
4065                           (FLOAT_STORE_FLAG_VALUE (mode), mode));
4066                   false_rtx = CONST0_RTX (mode);
4067                 }
4068 #endif
4069
4070               switch (code)
4071                 {
4072                 case EQ:
4073                   return false_rtx;
4074                 case NE:
4075                   return true_rtx;
4076                 case LT:  case LE:
4077                   if (has_sign)
4078                     return true_rtx;
4079                   break;
4080                 case GT:  case GE:
4081                   if (has_sign)
4082                     return false_rtx;
4083                   break;
4084                 default:
4085                   break;
4086                 }
4087             }
4088         }
4089
4090       {
4091         rtx op0 = const_arg0 ? const_arg0 : folded_arg0;
4092         rtx op1 = const_arg1 ? const_arg1 : folded_arg1;
4093         new = simplify_relational_operation (code, mode, mode_arg0, op0, op1);
4094       }
4095       break;
4096
4097     case RTX_BIN_ARITH:
4098     case RTX_COMM_ARITH:
4099       switch (code)
4100         {
4101         case PLUS:
4102           /* If the second operand is a LABEL_REF, see if the first is a MINUS
4103              with that LABEL_REF as its second operand.  If so, the result is
4104              the first operand of that MINUS.  This handles switches with an
4105              ADDR_DIFF_VEC table.  */
4106           if (const_arg1 && GET_CODE (const_arg1) == LABEL_REF)
4107             {
4108               rtx y
4109                 = GET_CODE (folded_arg0) == MINUS ? folded_arg0
4110                 : lookup_as_function (folded_arg0, MINUS);
4111
4112               if (y != 0 && GET_CODE (XEXP (y, 1)) == LABEL_REF
4113                   && XEXP (XEXP (y, 1), 0) == XEXP (const_arg1, 0))
4114                 return XEXP (y, 0);
4115
4116               /* Now try for a CONST of a MINUS like the above.  */
4117               if ((y = (GET_CODE (folded_arg0) == CONST ? folded_arg0
4118                         : lookup_as_function (folded_arg0, CONST))) != 0
4119                   && GET_CODE (XEXP (y, 0)) == MINUS
4120                   && GET_CODE (XEXP (XEXP (y, 0), 1)) == LABEL_REF
4121                   && XEXP (XEXP (XEXP (y, 0), 1), 0) == XEXP (const_arg1, 0))
4122                 return XEXP (XEXP (y, 0), 0);
4123             }
4124
4125           /* Likewise if the operands are in the other order.  */
4126           if (const_arg0 && GET_CODE (const_arg0) == LABEL_REF)
4127             {
4128               rtx y
4129                 = GET_CODE (folded_arg1) == MINUS ? folded_arg1
4130                 : lookup_as_function (folded_arg1, MINUS);
4131
4132               if (y != 0 && GET_CODE (XEXP (y, 1)) == LABEL_REF
4133                   && XEXP (XEXP (y, 1), 0) == XEXP (const_arg0, 0))
4134                 return XEXP (y, 0);
4135
4136               /* Now try for a CONST of a MINUS like the above.  */
4137               if ((y = (GET_CODE (folded_arg1) == CONST ? folded_arg1
4138                         : lookup_as_function (folded_arg1, CONST))) != 0
4139                   && GET_CODE (XEXP (y, 0)) == MINUS
4140                   && GET_CODE (XEXP (XEXP (y, 0), 1)) == LABEL_REF
4141                   && XEXP (XEXP (XEXP (y, 0), 1), 0) == XEXP (const_arg0, 0))
4142                 return XEXP (XEXP (y, 0), 0);
4143             }
4144
4145           /* If second operand is a register equivalent to a negative
4146              CONST_INT, see if we can find a register equivalent to the
4147              positive constant.  Make a MINUS if so.  Don't do this for
4148              a non-negative constant since we might then alternate between
4149              choosing positive and negative constants.  Having the positive
4150              constant previously-used is the more common case.  Be sure
4151              the resulting constant is non-negative; if const_arg1 were
4152              the smallest negative number this would overflow: depending
4153              on the mode, this would either just be the same value (and
4154              hence not save anything) or be incorrect.  */
4155           if (const_arg1 != 0 && GET_CODE (const_arg1) == CONST_INT
4156               && INTVAL (const_arg1) < 0
4157               /* This used to test
4158
4159                  -INTVAL (const_arg1) >= 0
4160
4161                  But The Sun V5.0 compilers mis-compiled that test.  So
4162                  instead we test for the problematic value in a more direct
4163                  manner and hope the Sun compilers get it correct.  */
4164               && INTVAL (const_arg1) !=
4165                 ((HOST_WIDE_INT) 1 << (HOST_BITS_PER_WIDE_INT - 1))
4166               && REG_P (folded_arg1))
4167             {
4168               rtx new_const = GEN_INT (-INTVAL (const_arg1));
4169               struct table_elt *p
4170                 = lookup (new_const, SAFE_HASH (new_const, mode), mode);
4171
4172               if (p)
4173                 for (p = p->first_same_value; p; p = p->next_same_value)
4174                   if (REG_P (p->exp))
4175                     return simplify_gen_binary (MINUS, mode, folded_arg0,
4176                                                 canon_reg (p->exp, NULL_RTX));
4177             }
4178           goto from_plus;
4179
4180         case MINUS:
4181           /* If we have (MINUS Y C), see if Y is known to be (PLUS Z C2).
4182              If so, produce (PLUS Z C2-C).  */
4183           if (const_arg1 != 0 && GET_CODE (const_arg1) == CONST_INT)
4184             {
4185               rtx y = lookup_as_function (XEXP (x, 0), PLUS);
4186               if (y && GET_CODE (XEXP (y, 1)) == CONST_INT)
4187                 return fold_rtx (plus_constant (copy_rtx (y),
4188                                                 -INTVAL (const_arg1)),
4189                                  NULL_RTX);
4190             }
4191
4192           /* Fall through.  */
4193
4194         from_plus:
4195         case SMIN:    case SMAX:      case UMIN:    case UMAX:
4196         case IOR:     case AND:       case XOR:
4197         case MULT:
4198         case ASHIFT:  case LSHIFTRT:  case ASHIFTRT:
4199           /* If we have (<op> <reg> <const_int>) for an associative OP and REG
4200              is known to be of similar form, we may be able to replace the
4201              operation with a combined operation.  This may eliminate the
4202              intermediate operation if every use is simplified in this way.
4203              Note that the similar optimization done by combine.c only works
4204              if the intermediate operation's result has only one reference.  */
4205
4206           if (REG_P (folded_arg0)
4207               && const_arg1 && GET_CODE (const_arg1) == CONST_INT)
4208             {
4209               int is_shift
4210                 = (code == ASHIFT || code == ASHIFTRT || code == LSHIFTRT);
4211               rtx y = lookup_as_function (folded_arg0, code);
4212               rtx inner_const;
4213               enum rtx_code associate_code;
4214               rtx new_const;
4215
4216               if (y == 0
4217                   || 0 == (inner_const
4218                            = equiv_constant (fold_rtx (XEXP (y, 1), 0)))
4219                   || GET_CODE (inner_const) != CONST_INT
4220                   /* If we have compiled a statement like
4221                      "if (x == (x & mask1))", and now are looking at
4222                      "x & mask2", we will have a case where the first operand
4223                      of Y is the same as our first operand.  Unless we detect
4224                      this case, an infinite loop will result.  */
4225                   || XEXP (y, 0) == folded_arg0)
4226                 break;
4227
4228               /* Don't associate these operations if they are a PLUS with the
4229                  same constant and it is a power of two.  These might be doable
4230                  with a pre- or post-increment.  Similarly for two subtracts of
4231                  identical powers of two with post decrement.  */
4232
4233               if (code == PLUS && const_arg1 == inner_const
4234                   && ((HAVE_PRE_INCREMENT
4235                           && exact_log2 (INTVAL (const_arg1)) >= 0)
4236                       || (HAVE_POST_INCREMENT
4237                           && exact_log2 (INTVAL (const_arg1)) >= 0)
4238                       || (HAVE_PRE_DECREMENT
4239                           && exact_log2 (- INTVAL (const_arg1)) >= 0)
4240                       || (HAVE_POST_DECREMENT
4241                           && exact_log2 (- INTVAL (const_arg1)) >= 0)))
4242                 break;
4243
4244               /* Compute the code used to compose the constants.  For example,
4245                  A-C1-C2 is A-(C1 + C2), so if CODE == MINUS, we want PLUS.  */
4246
4247               associate_code = (is_shift || code == MINUS ? PLUS : code);
4248
4249               new_const = simplify_binary_operation (associate_code, mode,
4250                                                      const_arg1, inner_const);
4251
4252               if (new_const == 0)
4253                 break;
4254
4255               /* If we are associating shift operations, don't let this
4256                  produce a shift of the size of the object or larger.
4257                  This could occur when we follow a sign-extend by a right
4258                  shift on a machine that does a sign-extend as a pair
4259                  of shifts.  */
4260
4261               if (is_shift && GET_CODE (new_const) == CONST_INT
4262                   && INTVAL (new_const) >= GET_MODE_BITSIZE (mode))
4263                 {
4264                   /* As an exception, we can turn an ASHIFTRT of this
4265                      form into a shift of the number of bits - 1.  */
4266                   if (code == ASHIFTRT)
4267                     new_const = GEN_INT (GET_MODE_BITSIZE (mode) - 1);
4268                   else
4269                     break;
4270                 }
4271
4272               y = copy_rtx (XEXP (y, 0));
4273
4274               /* If Y contains our first operand (the most common way this
4275                  can happen is if Y is a MEM), we would do into an infinite
4276                  loop if we tried to fold it.  So don't in that case.  */
4277
4278               if (! reg_mentioned_p (folded_arg0, y))
4279                 y = fold_rtx (y, insn);
4280
4281               return simplify_gen_binary (code, mode, y, new_const);
4282             }
4283           break;
4284
4285         case DIV:       case UDIV:
4286           /* ??? The associative optimization performed immediately above is
4287              also possible for DIV and UDIV using associate_code of MULT.
4288              However, we would need extra code to verify that the
4289              multiplication does not overflow, that is, there is no overflow
4290              in the calculation of new_const.  */
4291           break;
4292
4293         default:
4294           break;
4295         }
4296
4297       new = simplify_binary_operation (code, mode,
4298                                        const_arg0 ? const_arg0 : folded_arg0,
4299                                        const_arg1 ? const_arg1 : folded_arg1);
4300       break;
4301
4302     case RTX_OBJ:
4303       /* (lo_sum (high X) X) is simply X.  */
4304       if (code == LO_SUM && const_arg0 != 0
4305           && GET_CODE (const_arg0) == HIGH
4306           && rtx_equal_p (XEXP (const_arg0, 0), const_arg1))
4307         return const_arg1;
4308       break;
4309
4310     case RTX_TERNARY:
4311     case RTX_BITFIELD_OPS:
4312       new = simplify_ternary_operation (code, mode, mode_arg0,
4313                                         const_arg0 ? const_arg0 : folded_arg0,
4314                                         const_arg1 ? const_arg1 : folded_arg1,
4315                                         const_arg2 ? const_arg2 : XEXP (x, 2));
4316       break;
4317
4318     default:
4319       break;
4320     }
4321
4322   return new ? new : x;
4323 }
4324 \f
4325 /* Return a constant value currently equivalent to X.
4326    Return 0 if we don't know one.  */
4327
4328 static rtx
4329 equiv_constant (rtx x)
4330 {
4331   if (REG_P (x)
4332       && REGNO_QTY_VALID_P (REGNO (x)))
4333     {
4334       int x_q = REG_QTY (REGNO (x));
4335       struct qty_table_elem *x_ent = &qty_table[x_q];
4336
4337       if (x_ent->const_rtx)
4338         x = gen_lowpart (GET_MODE (x), x_ent->const_rtx);
4339     }
4340
4341   if (x == 0 || CONSTANT_P (x))
4342     return x;
4343
4344   /* If X is a MEM, try to fold it outside the context of any insn to see if
4345      it might be equivalent to a constant.  That handles the case where it
4346      is a constant-pool reference.  Then try to look it up in the hash table
4347      in case it is something whose value we have seen before.  */
4348
4349   if (MEM_P (x))
4350     {
4351       struct table_elt *elt;
4352
4353       x = fold_rtx (x, NULL_RTX);
4354       if (CONSTANT_P (x))
4355         return x;
4356
4357       elt = lookup (x, SAFE_HASH (x, GET_MODE (x)), GET_MODE (x));
4358       if (elt == 0)
4359         return 0;
4360
4361       for (elt = elt->first_same_value; elt; elt = elt->next_same_value)
4362         if (elt->is_const && CONSTANT_P (elt->exp))
4363           return elt->exp;
4364     }
4365
4366   return 0;
4367 }
4368 \f
4369 /* Given INSN, a jump insn, PATH_TAKEN indicates if we are following the "taken"
4370    branch.  It will be zero if not.
4371
4372    In certain cases, this can cause us to add an equivalence.  For example,
4373    if we are following the taken case of
4374         if (i == 2)
4375    we can add the fact that `i' and '2' are now equivalent.
4376
4377    In any case, we can record that this comparison was passed.  If the same
4378    comparison is seen later, we will know its value.  */
4379
4380 static void
4381 record_jump_equiv (rtx insn, int taken)
4382 {
4383   int cond_known_true;
4384   rtx op0, op1;
4385   rtx set;
4386   enum machine_mode mode, mode0, mode1;
4387   int reversed_nonequality = 0;
4388   enum rtx_code code;
4389
4390   /* Ensure this is the right kind of insn.  */
4391   if (! any_condjump_p (insn))
4392     return;
4393   set = pc_set (insn);
4394
4395   /* See if this jump condition is known true or false.  */
4396   if (taken)
4397     cond_known_true = (XEXP (SET_SRC (set), 2) == pc_rtx);
4398   else
4399     cond_known_true = (XEXP (SET_SRC (set), 1) == pc_rtx);
4400
4401   /* Get the type of comparison being done and the operands being compared.
4402      If we had to reverse a non-equality condition, record that fact so we
4403      know that it isn't valid for floating-point.  */
4404   code = GET_CODE (XEXP (SET_SRC (set), 0));
4405   op0 = fold_rtx (XEXP (XEXP (SET_SRC (set), 0), 0), insn);
4406   op1 = fold_rtx (XEXP (XEXP (SET_SRC (set), 0), 1), insn);
4407
4408   code = find_comparison_args (code, &op0, &op1, &mode0, &mode1);
4409   if (! cond_known_true)
4410     {
4411       code = reversed_comparison_code_parts (code, op0, op1, insn);
4412
4413       /* Don't remember if we can't find the inverse.  */
4414       if (code == UNKNOWN)
4415         return;
4416     }
4417
4418   /* The mode is the mode of the non-constant.  */
4419   mode = mode0;
4420   if (mode1 != VOIDmode)
4421     mode = mode1;
4422
4423   record_jump_cond (code, mode, op0, op1, reversed_nonequality);
4424 }
4425
4426 /* Yet another form of subreg creation.  In this case, we want something in
4427    MODE, and we should assume OP has MODE iff it is naturally modeless.  */
4428
4429 static rtx
4430 record_jump_cond_subreg (enum machine_mode mode, rtx op)
4431 {
4432   enum machine_mode op_mode = GET_MODE (op);
4433   if (op_mode == mode || op_mode == VOIDmode)
4434     return op;
4435   return lowpart_subreg (mode, op, op_mode);
4436 }
4437
4438 /* We know that comparison CODE applied to OP0 and OP1 in MODE is true.
4439    REVERSED_NONEQUALITY is nonzero if CODE had to be swapped.
4440    Make any useful entries we can with that information.  Called from
4441    above function and called recursively.  */
4442
4443 static void
4444 record_jump_cond (enum rtx_code code, enum machine_mode mode, rtx op0,
4445                   rtx op1, int reversed_nonequality)
4446 {
4447   unsigned op0_hash, op1_hash;
4448   int op0_in_memory, op1_in_memory;
4449   struct table_elt *op0_elt, *op1_elt;
4450
4451   /* If OP0 and OP1 are known equal, and either is a paradoxical SUBREG,
4452      we know that they are also equal in the smaller mode (this is also
4453      true for all smaller modes whether or not there is a SUBREG, but
4454      is not worth testing for with no SUBREG).  */
4455
4456   /* Note that GET_MODE (op0) may not equal MODE.  */
4457   if (code == EQ && GET_CODE (op0) == SUBREG
4458       && (GET_MODE_SIZE (GET_MODE (op0))
4459           > GET_MODE_SIZE (GET_MODE (SUBREG_REG (op0)))))
4460     {
4461       enum machine_mode inner_mode = GET_MODE (SUBREG_REG (op0));
4462       rtx tem = record_jump_cond_subreg (inner_mode, op1);
4463       if (tem)
4464         record_jump_cond (code, mode, SUBREG_REG (op0), tem,
4465                           reversed_nonequality);
4466     }
4467
4468   if (code == EQ && GET_CODE (op1) == SUBREG
4469       && (GET_MODE_SIZE (GET_MODE (op1))
4470           > GET_MODE_SIZE (GET_MODE (SUBREG_REG (op1)))))
4471     {
4472       enum machine_mode inner_mode = GET_MODE (SUBREG_REG (op1));
4473       rtx tem = record_jump_cond_subreg (inner_mode, op0);
4474       if (tem)
4475         record_jump_cond (code, mode, SUBREG_REG (op1), tem,
4476                           reversed_nonequality);
4477     }
4478
4479   /* Similarly, if this is an NE comparison, and either is a SUBREG
4480      making a smaller mode, we know the whole thing is also NE.  */
4481
4482   /* Note that GET_MODE (op0) may not equal MODE;
4483      if we test MODE instead, we can get an infinite recursion
4484      alternating between two modes each wider than MODE.  */
4485
4486   if (code == NE && GET_CODE (op0) == SUBREG
4487       && subreg_lowpart_p (op0)
4488       && (GET_MODE_SIZE (GET_MODE (op0))
4489           < GET_MODE_SIZE (GET_MODE (SUBREG_REG (op0)))))
4490     {
4491       enum machine_mode inner_mode = GET_MODE (SUBREG_REG (op0));
4492       rtx tem = record_jump_cond_subreg (inner_mode, op1);
4493       if (tem)
4494         record_jump_cond (code, mode, SUBREG_REG (op0), tem,
4495                           reversed_nonequality);
4496     }
4497
4498   if (code == NE && GET_CODE (op1) == SUBREG
4499       && subreg_lowpart_p (op1)
4500       && (GET_MODE_SIZE (GET_MODE (op1))
4501           < GET_MODE_SIZE (GET_MODE (SUBREG_REG (op1)))))
4502     {
4503       enum machine_mode inner_mode = GET_MODE (SUBREG_REG (op1));
4504       rtx tem = record_jump_cond_subreg (inner_mode, op0);
4505       if (tem)
4506         record_jump_cond (code, mode, SUBREG_REG (op1), tem,
4507                           reversed_nonequality);
4508     }
4509
4510   /* Hash both operands.  */
4511
4512   do_not_record = 0;
4513   hash_arg_in_memory = 0;
4514   op0_hash = HASH (op0, mode);
4515   op0_in_memory = hash_arg_in_memory;
4516
4517   if (do_not_record)
4518     return;
4519
4520   do_not_record = 0;
4521   hash_arg_in_memory = 0;
4522   op1_hash = HASH (op1, mode);
4523   op1_in_memory = hash_arg_in_memory;
4524
4525   if (do_not_record)
4526     return;
4527
4528   /* Look up both operands.  */
4529   op0_elt = lookup (op0, op0_hash, mode);
4530   op1_elt = lookup (op1, op1_hash, mode);
4531
4532   /* If both operands are already equivalent or if they are not in the
4533      table but are identical, do nothing.  */
4534   if ((op0_elt != 0 && op1_elt != 0
4535        && op0_elt->first_same_value == op1_elt->first_same_value)
4536       || op0 == op1 || rtx_equal_p (op0, op1))
4537     return;
4538
4539   /* If we aren't setting two things equal all we can do is save this
4540      comparison.   Similarly if this is floating-point.  In the latter
4541      case, OP1 might be zero and both -0.0 and 0.0 are equal to it.
4542      If we record the equality, we might inadvertently delete code
4543      whose intent was to change -0 to +0.  */
4544
4545   if (code != EQ || FLOAT_MODE_P (GET_MODE (op0)))
4546     {
4547       struct qty_table_elem *ent;
4548       int qty;
4549
4550       /* If we reversed a floating-point comparison, if OP0 is not a
4551          register, or if OP1 is neither a register or constant, we can't
4552          do anything.  */
4553
4554       if (!REG_P (op1))
4555         op1 = equiv_constant (op1);
4556
4557       if ((reversed_nonequality && FLOAT_MODE_P (mode))
4558           || !REG_P (op0) || op1 == 0)
4559         return;
4560
4561       /* Put OP0 in the hash table if it isn't already.  This gives it a
4562          new quantity number.  */
4563       if (op0_elt == 0)
4564         {
4565           if (insert_regs (op0, NULL, 0))
4566             {
4567               rehash_using_reg (op0);
4568               op0_hash = HASH (op0, mode);
4569
4570               /* If OP0 is contained in OP1, this changes its hash code
4571                  as well.  Faster to rehash than to check, except
4572                  for the simple case of a constant.  */
4573               if (! CONSTANT_P (op1))
4574                 op1_hash = HASH (op1,mode);
4575             }
4576
4577           op0_elt = insert (op0, NULL, op0_hash, mode);
4578           op0_elt->in_memory = op0_in_memory;
4579         }
4580
4581       qty = REG_QTY (REGNO (op0));
4582       ent = &qty_table[qty];
4583
4584       ent->comparison_code = code;
4585       if (REG_P (op1))
4586         {
4587           /* Look it up again--in case op0 and op1 are the same.  */
4588           op1_elt = lookup (op1, op1_hash, mode);
4589
4590           /* Put OP1 in the hash table so it gets a new quantity number.  */
4591           if (op1_elt == 0)
4592             {
4593               if (insert_regs (op1, NULL, 0))
4594                 {
4595                   rehash_using_reg (op1);
4596                   op1_hash = HASH (op1, mode);
4597                 }
4598
4599               op1_elt = insert (op1, NULL, op1_hash, mode);
4600               op1_elt->in_memory = op1_in_memory;
4601             }
4602
4603           ent->comparison_const = NULL_RTX;
4604           ent->comparison_qty = REG_QTY (REGNO (op1));
4605         }
4606       else
4607         {
4608           ent->comparison_const = op1;
4609           ent->comparison_qty = -1;
4610         }
4611
4612       return;
4613     }
4614
4615   /* If either side is still missing an equivalence, make it now,
4616      then merge the equivalences.  */
4617
4618   if (op0_elt == 0)
4619     {
4620       if (insert_regs (op0, NULL, 0))
4621         {
4622           rehash_using_reg (op0);
4623           op0_hash = HASH (op0, mode);
4624         }
4625
4626       op0_elt = insert (op0, NULL, op0_hash, mode);
4627       op0_elt->in_memory = op0_in_memory;
4628     }
4629
4630   if (op1_elt == 0)
4631     {
4632       if (insert_regs (op1, NULL, 0))
4633         {
4634           rehash_using_reg (op1);
4635           op1_hash = HASH (op1, mode);
4636         }
4637
4638       op1_elt = insert (op1, NULL, op1_hash, mode);
4639       op1_elt->in_memory = op1_in_memory;
4640     }
4641
4642   merge_equiv_classes (op0_elt, op1_elt);
4643 }
4644 \f
4645 /* CSE processing for one instruction.
4646    First simplify sources and addresses of all assignments
4647    in the instruction, using previously-computed equivalents values.
4648    Then install the new sources and destinations in the table
4649    of available values.
4650
4651    If LIBCALL_INSN is nonzero, don't record any equivalence made in
4652    the insn.  It means that INSN is inside libcall block.  In this
4653    case LIBCALL_INSN is the corresponding insn with REG_LIBCALL.  */
4654
4655 /* Data on one SET contained in the instruction.  */
4656
4657 struct set
4658 {
4659   /* The SET rtx itself.  */
4660   rtx rtl;
4661   /* The SET_SRC of the rtx (the original value, if it is changing).  */
4662   rtx src;
4663   /* The hash-table element for the SET_SRC of the SET.  */
4664   struct table_elt *src_elt;
4665   /* Hash value for the SET_SRC.  */
4666   unsigned src_hash;
4667   /* Hash value for the SET_DEST.  */
4668   unsigned dest_hash;
4669   /* The SET_DEST, with SUBREG, etc., stripped.  */
4670   rtx inner_dest;
4671   /* Nonzero if the SET_SRC is in memory.  */
4672   char src_in_memory;
4673   /* Nonzero if the SET_SRC contains something
4674      whose value cannot be predicted and understood.  */
4675   char src_volatile;
4676   /* Original machine mode, in case it becomes a CONST_INT.
4677      The size of this field should match the size of the mode
4678      field of struct rtx_def (see rtl.h).  */
4679   ENUM_BITFIELD(machine_mode) mode : 8;
4680   /* A constant equivalent for SET_SRC, if any.  */
4681   rtx src_const;
4682   /* Original SET_SRC value used for libcall notes.  */
4683   rtx orig_src;
4684   /* Hash value of constant equivalent for SET_SRC.  */
4685   unsigned src_const_hash;
4686   /* Table entry for constant equivalent for SET_SRC, if any.  */
4687   struct table_elt *src_const_elt;
4688 };
4689
4690 static void
4691 cse_insn (rtx insn, rtx libcall_insn)
4692 {
4693   rtx x = PATTERN (insn);
4694   int i;
4695   rtx tem;
4696   int n_sets = 0;
4697
4698 #ifdef HAVE_cc0
4699   /* Records what this insn does to set CC0.  */
4700   rtx this_insn_cc0 = 0;
4701   enum machine_mode this_insn_cc0_mode = VOIDmode;
4702 #endif
4703
4704   rtx src_eqv = 0;
4705   struct table_elt *src_eqv_elt = 0;
4706   int src_eqv_volatile = 0;
4707   int src_eqv_in_memory = 0;
4708   unsigned src_eqv_hash = 0;
4709
4710   struct set *sets = (struct set *) 0;
4711
4712   this_insn = insn;
4713
4714   /* Find all the SETs and CLOBBERs in this instruction.
4715      Record all the SETs in the array `set' and count them.
4716      Also determine whether there is a CLOBBER that invalidates
4717      all memory references, or all references at varying addresses.  */
4718
4719   if (CALL_P (insn))
4720     {
4721       for (tem = CALL_INSN_FUNCTION_USAGE (insn); tem; tem = XEXP (tem, 1))
4722         {
4723           if (GET_CODE (XEXP (tem, 0)) == CLOBBER)
4724             invalidate (SET_DEST (XEXP (tem, 0)), VOIDmode);
4725           XEXP (tem, 0) = canon_reg (XEXP (tem, 0), insn);
4726         }
4727     }
4728
4729   if (GET_CODE (x) == SET)
4730     {
4731       sets = alloca (sizeof (struct set));
4732       sets[0].rtl = x;
4733
4734       /* Ignore SETs that are unconditional jumps.
4735          They never need cse processing, so this does not hurt.
4736          The reason is not efficiency but rather
4737          so that we can test at the end for instructions
4738          that have been simplified to unconditional jumps
4739          and not be misled by unchanged instructions
4740          that were unconditional jumps to begin with.  */
4741       if (SET_DEST (x) == pc_rtx
4742           && GET_CODE (SET_SRC (x)) == LABEL_REF)
4743         ;
4744
4745       /* Don't count call-insns, (set (reg 0) (call ...)), as a set.
4746          The hard function value register is used only once, to copy to
4747          someplace else, so it isn't worth cse'ing (and on 80386 is unsafe)!
4748          Ensure we invalidate the destination register.  On the 80386 no
4749          other code would invalidate it since it is a fixed_reg.
4750          We need not check the return of apply_change_group; see canon_reg.  */
4751
4752       else if (GET_CODE (SET_SRC (x)) == CALL)
4753         {
4754           canon_reg (SET_SRC (x), insn);
4755           apply_change_group ();
4756           fold_rtx (SET_SRC (x), insn);
4757           invalidate (SET_DEST (x), VOIDmode);
4758         }
4759       else
4760         n_sets = 1;
4761     }
4762   else if (GET_CODE (x) == PARALLEL)
4763     {
4764       int lim = XVECLEN (x, 0);
4765
4766       sets = alloca (lim * sizeof (struct set));
4767
4768       /* Find all regs explicitly clobbered in this insn,
4769          and ensure they are not replaced with any other regs
4770          elsewhere in this insn.
4771          When a reg that is clobbered is also used for input,
4772          we should presume that that is for a reason,
4773          and we should not substitute some other register
4774          which is not supposed to be clobbered.
4775          Therefore, this loop cannot be merged into the one below
4776          because a CALL may precede a CLOBBER and refer to the
4777          value clobbered.  We must not let a canonicalization do
4778          anything in that case.  */
4779       for (i = 0; i < lim; i++)
4780         {
4781           rtx y = XVECEXP (x, 0, i);
4782           if (GET_CODE (y) == CLOBBER)
4783             {
4784               rtx clobbered = XEXP (y, 0);
4785
4786               if (REG_P (clobbered)
4787                   || GET_CODE (clobbered) == SUBREG)
4788                 invalidate (clobbered, VOIDmode);
4789               else if (GET_CODE (clobbered) == STRICT_LOW_PART
4790                        || GET_CODE (clobbered) == ZERO_EXTRACT)
4791                 invalidate (XEXP (clobbered, 0), GET_MODE (clobbered));
4792             }
4793         }
4794
4795       for (i = 0; i < lim; i++)
4796         {
4797           rtx y = XVECEXP (x, 0, i);
4798           if (GET_CODE (y) == SET)
4799             {
4800               /* As above, we ignore unconditional jumps and call-insns and
4801                  ignore the result of apply_change_group.  */
4802               if (GET_CODE (SET_SRC (y)) == CALL)
4803                 {
4804                   canon_reg (SET_SRC (y), insn);
4805                   apply_change_group ();
4806                   fold_rtx (SET_SRC (y), insn);
4807                   invalidate (SET_DEST (y), VOIDmode);
4808                 }
4809               else if (SET_DEST (y) == pc_rtx
4810                        && GET_CODE (SET_SRC (y)) == LABEL_REF)
4811                 ;
4812               else
4813                 sets[n_sets++].rtl = y;
4814             }
4815           else if (GET_CODE (y) == CLOBBER)
4816             {
4817               /* If we clobber memory, canon the address.
4818                  This does nothing when a register is clobbered
4819                  because we have already invalidated the reg.  */
4820               if (MEM_P (XEXP (y, 0)))
4821                 canon_reg (XEXP (y, 0), NULL_RTX);
4822             }
4823           else if (GET_CODE (y) == USE
4824                    && ! (REG_P (XEXP (y, 0))
4825                          && REGNO (XEXP (y, 0)) < FIRST_PSEUDO_REGISTER))
4826             canon_reg (y, NULL_RTX);
4827           else if (GET_CODE (y) == CALL)
4828             {
4829               /* The result of apply_change_group can be ignored; see
4830                  canon_reg.  */
4831               canon_reg (y, insn);
4832               apply_change_group ();
4833               fold_rtx (y, insn);
4834             }
4835         }
4836     }
4837   else if (GET_CODE (x) == CLOBBER)
4838     {
4839       if (MEM_P (XEXP (x, 0)))
4840         canon_reg (XEXP (x, 0), NULL_RTX);
4841     }
4842
4843   /* Canonicalize a USE of a pseudo register or memory location.  */
4844   else if (GET_CODE (x) == USE
4845            && ! (REG_P (XEXP (x, 0))
4846                  && REGNO (XEXP (x, 0)) < FIRST_PSEUDO_REGISTER))
4847     canon_reg (XEXP (x, 0), NULL_RTX);
4848   else if (GET_CODE (x) == CALL)
4849     {
4850       /* The result of apply_change_group can be ignored; see canon_reg.  */
4851       canon_reg (x, insn);
4852       apply_change_group ();
4853       fold_rtx (x, insn);
4854     }
4855
4856   /* Store the equivalent value in SRC_EQV, if different, or if the DEST
4857      is a STRICT_LOW_PART.  The latter condition is necessary because SRC_EQV
4858      is handled specially for this case, and if it isn't set, then there will
4859      be no equivalence for the destination.  */
4860   if (n_sets == 1 && REG_NOTES (insn) != 0
4861       && (tem = find_reg_note (insn, REG_EQUAL, NULL_RTX)) != 0
4862       && (! rtx_equal_p (XEXP (tem, 0), SET_SRC (sets[0].rtl))
4863           || GET_CODE (SET_DEST (sets[0].rtl)) == STRICT_LOW_PART))
4864     {
4865       src_eqv = fold_rtx (canon_reg (XEXP (tem, 0), NULL_RTX), insn);
4866       XEXP (tem, 0) = src_eqv;
4867     }
4868
4869   /* Canonicalize sources and addresses of destinations.
4870      We do this in a separate pass to avoid problems when a MATCH_DUP is
4871      present in the insn pattern.  In that case, we want to ensure that
4872      we don't break the duplicate nature of the pattern.  So we will replace
4873      both operands at the same time.  Otherwise, we would fail to find an
4874      equivalent substitution in the loop calling validate_change below.
4875
4876      We used to suppress canonicalization of DEST if it appears in SRC,
4877      but we don't do this any more.  */
4878
4879   for (i = 0; i < n_sets; i++)
4880     {
4881       rtx dest = SET_DEST (sets[i].rtl);
4882       rtx src = SET_SRC (sets[i].rtl);
4883       rtx new = canon_reg (src, insn);
4884       int insn_code;
4885
4886       sets[i].orig_src = src;
4887       if ((REG_P (new) && REG_P (src)
4888            && ((REGNO (new) < FIRST_PSEUDO_REGISTER)
4889                != (REGNO (src) < FIRST_PSEUDO_REGISTER)))
4890           || (insn_code = recog_memoized (insn)) < 0
4891           || insn_data[insn_code].n_dups > 0)
4892         validate_change (insn, &SET_SRC (sets[i].rtl), new, 1);
4893       else
4894         SET_SRC (sets[i].rtl) = new;
4895
4896       if (GET_CODE (dest) == ZERO_EXTRACT)
4897         {
4898           validate_change (insn, &XEXP (dest, 1),
4899                            canon_reg (XEXP (dest, 1), insn), 1);
4900           validate_change (insn, &XEXP (dest, 2),
4901                            canon_reg (XEXP (dest, 2), insn), 1);
4902         }
4903
4904       while (GET_CODE (dest) == SUBREG
4905              || GET_CODE (dest) == ZERO_EXTRACT
4906              || GET_CODE (dest) == STRICT_LOW_PART)
4907         dest = XEXP (dest, 0);
4908
4909       if (MEM_P (dest))
4910         canon_reg (dest, insn);
4911     }
4912
4913   /* Now that we have done all the replacements, we can apply the change
4914      group and see if they all work.  Note that this will cause some
4915      canonicalizations that would have worked individually not to be applied
4916      because some other canonicalization didn't work, but this should not
4917      occur often.
4918
4919      The result of apply_change_group can be ignored; see canon_reg.  */
4920
4921   apply_change_group ();
4922
4923   /* Set sets[i].src_elt to the class each source belongs to.
4924      Detect assignments from or to volatile things
4925      and set set[i] to zero so they will be ignored
4926      in the rest of this function.
4927
4928      Nothing in this loop changes the hash table or the register chains.  */
4929
4930   for (i = 0; i < n_sets; i++)
4931     {
4932       rtx src, dest;
4933       rtx src_folded;
4934       struct table_elt *elt = 0, *p;
4935       enum machine_mode mode;
4936       rtx src_eqv_here;
4937       rtx src_const = 0;
4938       rtx src_related = 0;
4939       struct table_elt *src_const_elt = 0;
4940       int src_cost = MAX_COST;
4941       int src_eqv_cost = MAX_COST;
4942       int src_folded_cost = MAX_COST;
4943       int src_related_cost = MAX_COST;
4944       int src_elt_cost = MAX_COST;
4945       int src_regcost = MAX_COST;
4946       int src_eqv_regcost = MAX_COST;
4947       int src_folded_regcost = MAX_COST;
4948       int src_related_regcost = MAX_COST;
4949       int src_elt_regcost = MAX_COST;
4950       /* Set nonzero if we need to call force_const_mem on with the
4951          contents of src_folded before using it.  */
4952       int src_folded_force_flag = 0;
4953
4954       dest = SET_DEST (sets[i].rtl);
4955       src = SET_SRC (sets[i].rtl);
4956
4957       /* If SRC is a constant that has no machine mode,
4958          hash it with the destination's machine mode.
4959          This way we can keep different modes separate.  */
4960
4961       mode = GET_MODE (src) == VOIDmode ? GET_MODE (dest) : GET_MODE (src);
4962       sets[i].mode = mode;
4963
4964       if (src_eqv)
4965         {
4966           enum machine_mode eqvmode = mode;
4967           if (GET_CODE (dest) == STRICT_LOW_PART)
4968             eqvmode = GET_MODE (SUBREG_REG (XEXP (dest, 0)));
4969           do_not_record = 0;
4970           hash_arg_in_memory = 0;
4971           src_eqv_hash = HASH (src_eqv, eqvmode);
4972
4973           /* Find the equivalence class for the equivalent expression.  */
4974
4975           if (!do_not_record)
4976             src_eqv_elt = lookup (src_eqv, src_eqv_hash, eqvmode);
4977
4978           src_eqv_volatile = do_not_record;
4979           src_eqv_in_memory = hash_arg_in_memory;
4980         }
4981
4982       /* If this is a STRICT_LOW_PART assignment, src_eqv corresponds to the
4983          value of the INNER register, not the destination.  So it is not
4984          a valid substitution for the source.  But save it for later.  */
4985       if (GET_CODE (dest) == STRICT_LOW_PART)
4986         src_eqv_here = 0;
4987       else
4988         src_eqv_here = src_eqv;
4989
4990       /* Simplify and foldable subexpressions in SRC.  Then get the fully-
4991          simplified result, which may not necessarily be valid.  */
4992       src_folded = fold_rtx (src, insn);
4993
4994 #if 0
4995       /* ??? This caused bad code to be generated for the m68k port with -O2.
4996          Suppose src is (CONST_INT -1), and that after truncation src_folded
4997          is (CONST_INT 3).  Suppose src_folded is then used for src_const.
4998          At the end we will add src and src_const to the same equivalence
4999          class.  We now have 3 and -1 on the same equivalence class.  This
5000          causes later instructions to be mis-optimized.  */
5001       /* If storing a constant in a bitfield, pre-truncate the constant
5002          so we will be able to record it later.  */
5003       if (GET_CODE (SET_DEST (sets[i].rtl)) == ZERO_EXTRACT)
5004         {
5005           rtx width = XEXP (SET_DEST (sets[i].rtl), 1);
5006
5007           if (GET_CODE (src) == CONST_INT
5008               && GET_CODE (width) == CONST_INT
5009               && INTVAL (width) < HOST_BITS_PER_WIDE_INT
5010               && (INTVAL (src) & ((HOST_WIDE_INT) (-1) << INTVAL (width))))
5011             src_folded
5012               = GEN_INT (INTVAL (src) & (((HOST_WIDE_INT) 1
5013                                           << INTVAL (width)) - 1));
5014         }
5015 #endif
5016
5017       /* Compute SRC's hash code, and also notice if it
5018          should not be recorded at all.  In that case,
5019          prevent any further processing of this assignment.  */
5020       do_not_record = 0;
5021       hash_arg_in_memory = 0;
5022
5023       sets[i].src = src;
5024       sets[i].src_hash = HASH (src, mode);
5025       sets[i].src_volatile = do_not_record;
5026       sets[i].src_in_memory = hash_arg_in_memory;
5027
5028       /* If SRC is a MEM, there is a REG_EQUIV note for SRC, and DEST is
5029          a pseudo, do not record SRC.  Using SRC as a replacement for
5030          anything else will be incorrect in that situation.  Note that
5031          this usually occurs only for stack slots, in which case all the
5032          RTL would be referring to SRC, so we don't lose any optimization
5033          opportunities by not having SRC in the hash table.  */
5034
5035       if (MEM_P (src)
5036           && find_reg_note (insn, REG_EQUIV, NULL_RTX) != 0
5037           && REG_P (dest)
5038           && REGNO (dest) >= FIRST_PSEUDO_REGISTER)
5039         sets[i].src_volatile = 1;
5040
5041 #if 0
5042       /* It is no longer clear why we used to do this, but it doesn't
5043          appear to still be needed.  So let's try without it since this
5044          code hurts cse'ing widened ops.  */
5045       /* If source is a paradoxical subreg (such as QI treated as an SI),
5046          treat it as volatile.  It may do the work of an SI in one context
5047          where the extra bits are not being used, but cannot replace an SI
5048          in general.  */
5049       if (GET_CODE (src) == SUBREG
5050           && (GET_MODE_SIZE (GET_MODE (src))
5051               > GET_MODE_SIZE (GET_MODE (SUBREG_REG (src)))))
5052         sets[i].src_volatile = 1;
5053 #endif
5054
5055       /* Locate all possible equivalent forms for SRC.  Try to replace
5056          SRC in the insn with each cheaper equivalent.
5057
5058          We have the following types of equivalents: SRC itself, a folded
5059          version, a value given in a REG_EQUAL note, or a value related
5060          to a constant.
5061
5062          Each of these equivalents may be part of an additional class
5063          of equivalents (if more than one is in the table, they must be in
5064          the same class; we check for this).
5065
5066          If the source is volatile, we don't do any table lookups.
5067
5068          We note any constant equivalent for possible later use in a
5069          REG_NOTE.  */
5070
5071       if (!sets[i].src_volatile)
5072         elt = lookup (src, sets[i].src_hash, mode);
5073
5074       sets[i].src_elt = elt;
5075
5076       if (elt && src_eqv_here && src_eqv_elt)
5077         {
5078           if (elt->first_same_value != src_eqv_elt->first_same_value)
5079             {
5080               /* The REG_EQUAL is indicating that two formerly distinct
5081                  classes are now equivalent.  So merge them.  */
5082               merge_equiv_classes (elt, src_eqv_elt);
5083               src_eqv_hash = HASH (src_eqv, elt->mode);
5084               src_eqv_elt = lookup (src_eqv, src_eqv_hash, elt->mode);
5085             }
5086
5087           src_eqv_here = 0;
5088         }
5089
5090       else if (src_eqv_elt)
5091         elt = src_eqv_elt;
5092
5093       /* Try to find a constant somewhere and record it in `src_const'.
5094          Record its table element, if any, in `src_const_elt'.  Look in
5095          any known equivalences first.  (If the constant is not in the
5096          table, also set `sets[i].src_const_hash').  */
5097       if (elt)
5098         for (p = elt->first_same_value; p; p = p->next_same_value)
5099           if (p->is_const)
5100             {
5101               src_const = p->exp;
5102               src_const_elt = elt;
5103               break;
5104             }
5105
5106       if (src_const == 0
5107           && (CONSTANT_P (src_folded)
5108               /* Consider (minus (label_ref L1) (label_ref L2)) as
5109                  "constant" here so we will record it. This allows us
5110                  to fold switch statements when an ADDR_DIFF_VEC is used.  */
5111               || (GET_CODE (src_folded) == MINUS
5112                   && GET_CODE (XEXP (src_folded, 0)) == LABEL_REF
5113                   && GET_CODE (XEXP (src_folded, 1)) == LABEL_REF)))
5114         src_const = src_folded, src_const_elt = elt;
5115       else if (src_const == 0 && src_eqv_here && CONSTANT_P (src_eqv_here))
5116         src_const = src_eqv_here, src_const_elt = src_eqv_elt;
5117
5118       /* If we don't know if the constant is in the table, get its
5119          hash code and look it up.  */
5120       if (src_const && src_const_elt == 0)
5121         {
5122           sets[i].src_const_hash = HASH (src_const, mode);
5123           src_const_elt = lookup (src_const, sets[i].src_const_hash, mode);
5124         }
5125
5126       sets[i].src_const = src_const;
5127       sets[i].src_const_elt = src_const_elt;
5128
5129       /* If the constant and our source are both in the table, mark them as
5130          equivalent.  Otherwise, if a constant is in the table but the source
5131          isn't, set ELT to it.  */
5132       if (src_const_elt && elt
5133           && src_const_elt->first_same_value != elt->first_same_value)
5134         merge_equiv_classes (elt, src_const_elt);
5135       else if (src_const_elt && elt == 0)
5136         elt = src_const_elt;
5137
5138       /* See if there is a register linearly related to a constant
5139          equivalent of SRC.  */
5140       if (src_const
5141           && (GET_CODE (src_const) == CONST
5142               || (src_const_elt && src_const_elt->related_value != 0)))
5143         {
5144           src_related = use_related_value (src_const, src_const_elt);
5145           if (src_related)
5146             {
5147               struct table_elt *src_related_elt
5148                 = lookup (src_related, HASH (src_related, mode), mode);
5149               if (src_related_elt && elt)
5150                 {
5151                   if (elt->first_same_value
5152                       != src_related_elt->first_same_value)
5153                     /* This can occur when we previously saw a CONST
5154                        involving a SYMBOL_REF and then see the SYMBOL_REF
5155                        twice.  Merge the involved classes.  */
5156                     merge_equiv_classes (elt, src_related_elt);
5157
5158                   src_related = 0;
5159                   src_related_elt = 0;
5160                 }
5161               else if (src_related_elt && elt == 0)
5162                 elt = src_related_elt;
5163             }
5164         }
5165
5166       /* See if we have a CONST_INT that is already in a register in a
5167          wider mode.  */
5168
5169       if (src_const && src_related == 0 && GET_CODE (src_const) == CONST_INT
5170           && GET_MODE_CLASS (mode) == MODE_INT
5171           && GET_MODE_BITSIZE (mode) < BITS_PER_WORD)
5172         {
5173           enum machine_mode wider_mode;
5174
5175           for (wider_mode = GET_MODE_WIDER_MODE (mode);
5176                GET_MODE_BITSIZE (wider_mode) <= BITS_PER_WORD
5177                && src_related == 0;
5178                wider_mode = GET_MODE_WIDER_MODE (wider_mode))
5179             {
5180               struct table_elt *const_elt
5181                 = lookup (src_const, HASH (src_const, wider_mode), wider_mode);
5182
5183               if (const_elt == 0)
5184                 continue;
5185
5186               for (const_elt = const_elt->first_same_value;
5187                    const_elt; const_elt = const_elt->next_same_value)
5188                 if (REG_P (const_elt->exp))
5189                   {
5190                     src_related = gen_lowpart (mode,
5191                                                            const_elt->exp);
5192                     break;
5193                   }
5194             }
5195         }
5196
5197       /* Another possibility is that we have an AND with a constant in
5198          a mode narrower than a word.  If so, it might have been generated
5199          as part of an "if" which would narrow the AND.  If we already
5200          have done the AND in a wider mode, we can use a SUBREG of that
5201          value.  */
5202
5203       if (flag_expensive_optimizations && ! src_related
5204           && GET_CODE (src) == AND && GET_CODE (XEXP (src, 1)) == CONST_INT
5205           && GET_MODE_SIZE (mode) < UNITS_PER_WORD)
5206         {
5207           enum machine_mode tmode;
5208           rtx new_and = gen_rtx_AND (VOIDmode, NULL_RTX, XEXP (src, 1));
5209
5210           for (tmode = GET_MODE_WIDER_MODE (mode);
5211                GET_MODE_SIZE (tmode) <= UNITS_PER_WORD;
5212                tmode = GET_MODE_WIDER_MODE (tmode))
5213             {
5214               rtx inner = gen_lowpart (tmode, XEXP (src, 0));
5215               struct table_elt *larger_elt;
5216
5217               if (inner)
5218                 {
5219                   PUT_MODE (new_and, tmode);
5220                   XEXP (new_and, 0) = inner;
5221                   larger_elt = lookup (new_and, HASH (new_and, tmode), tmode);
5222                   if (larger_elt == 0)
5223                     continue;
5224
5225                   for (larger_elt = larger_elt->first_same_value;
5226                        larger_elt; larger_elt = larger_elt->next_same_value)
5227                     if (REG_P (larger_elt->exp))
5228                       {
5229                         src_related
5230                           = gen_lowpart (mode, larger_elt->exp);
5231                         break;
5232                       }
5233
5234                   if (src_related)
5235                     break;
5236                 }
5237             }
5238         }
5239
5240 #ifdef LOAD_EXTEND_OP
5241       /* See if a MEM has already been loaded with a widening operation;
5242          if it has, we can use a subreg of that.  Many CISC machines
5243          also have such operations, but this is only likely to be
5244          beneficial on these machines.  */
5245
5246       if (flag_expensive_optimizations && src_related == 0
5247           && (GET_MODE_SIZE (mode) < UNITS_PER_WORD)
5248           && GET_MODE_CLASS (mode) == MODE_INT
5249           && MEM_P (src) && ! do_not_record
5250           && LOAD_EXTEND_OP (mode) != UNKNOWN)
5251         {
5252           struct rtx_def memory_extend_buf;
5253           rtx memory_extend_rtx = &memory_extend_buf;
5254           enum machine_mode tmode;
5255
5256           /* Set what we are trying to extend and the operation it might
5257              have been extended with.  */
5258           memset (memory_extend_rtx, 0, sizeof(*memory_extend_rtx));
5259           PUT_CODE (memory_extend_rtx, LOAD_EXTEND_OP (mode));
5260           XEXP (memory_extend_rtx, 0) = src;
5261
5262           for (tmode = GET_MODE_WIDER_MODE (mode);
5263                GET_MODE_SIZE (tmode) <= UNITS_PER_WORD;
5264                tmode = GET_MODE_WIDER_MODE (tmode))
5265             {
5266               struct table_elt *larger_elt;
5267
5268               PUT_MODE (memory_extend_rtx, tmode);
5269               larger_elt = lookup (memory_extend_rtx,
5270                                    HASH (memory_extend_rtx, tmode), tmode);
5271               if (larger_elt == 0)
5272                 continue;
5273
5274               for (larger_elt = larger_elt->first_same_value;
5275                    larger_elt; larger_elt = larger_elt->next_same_value)
5276                 if (REG_P (larger_elt->exp))
5277                   {
5278                     src_related = gen_lowpart (mode,
5279                                                            larger_elt->exp);
5280                     break;
5281                   }
5282
5283               if (src_related)
5284                 break;
5285             }
5286         }
5287 #endif /* LOAD_EXTEND_OP */
5288
5289       if (src == src_folded)
5290         src_folded = 0;
5291
5292       /* At this point, ELT, if nonzero, points to a class of expressions
5293          equivalent to the source of this SET and SRC, SRC_EQV, SRC_FOLDED,
5294          and SRC_RELATED, if nonzero, each contain additional equivalent
5295          expressions.  Prune these latter expressions by deleting expressions
5296          already in the equivalence class.
5297
5298          Check for an equivalent identical to the destination.  If found,
5299          this is the preferred equivalent since it will likely lead to
5300          elimination of the insn.  Indicate this by placing it in
5301          `src_related'.  */
5302
5303       if (elt)
5304         elt = elt->first_same_value;
5305       for (p = elt; p; p = p->next_same_value)
5306         {
5307           enum rtx_code code = GET_CODE (p->exp);
5308
5309           /* If the expression is not valid, ignore it.  Then we do not
5310              have to check for validity below.  In most cases, we can use
5311              `rtx_equal_p', since canonicalization has already been done.  */
5312           if (code != REG && ! exp_equiv_p (p->exp, p->exp, 1, false))
5313             continue;
5314
5315           /* Also skip paradoxical subregs, unless that's what we're
5316              looking for.  */
5317           if (code == SUBREG
5318               && (GET_MODE_SIZE (GET_MODE (p->exp))
5319                   > GET_MODE_SIZE (GET_MODE (SUBREG_REG (p->exp))))
5320               && ! (src != 0
5321                     && GET_CODE (src) == SUBREG
5322                     && GET_MODE (src) == GET_MODE (p->exp)
5323                     && (GET_MODE_SIZE (GET_MODE (SUBREG_REG (src)))
5324                         < GET_MODE_SIZE (GET_MODE (SUBREG_REG (p->exp))))))
5325             continue;
5326
5327           if (src && GET_CODE (src) == code && rtx_equal_p (src, p->exp))
5328             src = 0;
5329           else if (src_folded && GET_CODE (src_folded) == code
5330                    && rtx_equal_p (src_folded, p->exp))
5331             src_folded = 0;
5332           else if (src_eqv_here && GET_CODE (src_eqv_here) == code
5333                    && rtx_equal_p (src_eqv_here, p->exp))
5334             src_eqv_here = 0;
5335           else if (src_related && GET_CODE (src_related) == code
5336                    && rtx_equal_p (src_related, p->exp))
5337             src_related = 0;
5338
5339           /* This is the same as the destination of the insns, we want
5340              to prefer it.  Copy it to src_related.  The code below will
5341              then give it a negative cost.  */
5342           if (GET_CODE (dest) == code && rtx_equal_p (p->exp, dest))
5343             src_related = dest;
5344         }
5345
5346       /* Find the cheapest valid equivalent, trying all the available
5347          possibilities.  Prefer items not in the hash table to ones
5348          that are when they are equal cost.  Note that we can never
5349          worsen an insn as the current contents will also succeed.
5350          If we find an equivalent identical to the destination, use it as best,
5351          since this insn will probably be eliminated in that case.  */
5352       if (src)
5353         {
5354           if (rtx_equal_p (src, dest))
5355             src_cost = src_regcost = -1;
5356           else
5357             {
5358               src_cost = COST (src);
5359               src_regcost = approx_reg_cost (src);
5360             }
5361         }
5362
5363       if (src_eqv_here)
5364         {
5365           if (rtx_equal_p (src_eqv_here, dest))
5366             src_eqv_cost = src_eqv_regcost = -1;
5367           else
5368             {
5369               src_eqv_cost = COST (src_eqv_here);
5370               src_eqv_regcost = approx_reg_cost (src_eqv_here);
5371             }
5372         }
5373
5374       if (src_folded)
5375         {
5376           if (rtx_equal_p (src_folded, dest))
5377             src_folded_cost = src_folded_regcost = -1;
5378           else
5379             {
5380               src_folded_cost = COST (src_folded);
5381               src_folded_regcost = approx_reg_cost (src_folded);
5382             }
5383         }
5384
5385       if (src_related)
5386         {
5387           if (rtx_equal_p (src_related, dest))
5388             src_related_cost = src_related_regcost = -1;
5389           else
5390             {
5391               src_related_cost = COST (src_related);
5392               src_related_regcost = approx_reg_cost (src_related);
5393             }
5394         }
5395
5396       /* If this was an indirect jump insn, a known label will really be
5397          cheaper even though it looks more expensive.  */
5398       if (dest == pc_rtx && src_const && GET_CODE (src_const) == LABEL_REF)
5399         src_folded = src_const, src_folded_cost = src_folded_regcost = -1;
5400
5401       /* Terminate loop when replacement made.  This must terminate since
5402          the current contents will be tested and will always be valid.  */
5403       while (1)
5404         {
5405           rtx trial;
5406
5407           /* Skip invalid entries.  */
5408           while (elt && !REG_P (elt->exp)
5409                  && ! exp_equiv_p (elt->exp, elt->exp, 1, false))
5410             elt = elt->next_same_value;
5411
5412           /* A paradoxical subreg would be bad here: it'll be the right
5413              size, but later may be adjusted so that the upper bits aren't
5414              what we want.  So reject it.  */
5415           if (elt != 0
5416               && GET_CODE (elt->exp) == SUBREG
5417               && (GET_MODE_SIZE (GET_MODE (elt->exp))
5418                   > GET_MODE_SIZE (GET_MODE (SUBREG_REG (elt->exp))))
5419               /* It is okay, though, if the rtx we're trying to match
5420                  will ignore any of the bits we can't predict.  */
5421               && ! (src != 0
5422                     && GET_CODE (src) == SUBREG
5423                     && GET_MODE (src) == GET_MODE (elt->exp)
5424                     && (GET_MODE_SIZE (GET_MODE (SUBREG_REG (src)))
5425                         < GET_MODE_SIZE (GET_MODE (SUBREG_REG (elt->exp))))))
5426             {
5427               elt = elt->next_same_value;
5428               continue;
5429             }
5430
5431           if (elt)
5432             {
5433               src_elt_cost = elt->cost;
5434               src_elt_regcost = elt->regcost;
5435             }
5436
5437           /* Find cheapest and skip it for the next time.   For items
5438              of equal cost, use this order:
5439              src_folded, src, src_eqv, src_related and hash table entry.  */
5440           if (src_folded
5441               && preferable (src_folded_cost, src_folded_regcost,
5442                              src_cost, src_regcost) <= 0
5443               && preferable (src_folded_cost, src_folded_regcost,
5444                              src_eqv_cost, src_eqv_regcost) <= 0
5445               && preferable (src_folded_cost, src_folded_regcost,
5446                              src_related_cost, src_related_regcost) <= 0
5447               && preferable (src_folded_cost, src_folded_regcost,
5448                              src_elt_cost, src_elt_regcost) <= 0)
5449             {
5450               trial = src_folded, src_folded_cost = MAX_COST;
5451               if (src_folded_force_flag)
5452                 {
5453                   rtx forced = force_const_mem (mode, trial);
5454                   if (forced)
5455                     trial = forced;
5456                 }
5457             }
5458           else if (src
5459                    && preferable (src_cost, src_regcost,
5460                                   src_eqv_cost, src_eqv_regcost) <= 0
5461                    && preferable (src_cost, src_regcost,
5462                                   src_related_cost, src_related_regcost) <= 0
5463                    && preferable (src_cost, src_regcost,
5464                                   src_elt_cost, src_elt_regcost) <= 0)
5465             trial = src, src_cost = MAX_COST;
5466           else if (src_eqv_here
5467                    && preferable (src_eqv_cost, src_eqv_regcost,
5468                                   src_related_cost, src_related_regcost) <= 0
5469                    && preferable (src_eqv_cost, src_eqv_regcost,
5470                                   src_elt_cost, src_elt_regcost) <= 0)
5471             trial = copy_rtx (src_eqv_here), src_eqv_cost = MAX_COST;
5472           else if (src_related
5473                    && preferable (src_related_cost, src_related_regcost,
5474                                   src_elt_cost, src_elt_regcost) <= 0)
5475             trial = copy_rtx (src_related), src_related_cost = MAX_COST;
5476           else
5477             {
5478               trial = copy_rtx (elt->exp);
5479               elt = elt->next_same_value;
5480               src_elt_cost = MAX_COST;
5481             }
5482
5483           /* We don't normally have an insn matching (set (pc) (pc)), so
5484              check for this separately here.  We will delete such an
5485              insn below.
5486
5487              For other cases such as a table jump or conditional jump
5488              where we know the ultimate target, go ahead and replace the
5489              operand.  While that may not make a valid insn, we will
5490              reemit the jump below (and also insert any necessary
5491              barriers).  */
5492           if (n_sets == 1 && dest == pc_rtx
5493               && (trial == pc_rtx
5494                   || (GET_CODE (trial) == LABEL_REF
5495                       && ! condjump_p (insn))))
5496             {
5497               /* Don't substitute non-local labels, this confuses CFG.  */
5498               if (GET_CODE (trial) == LABEL_REF
5499                   && LABEL_REF_NONLOCAL_P (trial))
5500                 continue;
5501
5502               SET_SRC (sets[i].rtl) = trial;
5503               cse_jumps_altered = 1;
5504               break;
5505             }
5506
5507           /* Look for a substitution that makes a valid insn.  */
5508           else if (validate_change (insn, &SET_SRC (sets[i].rtl), trial, 0))
5509             {
5510               rtx new = canon_reg (SET_SRC (sets[i].rtl), insn);
5511
5512               /* If we just made a substitution inside a libcall, then we
5513                  need to make the same substitution in any notes attached
5514                  to the RETVAL insn.  */
5515               if (libcall_insn
5516                   && (REG_P (sets[i].orig_src)
5517                       || GET_CODE (sets[i].orig_src) == SUBREG
5518                       || MEM_P (sets[i].orig_src)))
5519                 {
5520                   rtx note = find_reg_equal_equiv_note (libcall_insn);
5521                   if (note != 0)
5522                     XEXP (note, 0) = simplify_replace_rtx (XEXP (note, 0),
5523                                                            sets[i].orig_src,
5524                                                            copy_rtx (new));
5525                 }
5526
5527               /* The result of apply_change_group can be ignored; see
5528                  canon_reg.  */
5529
5530               validate_change (insn, &SET_SRC (sets[i].rtl), new, 1);
5531               apply_change_group ();
5532               break;
5533             }
5534
5535           /* If we previously found constant pool entries for
5536              constants and this is a constant, try making a
5537              pool entry.  Put it in src_folded unless we already have done
5538              this since that is where it likely came from.  */
5539
5540           else if (constant_pool_entries_cost
5541                    && CONSTANT_P (trial)
5542                    /* Reject cases that will cause decode_rtx_const to
5543                       die.  On the alpha when simplifying a switch, we
5544                       get (const (truncate (minus (label_ref)
5545                       (label_ref)))).  */
5546                    && ! (GET_CODE (trial) == CONST
5547                          && GET_CODE (XEXP (trial, 0)) == TRUNCATE)
5548                    /* Likewise on IA-64, except without the truncate.  */
5549                    && ! (GET_CODE (trial) == CONST
5550                          && GET_CODE (XEXP (trial, 0)) == MINUS
5551                          && GET_CODE (XEXP (XEXP (trial, 0), 0)) == LABEL_REF
5552                          && GET_CODE (XEXP (XEXP (trial, 0), 1)) == LABEL_REF)
5553                    && (src_folded == 0
5554                        || (!MEM_P (src_folded)
5555                            && ! src_folded_force_flag))
5556                    && GET_MODE_CLASS (mode) != MODE_CC
5557                    && mode != VOIDmode)
5558             {
5559               src_folded_force_flag = 1;
5560               src_folded = trial;
5561               src_folded_cost = constant_pool_entries_cost;
5562               src_folded_regcost = constant_pool_entries_regcost;
5563             }
5564         }
5565
5566       src = SET_SRC (sets[i].rtl);
5567
5568       /* In general, it is good to have a SET with SET_SRC == SET_DEST.
5569          However, there is an important exception:  If both are registers
5570          that are not the head of their equivalence class, replace SET_SRC
5571          with the head of the class.  If we do not do this, we will have
5572          both registers live over a portion of the basic block.  This way,
5573          their lifetimes will likely abut instead of overlapping.  */
5574       if (REG_P (dest)
5575           && REGNO_QTY_VALID_P (REGNO (dest)))
5576         {
5577           int dest_q = REG_QTY (REGNO (dest));
5578           struct qty_table_elem *dest_ent = &qty_table[dest_q];
5579
5580           if (dest_ent->mode == GET_MODE (dest)
5581               && dest_ent->first_reg != REGNO (dest)
5582               && REG_P (src) && REGNO (src) == REGNO (dest)
5583               /* Don't do this if the original insn had a hard reg as
5584                  SET_SRC or SET_DEST.  */
5585               && (!REG_P (sets[i].src)
5586                   || REGNO (sets[i].src) >= FIRST_PSEUDO_REGISTER)
5587               && (!REG_P (dest) || REGNO (dest) >= FIRST_PSEUDO_REGISTER))
5588             /* We can't call canon_reg here because it won't do anything if
5589                SRC is a hard register.  */
5590             {
5591               int src_q = REG_QTY (REGNO (src));
5592               struct qty_table_elem *src_ent = &qty_table[src_q];
5593               int first = src_ent->first_reg;
5594               rtx new_src
5595                 = (first >= FIRST_PSEUDO_REGISTER
5596                    ? regno_reg_rtx[first] : gen_rtx_REG (GET_MODE (src), first));
5597
5598               /* We must use validate-change even for this, because this
5599                  might be a special no-op instruction, suitable only to
5600                  tag notes onto.  */
5601               if (validate_change (insn, &SET_SRC (sets[i].rtl), new_src, 0))
5602                 {
5603                   src = new_src;
5604                   /* If we had a constant that is cheaper than what we are now
5605                      setting SRC to, use that constant.  We ignored it when we
5606                      thought we could make this into a no-op.  */
5607                   if (src_const && COST (src_const) < COST (src)
5608                       && validate_change (insn, &SET_SRC (sets[i].rtl),
5609                                           src_const, 0))
5610                     src = src_const;
5611                 }
5612             }
5613         }
5614
5615       /* If we made a change, recompute SRC values.  */
5616       if (src != sets[i].src)
5617         {
5618           cse_altered = 1;
5619           do_not_record = 0;
5620           hash_arg_in_memory = 0;
5621           sets[i].src = src;
5622           sets[i].src_hash = HASH (src, mode);
5623           sets[i].src_volatile = do_not_record;
5624           sets[i].src_in_memory = hash_arg_in_memory;
5625           sets[i].src_elt = lookup (src, sets[i].src_hash, mode);
5626         }
5627
5628       /* If this is a single SET, we are setting a register, and we have an
5629          equivalent constant, we want to add a REG_NOTE.   We don't want
5630          to write a REG_EQUAL note for a constant pseudo since verifying that
5631          that pseudo hasn't been eliminated is a pain.  Such a note also
5632          won't help anything.
5633
5634          Avoid a REG_EQUAL note for (CONST (MINUS (LABEL_REF) (LABEL_REF)))
5635          which can be created for a reference to a compile time computable
5636          entry in a jump table.  */
5637
5638       if (n_sets == 1 && src_const && REG_P (dest)
5639           && !REG_P (src_const)
5640           && ! (GET_CODE (src_const) == CONST
5641                 && GET_CODE (XEXP (src_const, 0)) == MINUS
5642                 && GET_CODE (XEXP (XEXP (src_const, 0), 0)) == LABEL_REF
5643                 && GET_CODE (XEXP (XEXP (src_const, 0), 1)) == LABEL_REF))
5644         {
5645           /* We only want a REG_EQUAL note if src_const != src.  */
5646           if (! rtx_equal_p (src, src_const))
5647             {
5648               /* Make sure that the rtx is not shared.  */
5649               src_const = copy_rtx (src_const);
5650
5651               /* Record the actual constant value in a REG_EQUAL note,
5652                  making a new one if one does not already exist.  */
5653               set_unique_reg_note (insn, REG_EQUAL, src_const);
5654             }
5655         }
5656
5657       /* Now deal with the destination.  */
5658       do_not_record = 0;
5659
5660       /* Look within any ZERO_EXTRACT to the MEM or REG within it.  */
5661       while (GET_CODE (dest) == SUBREG
5662              || GET_CODE (dest) == ZERO_EXTRACT
5663              || GET_CODE (dest) == STRICT_LOW_PART)
5664         dest = XEXP (dest, 0);
5665
5666       sets[i].inner_dest = dest;
5667
5668       if (MEM_P (dest))
5669         {
5670 #ifdef PUSH_ROUNDING
5671           /* Stack pushes invalidate the stack pointer.  */
5672           rtx addr = XEXP (dest, 0);
5673           if (GET_RTX_CLASS (GET_CODE (addr)) == RTX_AUTOINC
5674               && XEXP (addr, 0) == stack_pointer_rtx)
5675             invalidate (stack_pointer_rtx, Pmode);
5676 #endif
5677           dest = fold_rtx (dest, insn);
5678         }
5679
5680       /* Compute the hash code of the destination now,
5681          before the effects of this instruction are recorded,
5682          since the register values used in the address computation
5683          are those before this instruction.  */
5684       sets[i].dest_hash = HASH (dest, mode);
5685
5686       /* Don't enter a bit-field in the hash table
5687          because the value in it after the store
5688          may not equal what was stored, due to truncation.  */
5689
5690       if (GET_CODE (SET_DEST (sets[i].rtl)) == ZERO_EXTRACT)
5691         {
5692           rtx width = XEXP (SET_DEST (sets[i].rtl), 1);
5693
5694           if (src_const != 0 && GET_CODE (src_const) == CONST_INT
5695               && GET_CODE (width) == CONST_INT
5696               && INTVAL (width) < HOST_BITS_PER_WIDE_INT
5697               && ! (INTVAL (src_const)
5698                     & ((HOST_WIDE_INT) (-1) << INTVAL (width))))
5699             /* Exception: if the value is constant,
5700                and it won't be truncated, record it.  */
5701             ;
5702           else
5703             {
5704               /* This is chosen so that the destination will be invalidated
5705                  but no new value will be recorded.
5706                  We must invalidate because sometimes constant
5707                  values can be recorded for bitfields.  */
5708               sets[i].src_elt = 0;
5709               sets[i].src_volatile = 1;
5710               src_eqv = 0;
5711               src_eqv_elt = 0;
5712             }
5713         }
5714
5715       /* If only one set in a JUMP_INSN and it is now a no-op, we can delete
5716          the insn.  */
5717       else if (n_sets == 1 && dest == pc_rtx && src == pc_rtx)
5718         {
5719           /* One less use of the label this insn used to jump to.  */
5720           delete_insn (insn);
5721           cse_jumps_altered = 1;
5722           /* No more processing for this set.  */
5723           sets[i].rtl = 0;
5724         }
5725
5726       /* If this SET is now setting PC to a label, we know it used to
5727          be a conditional or computed branch.  */
5728       else if (dest == pc_rtx && GET_CODE (src) == LABEL_REF
5729                && !LABEL_REF_NONLOCAL_P (src))
5730         {
5731           /* Now emit a BARRIER after the unconditional jump.  */
5732           if (NEXT_INSN (insn) == 0
5733               || !BARRIER_P (NEXT_INSN (insn)))
5734             emit_barrier_after (insn);
5735
5736           /* We reemit the jump in as many cases as possible just in
5737              case the form of an unconditional jump is significantly
5738              different than a computed jump or conditional jump.
5739
5740              If this insn has multiple sets, then reemitting the
5741              jump is nontrivial.  So instead we just force rerecognition
5742              and hope for the best.  */
5743           if (n_sets == 1)
5744             {
5745               rtx new, note;
5746
5747               new = emit_jump_insn_after (gen_jump (XEXP (src, 0)), insn);
5748               JUMP_LABEL (new) = XEXP (src, 0);
5749               LABEL_NUSES (XEXP (src, 0))++;
5750
5751               /* Make sure to copy over REG_NON_LOCAL_GOTO.  */
5752               note = find_reg_note (insn, REG_NON_LOCAL_GOTO, 0);
5753               if (note)
5754                 {
5755                   XEXP (note, 1) = NULL_RTX;
5756                   REG_NOTES (new) = note;
5757                 }
5758
5759               delete_insn (insn);
5760               insn = new;
5761
5762               /* Now emit a BARRIER after the unconditional jump.  */
5763               if (NEXT_INSN (insn) == 0
5764                   || !BARRIER_P (NEXT_INSN (insn)))
5765                 emit_barrier_after (insn);
5766             }
5767           else
5768             INSN_CODE (insn) = -1;
5769
5770           /* Do not bother deleting any unreachable code,
5771              let jump/flow do that.  */
5772
5773           cse_jumps_altered = 1;
5774           sets[i].rtl = 0;
5775         }
5776
5777       /* If destination is volatile, invalidate it and then do no further
5778          processing for this assignment.  */
5779
5780       else if (do_not_record)
5781         {
5782           if (REG_P (dest) || GET_CODE (dest) == SUBREG)
5783             invalidate (dest, VOIDmode);
5784           else if (MEM_P (dest))
5785             invalidate (dest, VOIDmode);
5786           else if (GET_CODE (dest) == STRICT_LOW_PART
5787                    || GET_CODE (dest) == ZERO_EXTRACT)
5788             invalidate (XEXP (dest, 0), GET_MODE (dest));
5789           sets[i].rtl = 0;
5790         }
5791
5792       if (sets[i].rtl != 0 && dest != SET_DEST (sets[i].rtl))
5793         sets[i].dest_hash = HASH (SET_DEST (sets[i].rtl), mode);
5794
5795 #ifdef HAVE_cc0
5796       /* If setting CC0, record what it was set to, or a constant, if it
5797          is equivalent to a constant.  If it is being set to a floating-point
5798          value, make a COMPARE with the appropriate constant of 0.  If we
5799          don't do this, later code can interpret this as a test against
5800          const0_rtx, which can cause problems if we try to put it into an
5801          insn as a floating-point operand.  */
5802       if (dest == cc0_rtx)
5803         {
5804           this_insn_cc0 = src_const && mode != VOIDmode ? src_const : src;
5805           this_insn_cc0_mode = mode;
5806           if (FLOAT_MODE_P (mode))
5807             this_insn_cc0 = gen_rtx_COMPARE (VOIDmode, this_insn_cc0,
5808                                              CONST0_RTX (mode));
5809         }
5810 #endif
5811     }
5812
5813   /* Now enter all non-volatile source expressions in the hash table
5814      if they are not already present.
5815      Record their equivalence classes in src_elt.
5816      This way we can insert the corresponding destinations into
5817      the same classes even if the actual sources are no longer in them
5818      (having been invalidated).  */
5819
5820   if (src_eqv && src_eqv_elt == 0 && sets[0].rtl != 0 && ! src_eqv_volatile
5821       && ! rtx_equal_p (src_eqv, SET_DEST (sets[0].rtl)))
5822     {
5823       struct table_elt *elt;
5824       struct table_elt *classp = sets[0].src_elt;
5825       rtx dest = SET_DEST (sets[0].rtl);
5826       enum machine_mode eqvmode = GET_MODE (dest);
5827
5828       if (GET_CODE (dest) == STRICT_LOW_PART)
5829         {
5830           eqvmode = GET_MODE (SUBREG_REG (XEXP (dest, 0)));
5831           classp = 0;
5832         }
5833       if (insert_regs (src_eqv, classp, 0))
5834         {
5835           rehash_using_reg (src_eqv);
5836           src_eqv_hash = HASH (src_eqv, eqvmode);
5837         }
5838       elt = insert (src_eqv, classp, src_eqv_hash, eqvmode);
5839       elt->in_memory = src_eqv_in_memory;
5840       src_eqv_elt = elt;
5841
5842       /* Check to see if src_eqv_elt is the same as a set source which
5843          does not yet have an elt, and if so set the elt of the set source
5844          to src_eqv_elt.  */
5845       for (i = 0; i < n_sets; i++)
5846         if (sets[i].rtl && sets[i].src_elt == 0
5847             && rtx_equal_p (SET_SRC (sets[i].rtl), src_eqv))
5848           sets[i].src_elt = src_eqv_elt;
5849     }
5850
5851   for (i = 0; i < n_sets; i++)
5852     if (sets[i].rtl && ! sets[i].src_volatile
5853         && ! rtx_equal_p (SET_SRC (sets[i].rtl), SET_DEST (sets[i].rtl)))
5854       {
5855         if (GET_CODE (SET_DEST (sets[i].rtl)) == STRICT_LOW_PART)
5856           {
5857             /* REG_EQUAL in setting a STRICT_LOW_PART
5858                gives an equivalent for the entire destination register,
5859                not just for the subreg being stored in now.
5860                This is a more interesting equivalence, so we arrange later
5861                to treat the entire reg as the destination.  */
5862             sets[i].src_elt = src_eqv_elt;
5863             sets[i].src_hash = src_eqv_hash;
5864           }
5865         else
5866           {
5867             /* Insert source and constant equivalent into hash table, if not
5868                already present.  */
5869             struct table_elt *classp = src_eqv_elt;
5870             rtx src = sets[i].src;
5871             rtx dest = SET_DEST (sets[i].rtl);
5872             enum machine_mode mode
5873               = GET_MODE (src) == VOIDmode ? GET_MODE (dest) : GET_MODE (src);
5874
5875             /* It's possible that we have a source value known to be
5876                constant but don't have a REG_EQUAL note on the insn.
5877                Lack of a note will mean src_eqv_elt will be NULL.  This
5878                can happen where we've generated a SUBREG to access a
5879                CONST_INT that is already in a register in a wider mode.
5880                Ensure that the source expression is put in the proper
5881                constant class.  */
5882             if (!classp)
5883               classp = sets[i].src_const_elt;
5884
5885             if (sets[i].src_elt == 0)
5886               {
5887                 /* Don't put a hard register source into the table if this is
5888                    the last insn of a libcall.  In this case, we only need
5889                    to put src_eqv_elt in src_elt.  */
5890                 if (! find_reg_note (insn, REG_RETVAL, NULL_RTX))
5891                   {
5892                     struct table_elt *elt;
5893
5894                     /* Note that these insert_regs calls cannot remove
5895                        any of the src_elt's, because they would have failed to
5896                        match if not still valid.  */
5897                     if (insert_regs (src, classp, 0))
5898                       {
5899                         rehash_using_reg (src);
5900                         sets[i].src_hash = HASH (src, mode);
5901                       }
5902                     elt = insert (src, classp, sets[i].src_hash, mode);
5903                     elt->in_memory = sets[i].src_in_memory;
5904                     sets[i].src_elt = classp = elt;
5905                   }
5906                 else
5907                   sets[i].src_elt = classp;
5908               }
5909             if (sets[i].src_const && sets[i].src_const_elt == 0
5910                 && src != sets[i].src_const
5911                 && ! rtx_equal_p (sets[i].src_const, src))
5912               sets[i].src_elt = insert (sets[i].src_const, classp,
5913                                         sets[i].src_const_hash, mode);
5914           }
5915       }
5916     else if (sets[i].src_elt == 0)
5917       /* If we did not insert the source into the hash table (e.g., it was
5918          volatile), note the equivalence class for the REG_EQUAL value, if any,
5919          so that the destination goes into that class.  */
5920       sets[i].src_elt = src_eqv_elt;
5921
5922   invalidate_from_clobbers (x);
5923
5924   /* Some registers are invalidated by subroutine calls.  Memory is
5925      invalidated by non-constant calls.  */
5926
5927   if (CALL_P (insn))
5928     {
5929       if (! CONST_OR_PURE_CALL_P (insn))
5930         invalidate_memory ();
5931       invalidate_for_call ();
5932     }
5933
5934   /* Now invalidate everything set by this instruction.
5935      If a SUBREG or other funny destination is being set,
5936      sets[i].rtl is still nonzero, so here we invalidate the reg
5937      a part of which is being set.  */
5938
5939   for (i = 0; i < n_sets; i++)
5940     if (sets[i].rtl)
5941       {
5942         /* We can't use the inner dest, because the mode associated with
5943            a ZERO_EXTRACT is significant.  */
5944         rtx dest = SET_DEST (sets[i].rtl);
5945
5946         /* Needed for registers to remove the register from its
5947            previous quantity's chain.
5948            Needed for memory if this is a nonvarying address, unless
5949            we have just done an invalidate_memory that covers even those.  */
5950         if (REG_P (dest) || GET_CODE (dest) == SUBREG)
5951           invalidate (dest, VOIDmode);
5952         else if (MEM_P (dest))
5953           invalidate (dest, VOIDmode);
5954         else if (GET_CODE (dest) == STRICT_LOW_PART
5955                  || GET_CODE (dest) == ZERO_EXTRACT)
5956           invalidate (XEXP (dest, 0), GET_MODE (dest));
5957       }
5958
5959   /* A volatile ASM invalidates everything.  */
5960   if (NONJUMP_INSN_P (insn)
5961       && GET_CODE (PATTERN (insn)) == ASM_OPERANDS
5962       && MEM_VOLATILE_P (PATTERN (insn)))
5963     flush_hash_table ();
5964
5965   /* Make sure registers mentioned in destinations
5966      are safe for use in an expression to be inserted.
5967      This removes from the hash table
5968      any invalid entry that refers to one of these registers.
5969
5970      We don't care about the return value from mention_regs because
5971      we are going to hash the SET_DEST values unconditionally.  */
5972
5973   for (i = 0; i < n_sets; i++)
5974     {
5975       if (sets[i].rtl)
5976         {
5977           rtx x = SET_DEST (sets[i].rtl);
5978
5979           if (!REG_P (x))
5980             mention_regs (x);
5981           else
5982             {
5983               /* We used to rely on all references to a register becoming
5984                  inaccessible when a register changes to a new quantity,
5985                  since that changes the hash code.  However, that is not
5986                  safe, since after HASH_SIZE new quantities we get a
5987                  hash 'collision' of a register with its own invalid
5988                  entries.  And since SUBREGs have been changed not to
5989                  change their hash code with the hash code of the register,
5990                  it wouldn't work any longer at all.  So we have to check
5991                  for any invalid references lying around now.
5992                  This code is similar to the REG case in mention_regs,
5993                  but it knows that reg_tick has been incremented, and
5994                  it leaves reg_in_table as -1 .  */
5995               unsigned int regno = REGNO (x);
5996               unsigned int endregno
5997                 = regno + (regno >= FIRST_PSEUDO_REGISTER ? 1
5998                            : hard_regno_nregs[regno][GET_MODE (x)]);
5999               unsigned int i;
6000
6001               for (i = regno; i < endregno; i++)
6002                 {
6003                   if (REG_IN_TABLE (i) >= 0)
6004                     {
6005                       remove_invalid_refs (i);
6006                       REG_IN_TABLE (i) = -1;
6007                     }
6008                 }
6009             }
6010         }
6011     }
6012
6013   /* We may have just removed some of the src_elt's from the hash table.
6014      So replace each one with the current head of the same class.  */
6015
6016   for (i = 0; i < n_sets; i++)
6017     if (sets[i].rtl)
6018       {
6019         if (sets[i].src_elt && sets[i].src_elt->first_same_value == 0)
6020           /* If elt was removed, find current head of same class,
6021              or 0 if nothing remains of that class.  */
6022           {
6023             struct table_elt *elt = sets[i].src_elt;
6024
6025             while (elt && elt->prev_same_value)
6026               elt = elt->prev_same_value;
6027
6028             while (elt && elt->first_same_value == 0)
6029               elt = elt->next_same_value;
6030             sets[i].src_elt = elt ? elt->first_same_value : 0;
6031           }
6032       }
6033
6034   /* Now insert the destinations into their equivalence classes.  */
6035
6036   for (i = 0; i < n_sets; i++)
6037     if (sets[i].rtl)
6038       {
6039         rtx dest = SET_DEST (sets[i].rtl);
6040         struct table_elt *elt;
6041
6042         /* Don't record value if we are not supposed to risk allocating
6043            floating-point values in registers that might be wider than
6044            memory.  */
6045         if ((flag_float_store
6046              && MEM_P (dest)
6047              && FLOAT_MODE_P (GET_MODE (dest)))
6048             /* Don't record BLKmode values, because we don't know the
6049                size of it, and can't be sure that other BLKmode values
6050                have the same or smaller size.  */
6051             || GET_MODE (dest) == BLKmode
6052             /* Don't record values of destinations set inside a libcall block
6053                since we might delete the libcall.  Things should have been set
6054                up so we won't want to reuse such a value, but we play it safe
6055                here.  */
6056             || libcall_insn
6057             /* If we didn't put a REG_EQUAL value or a source into the hash
6058                table, there is no point is recording DEST.  */
6059             || sets[i].src_elt == 0
6060             /* If DEST is a paradoxical SUBREG and SRC is a ZERO_EXTEND
6061                or SIGN_EXTEND, don't record DEST since it can cause
6062                some tracking to be wrong.
6063
6064                ??? Think about this more later.  */
6065             || (GET_CODE (dest) == SUBREG
6066                 && (GET_MODE_SIZE (GET_MODE (dest))
6067                     > GET_MODE_SIZE (GET_MODE (SUBREG_REG (dest))))
6068                 && (GET_CODE (sets[i].src) == SIGN_EXTEND
6069                     || GET_CODE (sets[i].src) == ZERO_EXTEND)))
6070           continue;
6071
6072         /* STRICT_LOW_PART isn't part of the value BEING set,
6073            and neither is the SUBREG inside it.
6074            Note that in this case SETS[I].SRC_ELT is really SRC_EQV_ELT.  */
6075         if (GET_CODE (dest) == STRICT_LOW_PART)
6076           dest = SUBREG_REG (XEXP (dest, 0));
6077
6078         if (REG_P (dest) || GET_CODE (dest) == SUBREG)
6079           /* Registers must also be inserted into chains for quantities.  */
6080           if (insert_regs (dest, sets[i].src_elt, 1))
6081             {
6082               /* If `insert_regs' changes something, the hash code must be
6083                  recalculated.  */
6084               rehash_using_reg (dest);
6085               sets[i].dest_hash = HASH (dest, GET_MODE (dest));
6086             }
6087
6088         elt = insert (dest, sets[i].src_elt,
6089                       sets[i].dest_hash, GET_MODE (dest));
6090
6091         elt->in_memory = (MEM_P (sets[i].inner_dest)
6092                           && !MEM_READONLY_P (sets[i].inner_dest));
6093
6094         /* If we have (set (subreg:m1 (reg:m2 foo) 0) (bar:m1)), M1 is no
6095            narrower than M2, and both M1 and M2 are the same number of words,
6096            we are also doing (set (reg:m2 foo) (subreg:m2 (bar:m1) 0)) so
6097            make that equivalence as well.
6098
6099            However, BAR may have equivalences for which gen_lowpart
6100            will produce a simpler value than gen_lowpart applied to
6101            BAR (e.g., if BAR was ZERO_EXTENDed from M2), so we will scan all
6102            BAR's equivalences.  If we don't get a simplified form, make
6103            the SUBREG.  It will not be used in an equivalence, but will
6104            cause two similar assignments to be detected.
6105
6106            Note the loop below will find SUBREG_REG (DEST) since we have
6107            already entered SRC and DEST of the SET in the table.  */
6108
6109         if (GET_CODE (dest) == SUBREG
6110             && (((GET_MODE_SIZE (GET_MODE (SUBREG_REG (dest))) - 1)
6111                  / UNITS_PER_WORD)
6112                 == (GET_MODE_SIZE (GET_MODE (dest)) - 1) / UNITS_PER_WORD)
6113             && (GET_MODE_SIZE (GET_MODE (dest))
6114                 >= GET_MODE_SIZE (GET_MODE (SUBREG_REG (dest))))
6115             && sets[i].src_elt != 0)
6116           {
6117             enum machine_mode new_mode = GET_MODE (SUBREG_REG (dest));
6118             struct table_elt *elt, *classp = 0;
6119
6120             for (elt = sets[i].src_elt->first_same_value; elt;
6121                  elt = elt->next_same_value)
6122               {
6123                 rtx new_src = 0;
6124                 unsigned src_hash;
6125                 struct table_elt *src_elt;
6126                 int byte = 0;
6127
6128                 /* Ignore invalid entries.  */
6129                 if (!REG_P (elt->exp)
6130                     && ! exp_equiv_p (elt->exp, elt->exp, 1, false))
6131                   continue;
6132
6133                 /* We may have already been playing subreg games.  If the
6134                    mode is already correct for the destination, use it.  */
6135                 if (GET_MODE (elt->exp) == new_mode)
6136                   new_src = elt->exp;
6137                 else
6138                   {
6139                     /* Calculate big endian correction for the SUBREG_BYTE.
6140                        We have already checked that M1 (GET_MODE (dest))
6141                        is not narrower than M2 (new_mode).  */
6142                     if (BYTES_BIG_ENDIAN)
6143                       byte = (GET_MODE_SIZE (GET_MODE (dest))
6144                               - GET_MODE_SIZE (new_mode));
6145
6146                     new_src = simplify_gen_subreg (new_mode, elt->exp,
6147                                                    GET_MODE (dest), byte);
6148                   }
6149
6150                 /* The call to simplify_gen_subreg fails if the value
6151                    is VOIDmode, yet we can't do any simplification, e.g.
6152                    for EXPR_LISTs denoting function call results.
6153                    It is invalid to construct a SUBREG with a VOIDmode
6154                    SUBREG_REG, hence a zero new_src means we can't do
6155                    this substitution.  */
6156                 if (! new_src)
6157                   continue;
6158
6159                 src_hash = HASH (new_src, new_mode);
6160                 src_elt = lookup (new_src, src_hash, new_mode);
6161
6162                 /* Put the new source in the hash table is if isn't
6163                    already.  */
6164                 if (src_elt == 0)
6165                   {
6166                     if (insert_regs (new_src, classp, 0))
6167                       {
6168                         rehash_using_reg (new_src);
6169                         src_hash = HASH (new_src, new_mode);
6170                       }
6171                     src_elt = insert (new_src, classp, src_hash, new_mode);
6172                     src_elt->in_memory = elt->in_memory;
6173                   }
6174                 else if (classp && classp != src_elt->first_same_value)
6175                   /* Show that two things that we've seen before are
6176                      actually the same.  */
6177                   merge_equiv_classes (src_elt, classp);
6178
6179                 classp = src_elt->first_same_value;
6180                 /* Ignore invalid entries.  */
6181                 while (classp
6182                        && !REG_P (classp->exp)
6183                        && ! exp_equiv_p (classp->exp, classp->exp, 1, false))
6184                   classp = classp->next_same_value;
6185               }
6186           }
6187       }
6188
6189   /* Special handling for (set REG0 REG1) where REG0 is the
6190      "cheapest", cheaper than REG1.  After cse, REG1 will probably not
6191      be used in the sequel, so (if easily done) change this insn to
6192      (set REG1 REG0) and replace REG1 with REG0 in the previous insn
6193      that computed their value.  Then REG1 will become a dead store
6194      and won't cloud the situation for later optimizations.
6195
6196      Do not make this change if REG1 is a hard register, because it will
6197      then be used in the sequel and we may be changing a two-operand insn
6198      into a three-operand insn.
6199
6200      Also do not do this if we are operating on a copy of INSN.
6201
6202      Also don't do this if INSN ends a libcall; this would cause an unrelated
6203      register to be set in the middle of a libcall, and we then get bad code
6204      if the libcall is deleted.  */
6205
6206   if (n_sets == 1 && sets[0].rtl && REG_P (SET_DEST (sets[0].rtl))
6207       && NEXT_INSN (PREV_INSN (insn)) == insn
6208       && REG_P (SET_SRC (sets[0].rtl))
6209       && REGNO (SET_SRC (sets[0].rtl)) >= FIRST_PSEUDO_REGISTER
6210       && REGNO_QTY_VALID_P (REGNO (SET_SRC (sets[0].rtl))))
6211     {
6212       int src_q = REG_QTY (REGNO (SET_SRC (sets[0].rtl)));
6213       struct qty_table_elem *src_ent = &qty_table[src_q];
6214
6215       if ((src_ent->first_reg == REGNO (SET_DEST (sets[0].rtl)))
6216           && ! find_reg_note (insn, REG_RETVAL, NULL_RTX))
6217         {
6218           rtx prev = insn;
6219           /* Scan for the previous nonnote insn, but stop at a basic
6220              block boundary.  */
6221           do
6222             {
6223               prev = PREV_INSN (prev);
6224             }
6225           while (prev && NOTE_P (prev)
6226                  && NOTE_LINE_NUMBER (prev) != NOTE_INSN_BASIC_BLOCK);
6227
6228           /* Do not swap the registers around if the previous instruction
6229              attaches a REG_EQUIV note to REG1.
6230
6231              ??? It's not entirely clear whether we can transfer a REG_EQUIV
6232              from the pseudo that originally shadowed an incoming argument
6233              to another register.  Some uses of REG_EQUIV might rely on it
6234              being attached to REG1 rather than REG2.
6235
6236              This section previously turned the REG_EQUIV into a REG_EQUAL
6237              note.  We cannot do that because REG_EQUIV may provide an
6238              uninitialized stack slot when REG_PARM_STACK_SPACE is used.  */
6239
6240           if (prev != 0 && NONJUMP_INSN_P (prev)
6241               && GET_CODE (PATTERN (prev)) == SET
6242               && SET_DEST (PATTERN (prev)) == SET_SRC (sets[0].rtl)
6243               && ! find_reg_note (prev, REG_EQUIV, NULL_RTX))
6244             {
6245               rtx dest = SET_DEST (sets[0].rtl);
6246               rtx src = SET_SRC (sets[0].rtl);
6247               rtx note;
6248
6249               validate_change (prev, &SET_DEST (PATTERN (prev)), dest, 1);
6250               validate_change (insn, &SET_DEST (sets[0].rtl), src, 1);
6251               validate_change (insn, &SET_SRC (sets[0].rtl), dest, 1);
6252               apply_change_group ();
6253
6254               /* If INSN has a REG_EQUAL note, and this note mentions
6255                  REG0, then we must delete it, because the value in
6256                  REG0 has changed.  If the note's value is REG1, we must
6257                  also delete it because that is now this insn's dest.  */
6258               note = find_reg_note (insn, REG_EQUAL, NULL_RTX);
6259               if (note != 0
6260                   && (reg_mentioned_p (dest, XEXP (note, 0))
6261                       || rtx_equal_p (src, XEXP (note, 0))))
6262                 remove_note (insn, note);
6263             }
6264         }
6265     }
6266
6267   /* If this is a conditional jump insn, record any known equivalences due to
6268      the condition being tested.  */
6269
6270   if (JUMP_P (insn)
6271       && n_sets == 1 && GET_CODE (x) == SET
6272       && GET_CODE (SET_SRC (x)) == IF_THEN_ELSE)
6273     record_jump_equiv (insn, 0);
6274
6275 #ifdef HAVE_cc0
6276   /* If the previous insn set CC0 and this insn no longer references CC0,
6277      delete the previous insn.  Here we use the fact that nothing expects CC0
6278      to be valid over an insn, which is true until the final pass.  */
6279   if (prev_insn && NONJUMP_INSN_P (prev_insn)
6280       && (tem = single_set (prev_insn)) != 0
6281       && SET_DEST (tem) == cc0_rtx
6282       && ! reg_mentioned_p (cc0_rtx, x))
6283     delete_insn (prev_insn);
6284
6285   prev_insn_cc0 = this_insn_cc0;
6286   prev_insn_cc0_mode = this_insn_cc0_mode;
6287   prev_insn = insn;
6288 #endif
6289 }
6290 \f
6291 /* Remove from the hash table all expressions that reference memory.  */
6292
6293 static void
6294 invalidate_memory (void)
6295 {
6296   int i;
6297   struct table_elt *p, *next;
6298
6299   for (i = 0; i < HASH_SIZE; i++)
6300     for (p = table[i]; p; p = next)
6301       {
6302         next = p->next_same_hash;
6303         if (p->in_memory)
6304           remove_from_table (p, i);
6305       }
6306 }
6307
6308 /* If ADDR is an address that implicitly affects the stack pointer, return
6309    1 and update the register tables to show the effect.  Else, return 0.  */
6310
6311 static int
6312 addr_affects_sp_p (rtx addr)
6313 {
6314   if (GET_RTX_CLASS (GET_CODE (addr)) == RTX_AUTOINC
6315       && REG_P (XEXP (addr, 0))
6316       && REGNO (XEXP (addr, 0)) == STACK_POINTER_REGNUM)
6317     {
6318       if (REG_TICK (STACK_POINTER_REGNUM) >= 0)
6319         {
6320           REG_TICK (STACK_POINTER_REGNUM)++;
6321           /* Is it possible to use a subreg of SP?  */
6322           SUBREG_TICKED (STACK_POINTER_REGNUM) = -1;
6323         }
6324
6325       /* This should be *very* rare.  */
6326       if (TEST_HARD_REG_BIT (hard_regs_in_table, STACK_POINTER_REGNUM))
6327         invalidate (stack_pointer_rtx, VOIDmode);
6328
6329       return 1;
6330     }
6331
6332   return 0;
6333 }
6334
6335 /* Perform invalidation on the basis of everything about an insn
6336    except for invalidating the actual places that are SET in it.
6337    This includes the places CLOBBERed, and anything that might
6338    alias with something that is SET or CLOBBERed.
6339
6340    X is the pattern of the insn.  */
6341
6342 static void
6343 invalidate_from_clobbers (rtx x)
6344 {
6345   if (GET_CODE (x) == CLOBBER)
6346     {
6347       rtx ref = XEXP (x, 0);
6348       if (ref)
6349         {
6350           if (REG_P (ref) || GET_CODE (ref) == SUBREG
6351               || MEM_P (ref))
6352             invalidate (ref, VOIDmode);
6353           else if (GET_CODE (ref) == STRICT_LOW_PART
6354                    || GET_CODE (ref) == ZERO_EXTRACT)
6355             invalidate (XEXP (ref, 0), GET_MODE (ref));
6356         }
6357     }
6358   else if (GET_CODE (x) == PARALLEL)
6359     {
6360       int i;
6361       for (i = XVECLEN (x, 0) - 1; i >= 0; i--)
6362         {
6363           rtx y = XVECEXP (x, 0, i);
6364           if (GET_CODE (y) == CLOBBER)
6365             {
6366               rtx ref = XEXP (y, 0);
6367               if (REG_P (ref) || GET_CODE (ref) == SUBREG
6368                   || MEM_P (ref))
6369                 invalidate (ref, VOIDmode);
6370               else if (GET_CODE (ref) == STRICT_LOW_PART
6371                        || GET_CODE (ref) == ZERO_EXTRACT)
6372                 invalidate (XEXP (ref, 0), GET_MODE (ref));
6373             }
6374         }
6375     }
6376 }
6377 \f
6378 /* Process X, part of the REG_NOTES of an insn.  Look at any REG_EQUAL notes
6379    and replace any registers in them with either an equivalent constant
6380    or the canonical form of the register.  If we are inside an address,
6381    only do this if the address remains valid.
6382
6383    OBJECT is 0 except when within a MEM in which case it is the MEM.
6384
6385    Return the replacement for X.  */
6386
6387 static rtx
6388 cse_process_notes (rtx x, rtx object)
6389 {
6390   enum rtx_code code = GET_CODE (x);
6391   const char *fmt = GET_RTX_FORMAT (code);
6392   int i;
6393
6394   switch (code)
6395     {
6396     case CONST_INT:
6397     case CONST:
6398     case SYMBOL_REF:
6399     case LABEL_REF:
6400     case CONST_DOUBLE:
6401     case CONST_VECTOR:
6402     case PC:
6403     case CC0:
6404     case LO_SUM:
6405       return x;
6406
6407     case MEM:
6408       validate_change (x, &XEXP (x, 0),
6409                        cse_process_notes (XEXP (x, 0), x), 0);
6410       return x;
6411
6412     case EXPR_LIST:
6413     case INSN_LIST:
6414       if (REG_NOTE_KIND (x) == REG_EQUAL)
6415         XEXP (x, 0) = cse_process_notes (XEXP (x, 0), NULL_RTX);
6416       if (XEXP (x, 1))
6417         XEXP (x, 1) = cse_process_notes (XEXP (x, 1), NULL_RTX);
6418       return x;
6419
6420     case SIGN_EXTEND:
6421     case ZERO_EXTEND:
6422     case SUBREG:
6423       {
6424         rtx new = cse_process_notes (XEXP (x, 0), object);
6425         /* We don't substitute VOIDmode constants into these rtx,
6426            since they would impede folding.  */
6427         if (GET_MODE (new) != VOIDmode)
6428           validate_change (object, &XEXP (x, 0), new, 0);
6429         return x;
6430       }
6431
6432     case REG:
6433       i = REG_QTY (REGNO (x));
6434
6435       /* Return a constant or a constant register.  */
6436       if (REGNO_QTY_VALID_P (REGNO (x)))
6437         {
6438           struct qty_table_elem *ent = &qty_table[i];
6439
6440           if (ent->const_rtx != NULL_RTX
6441               && (CONSTANT_P (ent->const_rtx)
6442                   || REG_P (ent->const_rtx)))
6443             {
6444               rtx new = gen_lowpart (GET_MODE (x), ent->const_rtx);
6445               if (new)
6446                 return new;
6447             }
6448         }
6449
6450       /* Otherwise, canonicalize this register.  */
6451       return canon_reg (x, NULL_RTX);
6452
6453     default:
6454       break;
6455     }
6456
6457   for (i = 0; i < GET_RTX_LENGTH (code); i++)
6458     if (fmt[i] == 'e')
6459       validate_change (object, &XEXP (x, i),
6460                        cse_process_notes (XEXP (x, i), object), 0);
6461
6462   return x;
6463 }
6464 \f
6465 /* Process one SET of an insn that was skipped.  We ignore CLOBBERs
6466    since they are done elsewhere.  This function is called via note_stores.  */
6467
6468 static void
6469 invalidate_skipped_set (rtx dest, rtx set, void *data ATTRIBUTE_UNUSED)
6470 {
6471   enum rtx_code code = GET_CODE (dest);
6472
6473   if (code == MEM
6474       && ! addr_affects_sp_p (dest)     /* If this is not a stack push ...  */
6475       /* There are times when an address can appear varying and be a PLUS
6476          during this scan when it would be a fixed address were we to know
6477          the proper equivalences.  So invalidate all memory if there is
6478          a BLKmode or nonscalar memory reference or a reference to a
6479          variable address.  */
6480       && (MEM_IN_STRUCT_P (dest) || GET_MODE (dest) == BLKmode
6481           || cse_rtx_varies_p (XEXP (dest, 0), 0)))
6482     {
6483       invalidate_memory ();
6484       return;
6485     }
6486
6487   if (GET_CODE (set) == CLOBBER
6488       || CC0_P (dest)
6489       || dest == pc_rtx)
6490     return;
6491
6492   if (code == STRICT_LOW_PART || code == ZERO_EXTRACT)
6493     invalidate (XEXP (dest, 0), GET_MODE (dest));
6494   else if (code == REG || code == SUBREG || code == MEM)
6495     invalidate (dest, VOIDmode);
6496 }
6497
6498 /* Invalidate all insns from START up to the end of the function or the
6499    next label.  This called when we wish to CSE around a block that is
6500    conditionally executed.  */
6501
6502 static void
6503 invalidate_skipped_block (rtx start)
6504 {
6505   rtx insn;
6506
6507   for (insn = start; insn && !LABEL_P (insn);
6508        insn = NEXT_INSN (insn))
6509     {
6510       if (! INSN_P (insn))
6511         continue;
6512
6513       if (CALL_P (insn))
6514         {
6515           if (! CONST_OR_PURE_CALL_P (insn))
6516             invalidate_memory ();
6517           invalidate_for_call ();
6518         }
6519
6520       invalidate_from_clobbers (PATTERN (insn));
6521       note_stores (PATTERN (insn), invalidate_skipped_set, NULL);
6522     }
6523 }
6524 \f
6525 /* Find the end of INSN's basic block and return its range,
6526    the total number of SETs in all the insns of the block, the last insn of the
6527    block, and the branch path.
6528
6529    The branch path indicates which branches should be followed.  If a nonzero
6530    path size is specified, the block should be rescanned and a different set
6531    of branches will be taken.  The branch path is only used if
6532    FLAG_CSE_FOLLOW_JUMPS or FLAG_CSE_SKIP_BLOCKS is nonzero.
6533
6534    DATA is a pointer to a struct cse_basic_block_data, defined below, that is
6535    used to describe the block.  It is filled in with the information about
6536    the current block.  The incoming structure's branch path, if any, is used
6537    to construct the output branch path.  */
6538
6539 static void
6540 cse_end_of_basic_block (rtx insn, struct cse_basic_block_data *data,
6541                         int follow_jumps, int skip_blocks)
6542 {
6543   rtx p = insn, q;
6544   int nsets = 0;
6545   int low_cuid = INSN_CUID (insn), high_cuid = INSN_CUID (insn);
6546   rtx next = INSN_P (insn) ? insn : next_real_insn (insn);
6547   int path_size = data->path_size;
6548   int path_entry = 0;
6549   int i;
6550
6551   /* Update the previous branch path, if any.  If the last branch was
6552      previously PATH_TAKEN, mark it PATH_NOT_TAKEN.
6553      If it was previously PATH_NOT_TAKEN,
6554      shorten the path by one and look at the previous branch.  We know that
6555      at least one branch must have been taken if PATH_SIZE is nonzero.  */
6556   while (path_size > 0)
6557     {
6558       if (data->path[path_size - 1].status != PATH_NOT_TAKEN)
6559         {
6560           data->path[path_size - 1].status = PATH_NOT_TAKEN;
6561           break;
6562         }
6563       else
6564         path_size--;
6565     }
6566
6567   /* If the first instruction is marked with QImode, that means we've
6568      already processed this block.  Our caller will look at DATA->LAST
6569      to figure out where to go next.  We want to return the next block
6570      in the instruction stream, not some branched-to block somewhere
6571      else.  We accomplish this by pretending our called forbid us to
6572      follow jumps, or skip blocks.  */
6573   if (GET_MODE (insn) == QImode)
6574     follow_jumps = skip_blocks = 0;
6575
6576   /* Scan to end of this basic block.  */
6577   while (p && !LABEL_P (p))
6578     {
6579       /* Don't cse over a call to setjmp; on some machines (eg VAX)
6580          the regs restored by the longjmp come from
6581          a later time than the setjmp.  */
6582       if (PREV_INSN (p) && CALL_P (PREV_INSN (p))
6583           && find_reg_note (PREV_INSN (p), REG_SETJMP, NULL))
6584         break;
6585
6586       /* A PARALLEL can have lots of SETs in it,
6587          especially if it is really an ASM_OPERANDS.  */
6588       if (INSN_P (p) && GET_CODE (PATTERN (p)) == PARALLEL)
6589         nsets += XVECLEN (PATTERN (p), 0);
6590       else if (!NOTE_P (p))
6591         nsets += 1;
6592
6593       /* Ignore insns made by CSE; they cannot affect the boundaries of
6594          the basic block.  */
6595
6596       if (INSN_UID (p) <= max_uid && INSN_CUID (p) > high_cuid)
6597         high_cuid = INSN_CUID (p);
6598       if (INSN_UID (p) <= max_uid && INSN_CUID (p) < low_cuid)
6599         low_cuid = INSN_CUID (p);
6600
6601       /* See if this insn is in our branch path.  If it is and we are to
6602          take it, do so.  */
6603       if (path_entry < path_size && data->path[path_entry].branch == p)
6604         {
6605           if (data->path[path_entry].status != PATH_NOT_TAKEN)
6606             p = JUMP_LABEL (p);
6607
6608           /* Point to next entry in path, if any.  */
6609           path_entry++;
6610         }
6611
6612       /* If this is a conditional jump, we can follow it if -fcse-follow-jumps
6613          was specified, we haven't reached our maximum path length, there are
6614          insns following the target of the jump, this is the only use of the
6615          jump label, and the target label is preceded by a BARRIER.
6616
6617          Alternatively, we can follow the jump if it branches around a
6618          block of code and there are no other branches into the block.
6619          In this case invalidate_skipped_block will be called to invalidate any
6620          registers set in the block when following the jump.  */
6621
6622       else if ((follow_jumps || skip_blocks) && path_size < PARAM_VALUE (PARAM_MAX_CSE_PATH_LENGTH) - 1
6623                && JUMP_P (p)
6624                && GET_CODE (PATTERN (p)) == SET
6625                && GET_CODE (SET_SRC (PATTERN (p))) == IF_THEN_ELSE
6626                && JUMP_LABEL (p) != 0
6627                && LABEL_NUSES (JUMP_LABEL (p)) == 1
6628                && NEXT_INSN (JUMP_LABEL (p)) != 0)
6629         {
6630           for (q = PREV_INSN (JUMP_LABEL (p)); q; q = PREV_INSN (q))
6631             if ((!NOTE_P (q)
6632                  || NOTE_LINE_NUMBER (q) == NOTE_INSN_LOOP_END
6633                  || (PREV_INSN (q) && CALL_P (PREV_INSN (q))
6634                      && find_reg_note (PREV_INSN (q), REG_SETJMP, NULL)))
6635                 && (!LABEL_P (q) || LABEL_NUSES (q) != 0))
6636               break;
6637
6638           /* If we ran into a BARRIER, this code is an extension of the
6639              basic block when the branch is taken.  */
6640           if (follow_jumps && q != 0 && BARRIER_P (q))
6641             {
6642               /* Don't allow ourself to keep walking around an
6643                  always-executed loop.  */
6644               if (next_real_insn (q) == next)
6645                 {
6646                   p = NEXT_INSN (p);
6647                   continue;
6648                 }
6649
6650               /* Similarly, don't put a branch in our path more than once.  */
6651               for (i = 0; i < path_entry; i++)
6652                 if (data->path[i].branch == p)
6653                   break;
6654
6655               if (i != path_entry)
6656                 break;
6657
6658               data->path[path_entry].branch = p;
6659               data->path[path_entry++].status = PATH_TAKEN;
6660
6661               /* This branch now ends our path.  It was possible that we
6662                  didn't see this branch the last time around (when the
6663                  insn in front of the target was a JUMP_INSN that was
6664                  turned into a no-op).  */
6665               path_size = path_entry;
6666
6667               p = JUMP_LABEL (p);
6668               /* Mark block so we won't scan it again later.  */
6669               PUT_MODE (NEXT_INSN (p), QImode);
6670             }
6671           /* Detect a branch around a block of code.  */
6672           else if (skip_blocks && q != 0 && !LABEL_P (q))
6673             {
6674               rtx tmp;
6675
6676               if (next_real_insn (q) == next)
6677                 {
6678                   p = NEXT_INSN (p);
6679                   continue;
6680                 }
6681
6682               for (i = 0; i < path_entry; i++)
6683                 if (data->path[i].branch == p)
6684                   break;
6685
6686               if (i != path_entry)
6687                 break;
6688
6689               /* This is no_labels_between_p (p, q) with an added check for
6690                  reaching the end of a function (in case Q precedes P).  */
6691               for (tmp = NEXT_INSN (p); tmp && tmp != q; tmp = NEXT_INSN (tmp))
6692                 if (LABEL_P (tmp))
6693                   break;
6694
6695               if (tmp == q)
6696                 {
6697                   data->path[path_entry].branch = p;
6698                   data->path[path_entry++].status = PATH_AROUND;
6699
6700                   path_size = path_entry;
6701
6702                   p = JUMP_LABEL (p);
6703                   /* Mark block so we won't scan it again later.  */
6704                   PUT_MODE (NEXT_INSN (p), QImode);
6705                 }
6706             }
6707         }
6708       p = NEXT_INSN (p);
6709     }
6710
6711   data->low_cuid = low_cuid;
6712   data->high_cuid = high_cuid;
6713   data->nsets = nsets;
6714   data->last = p;
6715
6716   /* If all jumps in the path are not taken, set our path length to zero
6717      so a rescan won't be done.  */
6718   for (i = path_size - 1; i >= 0; i--)
6719     if (data->path[i].status != PATH_NOT_TAKEN)
6720       break;
6721
6722   if (i == -1)
6723     data->path_size = 0;
6724   else
6725     data->path_size = path_size;
6726
6727   /* End the current branch path.  */
6728   data->path[path_size].branch = 0;
6729 }
6730 \f
6731 /* Perform cse on the instructions of a function.
6732    F is the first instruction.
6733    NREGS is one plus the highest pseudo-reg number used in the instruction.
6734
6735    Returns 1 if jump_optimize should be redone due to simplifications
6736    in conditional jump instructions.  */
6737
6738 int
6739 cse_main (rtx f, int nregs, FILE *file)
6740 {
6741   struct cse_basic_block_data val;
6742   rtx insn = f;
6743   int i;
6744
6745   init_cse_reg_info (nregs);
6746
6747   val.path = xmalloc (sizeof (struct branch_path)
6748                       * PARAM_VALUE (PARAM_MAX_CSE_PATH_LENGTH));
6749
6750   cse_jumps_altered = 0;
6751   recorded_label_ref = 0;
6752   constant_pool_entries_cost = 0;
6753   constant_pool_entries_regcost = 0;
6754   val.path_size = 0;
6755   rtl_hooks = cse_rtl_hooks;
6756
6757   init_recog ();
6758   init_alias_analysis ();
6759
6760   reg_eqv_table = xmalloc (nregs * sizeof (struct reg_eqv_elem));
6761
6762   /* Find the largest uid.  */
6763
6764   max_uid = get_max_uid ();
6765   uid_cuid = xcalloc (max_uid + 1, sizeof (int));
6766
6767   /* Compute the mapping from uids to cuids.
6768      CUIDs are numbers assigned to insns, like uids,
6769      except that cuids increase monotonically through the code.
6770      Don't assign cuids to line-number NOTEs, so that the distance in cuids
6771      between two insns is not affected by -g.  */
6772
6773   for (insn = f, i = 0; insn; insn = NEXT_INSN (insn))
6774     {
6775       if (!NOTE_P (insn)
6776           || NOTE_LINE_NUMBER (insn) < 0)
6777         INSN_CUID (insn) = ++i;
6778       else
6779         /* Give a line number note the same cuid as preceding insn.  */
6780         INSN_CUID (insn) = i;
6781     }
6782
6783   /* Loop over basic blocks.
6784      Compute the maximum number of qty's needed for each basic block
6785      (which is 2 for each SET).  */
6786   insn = f;
6787   while (insn)
6788     {
6789       cse_altered = 0;
6790       cse_end_of_basic_block (insn, &val, flag_cse_follow_jumps,
6791                               flag_cse_skip_blocks);
6792
6793       /* If this basic block was already processed or has no sets, skip it.  */
6794       if (val.nsets == 0 || GET_MODE (insn) == QImode)
6795         {
6796           PUT_MODE (insn, VOIDmode);
6797           insn = (val.last ? NEXT_INSN (val.last) : 0);
6798           val.path_size = 0;
6799           continue;
6800         }
6801
6802       cse_basic_block_start = val.low_cuid;
6803       cse_basic_block_end = val.high_cuid;
6804       max_qty = val.nsets * 2;
6805
6806       if (file)
6807         fprintf (file, ";; Processing block from %d to %d, %d sets.\n",
6808                  INSN_UID (insn), val.last ? INSN_UID (val.last) : 0,
6809                  val.nsets);
6810
6811       /* Make MAX_QTY bigger to give us room to optimize
6812          past the end of this basic block, if that should prove useful.  */
6813       if (max_qty < 500)
6814         max_qty = 500;
6815
6816       /* If this basic block is being extended by following certain jumps,
6817          (see `cse_end_of_basic_block'), we reprocess the code from the start.
6818          Otherwise, we start after this basic block.  */
6819       if (val.path_size > 0)
6820         cse_basic_block (insn, val.last, val.path);
6821       else
6822         {
6823           int old_cse_jumps_altered = cse_jumps_altered;
6824           rtx temp;
6825
6826           /* When cse changes a conditional jump to an unconditional
6827              jump, we want to reprocess the block, since it will give
6828              us a new branch path to investigate.  */
6829           cse_jumps_altered = 0;
6830           temp = cse_basic_block (insn, val.last, val.path);
6831           if (cse_jumps_altered == 0
6832               || (flag_cse_follow_jumps == 0 && flag_cse_skip_blocks == 0))
6833             insn = temp;
6834
6835           cse_jumps_altered |= old_cse_jumps_altered;
6836         }
6837
6838       if (cse_altered)
6839         ggc_collect ();
6840
6841 #ifdef USE_C_ALLOCA
6842       alloca (0);
6843 #endif
6844     }
6845
6846   /* Clean up.  */
6847   end_alias_analysis ();
6848   free (uid_cuid);
6849   free (reg_eqv_table);
6850   free (val.path);
6851   rtl_hooks = general_rtl_hooks;
6852
6853   return cse_jumps_altered || recorded_label_ref;
6854 }
6855
6856 /* Process a single basic block.  FROM and TO and the limits of the basic
6857    block.  NEXT_BRANCH points to the branch path when following jumps or
6858    a null path when not following jumps.  */
6859
6860 static rtx
6861 cse_basic_block (rtx from, rtx to, struct branch_path *next_branch)
6862 {
6863   rtx insn;
6864   int to_usage = 0;
6865   rtx libcall_insn = NULL_RTX;
6866   int num_insns = 0;
6867   int no_conflict = 0;
6868
6869   /* Allocate the space needed by qty_table.  */
6870   qty_table = xmalloc (max_qty * sizeof (struct qty_table_elem));
6871
6872   new_basic_block ();
6873
6874   /* TO might be a label.  If so, protect it from being deleted.  */
6875   if (to != 0 && LABEL_P (to))
6876     ++LABEL_NUSES (to);
6877
6878   for (insn = from; insn != to; insn = NEXT_INSN (insn))
6879     {
6880       enum rtx_code code = GET_CODE (insn);
6881
6882       /* If we have processed 1,000 insns, flush the hash table to
6883          avoid extreme quadratic behavior.  We must not include NOTEs
6884          in the count since there may be more of them when generating
6885          debugging information.  If we clear the table at different
6886          times, code generated with -g -O might be different than code
6887          generated with -O but not -g.
6888
6889          ??? This is a real kludge and needs to be done some other way.
6890          Perhaps for 2.9.  */
6891       if (code != NOTE && num_insns++ > 1000)
6892         {
6893           flush_hash_table ();
6894           num_insns = 0;
6895         }
6896
6897       /* See if this is a branch that is part of the path.  If so, and it is
6898          to be taken, do so.  */
6899       if (next_branch->branch == insn)
6900         {
6901           enum taken status = next_branch++->status;
6902           if (status != PATH_NOT_TAKEN)
6903             {
6904               if (status == PATH_TAKEN)
6905                 record_jump_equiv (insn, 1);
6906               else
6907                 invalidate_skipped_block (NEXT_INSN (insn));
6908
6909               /* Set the last insn as the jump insn; it doesn't affect cc0.
6910                  Then follow this branch.  */
6911 #ifdef HAVE_cc0
6912               prev_insn_cc0 = 0;
6913               prev_insn = insn;
6914 #endif
6915               insn = JUMP_LABEL (insn);
6916               continue;
6917             }
6918         }
6919
6920       if (GET_MODE (insn) == QImode)
6921         PUT_MODE (insn, VOIDmode);
6922
6923       if (GET_RTX_CLASS (code) == RTX_INSN)
6924         {
6925           rtx p;
6926
6927           /* Process notes first so we have all notes in canonical forms when
6928              looking for duplicate operations.  */
6929
6930           if (REG_NOTES (insn))
6931             REG_NOTES (insn) = cse_process_notes (REG_NOTES (insn), NULL_RTX);
6932
6933           /* Track when we are inside in LIBCALL block.  Inside such a block,
6934              we do not want to record destinations.  The last insn of a
6935              LIBCALL block is not considered to be part of the block, since
6936              its destination is the result of the block and hence should be
6937              recorded.  */
6938
6939           if (REG_NOTES (insn) != 0)
6940             {
6941               if ((p = find_reg_note (insn, REG_LIBCALL, NULL_RTX)))
6942                 libcall_insn = XEXP (p, 0);
6943               else if (find_reg_note (insn, REG_RETVAL, NULL_RTX))
6944                 {
6945                   /* Keep libcall_insn for the last SET insn of a no-conflict
6946                      block to prevent changing the destination.  */
6947                   if (! no_conflict)
6948                     libcall_insn = 0;
6949                   else
6950                     no_conflict = -1;
6951                 }
6952               else if (find_reg_note (insn, REG_NO_CONFLICT, NULL_RTX))
6953                 no_conflict = 1;
6954             }
6955
6956           cse_insn (insn, libcall_insn);
6957
6958           if (no_conflict == -1)
6959             {
6960               libcall_insn = 0;
6961               no_conflict = 0;
6962             }
6963             
6964           /* If we haven't already found an insn where we added a LABEL_REF,
6965              check this one.  */
6966           if (NONJUMP_INSN_P (insn) && ! recorded_label_ref
6967               && for_each_rtx (&PATTERN (insn), check_for_label_ref,
6968                                (void *) insn))
6969             recorded_label_ref = 1;
6970         }
6971
6972       /* If INSN is now an unconditional jump, skip to the end of our
6973          basic block by pretending that we just did the last insn in the
6974          basic block.  If we are jumping to the end of our block, show
6975          that we can have one usage of TO.  */
6976
6977       if (any_uncondjump_p (insn))
6978         {
6979           if (to == 0)
6980             {
6981               free (qty_table);
6982               return 0;
6983             }
6984
6985           if (JUMP_LABEL (insn) == to)
6986             to_usage = 1;
6987
6988           /* Maybe TO was deleted because the jump is unconditional.
6989              If so, there is nothing left in this basic block.  */
6990           /* ??? Perhaps it would be smarter to set TO
6991              to whatever follows this insn,
6992              and pretend the basic block had always ended here.  */
6993           if (INSN_DELETED_P (to))
6994             break;
6995
6996           insn = PREV_INSN (to);
6997         }
6998
6999       /* See if it is ok to keep on going past the label
7000          which used to end our basic block.  Remember that we incremented
7001          the count of that label, so we decrement it here.  If we made
7002          a jump unconditional, TO_USAGE will be one; in that case, we don't
7003          want to count the use in that jump.  */
7004
7005       if (to != 0 && NEXT_INSN (insn) == to
7006           && LABEL_P (to) && --LABEL_NUSES (to) == to_usage)
7007         {
7008           struct cse_basic_block_data val;
7009           rtx prev;
7010
7011           insn = NEXT_INSN (to);
7012
7013           /* If TO was the last insn in the function, we are done.  */
7014           if (insn == 0)
7015             {
7016               free (qty_table);
7017               return 0;
7018             }
7019
7020           /* If TO was preceded by a BARRIER we are done with this block
7021              because it has no continuation.  */
7022           prev = prev_nonnote_insn (to);
7023           if (prev && BARRIER_P (prev))
7024             {
7025               free (qty_table);
7026               return insn;
7027             }
7028
7029           /* Find the end of the following block.  Note that we won't be
7030              following branches in this case.  */
7031           to_usage = 0;
7032           val.path_size = 0;
7033           val.path = xmalloc (sizeof (struct branch_path)
7034                               * PARAM_VALUE (PARAM_MAX_CSE_PATH_LENGTH));
7035           cse_end_of_basic_block (insn, &val, 0, 0);
7036           free (val.path);
7037
7038           /* If the tables we allocated have enough space left
7039              to handle all the SETs in the next basic block,
7040              continue through it.  Otherwise, return,
7041              and that block will be scanned individually.  */
7042           if (val.nsets * 2 + next_qty > max_qty)
7043             break;
7044
7045           cse_basic_block_start = val.low_cuid;
7046           cse_basic_block_end = val.high_cuid;
7047           to = val.last;
7048
7049           /* Prevent TO from being deleted if it is a label.  */
7050           if (to != 0 && LABEL_P (to))
7051             ++LABEL_NUSES (to);
7052
7053           /* Back up so we process the first insn in the extension.  */
7054           insn = PREV_INSN (insn);
7055         }
7056     }
7057
7058   gcc_assert (next_qty <= max_qty);
7059
7060   free (qty_table);
7061
7062   return to ? NEXT_INSN (to) : 0;
7063 }
7064 \f
7065 /* Called via for_each_rtx to see if an insn is using a LABEL_REF for which
7066    there isn't a REG_LABEL note.  Return one if so.  DATA is the insn.  */
7067
7068 static int
7069 check_for_label_ref (rtx *rtl, void *data)
7070 {
7071   rtx insn = (rtx) data;
7072
7073   /* If this insn uses a LABEL_REF and there isn't a REG_LABEL note for it,
7074      we must rerun jump since it needs to place the note.  If this is a
7075      LABEL_REF for a CODE_LABEL that isn't in the insn chain, don't do this
7076      since no REG_LABEL will be added.  */
7077   return (GET_CODE (*rtl) == LABEL_REF
7078           && ! LABEL_REF_NONLOCAL_P (*rtl)
7079           && LABEL_P (XEXP (*rtl, 0))
7080           && INSN_UID (XEXP (*rtl, 0)) != 0
7081           && ! find_reg_note (insn, REG_LABEL, XEXP (*rtl, 0)));
7082 }
7083 \f
7084 /* Count the number of times registers are used (not set) in X.
7085    COUNTS is an array in which we accumulate the count, INCR is how much
7086    we count each register usage.
7087
7088    Don't count a usage of DEST, which is the SET_DEST of a SET which
7089    contains X in its SET_SRC.  This is because such a SET does not
7090    modify the liveness of DEST.
7091    DEST is set to pc_rtx for a trapping insn, which means that we must count
7092    uses of a SET_DEST regardless because the insn can't be deleted here.  */
7093
7094 static void
7095 count_reg_usage (rtx x, int *counts, rtx dest, int incr)
7096 {
7097   enum rtx_code code;
7098   rtx note;
7099   const char *fmt;
7100   int i, j;
7101
7102   if (x == 0)
7103     return;
7104
7105   switch (code = GET_CODE (x))
7106     {
7107     case REG:
7108       if (x != dest)
7109         counts[REGNO (x)] += incr;
7110       return;
7111
7112     case PC:
7113     case CC0:
7114     case CONST:
7115     case CONST_INT:
7116     case CONST_DOUBLE:
7117     case CONST_VECTOR:
7118     case SYMBOL_REF:
7119     case LABEL_REF:
7120       return;
7121
7122     case CLOBBER:
7123       /* If we are clobbering a MEM, mark any registers inside the address
7124          as being used.  */
7125       if (MEM_P (XEXP (x, 0)))
7126         count_reg_usage (XEXP (XEXP (x, 0), 0), counts, NULL_RTX, incr);
7127       return;
7128
7129     case SET:
7130       /* Unless we are setting a REG, count everything in SET_DEST.  */
7131       if (!REG_P (SET_DEST (x)))
7132         count_reg_usage (SET_DEST (x), counts, NULL_RTX, incr);
7133       count_reg_usage (SET_SRC (x), counts,
7134                        dest ? dest : SET_DEST (x),
7135                        incr);
7136       return;
7137
7138     case CALL_INSN:
7139     case INSN:
7140     case JUMP_INSN:
7141     /* We expect dest to be NULL_RTX here.  If the insn may trap, mark
7142        this fact by setting DEST to pc_rtx.  */
7143       if (flag_non_call_exceptions && may_trap_p (PATTERN (x)))
7144         dest = pc_rtx;
7145       if (code == CALL_INSN)
7146         count_reg_usage (CALL_INSN_FUNCTION_USAGE (x), counts, dest, incr);
7147       count_reg_usage (PATTERN (x), counts, dest, incr);
7148
7149       /* Things used in a REG_EQUAL note aren't dead since loop may try to
7150          use them.  */
7151
7152       note = find_reg_equal_equiv_note (x);
7153       if (note)
7154         {
7155           rtx eqv = XEXP (note, 0);
7156
7157           if (GET_CODE (eqv) == EXPR_LIST)
7158           /* This REG_EQUAL note describes the result of a function call.
7159              Process all the arguments.  */
7160             do
7161               {
7162                 count_reg_usage (XEXP (eqv, 0), counts, dest, incr);
7163                 eqv = XEXP (eqv, 1);
7164               }
7165             while (eqv && GET_CODE (eqv) == EXPR_LIST);
7166           else
7167             count_reg_usage (eqv, counts, dest, incr);
7168         }
7169       return;
7170
7171     case EXPR_LIST:
7172       if (REG_NOTE_KIND (x) == REG_EQUAL
7173           || (REG_NOTE_KIND (x) != REG_NONNEG && GET_CODE (XEXP (x,0)) == USE)
7174           /* FUNCTION_USAGE expression lists may include (CLOBBER (mem /u)),
7175              involving registers in the address.  */
7176           || GET_CODE (XEXP (x, 0)) == CLOBBER)
7177         count_reg_usage (XEXP (x, 0), counts, NULL_RTX, incr);
7178
7179       count_reg_usage (XEXP (x, 1), counts, NULL_RTX, incr);
7180       return;
7181
7182     case ASM_OPERANDS:
7183       /* If the asm is volatile, then this insn cannot be deleted,
7184          and so the inputs *must* be live.  */
7185       if (MEM_VOLATILE_P (x))
7186         dest = NULL_RTX;
7187       /* Iterate over just the inputs, not the constraints as well.  */
7188       for (i = ASM_OPERANDS_INPUT_LENGTH (x) - 1; i >= 0; i--)
7189         count_reg_usage (ASM_OPERANDS_INPUT (x, i), counts, dest, incr);
7190       return;
7191
7192     case INSN_LIST:
7193       gcc_unreachable ();
7194
7195     default:
7196       break;
7197     }
7198
7199   fmt = GET_RTX_FORMAT (code);
7200   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
7201     {
7202       if (fmt[i] == 'e')
7203         count_reg_usage (XEXP (x, i), counts, dest, incr);
7204       else if (fmt[i] == 'E')
7205         for (j = XVECLEN (x, i) - 1; j >= 0; j--)
7206           count_reg_usage (XVECEXP (x, i, j), counts, dest, incr);
7207     }
7208 }
7209 \f
7210 /* Return true if set is live.  */
7211 static bool
7212 set_live_p (rtx set, rtx insn ATTRIBUTE_UNUSED, /* Only used with HAVE_cc0.  */
7213             int *counts)
7214 {
7215 #ifdef HAVE_cc0
7216   rtx tem;
7217 #endif
7218
7219   if (set_noop_p (set))
7220     ;
7221
7222 #ifdef HAVE_cc0
7223   else if (GET_CODE (SET_DEST (set)) == CC0
7224            && !side_effects_p (SET_SRC (set))
7225            && ((tem = next_nonnote_insn (insn)) == 0
7226                || !INSN_P (tem)
7227                || !reg_referenced_p (cc0_rtx, PATTERN (tem))))
7228     return false;
7229 #endif
7230   else if (!REG_P (SET_DEST (set))
7231            || REGNO (SET_DEST (set)) < FIRST_PSEUDO_REGISTER
7232            || counts[REGNO (SET_DEST (set))] != 0
7233            || side_effects_p (SET_SRC (set)))
7234     return true;
7235   return false;
7236 }
7237
7238 /* Return true if insn is live.  */
7239
7240 static bool
7241 insn_live_p (rtx insn, int *counts)
7242 {
7243   int i;
7244   if (flag_non_call_exceptions && may_trap_p (PATTERN (insn)))
7245     return true;
7246   else if (GET_CODE (PATTERN (insn)) == SET)
7247     return set_live_p (PATTERN (insn), insn, counts);
7248   else if (GET_CODE (PATTERN (insn)) == PARALLEL)
7249     {
7250       for (i = XVECLEN (PATTERN (insn), 0) - 1; i >= 0; i--)
7251         {
7252           rtx elt = XVECEXP (PATTERN (insn), 0, i);
7253
7254           if (GET_CODE (elt) == SET)
7255             {
7256               if (set_live_p (elt, insn, counts))
7257                 return true;
7258             }
7259           else if (GET_CODE (elt) != CLOBBER && GET_CODE (elt) != USE)
7260             return true;
7261         }
7262       return false;
7263     }
7264   else
7265     return true;
7266 }
7267
7268 /* Return true if libcall is dead as a whole.  */
7269
7270 static bool
7271 dead_libcall_p (rtx insn, int *counts)
7272 {
7273   rtx note, set, new;
7274
7275   /* See if there's a REG_EQUAL note on this insn and try to
7276      replace the source with the REG_EQUAL expression.
7277
7278      We assume that insns with REG_RETVALs can only be reg->reg
7279      copies at this point.  */
7280   note = find_reg_note (insn, REG_EQUAL, NULL_RTX);
7281   if (!note)
7282     return false;
7283
7284   set = single_set (insn);
7285   if (!set)
7286     return false;
7287
7288   new = simplify_rtx (XEXP (note, 0));
7289   if (!new)
7290     new = XEXP (note, 0);
7291
7292   /* While changing insn, we must update the counts accordingly.  */
7293   count_reg_usage (insn, counts, NULL_RTX, -1);
7294
7295   if (validate_change (insn, &SET_SRC (set), new, 0))
7296     {
7297       count_reg_usage (insn, counts, NULL_RTX, 1);
7298       remove_note (insn, find_reg_note (insn, REG_RETVAL, NULL_RTX));
7299       remove_note (insn, note);
7300       return true;
7301     }
7302
7303   if (CONSTANT_P (new))
7304     {
7305       new = force_const_mem (GET_MODE (SET_DEST (set)), new);
7306       if (new && validate_change (insn, &SET_SRC (set), new, 0))
7307         {
7308           count_reg_usage (insn, counts, NULL_RTX, 1);
7309           remove_note (insn, find_reg_note (insn, REG_RETVAL, NULL_RTX));
7310           remove_note (insn, note);
7311           return true;
7312         }
7313     }
7314
7315   count_reg_usage (insn, counts, NULL_RTX, 1);
7316   return false;
7317 }
7318
7319 /* Scan all the insns and delete any that are dead; i.e., they store a register
7320    that is never used or they copy a register to itself.
7321
7322    This is used to remove insns made obviously dead by cse, loop or other
7323    optimizations.  It improves the heuristics in loop since it won't try to
7324    move dead invariants out of loops or make givs for dead quantities.  The
7325    remaining passes of the compilation are also sped up.  */
7326
7327 int
7328 delete_trivially_dead_insns (rtx insns, int nreg)
7329 {
7330   int *counts;
7331   rtx insn, prev;
7332   int in_libcall = 0, dead_libcall = 0;
7333   int ndead = 0;
7334
7335   timevar_push (TV_DELETE_TRIVIALLY_DEAD);
7336   /* First count the number of times each register is used.  */
7337   counts = xcalloc (nreg, sizeof (int));
7338   for (insn = insns; insn; insn = NEXT_INSN (insn))
7339     if (INSN_P (insn))
7340       count_reg_usage (insn, counts, NULL_RTX, 1);
7341
7342   /* Go from the last insn to the first and delete insns that only set unused
7343      registers or copy a register to itself.  As we delete an insn, remove
7344      usage counts for registers it uses.
7345
7346      The first jump optimization pass may leave a real insn as the last
7347      insn in the function.   We must not skip that insn or we may end
7348      up deleting code that is not really dead.  */
7349   for (insn = get_last_insn (); insn; insn = prev)
7350     {
7351       int live_insn = 0;
7352
7353       prev = PREV_INSN (insn);
7354       if (!INSN_P (insn))
7355         continue;
7356
7357       /* Don't delete any insns that are part of a libcall block unless
7358          we can delete the whole libcall block.
7359
7360          Flow or loop might get confused if we did that.  Remember
7361          that we are scanning backwards.  */
7362       if (find_reg_note (insn, REG_RETVAL, NULL_RTX))
7363         {
7364           in_libcall = 1;
7365           live_insn = 1;
7366           dead_libcall = dead_libcall_p (insn, counts);
7367         }
7368       else if (in_libcall)
7369         live_insn = ! dead_libcall;
7370       else
7371         live_insn = insn_live_p (insn, counts);
7372
7373       /* If this is a dead insn, delete it and show registers in it aren't
7374          being used.  */
7375
7376       if (! live_insn)
7377         {
7378           count_reg_usage (insn, counts, NULL_RTX, -1);
7379           delete_insn_and_edges (insn);
7380           ndead++;
7381         }
7382
7383       if (in_libcall && find_reg_note (insn, REG_LIBCALL, NULL_RTX))
7384         {
7385           in_libcall = 0;
7386           dead_libcall = 0;
7387         }
7388     }
7389
7390   if (dump_file && ndead)
7391     fprintf (dump_file, "Deleted %i trivially dead insns\n",
7392              ndead);
7393   /* Clean up.  */
7394   free (counts);
7395   timevar_pop (TV_DELETE_TRIVIALLY_DEAD);
7396   return ndead;
7397 }
7398
7399 /* This function is called via for_each_rtx.  The argument, NEWREG, is
7400    a condition code register with the desired mode.  If we are looking
7401    at the same register in a different mode, replace it with
7402    NEWREG.  */
7403
7404 static int
7405 cse_change_cc_mode (rtx *loc, void *data)
7406 {
7407   struct change_cc_mode_args* args = (struct change_cc_mode_args*)data;
7408
7409   if (*loc
7410       && REG_P (*loc)
7411       && REGNO (*loc) == REGNO (args->newreg)
7412       && GET_MODE (*loc) != GET_MODE (args->newreg))
7413     {
7414       validate_change (args->insn, loc, args->newreg, 1);
7415       
7416       return -1;
7417     }
7418   return 0;
7419 }
7420
7421 /* Change the mode of any reference to the register REGNO (NEWREG) to
7422    GET_MODE (NEWREG) in INSN.  */
7423
7424 static void
7425 cse_change_cc_mode_insn (rtx insn, rtx newreg)
7426 {
7427   struct change_cc_mode_args args;
7428   int success;
7429
7430   if (!INSN_P (insn))
7431     return;
7432
7433   args.insn = insn;
7434   args.newreg = newreg;
7435   
7436   for_each_rtx (&PATTERN (insn), cse_change_cc_mode, &args);
7437   for_each_rtx (&REG_NOTES (insn), cse_change_cc_mode, &args);
7438   
7439   /* If the following assertion was triggered, there is most probably
7440      something wrong with the cc_modes_compatible back end function.
7441      CC modes only can be considered compatible if the insn - with the mode
7442      replaced by any of the compatible modes - can still be recognized.  */
7443   success = apply_change_group ();
7444   gcc_assert (success);
7445 }
7446
7447 /* Change the mode of any reference to the register REGNO (NEWREG) to
7448    GET_MODE (NEWREG), starting at START.  Stop before END.  Stop at
7449    any instruction which modifies NEWREG.  */
7450
7451 static void
7452 cse_change_cc_mode_insns (rtx start, rtx end, rtx newreg)
7453 {
7454   rtx insn;
7455
7456   for (insn = start; insn != end; insn = NEXT_INSN (insn))
7457     {
7458       if (! INSN_P (insn))
7459         continue;
7460
7461       if (reg_set_p (newreg, insn))
7462         return;
7463
7464       cse_change_cc_mode_insn (insn, newreg);
7465     }
7466 }
7467
7468 /* BB is a basic block which finishes with CC_REG as a condition code
7469    register which is set to CC_SRC.  Look through the successors of BB
7470    to find blocks which have a single predecessor (i.e., this one),
7471    and look through those blocks for an assignment to CC_REG which is
7472    equivalent to CC_SRC.  CAN_CHANGE_MODE indicates whether we are
7473    permitted to change the mode of CC_SRC to a compatible mode.  This
7474    returns VOIDmode if no equivalent assignments were found.
7475    Otherwise it returns the mode which CC_SRC should wind up with.
7476
7477    The main complexity in this function is handling the mode issues.
7478    We may have more than one duplicate which we can eliminate, and we
7479    try to find a mode which will work for multiple duplicates.  */
7480
7481 static enum machine_mode
7482 cse_cc_succs (basic_block bb, rtx cc_reg, rtx cc_src, bool can_change_mode)
7483 {
7484   bool found_equiv;
7485   enum machine_mode mode;
7486   unsigned int insn_count;
7487   edge e;
7488   rtx insns[2];
7489   enum machine_mode modes[2];
7490   rtx last_insns[2];
7491   unsigned int i;
7492   rtx newreg;
7493   edge_iterator ei;
7494
7495   /* We expect to have two successors.  Look at both before picking
7496      the final mode for the comparison.  If we have more successors
7497      (i.e., some sort of table jump, although that seems unlikely),
7498      then we require all beyond the first two to use the same
7499      mode.  */
7500
7501   found_equiv = false;
7502   mode = GET_MODE (cc_src);
7503   insn_count = 0;
7504   FOR_EACH_EDGE (e, ei, bb->succs)
7505     {
7506       rtx insn;
7507       rtx end;
7508
7509       if (e->flags & EDGE_COMPLEX)
7510         continue;
7511
7512       if (EDGE_COUNT (e->dest->preds) != 1
7513           || e->dest == EXIT_BLOCK_PTR)
7514         continue;
7515
7516       end = NEXT_INSN (BB_END (e->dest));
7517       for (insn = BB_HEAD (e->dest); insn != end; insn = NEXT_INSN (insn))
7518         {
7519           rtx set;
7520
7521           if (! INSN_P (insn))
7522             continue;
7523
7524           /* If CC_SRC is modified, we have to stop looking for
7525              something which uses it.  */
7526           if (modified_in_p (cc_src, insn))
7527             break;
7528
7529           /* Check whether INSN sets CC_REG to CC_SRC.  */
7530           set = single_set (insn);
7531           if (set
7532               && REG_P (SET_DEST (set))
7533               && REGNO (SET_DEST (set)) == REGNO (cc_reg))
7534             {
7535               bool found;
7536               enum machine_mode set_mode;
7537               enum machine_mode comp_mode;
7538
7539               found = false;
7540               set_mode = GET_MODE (SET_SRC (set));
7541               comp_mode = set_mode;
7542               if (rtx_equal_p (cc_src, SET_SRC (set)))
7543                 found = true;
7544               else if (GET_CODE (cc_src) == COMPARE
7545                        && GET_CODE (SET_SRC (set)) == COMPARE
7546                        && mode != set_mode
7547                        && rtx_equal_p (XEXP (cc_src, 0),
7548                                        XEXP (SET_SRC (set), 0))
7549                        && rtx_equal_p (XEXP (cc_src, 1),
7550                                        XEXP (SET_SRC (set), 1)))
7551                            
7552                 {
7553                   comp_mode = targetm.cc_modes_compatible (mode, set_mode);
7554                   if (comp_mode != VOIDmode
7555                       && (can_change_mode || comp_mode == mode))
7556                     found = true;
7557                 }
7558
7559               if (found)
7560                 {
7561                   found_equiv = true;
7562                   if (insn_count < ARRAY_SIZE (insns))
7563                     {
7564                       insns[insn_count] = insn;
7565                       modes[insn_count] = set_mode;
7566                       last_insns[insn_count] = end;
7567                       ++insn_count;
7568
7569                       if (mode != comp_mode)
7570                         {
7571                           gcc_assert (can_change_mode);
7572                           mode = comp_mode;
7573
7574                           /* The modified insn will be re-recognized later.  */
7575                           PUT_MODE (cc_src, mode);
7576                         }
7577                     }
7578                   else
7579                     {
7580                       if (set_mode != mode)
7581                         {
7582                           /* We found a matching expression in the
7583                              wrong mode, but we don't have room to
7584                              store it in the array.  Punt.  This case
7585                              should be rare.  */
7586                           break;
7587                         }
7588                       /* INSN sets CC_REG to a value equal to CC_SRC
7589                          with the right mode.  We can simply delete
7590                          it.  */
7591                       delete_insn (insn);
7592                     }
7593
7594                   /* We found an instruction to delete.  Keep looking,
7595                      in the hopes of finding a three-way jump.  */
7596                   continue;
7597                 }
7598
7599               /* We found an instruction which sets the condition
7600                  code, so don't look any farther.  */
7601               break;
7602             }
7603
7604           /* If INSN sets CC_REG in some other way, don't look any
7605              farther.  */
7606           if (reg_set_p (cc_reg, insn))
7607             break;
7608         }
7609
7610       /* If we fell off the bottom of the block, we can keep looking
7611          through successors.  We pass CAN_CHANGE_MODE as false because
7612          we aren't prepared to handle compatibility between the
7613          further blocks and this block.  */
7614       if (insn == end)
7615         {
7616           enum machine_mode submode;
7617
7618           submode = cse_cc_succs (e->dest, cc_reg, cc_src, false);
7619           if (submode != VOIDmode)
7620             {
7621               gcc_assert (submode == mode);
7622               found_equiv = true;
7623               can_change_mode = false;
7624             }
7625         }
7626     }
7627
7628   if (! found_equiv)
7629     return VOIDmode;
7630
7631   /* Now INSN_COUNT is the number of instructions we found which set
7632      CC_REG to a value equivalent to CC_SRC.  The instructions are in
7633      INSNS.  The modes used by those instructions are in MODES.  */
7634
7635   newreg = NULL_RTX;
7636   for (i = 0; i < insn_count; ++i)
7637     {
7638       if (modes[i] != mode)
7639         {
7640           /* We need to change the mode of CC_REG in INSNS[i] and
7641              subsequent instructions.  */
7642           if (! newreg)
7643             {
7644               if (GET_MODE (cc_reg) == mode)
7645                 newreg = cc_reg;
7646               else
7647                 newreg = gen_rtx_REG (mode, REGNO (cc_reg));
7648             }
7649           cse_change_cc_mode_insns (NEXT_INSN (insns[i]), last_insns[i],
7650                                     newreg);
7651         }
7652
7653       delete_insn (insns[i]);
7654     }
7655
7656   return mode;
7657 }
7658
7659 /* If we have a fixed condition code register (or two), walk through
7660    the instructions and try to eliminate duplicate assignments.  */
7661
7662 void
7663 cse_condition_code_reg (void)
7664 {
7665   unsigned int cc_regno_1;
7666   unsigned int cc_regno_2;
7667   rtx cc_reg_1;
7668   rtx cc_reg_2;
7669   basic_block bb;
7670
7671   if (! targetm.fixed_condition_code_regs (&cc_regno_1, &cc_regno_2))
7672     return;
7673
7674   cc_reg_1 = gen_rtx_REG (CCmode, cc_regno_1);
7675   if (cc_regno_2 != INVALID_REGNUM)
7676     cc_reg_2 = gen_rtx_REG (CCmode, cc_regno_2);
7677   else
7678     cc_reg_2 = NULL_RTX;
7679
7680   FOR_EACH_BB (bb)
7681     {
7682       rtx last_insn;
7683       rtx cc_reg;
7684       rtx insn;
7685       rtx cc_src_insn;
7686       rtx cc_src;
7687       enum machine_mode mode;
7688       enum machine_mode orig_mode;
7689
7690       /* Look for blocks which end with a conditional jump based on a
7691          condition code register.  Then look for the instruction which
7692          sets the condition code register.  Then look through the
7693          successor blocks for instructions which set the condition
7694          code register to the same value.  There are other possible
7695          uses of the condition code register, but these are by far the
7696          most common and the ones which we are most likely to be able
7697          to optimize.  */
7698
7699       last_insn = BB_END (bb);
7700       if (!JUMP_P (last_insn))
7701         continue;
7702
7703       if (reg_referenced_p (cc_reg_1, PATTERN (last_insn)))
7704         cc_reg = cc_reg_1;
7705       else if (cc_reg_2 && reg_referenced_p (cc_reg_2, PATTERN (last_insn)))
7706         cc_reg = cc_reg_2;
7707       else
7708         continue;
7709
7710       cc_src_insn = NULL_RTX;
7711       cc_src = NULL_RTX;
7712       for (insn = PREV_INSN (last_insn);
7713            insn && insn != PREV_INSN (BB_HEAD (bb));
7714            insn = PREV_INSN (insn))
7715         {
7716           rtx set;
7717
7718           if (! INSN_P (insn))
7719             continue;
7720           set = single_set (insn);
7721           if (set
7722               && REG_P (SET_DEST (set))
7723               && REGNO (SET_DEST (set)) == REGNO (cc_reg))
7724             {
7725               cc_src_insn = insn;
7726               cc_src = SET_SRC (set);
7727               break;
7728             }
7729           else if (reg_set_p (cc_reg, insn))
7730             break;
7731         }
7732
7733       if (! cc_src_insn)
7734         continue;
7735
7736       if (modified_between_p (cc_src, cc_src_insn, NEXT_INSN (last_insn)))
7737         continue;
7738
7739       /* Now CC_REG is a condition code register used for a
7740          conditional jump at the end of the block, and CC_SRC, in
7741          CC_SRC_INSN, is the value to which that condition code
7742          register is set, and CC_SRC is still meaningful at the end of
7743          the basic block.  */
7744
7745       orig_mode = GET_MODE (cc_src);
7746       mode = cse_cc_succs (bb, cc_reg, cc_src, true);
7747       if (mode != VOIDmode)
7748         {
7749           gcc_assert (mode == GET_MODE (cc_src));
7750           if (mode != orig_mode)
7751             {
7752               rtx newreg = gen_rtx_REG (mode, REGNO (cc_reg));
7753
7754               cse_change_cc_mode_insn (cc_src_insn, newreg);
7755
7756               /* Do the same in the following insns that use the
7757                  current value of CC_REG within BB.  */
7758               cse_change_cc_mode_insns (NEXT_INSN (cc_src_insn),
7759                                         NEXT_INSN (last_insn),
7760                                         newreg);
7761             }
7762         }
7763     }
7764 }
7765 \f
7766
7767 /* Perform common subexpression elimination.  Nonzero value from
7768    `cse_main' means that jumps were simplified and some code may now
7769    be unreachable, so do jump optimization again.  */
7770 static bool
7771 gate_handle_cse (void)
7772 {
7773   return optimize > 0;
7774 }
7775
7776 static void
7777 rest_of_handle_cse (void)
7778 {
7779   int tem;
7780
7781   if (dump_file)
7782     dump_flow_info (dump_file);
7783
7784   reg_scan (get_insns (), max_reg_num ());
7785
7786   tem = cse_main (get_insns (), max_reg_num (), dump_file);
7787   if (tem)
7788     rebuild_jump_labels (get_insns ());
7789   if (purge_all_dead_edges ())
7790     delete_unreachable_blocks ();
7791
7792   delete_trivially_dead_insns (get_insns (), max_reg_num ());
7793
7794   /* If we are not running more CSE passes, then we are no longer
7795      expecting CSE to be run.  But always rerun it in a cheap mode.  */
7796   cse_not_expected = !flag_rerun_cse_after_loop && !flag_gcse;
7797
7798   if (tem)
7799     delete_dead_jumptables ();
7800
7801   if (tem || optimize > 1)
7802     cleanup_cfg (CLEANUP_EXPENSIVE | CLEANUP_PRE_LOOP);
7803 }
7804
7805 struct tree_opt_pass pass_cse =
7806 {
7807   "cse1",                               /* name */
7808   gate_handle_cse,                      /* gate */   
7809   rest_of_handle_cse,                   /* execute */       
7810   NULL,                                 /* sub */
7811   NULL,                                 /* next */
7812   0,                                    /* static_pass_number */
7813   TV_CSE,                               /* tv_id */
7814   0,                                    /* properties_required */
7815   0,                                    /* properties_provided */
7816   0,                                    /* properties_destroyed */
7817   0,                                    /* todo_flags_start */
7818   TODO_dump_func |
7819   TODO_ggc_collect,                     /* todo_flags_finish */
7820   's'                                   /* letter */
7821 };
7822
7823
7824 static bool
7825 gate_handle_cse2 (void)
7826 {
7827   return optimize > 0 && flag_rerun_cse_after_loop;
7828 }
7829
7830 /* Run second CSE pass after loop optimizations.  */
7831 static void
7832 rest_of_handle_cse2 (void)
7833 {
7834   int tem;
7835
7836   if (dump_file)
7837     dump_flow_info (dump_file);
7838
7839   tem = cse_main (get_insns (), max_reg_num (), dump_file);
7840
7841   /* Run a pass to eliminate duplicated assignments to condition code
7842      registers.  We have to run this after bypass_jumps, because it
7843      makes it harder for that pass to determine whether a jump can be
7844      bypassed safely.  */
7845   cse_condition_code_reg ();
7846
7847   purge_all_dead_edges ();
7848   delete_trivially_dead_insns (get_insns (), max_reg_num ());
7849
7850   if (tem)
7851     {
7852       timevar_push (TV_JUMP);
7853       rebuild_jump_labels (get_insns ());
7854       delete_dead_jumptables ();
7855       cleanup_cfg (CLEANUP_EXPENSIVE);
7856       timevar_pop (TV_JUMP);
7857     }
7858   reg_scan (get_insns (), max_reg_num ());
7859   cse_not_expected = 1;
7860 }
7861
7862
7863 struct tree_opt_pass pass_cse2 =
7864 {
7865   "cse2",                               /* name */
7866   gate_handle_cse2,                     /* gate */   
7867   rest_of_handle_cse2,                  /* execute */       
7868   NULL,                                 /* sub */
7869   NULL,                                 /* next */
7870   0,                                    /* static_pass_number */
7871   TV_CSE2,                              /* tv_id */
7872   0,                                    /* properties_required */
7873   0,                                    /* properties_provided */
7874   0,                                    /* properties_destroyed */
7875   0,                                    /* todo_flags_start */
7876   TODO_dump_func |
7877   TODO_ggc_collect,                     /* todo_flags_finish */
7878   't'                                   /* letter */
7879 };
7880