OSDN Git Service

(mark_target_live_regs): Delete unused variables.
[pf3gnuchains/gcc-fork.git] / gcc / reorg.c
1 /* Perform instruction reorganizations for delay slot filling.
2    Copyright (C) 1992, 93, 94, 95, 96, 1997 Free Software Foundation, Inc.
3    Contributed by Richard Kenner (kenner@vlsi1.ultra.nyu.edu).
4    Hacked by Michael Tiemann (tiemann@cygnus.com).
5
6 This file is part of GNU CC.
7
8 GNU CC is free software; you can redistribute it and/or modify
9 it under the terms of the GNU General Public License as published by
10 the Free Software Foundation; either version 2, or (at your option)
11 any later version.
12
13 GNU CC is distributed in the hope that it will be useful,
14 but WITHOUT ANY WARRANTY; without even the implied warranty of
15 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 GNU General Public License for more details.
17
18 You should have received a copy of the GNU General Public License
19 along with GNU CC; see the file COPYING.  If not, write to
20 the Free Software Foundation, 59 Temple Place - Suite 330,
21 Boston, MA 02111-1307, USA.  */
22
23 /* Instruction reorganization pass.
24
25    This pass runs after register allocation and final jump
26    optimization.  It should be the last pass to run before peephole.
27    It serves primarily to fill delay slots of insns, typically branch
28    and call insns.  Other insns typically involve more complicated
29    interactions of data dependencies and resource constraints, and
30    are better handled by scheduling before register allocation (by the
31    function `schedule_insns').
32
33    The Branch Penalty is the number of extra cycles that are needed to
34    execute a branch insn.  On an ideal machine, branches take a single
35    cycle, and the Branch Penalty is 0.  Several RISC machines approach
36    branch delays differently:
37
38    The MIPS and AMD 29000 have a single branch delay slot.  Most insns
39    (except other branches) can be used to fill this slot.  When the
40    slot is filled, two insns execute in two cycles, reducing the
41    branch penalty to zero.
42
43    The Motorola 88000 conditionally exposes its branch delay slot,
44    so code is shorter when it is turned off, but will run faster
45    when useful insns are scheduled there.
46
47    The IBM ROMP has two forms of branch and call insns, both with and
48    without a delay slot.  Much like the 88k, insns not using the delay
49    slot can be shorted (2 bytes vs. 4 bytes), but will run slowed.
50
51    The SPARC always has a branch delay slot, but its effects can be
52    annulled when the branch is not taken.  This means that failing to
53    find other sources of insns, we can hoist an insn from the branch
54    target that would only be safe to execute knowing that the branch
55    is taken.
56
57    The HP-PA always has a branch delay slot.  For unconditional branches
58    its effects can be annulled when the branch is taken.  The effects 
59    of the delay slot in a conditional branch can be nullified for forward
60    taken branches, or for untaken backward branches.  This means
61    we can hoist insns from the fall-through path for forward branches or
62    steal insns from the target of backward branches.
63
64    Three techniques for filling delay slots have been implemented so far:
65
66    (1) `fill_simple_delay_slots' is the simplest, most efficient way
67    to fill delay slots.  This pass first looks for insns which come
68    from before the branch and which are safe to execute after the
69    branch.  Then it searches after the insn requiring delay slots or,
70    in the case of a branch, for insns that are after the point at
71    which the branch merges into the fallthrough code, if such a point
72    exists.  When such insns are found, the branch penalty decreases
73    and no code expansion takes place.
74
75    (2) `fill_eager_delay_slots' is more complicated: it is used for
76    scheduling conditional jumps, or for scheduling jumps which cannot
77    be filled using (1).  A machine need not have annulled jumps to use
78    this strategy, but it helps (by keeping more options open).
79    `fill_eager_delay_slots' tries to guess the direction the branch
80    will go; if it guesses right 100% of the time, it can reduce the
81    branch penalty as much as `fill_simple_delay_slots' does.  If it
82    guesses wrong 100% of the time, it might as well schedule nops (or
83    on the m88k, unexpose the branch slot).  When
84    `fill_eager_delay_slots' takes insns from the fall-through path of
85    the jump, usually there is no code expansion; when it takes insns
86    from the branch target, there is code expansion if it is not the
87    only way to reach that target.
88
89    (3) `relax_delay_slots' uses a set of rules to simplify code that
90    has been reorganized by (1) and (2).  It finds cases where
91    conditional test can be eliminated, jumps can be threaded, extra
92    insns can be eliminated, etc.  It is the job of (1) and (2) to do a
93    good job of scheduling locally; `relax_delay_slots' takes care of
94    making the various individual schedules work well together.  It is
95    especially tuned to handle the control flow interactions of branch
96    insns.  It does nothing for insns with delay slots that do not
97    branch.
98
99    On machines that use CC0, we are very conservative.  We will not make
100    a copy of an insn involving CC0 since we want to maintain a 1-1
101    correspondence between the insn that sets and uses CC0.  The insns are
102    allowed to be separated by placing an insn that sets CC0 (but not an insn
103    that uses CC0; we could do this, but it doesn't seem worthwhile) in a
104    delay slot.  In that case, we point each insn at the other with REG_CC_USER
105    and REG_CC_SETTER notes.  Note that these restrictions affect very few
106    machines because most RISC machines with delay slots will not use CC0
107    (the RT is the only known exception at this point).
108
109    Not yet implemented:
110
111    The Acorn Risc Machine can conditionally execute most insns, so
112    it is profitable to move single insns into a position to execute
113    based on the condition code of the previous insn.
114
115    The HP-PA can conditionally nullify insns, providing a similar
116    effect to the ARM, differing mostly in which insn is "in charge".   */
117
118 #include <stdio.h>
119 #include "config.h"
120 #include "rtl.h"
121 #include "insn-config.h"
122 #include "conditions.h"
123 #include "hard-reg-set.h"
124 #include "basic-block.h"
125 #include "regs.h"
126 #include "insn-flags.h"
127 #include "recog.h"
128 #include "flags.h"
129 #include "output.h"
130 #include "obstack.h"
131 #include "insn-attr.h"
132
133 /* Import list of registers used as spill regs from reload.  */
134 extern HARD_REG_SET used_spill_regs;
135
136 /* Import highest label used in function at end of reload.  */
137 extern int max_label_num_after_reload;
138
139
140 #ifdef DELAY_SLOTS
141
142 #define obstack_chunk_alloc xmalloc
143 #define obstack_chunk_free free
144
145 #ifndef ANNUL_IFTRUE_SLOTS
146 #define eligible_for_annul_true(INSN, SLOTS, TRIAL, FLAGS) 0
147 #endif
148 #ifndef ANNUL_IFFALSE_SLOTS
149 #define eligible_for_annul_false(INSN, SLOTS, TRIAL, FLAGS) 0
150 #endif
151
152 /* Insns which have delay slots that have not yet been filled.  */
153
154 static struct obstack unfilled_slots_obstack;
155 static rtx *unfilled_firstobj;
156
157 /* Define macros to refer to the first and last slot containing unfilled
158    insns.  These are used because the list may move and its address
159    should be recomputed at each use.  */
160
161 #define unfilled_slots_base     \
162   ((rtx *) obstack_base (&unfilled_slots_obstack))
163
164 #define unfilled_slots_next     \
165   ((rtx *) obstack_next_free (&unfilled_slots_obstack))
166
167 /* This structure is used to indicate which hardware resources are set or
168    needed by insns so far.  */
169
170 struct resources
171 {
172   char memory;                  /* Insn sets or needs a memory location.  */
173   char unch_memory;             /* Insn sets of needs a "unchanging" MEM.  */
174   char volatil;                 /* Insn sets or needs a volatile memory loc.  */
175   char cc;                      /* Insn sets or needs the condition codes.  */
176   HARD_REG_SET regs;            /* Which registers are set or needed.  */
177 };
178
179 /* Macro to clear all resources.  */
180 #define CLEAR_RESOURCE(RES)     \
181  do { (RES)->memory = (RES)->unch_memory = (RES)->volatil = (RES)->cc = 0; \
182       CLEAR_HARD_REG_SET ((RES)->regs); } while (0)
183
184 /* Indicates what resources are required at the beginning of the epilogue.  */
185 static struct resources start_of_epilogue_needs;
186
187 /* Indicates what resources are required at function end.  */
188 static struct resources end_of_function_needs;
189
190 /* Points to the label before the end of the function.  */
191 static rtx end_of_function_label;
192
193 /* This structure is used to record liveness information at the targets or
194    fallthrough insns of branches.  We will most likely need the information
195    at targets again, so save them in a hash table rather than recomputing them
196    each time.  */
197
198 struct target_info
199 {
200   int uid;                      /* INSN_UID of target.  */
201   struct target_info *next;     /* Next info for same hash bucket.  */
202   HARD_REG_SET live_regs;       /* Registers live at target.  */
203   int block;                    /* Basic block number containing target.  */
204   int bb_tick;                  /* Generation count of basic block info.  */
205 };
206
207 #define TARGET_HASH_PRIME 257
208
209 /* Define the hash table itself.  */
210 static struct target_info **target_hash_table;
211
212 /* For each basic block, we maintain a generation number of its basic
213    block info, which is updated each time we move an insn from the
214    target of a jump.  This is the generation number indexed by block
215    number.  */
216
217 static int *bb_ticks;
218
219 /* Mapping between INSN_UID's and position in the code since INSN_UID's do
220    not always monotonically increase.  */
221 static int *uid_to_ruid;
222
223 /* Highest valid index in `uid_to_ruid'.  */
224 static int max_uid;
225
226 static void mark_referenced_resources PROTO((rtx, struct resources *, int));
227 static void mark_set_resources  PROTO((rtx, struct resources *, int, int));
228 static int stop_search_p        PROTO((rtx, int));
229 static int resource_conflicts_p PROTO((struct resources *,
230                                        struct resources *));
231 static int insn_references_resource_p PROTO((rtx, struct resources *, int));
232 static int insn_sets_resources_p PROTO((rtx, struct resources *, int));
233 static rtx find_end_label       PROTO((void));
234 static rtx emit_delay_sequence  PROTO((rtx, rtx, int, int));
235 static rtx add_to_delay_list    PROTO((rtx, rtx));
236 static void delete_from_delay_slot PROTO((rtx));
237 static void delete_scheduled_jump PROTO((rtx));
238 static void note_delay_statistics PROTO((int, int));
239 static rtx optimize_skip        PROTO((rtx));
240 static int get_jump_flags PROTO((rtx, rtx));
241 static int rare_destination PROTO((rtx));
242 static int mostly_true_jump     PROTO((rtx, rtx));
243 static rtx get_branch_condition PROTO((rtx, rtx));
244 static int condition_dominates_p PROTO((rtx, rtx));
245 static rtx steal_delay_list_from_target PROTO((rtx, rtx, rtx, rtx,
246                                                struct resources *,
247                                                struct resources *,
248                                                struct resources *,
249                                                int, int *, int *, rtx *));
250 static rtx steal_delay_list_from_fallthrough PROTO((rtx, rtx, rtx, rtx,
251                                                     struct resources *,
252                                                     struct resources *,
253                                                     struct resources *,
254                                                     int, int *, int *));
255 static void try_merge_delay_insns PROTO((rtx, rtx));
256 static rtx redundant_insn       PROTO((rtx, rtx, rtx));
257 static int own_thread_p         PROTO((rtx, rtx, int));
258 static int find_basic_block     PROTO((rtx));
259 static void update_block        PROTO((rtx, rtx));
260 static int reorg_redirect_jump PROTO((rtx, rtx));
261 static void update_reg_dead_notes PROTO((rtx, rtx));
262 static void fix_reg_dead_note PROTO((rtx, rtx));
263 static void update_reg_unused_notes PROTO((rtx, rtx));
264 static void update_live_status  PROTO((rtx, rtx));
265 static rtx next_insn_no_annul   PROTO((rtx));
266 static void mark_target_live_regs PROTO((rtx, struct resources *));
267 static void fill_simple_delay_slots PROTO((rtx, int));
268 static rtx fill_slots_from_thread PROTO((rtx, rtx, rtx, rtx, int, int,
269                                          int, int, int, int *));
270 static void fill_eager_delay_slots PROTO((rtx));
271 static void relax_delay_slots   PROTO((rtx));
272 static void make_return_insns   PROTO((rtx));
273 static int redirect_with_delay_slots_safe_p PROTO ((rtx, rtx, rtx));
274 static int redirect_with_delay_list_safe_p PROTO ((rtx, rtx, rtx));
275 \f
276 /* Given X, some rtl, and RES, a pointer to a `struct resource', mark
277    which resources are references by the insn.  If INCLUDE_CALLED_ROUTINE
278    is TRUE, resources used by the called routine will be included for
279    CALL_INSNs.  */
280
281 static void
282 mark_referenced_resources (x, res, include_delayed_effects)
283      register rtx x;
284      register struct resources *res;
285      register int include_delayed_effects;
286 {
287   register enum rtx_code code = GET_CODE (x);
288   register int i, j;
289   register char *format_ptr;
290
291   /* Handle leaf items for which we set resource flags.  Also, special-case
292      CALL, SET and CLOBBER operators.  */
293   switch (code)
294     {
295     case CONST:
296     case CONST_INT:
297     case CONST_DOUBLE:
298     case PC:
299     case SYMBOL_REF:
300     case LABEL_REF:
301       return;
302
303     case SUBREG:
304       if (GET_CODE (SUBREG_REG (x)) != REG)
305         mark_referenced_resources (SUBREG_REG (x), res, 0);
306       else
307         {
308           int regno = REGNO (SUBREG_REG (x)) + SUBREG_WORD (x);
309           int last_regno = regno + HARD_REGNO_NREGS (regno, GET_MODE (x));
310           for (i = regno; i < last_regno; i++)
311             SET_HARD_REG_BIT (res->regs, i);
312         }
313       return;
314
315     case REG:
316       for (i = 0; i < HARD_REGNO_NREGS (REGNO (x), GET_MODE (x)); i++)
317         SET_HARD_REG_BIT (res->regs, REGNO (x) + i);
318       return;
319
320     case MEM:
321       /* If this memory shouldn't change, it really isn't referencing
322          memory.  */
323       if (RTX_UNCHANGING_P (x))
324         res->unch_memory = 1;
325       else
326         res->memory = 1;
327       res->volatil = MEM_VOLATILE_P (x);
328
329       /* Mark registers used to access memory.  */
330       mark_referenced_resources (XEXP (x, 0), res, 0);
331       return;
332
333     case CC0:
334       res->cc = 1;
335       return;
336
337     case UNSPEC_VOLATILE:
338     case ASM_INPUT:
339     case TRAP_IF:
340       /* Traditional asm's are always volatile.  */
341       res->volatil = 1;
342       return;
343
344     case ASM_OPERANDS:
345       res->volatil = MEM_VOLATILE_P (x);
346
347       /* For all ASM_OPERANDS, we must traverse the vector of input operands.
348          We can not just fall through here since then we would be confused
349          by the ASM_INPUT rtx inside ASM_OPERANDS, which do not indicate
350          traditional asms unlike their normal usage.  */
351       
352       for (i = 0; i < ASM_OPERANDS_INPUT_LENGTH (x); i++)
353         mark_referenced_resources (ASM_OPERANDS_INPUT (x, i), res, 0);
354       return;
355
356     case CALL:
357       /* The first operand will be a (MEM (xxx)) but doesn't really reference
358          memory.  The second operand may be referenced, though.  */
359       mark_referenced_resources (XEXP (XEXP (x, 0), 0), res, 0);
360       mark_referenced_resources (XEXP (x, 1), res, 0);
361       return;
362
363     case SET:
364       /* Usually, the first operand of SET is set, not referenced.  But
365          registers used to access memory are referenced.  SET_DEST is
366          also referenced if it is a ZERO_EXTRACT or SIGN_EXTRACT.  */
367
368       mark_referenced_resources (SET_SRC (x), res, 0);
369
370       x = SET_DEST (x);
371       if (GET_CODE (x) == SIGN_EXTRACT || GET_CODE (x) == ZERO_EXTRACT)
372         mark_referenced_resources (x, res, 0);
373       else if (GET_CODE (x) == SUBREG)
374         x = SUBREG_REG (x);
375       if (GET_CODE (x) == MEM)
376         mark_referenced_resources (XEXP (x, 0), res, 0);
377       return;
378
379     case CLOBBER:
380       return;
381
382     case CALL_INSN:
383       if (include_delayed_effects)
384         {
385           /* A CALL references memory, the frame pointer if it exists, the
386              stack pointer, any global registers and any registers given in
387              USE insns immediately in front of the CALL.
388
389              However, we may have moved some of the parameter loading insns
390              into the delay slot of this CALL.  If so, the USE's for them
391              don't count and should be skipped.  */
392           rtx insn = PREV_INSN (x);
393           rtx sequence = 0;
394           int seq_size = 0;
395           rtx next = NEXT_INSN (x);
396           int i;
397
398           /* If we are part of a delay slot sequence, point at the SEQUENCE.  */
399           if (NEXT_INSN (insn) != x)
400             {
401               next = NEXT_INSN (NEXT_INSN (insn));
402               sequence = PATTERN (NEXT_INSN (insn));
403               seq_size = XVECLEN (sequence, 0);
404               if (GET_CODE (sequence) != SEQUENCE)
405                 abort ();
406             }
407
408           res->memory = 1;
409           SET_HARD_REG_BIT (res->regs, STACK_POINTER_REGNUM);
410           if (frame_pointer_needed)
411             {
412               SET_HARD_REG_BIT (res->regs, FRAME_POINTER_REGNUM);
413 #if FRAME_POINTER_REGNUM != HARD_FRAME_POINTER_REGNUM
414               SET_HARD_REG_BIT (res->regs, HARD_FRAME_POINTER_REGNUM);
415 #endif
416             }
417
418           for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
419             if (global_regs[i])
420               SET_HARD_REG_BIT (res->regs, i);
421
422           /* Check for a NOTE_INSN_SETJMP.  If it exists, then we must
423              assume that this call can need any register.
424
425              This is done to be more conservative about how we handle setjmp.
426              We assume that they both use and set all registers.  Using all
427              registers ensures that a register will not be considered dead
428              just because it crosses a setjmp call.  A register should be
429              considered dead only if the setjmp call returns non-zero.  */
430           if (next && GET_CODE (next) == NOTE
431               && NOTE_LINE_NUMBER (next) == NOTE_INSN_SETJMP)
432             SET_HARD_REG_SET (res->regs);
433
434           {
435             rtx link;
436
437             for (link = CALL_INSN_FUNCTION_USAGE (x);
438                  link;
439                  link = XEXP (link, 1))
440               if (GET_CODE (XEXP (link, 0)) == USE)
441                 {
442                   for (i = 1; i < seq_size; i++)
443                     {
444                       rtx slot_pat = PATTERN (XVECEXP (sequence, 0, i));
445                       if (GET_CODE (slot_pat) == SET
446                           && rtx_equal_p (SET_DEST (slot_pat),
447                                           SET_DEST (XEXP (link, 0))))
448                         break;
449                     }
450                   if (i >= seq_size)
451                     mark_referenced_resources (SET_DEST (XEXP (link, 0)),
452                                                res, 0);
453                 }
454           }
455         }
456
457       /* ... fall through to other INSN processing ...  */
458
459     case INSN:
460     case JUMP_INSN:
461
462 #ifdef INSN_REFERENCES_ARE_DELAYED
463       if (! include_delayed_effects
464           && INSN_REFERENCES_ARE_DELAYED (x))
465         return;
466 #endif
467
468       /* No special processing, just speed up.  */
469       mark_referenced_resources (PATTERN (x), res, include_delayed_effects);
470       return;
471     }
472
473   /* Process each sub-expression and flag what it needs.  */
474   format_ptr = GET_RTX_FORMAT (code);
475   for (i = 0; i < GET_RTX_LENGTH (code); i++)
476     switch (*format_ptr++)
477       {
478       case 'e':
479         mark_referenced_resources (XEXP (x, i), res, include_delayed_effects);
480         break;
481
482       case 'E':
483         for (j = 0; j < XVECLEN (x, i); j++)
484           mark_referenced_resources (XVECEXP (x, i, j), res,
485                                      include_delayed_effects);
486         break;
487       }
488 }
489 \f
490 /* Given X, a part of an insn, and a pointer to a `struct resource', RES,
491    indicate which resources are modified by the insn. If INCLUDE_CALLED_ROUTINE
492    is nonzero, also mark resources potentially set by the called routine.
493
494    If IN_DEST is nonzero, it means we are inside a SET.  Otherwise,
495    objects are being referenced instead of set.
496
497    We never mark the insn as modifying the condition code unless it explicitly
498    SETs CC0 even though this is not totally correct.  The reason for this is
499    that we require a SET of CC0 to immediately precede the reference to CC0.
500    So if some other insn sets CC0 as a side-effect, we know it cannot affect
501    our computation and thus may be placed in a delay slot.   */
502
503 static void
504 mark_set_resources (x, res, in_dest, include_delayed_effects)
505      register rtx x;
506      register struct resources *res;
507      int in_dest;
508      int include_delayed_effects;
509 {
510   register enum rtx_code code;
511   register int i, j;
512   register char *format_ptr;
513
514  restart:
515
516   code = GET_CODE (x);
517
518   switch (code)
519     {
520     case NOTE:
521     case BARRIER:
522     case CODE_LABEL:
523     case USE:
524     case CONST_INT:
525     case CONST_DOUBLE:
526     case LABEL_REF:
527     case SYMBOL_REF:
528     case CONST:
529     case PC:
530       /* These don't set any resources.  */
531       return;
532
533     case CC0:
534       if (in_dest)
535         res->cc = 1;
536       return;
537
538     case CALL_INSN:
539       /* Called routine modifies the condition code, memory, any registers
540          that aren't saved across calls, global registers and anything
541          explicitly CLOBBERed immediately after the CALL_INSN.  */
542
543       if (include_delayed_effects)
544         {
545           rtx next = NEXT_INSN (x);
546           rtx prev = PREV_INSN (x);
547           rtx link;
548
549           res->cc = res->memory = 1;
550           for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
551             if (call_used_regs[i] || global_regs[i])
552               SET_HARD_REG_BIT (res->regs, i);
553
554           /* If X is part of a delay slot sequence, then NEXT should be
555              the first insn after the sequence.  */
556           if (NEXT_INSN (prev) != x)
557             next = NEXT_INSN (NEXT_INSN (prev));
558
559           for (link = CALL_INSN_FUNCTION_USAGE (x);
560                link; link = XEXP (link, 1))
561             if (GET_CODE (XEXP (link, 0)) == CLOBBER)
562               mark_set_resources (SET_DEST (XEXP (link, 0)), res, 1, 0);
563
564           /* Check for a NOTE_INSN_SETJMP.  If it exists, then we must
565              assume that this call can clobber any register.  */
566           if (next && GET_CODE (next) == NOTE
567               && NOTE_LINE_NUMBER (next) == NOTE_INSN_SETJMP)
568             SET_HARD_REG_SET (res->regs);
569         }
570
571       /* ... and also what it's RTL says it modifies, if anything.  */
572
573     case JUMP_INSN:
574     case INSN:
575
576         /* An insn consisting of just a CLOBBER (or USE) is just for flow
577            and doesn't actually do anything, so we ignore it.  */
578
579 #ifdef INSN_SETS_ARE_DELAYED
580       if (! include_delayed_effects
581           && INSN_SETS_ARE_DELAYED (x))
582         return;
583 #endif
584
585       x = PATTERN (x);
586       if (GET_CODE (x) != USE && GET_CODE (x) != CLOBBER)
587         goto restart;
588       return;
589
590     case SET:
591       /* If the source of a SET is a CALL, this is actually done by
592          the called routine.  So only include it if we are to include the
593          effects of the calling routine.  */
594
595       mark_set_resources (SET_DEST (x), res,
596                           (include_delayed_effects
597                            || GET_CODE (SET_SRC (x)) != CALL),
598                           0);
599
600       mark_set_resources (SET_SRC (x), res, 0, 0);
601       return;
602
603     case CLOBBER:
604       mark_set_resources (XEXP (x, 0), res, 1, 0);
605       return;
606       
607     case SEQUENCE:
608       for (i = 0; i < XVECLEN (x, 0); i++)
609         if (! (INSN_ANNULLED_BRANCH_P (XVECEXP (x, 0, 0))
610                && INSN_FROM_TARGET_P (XVECEXP (x, 0, i))))
611           mark_set_resources (XVECEXP (x, 0, i), res, 0,
612                               include_delayed_effects);
613       return;
614
615     case POST_INC:
616     case PRE_INC:
617     case POST_DEC:
618     case PRE_DEC:
619       mark_set_resources (XEXP (x, 0), res, 1, 0);
620       return;
621
622     case ZERO_EXTRACT:
623       mark_set_resources (XEXP (x, 0), res, in_dest, 0);
624       mark_set_resources (XEXP (x, 1), res, 0, 0);
625       mark_set_resources (XEXP (x, 2), res, 0, 0);
626       return;
627
628     case MEM:
629       if (in_dest)
630         {
631           res->memory = 1;
632           res->unch_memory = RTX_UNCHANGING_P (x);
633           res->volatil = MEM_VOLATILE_P (x);
634         }
635
636       mark_set_resources (XEXP (x, 0), res, 0, 0);
637       return;
638
639     case SUBREG:
640       if (in_dest)
641         {
642           if (GET_CODE (SUBREG_REG (x)) != REG)
643             mark_set_resources (SUBREG_REG (x), res,
644                                 in_dest, include_delayed_effects);
645           else
646             {
647               int regno = REGNO (SUBREG_REG (x)) + SUBREG_WORD (x);
648               int last_regno = regno + HARD_REGNO_NREGS (regno, GET_MODE (x));
649               for (i = regno; i < last_regno; i++)
650                 SET_HARD_REG_BIT (res->regs, i);
651             }
652         }
653       return;
654
655     case REG:
656       if (in_dest)
657         for (i = 0; i < HARD_REGNO_NREGS (REGNO (x), GET_MODE (x)); i++)
658           SET_HARD_REG_BIT (res->regs, REGNO (x) + i);
659       return;
660     }
661
662   /* Process each sub-expression and flag what it needs.  */
663   format_ptr = GET_RTX_FORMAT (code);
664   for (i = 0; i < GET_RTX_LENGTH (code); i++)
665     switch (*format_ptr++)
666       {
667       case 'e':
668         mark_set_resources (XEXP (x, i), res, in_dest, include_delayed_effects);
669         break;
670
671       case 'E':
672         for (j = 0; j < XVECLEN (x, i); j++)
673           mark_set_resources (XVECEXP (x, i, j), res, in_dest,
674                               include_delayed_effects);
675         break;
676       }
677 }
678 \f
679 /* Return TRUE if this insn should stop the search for insn to fill delay
680    slots.  LABELS_P indicates that labels should terminate the search.
681    In all cases, jumps terminate the search.  */
682
683 static int
684 stop_search_p (insn, labels_p)
685      rtx insn;
686      int labels_p;
687 {
688   if (insn == 0)
689     return 1;
690
691   switch (GET_CODE (insn))
692     {
693     case NOTE:
694     case CALL_INSN:
695       return 0;
696
697     case CODE_LABEL:
698       return labels_p;
699
700     case JUMP_INSN:
701     case BARRIER:
702       return 1;
703
704     case INSN:
705       /* OK unless it contains a delay slot or is an `asm' insn of some type.
706          We don't know anything about these.  */
707       return (GET_CODE (PATTERN (insn)) == SEQUENCE
708               || GET_CODE (PATTERN (insn)) == ASM_INPUT
709               || asm_noperands (PATTERN (insn)) >= 0);
710
711     default:
712       abort ();
713     }
714 }
715 \f
716 /* Return TRUE if any resources are marked in both RES1 and RES2 or if either
717    resource set contains a volatile memory reference.  Otherwise, return FALSE.  */
718
719 static int
720 resource_conflicts_p (res1, res2)
721      struct resources *res1, *res2;
722 {
723   if ((res1->cc && res2->cc) || (res1->memory && res2->memory)
724       || (res1->unch_memory && res2->unch_memory)
725       || res1->volatil || res2->volatil)
726     return 1;
727
728 #ifdef HARD_REG_SET
729   return (res1->regs & res2->regs) != HARD_CONST (0);
730 #else
731   {
732     int i;
733
734     for (i = 0; i < HARD_REG_SET_LONGS; i++)
735       if ((res1->regs[i] & res2->regs[i]) != 0)
736         return 1;
737     return 0;
738   }
739 #endif
740 }
741
742 /* Return TRUE if any resource marked in RES, a `struct resources', is
743    referenced by INSN.  If INCLUDE_CALLED_ROUTINE is set, return if the called
744    routine is using those resources.
745
746    We compute this by computing all the resources referenced by INSN and
747    seeing if this conflicts with RES.  It might be faster to directly check
748    ourselves, and this is the way it used to work, but it means duplicating
749    a large block of complex code.  */
750
751 static int
752 insn_references_resource_p (insn, res, include_delayed_effects)
753      register rtx insn;
754      register struct resources *res;
755      int include_delayed_effects;
756 {
757   struct resources insn_res;
758
759   CLEAR_RESOURCE (&insn_res);
760   mark_referenced_resources (insn, &insn_res, include_delayed_effects);
761   return resource_conflicts_p (&insn_res, res);
762 }
763
764 /* Return TRUE if INSN modifies resources that are marked in RES.
765    INCLUDE_CALLED_ROUTINE is set if the actions of that routine should be
766    included.   CC0 is only modified if it is explicitly set; see comments
767    in front of mark_set_resources for details.  */
768
769 static int
770 insn_sets_resource_p (insn, res, include_delayed_effects)
771      register rtx insn;
772      register struct resources *res;
773      int include_delayed_effects;
774 {
775   struct resources insn_sets;
776
777   CLEAR_RESOURCE (&insn_sets);
778   mark_set_resources (insn, &insn_sets, 0, include_delayed_effects);
779   return resource_conflicts_p (&insn_sets, res);
780 }
781 \f
782 /* Find a label at the end of the function or before a RETURN.  If there is
783    none, make one.  */
784
785 static rtx
786 find_end_label ()
787 {
788   rtx insn;
789
790   /* If we found one previously, return it.  */
791   if (end_of_function_label)
792     return end_of_function_label;
793
794   /* Otherwise, see if there is a label at the end of the function.  If there
795      is, it must be that RETURN insns aren't needed, so that is our return
796      label and we don't have to do anything else.  */
797
798   insn = get_last_insn ();
799   while (GET_CODE (insn) == NOTE
800          || (GET_CODE (insn) == INSN
801              && (GET_CODE (PATTERN (insn)) == USE
802                  || GET_CODE (PATTERN (insn)) == CLOBBER)))
803     insn = PREV_INSN (insn);
804
805   /* When a target threads its epilogue we might already have a 
806      suitable return insn.  If so put a label before it for the
807      end_of_function_label.  */
808   if (GET_CODE (insn) == BARRIER
809       && GET_CODE (PREV_INSN (insn)) == JUMP_INSN
810       && GET_CODE (PATTERN (PREV_INSN (insn))) == RETURN)
811     {
812       rtx temp = PREV_INSN (PREV_INSN (insn));
813       end_of_function_label = gen_label_rtx ();
814       LABEL_NUSES (end_of_function_label) = 0;
815
816       /* Put the label before an USE insns that may proceed the RETURN insn.  */
817       while (GET_CODE (temp) == USE)
818         temp = PREV_INSN (temp);
819
820       emit_label_after (end_of_function_label, temp);
821     }
822
823   else if (GET_CODE (insn) == CODE_LABEL)
824     end_of_function_label = insn;
825   else
826     {
827       /* Otherwise, make a new label and emit a RETURN and BARRIER,
828          if needed.  */
829       end_of_function_label = gen_label_rtx ();
830       LABEL_NUSES (end_of_function_label) = 0;
831       emit_label (end_of_function_label);
832 #ifdef HAVE_return
833       if (HAVE_return)
834         {
835           /* The return we make may have delay slots too.  */
836           rtx insn = gen_return ();
837           insn = emit_jump_insn (insn);
838           emit_barrier ();
839           if (num_delay_slots (insn) > 0)
840             obstack_ptr_grow (&unfilled_slots_obstack, insn);
841         }
842 #endif
843     }
844
845   /* Show one additional use for this label so it won't go away until
846      we are done.  */
847   ++LABEL_NUSES (end_of_function_label);
848
849   return end_of_function_label;
850 }
851 \f
852 /* Put INSN and LIST together in a SEQUENCE rtx of LENGTH, and replace
853    the pattern of INSN with the SEQUENCE.
854
855    Chain the insns so that NEXT_INSN of each insn in the sequence points to
856    the next and NEXT_INSN of the last insn in the sequence points to
857    the first insn after the sequence.  Similarly for PREV_INSN.  This makes
858    it easier to scan all insns.
859
860    Returns the SEQUENCE that replaces INSN.  */
861
862 static rtx
863 emit_delay_sequence (insn, list, length, avail)
864      rtx insn;
865      rtx list;
866      int length;
867      int avail;
868 {
869   register int i = 1;
870   register rtx li;
871   int had_barrier = 0;
872
873   /* Allocate the the rtvec to hold the insns and the SEQUENCE.  */
874   rtvec seqv = rtvec_alloc (length + 1);
875   rtx seq = gen_rtx (SEQUENCE, VOIDmode, seqv);
876   rtx seq_insn = make_insn_raw (seq);
877   rtx first = get_insns ();
878   rtx last = get_last_insn ();
879
880   /* Make a copy of the insn having delay slots.  */
881   rtx delay_insn = copy_rtx (insn);
882
883   /* If INSN is followed by a BARRIER, delete the BARRIER since it will only
884      confuse further processing.  Update LAST in case it was the last insn.  
885      We will put the BARRIER back in later.  */
886   if (NEXT_INSN (insn) && GET_CODE (NEXT_INSN (insn)) == BARRIER)
887     {
888       delete_insn (NEXT_INSN (insn));
889       last = get_last_insn ();
890       had_barrier = 1;
891     }
892
893   /* Splice our SEQUENCE into the insn stream where INSN used to be.  */
894   NEXT_INSN (seq_insn) = NEXT_INSN (insn);
895   PREV_INSN (seq_insn) = PREV_INSN (insn);
896
897   if (insn != last)
898     PREV_INSN (NEXT_INSN (seq_insn)) = seq_insn;
899
900   if (insn != first)
901     NEXT_INSN (PREV_INSN (seq_insn)) = seq_insn;
902
903   /* Note the calls to set_new_first_and_last_insn must occur after
904      SEQ_INSN has been completely spliced into the insn stream.
905
906      Otherwise CUR_INSN_UID will get set to an incorrect value because
907      set_new_first_and_last_insn will not find SEQ_INSN in the chain.  */
908   if (insn == last)
909     set_new_first_and_last_insn (first, seq_insn);
910
911   if (insn == first)
912     set_new_first_and_last_insn (seq_insn, last);
913
914   /* Build our SEQUENCE and rebuild the insn chain.  */
915   XVECEXP (seq, 0, 0) = delay_insn;
916   INSN_DELETED_P (delay_insn) = 0;
917   PREV_INSN (delay_insn) = PREV_INSN (seq_insn);
918
919   for (li = list; li; li = XEXP (li, 1), i++)
920     {
921       rtx tem = XEXP (li, 0);
922       rtx note;
923
924       /* Show that this copy of the insn isn't deleted.  */
925       INSN_DELETED_P (tem) = 0;
926
927       XVECEXP (seq, 0, i) = tem;
928       PREV_INSN (tem) = XVECEXP (seq, 0, i - 1);
929       NEXT_INSN (XVECEXP (seq, 0, i - 1)) = tem;
930
931       /* Remove any REG_DEAD notes because we can't rely on them now
932          that the insn has been moved.  */
933       for (note = REG_NOTES (tem); note; note = XEXP (note, 1))
934         if (REG_NOTE_KIND (note) == REG_DEAD)
935           XEXP (note, 0) = const0_rtx;
936     }
937
938   NEXT_INSN (XVECEXP (seq, 0, length)) = NEXT_INSN (seq_insn);
939
940   /* If the previous insn is a SEQUENCE, update the NEXT_INSN pointer on the
941      last insn in that SEQUENCE to point to us.  Similarly for the first
942      insn in the following insn if it is a SEQUENCE.  */
943
944   if (PREV_INSN (seq_insn) && GET_CODE (PREV_INSN (seq_insn)) == INSN
945       && GET_CODE (PATTERN (PREV_INSN (seq_insn))) == SEQUENCE)
946     NEXT_INSN (XVECEXP (PATTERN (PREV_INSN (seq_insn)), 0,
947                         XVECLEN (PATTERN (PREV_INSN (seq_insn)), 0) - 1))
948       = seq_insn;
949
950   if (NEXT_INSN (seq_insn) && GET_CODE (NEXT_INSN (seq_insn)) == INSN
951       && GET_CODE (PATTERN (NEXT_INSN (seq_insn))) == SEQUENCE)
952     PREV_INSN (XVECEXP (PATTERN (NEXT_INSN (seq_insn)), 0, 0)) = seq_insn;
953     
954   /* If there used to be a BARRIER, put it back.  */
955   if (had_barrier)
956     emit_barrier_after (seq_insn);
957
958   if (i != length + 1)
959     abort ();
960
961   return seq_insn;
962 }
963
964 /* Add INSN to DELAY_LIST and return the head of the new list.  The list must
965    be in the order in which the insns are to be executed.  */
966
967 static rtx
968 add_to_delay_list (insn, delay_list)
969      rtx insn;
970      rtx delay_list;
971 {
972   /* If we have an empty list, just make a new list element.  If
973      INSN has it's block number recorded, clear it since we may
974      be moving the insn to a new block.  */
975
976   if (delay_list == 0)
977     {
978       struct target_info *tinfo;
979       
980       for (tinfo = target_hash_table[INSN_UID (insn) % TARGET_HASH_PRIME];
981            tinfo; tinfo = tinfo->next)
982         if (tinfo->uid == INSN_UID (insn))
983           break;
984
985       if (tinfo)
986         tinfo->block = -1;
987
988       return gen_rtx (INSN_LIST, VOIDmode, insn, NULL_RTX);
989     }
990
991   /* Otherwise this must be an INSN_LIST.  Add INSN to the end of the
992      list.  */
993   XEXP (delay_list, 1) = add_to_delay_list (insn, XEXP (delay_list, 1));
994
995   return delay_list;
996 }   
997 \f
998 /* Delete INSN from the the delay slot of the insn that it is in.  This may
999    produce an insn without anything in its delay slots.  */
1000
1001 static void
1002 delete_from_delay_slot (insn)
1003      rtx insn;
1004 {
1005   rtx trial, seq_insn, seq, prev;
1006   rtx delay_list = 0;
1007   int i;
1008
1009   /* We first must find the insn containing the SEQUENCE with INSN in its
1010      delay slot.  Do this by finding an insn, TRIAL, where
1011      PREV_INSN (NEXT_INSN (TRIAL)) != TRIAL.  */
1012
1013   for (trial = insn;
1014        PREV_INSN (NEXT_INSN (trial)) == trial;
1015        trial = NEXT_INSN (trial))
1016     ;
1017
1018   seq_insn = PREV_INSN (NEXT_INSN (trial));
1019   seq = PATTERN (seq_insn);
1020
1021   /* Create a delay list consisting of all the insns other than the one
1022      we are deleting (unless we were the only one).  */
1023   if (XVECLEN (seq, 0) > 2)
1024     for (i = 1; i < XVECLEN (seq, 0); i++)
1025       if (XVECEXP (seq, 0, i) != insn)
1026         delay_list = add_to_delay_list (XVECEXP (seq, 0, i), delay_list);
1027
1028   /* Delete the old SEQUENCE, re-emit the insn that used to have the delay
1029      list, and rebuild the delay list if non-empty.  */
1030   prev = PREV_INSN (seq_insn);
1031   trial = XVECEXP (seq, 0, 0);
1032   delete_insn (seq_insn);
1033   add_insn_after (trial, prev);
1034
1035   if (GET_CODE (trial) == JUMP_INSN
1036       && (simplejump_p (trial) || GET_CODE (PATTERN (trial)) == RETURN))
1037     emit_barrier_after (trial);
1038
1039   /* If there are any delay insns, remit them.  Otherwise clear the
1040      annul flag.  */
1041   if (delay_list)
1042     trial = emit_delay_sequence (trial, delay_list, XVECLEN (seq, 0) - 2, 0);
1043   else
1044     INSN_ANNULLED_BRANCH_P (trial) = 0;
1045
1046   INSN_FROM_TARGET_P (insn) = 0;
1047
1048   /* Show we need to fill this insn again.  */
1049   obstack_ptr_grow (&unfilled_slots_obstack, trial);
1050 }
1051 \f
1052 /* Delete INSN, a JUMP_INSN.  If it is a conditional jump, we must track down
1053    the insn that sets CC0 for it and delete it too.  */
1054
1055 static void
1056 delete_scheduled_jump (insn)
1057      rtx insn;
1058 {
1059   /* Delete the insn that sets cc0 for us.  On machines without cc0, we could
1060      delete the insn that sets the condition code, but it is hard to find it.
1061      Since this case is rare anyway, don't bother trying; there would likely
1062      be other insns that became dead anyway, which we wouldn't know to
1063      delete.  */
1064
1065 #ifdef HAVE_cc0
1066   if (reg_mentioned_p (cc0_rtx, insn))
1067     {
1068       rtx note = find_reg_note (insn, REG_CC_SETTER, NULL_RTX);
1069
1070       /* If a reg-note was found, it points to an insn to set CC0.  This
1071          insn is in the delay list of some other insn.  So delete it from
1072          the delay list it was in.  */
1073       if (note)
1074         {
1075           if (! FIND_REG_INC_NOTE (XEXP (note, 0), NULL_RTX)
1076               && sets_cc0_p (PATTERN (XEXP (note, 0))) == 1)
1077             delete_from_delay_slot (XEXP (note, 0));
1078         }
1079       else
1080         {
1081           /* The insn setting CC0 is our previous insn, but it may be in
1082              a delay slot.  It will be the last insn in the delay slot, if
1083              it is.  */
1084           rtx trial = previous_insn (insn);
1085           if (GET_CODE (trial) == NOTE)
1086             trial = prev_nonnote_insn (trial);
1087           if (sets_cc0_p (PATTERN (trial)) != 1
1088               || FIND_REG_INC_NOTE (trial, 0))
1089             return;
1090           if (PREV_INSN (NEXT_INSN (trial)) == trial)
1091             delete_insn (trial);
1092           else
1093             delete_from_delay_slot (trial);
1094         }
1095     }
1096 #endif
1097
1098   delete_insn (insn);
1099 }
1100 \f
1101 /* Counters for delay-slot filling.  */
1102
1103 #define NUM_REORG_FUNCTIONS 2
1104 #define MAX_DELAY_HISTOGRAM 3
1105 #define MAX_REORG_PASSES 2
1106
1107 static int num_insns_needing_delays[NUM_REORG_FUNCTIONS][MAX_REORG_PASSES];
1108
1109 static int num_filled_delays[NUM_REORG_FUNCTIONS][MAX_DELAY_HISTOGRAM+1][MAX_REORG_PASSES];
1110
1111 static int reorg_pass_number;
1112
1113 static void
1114 note_delay_statistics (slots_filled, index)
1115      int slots_filled, index;
1116 {
1117   num_insns_needing_delays[index][reorg_pass_number]++;
1118   if (slots_filled > MAX_DELAY_HISTOGRAM)
1119     slots_filled = MAX_DELAY_HISTOGRAM;
1120   num_filled_delays[index][slots_filled][reorg_pass_number]++;
1121 }
1122 \f
1123 #if defined(ANNUL_IFFALSE_SLOTS) || defined(ANNUL_IFTRUE_SLOTS)
1124
1125 /* Optimize the following cases:
1126
1127    1.  When a conditional branch skips over only one instruction,
1128        use an annulling branch and put that insn in the delay slot.
1129        Use either a branch that annuls when the condition if true or
1130        invert the test with a branch that annuls when the condition is
1131        false.  This saves insns, since otherwise we must copy an insn
1132        from the L1 target.
1133
1134         (orig)           (skip)         (otherwise)
1135         Bcc.n L1        Bcc',a L1       Bcc,a L1'
1136         insn            insn            insn2
1137       L1:             L1:             L1:
1138         insn2           insn2           insn2
1139         insn3           insn3         L1':
1140                                         insn3
1141
1142    2.  When a conditional branch skips over only one instruction,
1143        and after that, it unconditionally branches somewhere else,
1144        perform the similar optimization. This saves executing the
1145        second branch in the case where the inverted condition is true.
1146
1147         Bcc.n L1        Bcc',a L2
1148         insn            insn
1149       L1:             L1:
1150         Bra L2          Bra L2
1151
1152    INSN is a JUMP_INSN.
1153
1154    This should be expanded to skip over N insns, where N is the number
1155    of delay slots required.  */
1156
1157 static rtx
1158 optimize_skip (insn)
1159      register rtx insn;
1160 {
1161   register rtx trial = next_nonnote_insn (insn);
1162   rtx next_trial = next_active_insn (trial);
1163   rtx delay_list = 0;
1164   rtx target_label;
1165   int flags;
1166
1167   flags = get_jump_flags (insn, JUMP_LABEL (insn));
1168
1169   if (trial == 0
1170       || GET_CODE (trial) != INSN
1171       || GET_CODE (PATTERN (trial)) == SEQUENCE
1172       || recog_memoized (trial) < 0
1173       || (! eligible_for_annul_false (insn, 0, trial, flags)
1174           && ! eligible_for_annul_true (insn, 0, trial, flags)))
1175     return 0;
1176
1177   /* There are two cases where we are just executing one insn (we assume
1178      here that a branch requires only one insn; this should be generalized
1179      at some point):  Where the branch goes around a single insn or where
1180      we have one insn followed by a branch to the same label we branch to.
1181      In both of these cases, inverting the jump and annulling the delay
1182      slot give the same effect in fewer insns.  */
1183   if ((next_trial == next_active_insn (JUMP_LABEL (insn)))
1184       || (next_trial != 0
1185           && GET_CODE (next_trial) == JUMP_INSN
1186           && JUMP_LABEL (insn) == JUMP_LABEL (next_trial)
1187           && (simplejump_p (next_trial)
1188               || GET_CODE (PATTERN (next_trial)) == RETURN)))
1189     {
1190       if (eligible_for_annul_false (insn, 0, trial, flags))
1191         {
1192           if (invert_jump (insn, JUMP_LABEL (insn)))
1193             INSN_FROM_TARGET_P (trial) = 1;
1194           else if (! eligible_for_annul_true (insn, 0, trial, flags))
1195             return 0;
1196         }
1197
1198       delay_list = add_to_delay_list (trial, NULL_RTX);
1199       next_trial = next_active_insn (trial);
1200       update_block (trial, trial);
1201       delete_insn (trial);
1202
1203       /* Also, if we are targeting an unconditional
1204          branch, thread our jump to the target of that branch.  Don't
1205          change this into a RETURN here, because it may not accept what
1206          we have in the delay slot.  We'll fix this up later.  */
1207       if (next_trial && GET_CODE (next_trial) == JUMP_INSN
1208           && (simplejump_p (next_trial)
1209               || GET_CODE (PATTERN (next_trial)) == RETURN))
1210         {
1211           target_label = JUMP_LABEL (next_trial);
1212           if (target_label == 0)
1213             target_label = find_end_label ();
1214
1215           /* Recompute the flags based on TARGET_LABEL since threading
1216              the jump to TARGET_LABEL may change the direction of the
1217              jump (which may change the circumstances in which the
1218              delay slot is nullified).  */
1219           flags = get_jump_flags (insn, target_label);
1220           if (eligible_for_annul_true (insn, 0, trial, flags))
1221             reorg_redirect_jump (insn, target_label);
1222         }
1223
1224       INSN_ANNULLED_BRANCH_P (insn) = 1;
1225     }
1226
1227   return delay_list;
1228 }
1229 #endif
1230 \f
1231
1232 /*  Encode and return branch direction and prediction information for
1233     INSN assuming it will jump to LABEL.
1234
1235     Non conditional branches return no direction information and
1236     are predicted as very likely taken.  */
1237
1238 static int
1239 get_jump_flags (insn, label)
1240      rtx insn, label;
1241 {
1242   int flags;
1243
1244   /* get_jump_flags can be passed any insn with delay slots, these may
1245      be INSNs, CALL_INSNs, or JUMP_INSNs.  Only JUMP_INSNs have branch
1246      direction information, and only if they are conditional jumps.
1247
1248      If LABEL is zero, then there is no way to determine the branch
1249      direction.  */
1250   if (GET_CODE (insn) == JUMP_INSN
1251       && (condjump_p (insn) || condjump_in_parallel_p (insn))
1252       && INSN_UID (insn) <= max_uid
1253       && label != 0
1254       && INSN_UID (label) <= max_uid)
1255     flags 
1256       = (uid_to_ruid[INSN_UID (label)] > uid_to_ruid[INSN_UID (insn)])
1257          ? ATTR_FLAG_forward : ATTR_FLAG_backward;
1258   /* No valid direction information.  */
1259   else
1260     flags = 0;
1261   
1262   /* If insn is a conditional branch call mostly_true_jump to get
1263      determine the branch prediction.  
1264
1265      Non conditional branches are predicted as very likely taken.  */
1266   if (GET_CODE (insn) == JUMP_INSN
1267       && (condjump_p (insn) || condjump_in_parallel_p (insn)))
1268     {
1269       int prediction;
1270
1271       prediction = mostly_true_jump (insn, get_branch_condition (insn, label));
1272       switch (prediction)
1273         {
1274           case 2:
1275             flags |= (ATTR_FLAG_very_likely | ATTR_FLAG_likely);
1276             break;
1277           case 1:
1278             flags |= ATTR_FLAG_likely;
1279             break;
1280           case 0:
1281             flags |= ATTR_FLAG_unlikely;
1282             break;
1283           case -1:
1284             flags |= (ATTR_FLAG_very_unlikely | ATTR_FLAG_unlikely);
1285             break;
1286
1287           default:
1288             abort();
1289         }
1290     }
1291   else
1292     flags |= (ATTR_FLAG_very_likely | ATTR_FLAG_likely);
1293
1294   return flags;
1295 }
1296
1297 /* Return 1 if INSN is a destination that will be branched to rarely (the
1298    return point of a function); return 2 if DEST will be branched to very
1299    rarely (a call to a function that doesn't return).  Otherwise,
1300    return 0.  */
1301
1302 static int
1303 rare_destination (insn)
1304      rtx insn;
1305 {
1306   int jump_count = 0;
1307   rtx next;
1308
1309   for (; insn; insn = next)
1310     {
1311       if (GET_CODE (insn) == INSN && GET_CODE (PATTERN (insn)) == SEQUENCE)
1312         insn = XVECEXP (PATTERN (insn), 0, 0);
1313
1314       next = NEXT_INSN (insn);
1315
1316       switch (GET_CODE (insn))
1317         {
1318         case CODE_LABEL:
1319           return 0;
1320         case BARRIER:
1321           /* A BARRIER can either be after a JUMP_INSN or a CALL_INSN.  We 
1322              don't scan past JUMP_INSNs, so any barrier we find here must
1323              have been after a CALL_INSN and hence mean the call doesn't
1324              return.  */
1325           return 2;
1326         case JUMP_INSN:
1327           if (GET_CODE (PATTERN (insn)) == RETURN)
1328             return 1;
1329           else if (simplejump_p (insn)
1330                    && jump_count++ < 10)
1331             next = JUMP_LABEL (insn);
1332           else
1333             return 0;
1334         }
1335     }
1336
1337   /* If we got here it means we hit the end of the function.  So this
1338      is an unlikely destination.  */
1339
1340   return 1;
1341 }
1342
1343 /* Return truth value of the statement that this branch
1344    is mostly taken.  If we think that the branch is extremely likely
1345    to be taken, we return 2.  If the branch is slightly more likely to be
1346    taken, return 1.  If the branch is slightly less likely to be taken,
1347    return 0 and if the branch is highly unlikely to be taken, return -1.
1348
1349    CONDITION, if non-zero, is the condition that JUMP_INSN is testing.  */
1350
1351 static int
1352 mostly_true_jump (jump_insn, condition)
1353      rtx jump_insn, condition;
1354 {
1355   rtx target_label = JUMP_LABEL (jump_insn);
1356   rtx insn;
1357   int rare_dest = rare_destination (target_label);
1358   int rare_fallthrough = rare_destination (NEXT_INSN (jump_insn));
1359
1360   /* If branch probabilities are available, then use that number since it
1361      always gives a correct answer.  */
1362   if (flag_branch_probabilities)
1363     {
1364       rtx note = find_reg_note (jump_insn, REG_BR_PROB, 0);;
1365       if (note)
1366         {
1367           int prob = XINT (note, 0);
1368
1369           if (prob >= REG_BR_PROB_BASE * 9 / 10)
1370             return 2;
1371           else if (prob >= REG_BR_PROB_BASE / 2)
1372             return 1;
1373           else if (prob >= REG_BR_PROB_BASE / 10)
1374             return 0;
1375           else
1376             return -1;
1377         }
1378     }
1379
1380   /* If this is a branch outside a loop, it is highly unlikely.  */
1381   if (GET_CODE (PATTERN (jump_insn)) == SET
1382       && GET_CODE (SET_SRC (PATTERN (jump_insn))) == IF_THEN_ELSE
1383       && ((GET_CODE (XEXP (SET_SRC (PATTERN (jump_insn)), 1)) == LABEL_REF
1384            && LABEL_OUTSIDE_LOOP_P (XEXP (SET_SRC (PATTERN (jump_insn)), 1)))
1385           || (GET_CODE (XEXP (SET_SRC (PATTERN (jump_insn)), 2)) == LABEL_REF
1386               && LABEL_OUTSIDE_LOOP_P (XEXP (SET_SRC (PATTERN (jump_insn)), 2)))))
1387     return -1;
1388
1389   if (target_label)
1390     {
1391       /* If this is the test of a loop, it is very likely true.  We scan
1392          backwards from the target label.  If we find a NOTE_INSN_LOOP_BEG
1393          before the next real insn, we assume the branch is to the top of 
1394          the loop.  */
1395       for (insn = PREV_INSN (target_label);
1396            insn && GET_CODE (insn) == NOTE;
1397            insn = PREV_INSN (insn))
1398         if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_BEG)
1399           return 2;
1400
1401       /* If this is a jump to the test of a loop, it is likely true.  We scan
1402          forwards from the target label.  If we find a NOTE_INSN_LOOP_VTOP
1403          before the next real insn, we assume the branch is to the loop branch
1404          test.  */
1405       for (insn = NEXT_INSN (target_label);
1406            insn && GET_CODE (insn) == NOTE;
1407            insn = PREV_INSN (insn))
1408         if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_VTOP)
1409           return 1;
1410     }
1411
1412   /* Look at the relative rarities of the fallthrough and destination.  If
1413      they differ, we can predict the branch that way.  */
1414
1415   switch (rare_fallthrough - rare_dest)
1416     {
1417     case -2:
1418       return -1;
1419     case -1:
1420       return 0;
1421     case 0:
1422       break;
1423     case 1:
1424       return 1;
1425     case 2:
1426       return 2;
1427     }
1428
1429   /* If we couldn't figure out what this jump was, assume it won't be 
1430      taken.  This should be rare.  */
1431   if (condition == 0)
1432     return 0;
1433
1434   /* EQ tests are usually false and NE tests are usually true.  Also,
1435      most quantities are positive, so we can make the appropriate guesses
1436      about signed comparisons against zero.  */
1437   switch (GET_CODE (condition))
1438     {
1439     case CONST_INT:
1440       /* Unconditional branch.  */
1441       return 1;
1442     case EQ:
1443       return 0;
1444     case NE:
1445       return 1;
1446     case LE:
1447     case LT:
1448       if (XEXP (condition, 1) == const0_rtx)
1449         return 0;
1450       break;
1451     case GE:
1452     case GT:
1453       if (XEXP (condition, 1) == const0_rtx)
1454         return 1;
1455       break;
1456     }
1457
1458   /* Predict backward branches usually take, forward branches usually not.  If
1459      we don't know whether this is forward or backward, assume the branch
1460      will be taken, since most are.  */
1461   return (target_label == 0 || INSN_UID (jump_insn) > max_uid
1462           || INSN_UID (target_label) > max_uid
1463           || (uid_to_ruid[INSN_UID (jump_insn)]
1464               > uid_to_ruid[INSN_UID (target_label)]));;
1465 }
1466
1467 /* Return the condition under which INSN will branch to TARGET.  If TARGET
1468    is zero, return the condition under which INSN will return.  If INSN is
1469    an unconditional branch, return const_true_rtx.  If INSN isn't a simple
1470    type of jump, or it doesn't go to TARGET, return 0.  */
1471
1472 static rtx
1473 get_branch_condition (insn, target)
1474      rtx insn;
1475      rtx target;
1476 {
1477   rtx pat = PATTERN (insn);
1478   rtx src;
1479   
1480   if (condjump_in_parallel_p (insn))
1481     pat = XVECEXP (pat, 0, 0);
1482
1483   if (GET_CODE (pat) == RETURN)
1484     return target == 0 ? const_true_rtx : 0;
1485
1486   else if (GET_CODE (pat) != SET || SET_DEST (pat) != pc_rtx)
1487     return 0;
1488
1489   src = SET_SRC (pat);
1490   if (GET_CODE (src) == LABEL_REF && XEXP (src, 0) == target)
1491     return const_true_rtx;
1492
1493   else if (GET_CODE (src) == IF_THEN_ELSE
1494            && ((target == 0 && GET_CODE (XEXP (src, 1)) == RETURN)
1495                || (GET_CODE (XEXP (src, 1)) == LABEL_REF
1496                    && XEXP (XEXP (src, 1), 0) == target))
1497            && XEXP (src, 2) == pc_rtx)
1498     return XEXP (src, 0);
1499
1500   else if (GET_CODE (src) == IF_THEN_ELSE
1501            && ((target == 0 && GET_CODE (XEXP (src, 2)) == RETURN)
1502                || (GET_CODE (XEXP (src, 2)) == LABEL_REF
1503                    && XEXP (XEXP (src, 2), 0) == target))
1504            && XEXP (src, 1) == pc_rtx)
1505     return gen_rtx (reverse_condition (GET_CODE (XEXP (src, 0))),
1506                     GET_MODE (XEXP (src, 0)),
1507                     XEXP (XEXP (src, 0), 0), XEXP (XEXP (src, 0), 1));
1508
1509   return 0;
1510 }
1511
1512 /* Return non-zero if CONDITION is more strict than the condition of
1513    INSN, i.e., if INSN will always branch if CONDITION is true.  */
1514
1515 static int
1516 condition_dominates_p (condition, insn)
1517      rtx condition;
1518      rtx insn;
1519 {
1520   rtx other_condition = get_branch_condition (insn, JUMP_LABEL (insn));
1521   enum rtx_code code = GET_CODE (condition);
1522   enum rtx_code other_code;
1523
1524   if (rtx_equal_p (condition, other_condition)
1525       || other_condition == const_true_rtx)
1526     return 1;
1527
1528   else if (condition == const_true_rtx || other_condition == 0)
1529     return 0;
1530
1531   other_code = GET_CODE (other_condition);
1532   if (GET_RTX_LENGTH (code) != 2 || GET_RTX_LENGTH (other_code) != 2
1533       || ! rtx_equal_p (XEXP (condition, 0), XEXP (other_condition, 0))
1534       || ! rtx_equal_p (XEXP (condition, 1), XEXP (other_condition, 1)))
1535     return 0;
1536
1537   return comparison_dominates_p (code, other_code);
1538 }
1539
1540 /* Return non-zero if redirecting JUMP to NEWLABEL does not invalidate
1541    any insns already in the delay slot of JUMP.  */
1542
1543 static int
1544 redirect_with_delay_slots_safe_p (jump, newlabel, seq)
1545      rtx jump, newlabel, seq;
1546 {
1547   int flags, slots, i;
1548   rtx pat = PATTERN (seq);
1549
1550   /* Make sure all the delay slots of this jump would still
1551      be valid after threading the jump.  If they are still
1552      valid, then return non-zero.  */
1553
1554   flags = get_jump_flags (jump, newlabel);
1555   for (i = 1; i < XVECLEN (pat, 0); i++)
1556     if (! (
1557 #ifdef ANNUL_IFFALSE_SLOTS
1558            (INSN_ANNULLED_BRANCH_P (jump)
1559             && INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)))
1560            ? eligible_for_annul_false (jump, i - 1,
1561                                        XVECEXP (pat, 0, i), flags) :
1562 #endif
1563 #ifdef ANNUL_IFTRUE_SLOTS
1564            (INSN_ANNULLED_BRANCH_P (jump)
1565             && ! INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)))
1566            ? eligible_for_annul_true (jump, i - 1,
1567                                       XVECEXP (pat, 0, i), flags) :
1568 #endif
1569            eligible_for_delay (jump, i -1, XVECEXP (pat, 0, i), flags)))
1570       break;
1571
1572   return (i == XVECLEN (pat, 0));
1573 }
1574
1575 /* Return non-zero if redirecting JUMP to NEWLABEL does not invalidate
1576    any insns we wish to place in the delay slot of JUMP.  */
1577
1578 static int
1579 redirect_with_delay_list_safe_p (jump, newlabel, delay_list)
1580      rtx jump, newlabel, delay_list;
1581 {
1582   int flags, i;
1583   rtx li;
1584
1585   /* Make sure all the insns in DELAY_LIST would still be
1586      valid after threading the jump.  If they are still
1587      valid, then return non-zero.  */
1588
1589   flags = get_jump_flags (jump, newlabel);
1590   for (li = delay_list, i = 0; li; li = XEXP (li, 1), i++)
1591     if (! (
1592 #ifdef ANNUL_IFFALSE_SLOTS
1593            (INSN_ANNULLED_BRANCH_P (jump)
1594             && INSN_FROM_TARGET_P (XEXP (li, 0)))
1595            ? eligible_for_annul_false (jump, i, XEXP (li, 0), flags) :
1596 #endif
1597 #ifdef ANNUL_IFTRUE_SLOTS
1598            (INSN_ANNULLED_BRANCH_P (jump)
1599             && ! INSN_FROM_TARGET_P (XEXP (li, 0)))
1600            ? eligible_for_annul_true (jump, i, XEXP (li, 0), flags) :
1601 #endif
1602            eligible_for_delay (jump, i, XEXP (li, 0), flags)))
1603       break;
1604
1605   return (li == NULL);
1606 }
1607
1608 \f
1609 /* INSN branches to an insn whose pattern SEQ is a SEQUENCE.  Given that
1610    the condition tested by INSN is CONDITION and the resources shown in
1611    OTHER_NEEDED are needed after INSN, see whether INSN can take all the insns
1612    from SEQ's delay list, in addition to whatever insns it may execute
1613    (in DELAY_LIST).   SETS and NEEDED are denote resources already set and
1614    needed while searching for delay slot insns.  Return the concatenated
1615    delay list if possible, otherwise, return 0.
1616
1617    SLOTS_TO_FILL is the total number of slots required by INSN, and
1618    PSLOTS_FILLED points to the number filled so far (also the number of
1619    insns in DELAY_LIST).  It is updated with the number that have been
1620    filled from the SEQUENCE, if any.
1621
1622    PANNUL_P points to a non-zero value if we already know that we need
1623    to annul INSN.  If this routine determines that annulling is needed,
1624    it may set that value non-zero.
1625
1626    PNEW_THREAD points to a location that is to receive the place at which
1627    execution should continue.  */
1628
1629 static rtx
1630 steal_delay_list_from_target (insn, condition, seq, delay_list,
1631                               sets, needed, other_needed,
1632                               slots_to_fill, pslots_filled, pannul_p,
1633                               pnew_thread)
1634      rtx insn, condition;
1635      rtx seq;
1636      rtx delay_list;
1637      struct resources *sets, *needed, *other_needed;
1638      int slots_to_fill;
1639      int *pslots_filled;
1640      int *pannul_p;
1641      rtx *pnew_thread;
1642 {
1643   rtx temp;
1644   int slots_remaining = slots_to_fill - *pslots_filled;
1645   int total_slots_filled = *pslots_filled;
1646   rtx new_delay_list = 0;
1647   int must_annul = *pannul_p;
1648   int i;
1649
1650   /* We can't do anything if there are more delay slots in SEQ than we
1651      can handle, or if we don't know that it will be a taken branch.
1652      We know that it will be a taken branch if it is either an unconditional
1653      branch or a conditional branch with a stricter branch condition.
1654
1655      Also, exit if the branch has more than one set, since then it is computing
1656      other results that can't be ignored, e.g. the HPPA mov&branch instruction.
1657      ??? It may be possible to move other sets into INSN in addition to
1658      moving the instructions in the delay slots.  */
1659
1660   if (XVECLEN (seq, 0) - 1 > slots_remaining
1661       || ! condition_dominates_p (condition, XVECEXP (seq, 0, 0))
1662       || ! single_set (XVECEXP (seq, 0, 0)))
1663     return delay_list;
1664
1665   for (i = 1; i < XVECLEN (seq, 0); i++)
1666     {
1667       rtx trial = XVECEXP (seq, 0, i);
1668       int flags;
1669
1670       if (insn_references_resource_p (trial, sets, 0)
1671           || insn_sets_resource_p (trial, needed, 0)
1672           || insn_sets_resource_p (trial, sets, 0)
1673 #ifdef HAVE_cc0
1674           /* If TRIAL sets CC0, we can't copy it, so we can't steal this
1675              delay list.  */
1676           || find_reg_note (trial, REG_CC_USER, NULL_RTX)
1677 #endif
1678           /* If TRIAL is from the fallthrough code of an annulled branch insn
1679              in SEQ, we cannot use it.  */
1680           || (INSN_ANNULLED_BRANCH_P (XVECEXP (seq, 0, 0))
1681               && ! INSN_FROM_TARGET_P (trial)))
1682         return delay_list;
1683
1684       /* If this insn was already done (usually in a previous delay slot),
1685          pretend we put it in our delay slot.  */
1686       if (redundant_insn (trial, insn, new_delay_list))
1687         continue;
1688
1689       /* We will end up re-vectoring this branch, so compute flags
1690          based on jumping to the new label.  */
1691       flags = get_jump_flags (insn, JUMP_LABEL (XVECEXP (seq, 0, 0)));
1692
1693       if (! must_annul
1694           && ((condition == const_true_rtx
1695                || (! insn_sets_resource_p (trial, other_needed, 0)
1696                    && ! may_trap_p (PATTERN (trial)))))
1697           ? eligible_for_delay (insn, total_slots_filled, trial, flags)
1698           : (must_annul = 1,
1699              eligible_for_annul_false (insn, total_slots_filled, trial, flags)))
1700         {
1701           temp = copy_rtx (trial);
1702           INSN_FROM_TARGET_P (temp) = 1;
1703           new_delay_list = add_to_delay_list (temp, new_delay_list);
1704           total_slots_filled++;
1705
1706           if (--slots_remaining == 0)
1707             break;
1708         }
1709       else
1710         return delay_list;
1711     }
1712
1713   /* Show the place to which we will be branching.  */
1714   *pnew_thread = next_active_insn (JUMP_LABEL (XVECEXP (seq, 0, 0)));
1715
1716   /* Add any new insns to the delay list and update the count of the
1717      number of slots filled.  */
1718   *pslots_filled = total_slots_filled;
1719   *pannul_p = must_annul;
1720
1721   if (delay_list == 0)
1722     return new_delay_list;
1723
1724   for (temp = new_delay_list; temp; temp = XEXP (temp, 1))
1725     delay_list = add_to_delay_list (XEXP (temp, 0), delay_list);
1726
1727   return delay_list;
1728 }
1729 \f
1730 /* Similar to steal_delay_list_from_target except that SEQ is on the 
1731    fallthrough path of INSN.  Here we only do something if the delay insn
1732    of SEQ is an unconditional branch.  In that case we steal its delay slot
1733    for INSN since unconditional branches are much easier to fill.  */
1734
1735 static rtx
1736 steal_delay_list_from_fallthrough (insn, condition, seq, 
1737                                    delay_list, sets, needed, other_needed,
1738                                    slots_to_fill, pslots_filled, pannul_p)
1739      rtx insn, condition;
1740      rtx seq;
1741      rtx delay_list;
1742      struct resources *sets, *needed, *other_needed;
1743      int slots_to_fill;
1744      int *pslots_filled;
1745      int *pannul_p;
1746 {
1747   int i;
1748   int flags;
1749
1750   flags = get_jump_flags (insn, JUMP_LABEL (insn));
1751
1752   /* We can't do anything if SEQ's delay insn isn't an
1753      unconditional branch.  */
1754
1755   if (! simplejump_p (XVECEXP (seq, 0, 0))
1756       && GET_CODE (PATTERN (XVECEXP (seq, 0, 0))) != RETURN)
1757     return delay_list;
1758
1759   for (i = 1; i < XVECLEN (seq, 0); i++)
1760     {
1761       rtx trial = XVECEXP (seq, 0, i);
1762
1763       /* If TRIAL sets CC0, stealing it will move it too far from the use
1764          of CC0.  */
1765       if (insn_references_resource_p (trial, sets, 0)
1766           || insn_sets_resource_p (trial, needed, 0)
1767           || insn_sets_resource_p (trial, sets, 0)
1768 #ifdef HAVE_cc0
1769           || sets_cc0_p (PATTERN (trial))
1770 #endif
1771           )
1772
1773         break;
1774
1775       /* If this insn was already done, we don't need it.  */
1776       if (redundant_insn (trial, insn, delay_list))
1777         {
1778           delete_from_delay_slot (trial);
1779           continue;
1780         }
1781
1782       if (! *pannul_p
1783           && ((condition == const_true_rtx
1784                || (! insn_sets_resource_p (trial, other_needed, 0)
1785                    && ! may_trap_p (PATTERN (trial)))))
1786           ? eligible_for_delay (insn, *pslots_filled, trial, flags)
1787           : (*pannul_p = 1,
1788              eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
1789         {
1790           delete_from_delay_slot (trial);
1791           delay_list = add_to_delay_list (trial, delay_list);
1792
1793           if (++(*pslots_filled) == slots_to_fill)
1794             break;
1795         }
1796       else
1797         break;
1798     }
1799
1800   return delay_list;
1801 }
1802 \f
1803 /* Try merging insns starting at THREAD which match exactly the insns in
1804    INSN's delay list.
1805
1806    If all insns were matched and the insn was previously annulling, the
1807    annul bit will be cleared.
1808
1809    For each insn that is merged, if the branch is or will be non-annulling,
1810    we delete the merged insn.  */
1811
1812 static void
1813 try_merge_delay_insns (insn, thread)
1814      rtx insn, thread;
1815 {
1816   rtx trial, next_trial;
1817   rtx delay_insn = XVECEXP (PATTERN (insn), 0, 0);
1818   int annul_p = INSN_ANNULLED_BRANCH_P (delay_insn);
1819   int slot_number = 1;
1820   int num_slots = XVECLEN (PATTERN (insn), 0);
1821   rtx next_to_match = XVECEXP (PATTERN (insn), 0, slot_number);
1822   struct resources set, needed;
1823   rtx merged_insns = 0;
1824   int i;
1825   int flags;
1826
1827   flags = get_jump_flags (delay_insn, JUMP_LABEL (delay_insn));
1828
1829   CLEAR_RESOURCE (&needed);
1830   CLEAR_RESOURCE (&set);
1831
1832   /* If this is not an annulling branch, take into account anything needed in
1833      NEXT_TO_MATCH.  This prevents two increments from being incorrectly
1834      folded into one.  If we are annulling, this would be the correct
1835      thing to do.  (The alternative, looking at things set in NEXT_TO_MATCH
1836      will essentially disable this optimization.  This method is somewhat of
1837      a kludge, but I don't see a better way.)  */
1838   if (! annul_p)
1839     mark_referenced_resources (next_to_match, &needed, 1);
1840
1841   for (trial = thread; !stop_search_p (trial, 1); trial = next_trial)
1842     {
1843       rtx pat = PATTERN (trial);
1844       rtx oldtrial = trial;
1845
1846       next_trial = next_nonnote_insn (trial);
1847
1848       /* TRIAL must be a CALL_INSN or INSN.  Skip USE and CLOBBER.  */
1849       if (GET_CODE (trial) == INSN
1850           && (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER))
1851         continue;
1852
1853       if (GET_CODE (next_to_match) == GET_CODE (trial)
1854 #ifdef HAVE_cc0
1855           /* We can't share an insn that sets cc0.  */
1856           && ! sets_cc0_p (pat)
1857 #endif
1858           && ! insn_references_resource_p (trial, &set, 1)
1859           && ! insn_sets_resource_p (trial, &set, 1)
1860           && ! insn_sets_resource_p (trial, &needed, 1)
1861           && (trial = try_split (pat, trial, 0)) != 0
1862           /* Update next_trial, in case try_split succeeded.  */
1863           && (next_trial = next_nonnote_insn (trial))
1864           /* Likewise THREAD.  */
1865           && (thread = oldtrial == thread ? trial : thread)
1866           && rtx_equal_p (PATTERN (next_to_match), PATTERN (trial))
1867           /* Have to test this condition if annul condition is different
1868              from (and less restrictive than) non-annulling one.  */
1869           && eligible_for_delay (delay_insn, slot_number - 1, trial, flags))
1870         {
1871
1872           if (! annul_p)
1873             {
1874               update_block (trial, thread);
1875               if (trial == thread)
1876                 thread = next_active_insn (thread);
1877
1878               delete_insn (trial);
1879               INSN_FROM_TARGET_P (next_to_match) = 0;
1880             }
1881           else
1882             merged_insns = gen_rtx (INSN_LIST, VOIDmode, trial, merged_insns);
1883
1884           if (++slot_number == num_slots)
1885             break;
1886
1887           next_to_match = XVECEXP (PATTERN (insn), 0, slot_number);
1888           if (! annul_p)
1889             mark_referenced_resources (next_to_match, &needed, 1);
1890         }
1891
1892       mark_set_resources (trial, &set, 0, 1);
1893       mark_referenced_resources (trial, &needed, 1);
1894     }
1895
1896   /* See if we stopped on a filled insn.  If we did, try to see if its
1897      delay slots match.  */
1898   if (slot_number != num_slots
1899       && trial && GET_CODE (trial) == INSN
1900       && GET_CODE (PATTERN (trial)) == SEQUENCE
1901       && ! INSN_ANNULLED_BRANCH_P (XVECEXP (PATTERN (trial), 0, 0)))
1902     {
1903       rtx pat = PATTERN (trial);
1904       rtx filled_insn = XVECEXP (pat, 0, 0);
1905
1906       /* Account for resources set/needed by the filled insn.  */
1907       mark_set_resources (filled_insn, &set, 0, 1);
1908       mark_referenced_resources (filled_insn, &needed, 1);
1909
1910       for (i = 1; i < XVECLEN (pat, 0); i++)
1911         {
1912           rtx dtrial = XVECEXP (pat, 0, i);
1913
1914           if (! insn_references_resource_p (dtrial, &set, 1)
1915               && ! insn_sets_resource_p (dtrial, &set, 1)
1916               && ! insn_sets_resource_p (dtrial, &needed, 1)
1917 #ifdef HAVE_cc0
1918               && ! sets_cc0_p (PATTERN (dtrial))
1919 #endif
1920               && rtx_equal_p (PATTERN (next_to_match), PATTERN (dtrial))
1921               && eligible_for_delay (delay_insn, slot_number - 1, dtrial, flags))
1922             {
1923               if (! annul_p)
1924                 {
1925                   update_block (dtrial, thread);
1926                   delete_from_delay_slot (dtrial);
1927                   INSN_FROM_TARGET_P (next_to_match) = 0;
1928                 }
1929               else
1930                 merged_insns = gen_rtx (INSN_LIST, SImode, dtrial,
1931                                         merged_insns);
1932
1933               if (++slot_number == num_slots)
1934                 break;
1935
1936               next_to_match = XVECEXP (PATTERN (insn), 0, slot_number);
1937             }
1938         }
1939     }
1940
1941   /* If all insns in the delay slot have been matched and we were previously
1942      annulling the branch, we need not any more.  In that case delete all the
1943      merged insns.  Also clear the INSN_FROM_TARGET_P bit of each insn the
1944      the delay list so that we know that it isn't only being used at the
1945      target.  */
1946   if (slot_number == num_slots && annul_p)
1947     {
1948       for (; merged_insns; merged_insns = XEXP (merged_insns, 1))
1949         {
1950           if (GET_MODE (merged_insns) == SImode)
1951             {
1952               update_block (XEXP (merged_insns, 0), thread);
1953               delete_from_delay_slot (XEXP (merged_insns, 0));
1954             }
1955           else
1956             {
1957               update_block (XEXP (merged_insns, 0), thread);
1958               delete_insn (XEXP (merged_insns, 0));
1959             }
1960         }
1961
1962       INSN_ANNULLED_BRANCH_P (delay_insn) = 0;
1963
1964       for (i = 0; i < XVECLEN (PATTERN (insn), 0); i++)
1965         INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i)) = 0;
1966     }
1967 }
1968 \f
1969 /* See if INSN is redundant with an insn in front of TARGET.  Often this
1970    is called when INSN is a candidate for a delay slot of TARGET.
1971    DELAY_LIST are insns that will be placed in delay slots of TARGET in front
1972    of INSN.  Often INSN will be redundant with an insn in a delay slot of
1973    some previous insn.  This happens when we have a series of branches to the
1974    same label; in that case the first insn at the target might want to go
1975    into each of the delay slots.
1976
1977    If we are not careful, this routine can take up a significant fraction
1978    of the total compilation time (4%), but only wins rarely.  Hence we
1979    speed this routine up by making two passes.  The first pass goes back
1980    until it hits a label and sees if it find an insn with an identical
1981    pattern.  Only in this (relatively rare) event does it check for
1982    data conflicts.
1983
1984    We do not split insns we encounter.  This could cause us not to find a
1985    redundant insn, but the cost of splitting seems greater than the possible
1986    gain in rare cases.  */
1987
1988 static rtx
1989 redundant_insn (insn, target, delay_list)
1990      rtx insn;
1991      rtx target;
1992      rtx delay_list;
1993 {
1994   rtx target_main = target;
1995   rtx ipat = PATTERN (insn);
1996   rtx trial, pat;
1997   struct resources needed, set;
1998   int i;
1999
2000   /* If INSN has any REG_UNUSED notes, it can't match anything since we
2001      are allowed to not actually assign to such a register.  */
2002   if (find_reg_note (insn, REG_UNUSED, NULL_RTX) != 0)
2003     return 0;
2004
2005   /* Scan backwards looking for a match.  */
2006   for (trial = PREV_INSN (target); trial; trial = PREV_INSN (trial))
2007     {
2008       if (GET_CODE (trial) == CODE_LABEL)
2009         return 0;
2010
2011       if (GET_RTX_CLASS (GET_CODE (trial)) != 'i')
2012         continue;
2013
2014       pat = PATTERN (trial);
2015       if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
2016         continue;
2017
2018       if (GET_CODE (pat) == SEQUENCE)
2019         {
2020           /* Stop for a CALL and its delay slots because it is difficult to
2021              track its resource needs correctly.  */
2022           if (GET_CODE (XVECEXP (pat, 0, 0)) == CALL_INSN)
2023             return 0;
2024
2025           /* Stop for an INSN or JUMP_INSN with delayed effects and its delay
2026              slots because it is difficult to track its resource needs 
2027              correctly.  */
2028
2029 #ifdef INSN_SETS_ARE_DELAYED
2030           if (INSN_SETS_ARE_DELAYED (XVECEXP (pat, 0, 0)))
2031             return 0; 
2032 #endif
2033
2034 #ifdef INSN_REFERENCES_ARE_DELAYED
2035           if (INSN_REFERENCES_ARE_DELAYED (XVECEXP (pat, 0, 0)))
2036             return 0; 
2037 #endif
2038
2039           /* See if any of the insns in the delay slot match, updating
2040              resource requirements as we go.  */
2041           for (i = XVECLEN (pat, 0) - 1; i > 0; i--)
2042             if (GET_CODE (XVECEXP (pat, 0, i)) == GET_CODE (insn)
2043                 && rtx_equal_p (PATTERN (XVECEXP (pat, 0, i)), ipat)
2044                 && ! find_reg_note (XVECEXP (pat, 0, i), REG_UNUSED, NULL_RTX))
2045               break;
2046
2047           /* If found a match, exit this loop early.  */
2048           if (i > 0)
2049             break;
2050         }
2051
2052       else if (GET_CODE (trial) == GET_CODE (insn) && rtx_equal_p (pat, ipat)
2053                && ! find_reg_note (trial, REG_UNUSED, NULL_RTX))
2054         break;
2055     }
2056
2057   /* If we didn't find an insn that matches, return 0.  */
2058   if (trial == 0)
2059     return 0;
2060
2061   /* See what resources this insn sets and needs.  If they overlap, or
2062      if this insn references CC0, it can't be redundant.  */
2063
2064   CLEAR_RESOURCE (&needed);
2065   CLEAR_RESOURCE (&set);
2066   mark_set_resources (insn, &set, 0, 1);
2067   mark_referenced_resources (insn, &needed, 1);
2068
2069   /* If TARGET is a SEQUENCE, get the main insn.  */
2070   if (GET_CODE (target) == INSN && GET_CODE (PATTERN (target)) == SEQUENCE)
2071     target_main = XVECEXP (PATTERN (target), 0, 0);
2072
2073   if (resource_conflicts_p (&needed, &set)
2074 #ifdef HAVE_cc0
2075       || reg_mentioned_p (cc0_rtx, ipat)
2076 #endif
2077       /* The insn requiring the delay may not set anything needed or set by
2078          INSN.  */
2079       || insn_sets_resource_p (target_main, &needed, 1)
2080       || insn_sets_resource_p (target_main, &set, 1))
2081     return 0;
2082
2083   /* Insns we pass may not set either NEEDED or SET, so merge them for
2084      simpler tests.  */
2085   needed.memory |= set.memory;
2086   needed.unch_memory |= set.unch_memory;
2087   IOR_HARD_REG_SET (needed.regs, set.regs);
2088
2089   /* This insn isn't redundant if it conflicts with an insn that either is
2090      or will be in a delay slot of TARGET.  */
2091
2092   while (delay_list)
2093     {
2094       if (insn_sets_resource_p (XEXP (delay_list, 0), &needed, 1))
2095         return 0;
2096       delay_list = XEXP (delay_list, 1);
2097     }
2098
2099   if (GET_CODE (target) == INSN && GET_CODE (PATTERN (target)) == SEQUENCE)
2100     for (i = 1; i < XVECLEN (PATTERN (target), 0); i++)
2101       if (insn_sets_resource_p (XVECEXP (PATTERN (target), 0, i), &needed, 1))
2102         return 0;
2103
2104   /* Scan backwards until we reach a label or an insn that uses something
2105      INSN sets or sets something insn uses or sets.  */
2106
2107   for (trial = PREV_INSN (target);
2108        trial && GET_CODE (trial) != CODE_LABEL;
2109        trial = PREV_INSN (trial))
2110     {
2111       if (GET_CODE (trial) != INSN && GET_CODE (trial) != CALL_INSN
2112           && GET_CODE (trial) != JUMP_INSN)
2113         continue;
2114
2115       pat = PATTERN (trial);
2116       if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
2117         continue;
2118
2119       if (GET_CODE (pat) == SEQUENCE)
2120         {
2121           /* If this is a CALL_INSN and its delay slots, it is hard to track
2122              the resource needs properly, so give up.  */
2123           if (GET_CODE (XVECEXP (pat, 0, 0)) == CALL_INSN)
2124             return 0;
2125
2126           /* If this this is an INSN or JUMP_INSN with delayed effects, it
2127              is hard to track the resource needs properly, so give up.  */
2128
2129 #ifdef INSN_SETS_ARE_DELAYED
2130           if (INSN_SETS_ARE_DELAYED (XVECEXP (pat, 0, 0)))
2131             return 0; 
2132 #endif
2133
2134 #ifdef INSN_REFERENCES_ARE_DELAYED
2135           if (INSN_REFERENCES_ARE_DELAYED (XVECEXP (pat, 0, 0)))
2136             return 0; 
2137 #endif
2138
2139           /* See if any of the insns in the delay slot match, updating
2140              resource requirements as we go.  */
2141           for (i = XVECLEN (pat, 0) - 1; i > 0; i--)
2142             {
2143               rtx candidate = XVECEXP (pat, 0, i);
2144
2145               /* If an insn will be annulled if the branch is false, it isn't
2146                  considered as a possible duplicate insn.  */
2147               if (rtx_equal_p (PATTERN (candidate), ipat)
2148                   && ! (INSN_ANNULLED_BRANCH_P (XVECEXP (pat, 0, 0))
2149                         && INSN_FROM_TARGET_P (candidate)))
2150                 {
2151                   /* Show that this insn will be used in the sequel.  */
2152                   INSN_FROM_TARGET_P (candidate) = 0;
2153                   return candidate;
2154                 }
2155
2156               /* Unless this is an annulled insn from the target of a branch,
2157                  we must stop if it sets anything needed or set by INSN.  */
2158               if ((! INSN_ANNULLED_BRANCH_P (XVECEXP (pat, 0, 0))
2159                    || ! INSN_FROM_TARGET_P (candidate))
2160                   && insn_sets_resource_p (candidate, &needed, 1))
2161                 return 0;
2162             }
2163
2164
2165           /* If the insn requiring the delay slot conflicts with INSN, we 
2166              must stop.  */
2167           if (insn_sets_resource_p (XVECEXP (pat, 0, 0), &needed, 1))
2168             return 0;
2169         }
2170       else
2171         {
2172           /* See if TRIAL is the same as INSN.  */
2173           pat = PATTERN (trial);
2174           if (rtx_equal_p (pat, ipat))
2175             return trial;
2176
2177           /* Can't go any further if TRIAL conflicts with INSN.  */
2178           if (insn_sets_resource_p (trial, &needed, 1))
2179             return 0;
2180         }
2181     }
2182
2183   return 0;
2184 }
2185 \f
2186 /* Return 1 if THREAD can only be executed in one way.  If LABEL is non-zero,
2187    it is the target of the branch insn being scanned.  If ALLOW_FALLTHROUGH
2188    is non-zero, we are allowed to fall into this thread; otherwise, we are
2189    not.
2190
2191    If LABEL is used more than one or we pass a label other than LABEL before
2192    finding an active insn, we do not own this thread.  */
2193
2194 static int
2195 own_thread_p (thread, label, allow_fallthrough)
2196      rtx thread;
2197      rtx label;
2198      int allow_fallthrough;
2199 {
2200   rtx active_insn;
2201   rtx insn;
2202
2203   /* We don't own the function end.  */
2204   if (thread == 0)
2205     return 0;
2206
2207   /* Get the first active insn, or THREAD, if it is an active insn.  */
2208   active_insn = next_active_insn (PREV_INSN (thread));
2209
2210   for (insn = thread; insn != active_insn; insn = NEXT_INSN (insn))
2211     if (GET_CODE (insn) == CODE_LABEL
2212         && (insn != label || LABEL_NUSES (insn) != 1))
2213       return 0;
2214
2215   if (allow_fallthrough)
2216     return 1;
2217
2218   /* Ensure that we reach a BARRIER before any insn or label.  */
2219   for (insn = prev_nonnote_insn (thread);
2220        insn == 0 || GET_CODE (insn) != BARRIER;
2221        insn = prev_nonnote_insn (insn))
2222     if (insn == 0
2223         || GET_CODE (insn) == CODE_LABEL
2224         || (GET_CODE (insn) == INSN
2225             && GET_CODE (PATTERN (insn)) != USE
2226             && GET_CODE (PATTERN (insn)) != CLOBBER))
2227       return 0;
2228
2229   return 1;
2230 }
2231 \f
2232 /* Find the number of the basic block that starts closest to INSN.  Return -1
2233    if we couldn't find such a basic block.  */
2234
2235 static int
2236 find_basic_block (insn)
2237      rtx insn;
2238 {
2239   int i;
2240
2241   /* Scan backwards to the previous BARRIER.  Then see if we can find a
2242      label that starts a basic block.  Return the basic block number.  */
2243
2244   for (insn = prev_nonnote_insn (insn);
2245        insn && GET_CODE (insn) != BARRIER;
2246        insn = prev_nonnote_insn (insn))
2247     ;
2248
2249   /* The start of the function is basic block zero.  */
2250   if (insn == 0)
2251     return 0;
2252
2253   /* See if any of the upcoming CODE_LABELs start a basic block.  If we reach
2254      anything other than a CODE_LABEL or note, we can't find this code.  */
2255   for (insn = next_nonnote_insn (insn);
2256        insn && GET_CODE (insn) == CODE_LABEL;
2257        insn = next_nonnote_insn (insn))
2258     {
2259       for (i = 0; i < n_basic_blocks; i++)
2260         if (insn == basic_block_head[i])
2261           return i;
2262     }
2263
2264   return -1;
2265 }
2266 \f
2267 /* Called when INSN is being moved from a location near the target of a jump.
2268    We leave a marker of the form (use (INSN)) immediately in front
2269    of WHERE for mark_target_live_regs.  These markers will be deleted when
2270    reorg finishes.
2271
2272    We used to try to update the live status of registers if WHERE is at
2273    the start of a basic block, but that can't work since we may remove a
2274    BARRIER in relax_delay_slots.  */
2275
2276 static void
2277 update_block (insn, where)
2278      rtx insn;
2279      rtx where;
2280 {
2281   int b;
2282
2283   /* Ignore if this was in a delay slot and it came from the target of 
2284      a branch.  */
2285   if (INSN_FROM_TARGET_P (insn))
2286     return;
2287
2288   emit_insn_before (gen_rtx (USE, VOIDmode, insn), where);
2289
2290   /* INSN might be making a value live in a block where it didn't use to
2291      be.  So recompute liveness information for this block.  */
2292
2293   b = find_basic_block (insn);
2294   if (b != -1)
2295     bb_ticks[b]++;
2296 }
2297
2298 /* Similar to REDIRECT_JUMP except that we update the BB_TICKS entry for
2299    the basic block containing the jump.  */
2300
2301 static int
2302 reorg_redirect_jump (jump, nlabel)
2303      rtx jump;
2304      rtx nlabel;
2305 {
2306   int b = find_basic_block (jump);
2307
2308   if (b != -1)
2309     bb_ticks[b]++;
2310
2311   return redirect_jump (jump, nlabel);
2312 }
2313
2314 /* Called when INSN is being moved forward into a delay slot of DELAYED_INSN.
2315    We check every instruction between INSN and DELAYED_INSN for REG_DEAD notes
2316    that reference values used in INSN.  If we find one, then we move the
2317    REG_DEAD note to INSN.
2318
2319    This is needed to handle the case where an later insn (after INSN) has a
2320    REG_DEAD note for a register used by INSN, and this later insn subsequently
2321    gets moved before a CODE_LABEL because it is a redundant insn.  In this
2322    case, mark_target_live_regs may be confused into thinking the register
2323    is dead because it sees a REG_DEAD note immediately before a CODE_LABEL.  */
2324
2325 static void
2326 update_reg_dead_notes (insn, delayed_insn)
2327      rtx insn, delayed_insn;
2328 {
2329   rtx p, link, next;
2330
2331   for (p = next_nonnote_insn (insn); p != delayed_insn;
2332        p = next_nonnote_insn (p))
2333     for (link = REG_NOTES (p); link; link = next)
2334       {
2335         next = XEXP (link, 1);
2336
2337         if (REG_NOTE_KIND (link) != REG_DEAD
2338             || GET_CODE (XEXP (link, 0)) != REG)
2339           continue;
2340
2341         if (reg_referenced_p (XEXP (link, 0), PATTERN (insn)))
2342           {
2343             /* Move the REG_DEAD note from P to INSN.  */
2344             remove_note (p, link);
2345             XEXP (link, 1) = REG_NOTES (insn);
2346             REG_NOTES (insn) = link;
2347           }
2348       }
2349 }
2350
2351 /* Called when an insn redundant with start_insn is deleted.  If there
2352    is a REG_DEAD note for the target of start_insn between start_insn
2353    and stop_insn, then the REG_DEAD note needs to be deleted since the
2354    value no longer dies there.
2355
2356    If the REG_DEAD note isn't deleted, then mark_target_live_regs may be
2357    confused into thinking the register is dead.  */
2358
2359 static void
2360 fix_reg_dead_note (start_insn, stop_insn)
2361      rtx start_insn, stop_insn;
2362 {
2363   rtx p, link, next;
2364
2365   for (p = next_nonnote_insn (start_insn); p != stop_insn;
2366        p = next_nonnote_insn (p))
2367     for (link = REG_NOTES (p); link; link = next)
2368       {
2369         next = XEXP (link, 1);
2370
2371         if (REG_NOTE_KIND (link) != REG_DEAD
2372             || GET_CODE (XEXP (link, 0)) != REG)
2373           continue;
2374
2375         if (reg_set_p (XEXP (link, 0), PATTERN (start_insn)))
2376           {
2377             remove_note (p, link);
2378             return;
2379           }
2380       }
2381 }
2382
2383 /* Delete any REG_UNUSED notes that exist on INSN but not on REDUNDANT_INSN.
2384
2385    This handles the case of udivmodXi4 instructions which optimize their
2386    output depending on whether any REG_UNUSED notes are present.
2387    we must make sure that INSN calculates as many results as REDUNDANT_INSN
2388    does.  */
2389
2390 static void
2391 update_reg_unused_notes (insn, redundant_insn)
2392      rtx insn, redundant_insn;
2393 {
2394   rtx p, link, next;
2395
2396   for (link = REG_NOTES (insn); link; link = next)
2397     {
2398       next = XEXP (link, 1);
2399
2400       if (REG_NOTE_KIND (link) != REG_UNUSED
2401           || GET_CODE (XEXP (link, 0)) != REG)
2402         continue;
2403
2404       if (! find_regno_note (redundant_insn, REG_UNUSED,
2405                              REGNO (XEXP (link, 0))))
2406         remove_note (insn, link);
2407     }
2408 }
2409 \f
2410 /* Marks registers possibly live at the current place being scanned by
2411    mark_target_live_regs.  Used only by next two function.    */
2412
2413 static HARD_REG_SET current_live_regs;
2414
2415 /* Marks registers for which we have seen a REG_DEAD note but no assignment.
2416    Also only used by the next two functions.  */
2417
2418 static HARD_REG_SET pending_dead_regs;
2419
2420 /* Utility function called from mark_target_live_regs via note_stores.
2421    It deadens any CLOBBERed registers and livens any SET registers.  */
2422
2423 static void
2424 update_live_status (dest, x)
2425      rtx dest;
2426      rtx x;
2427 {
2428   int first_regno, last_regno;
2429   int i;
2430
2431   if (GET_CODE (dest) != REG
2432       && (GET_CODE (dest) != SUBREG || GET_CODE (SUBREG_REG (dest)) != REG))
2433     return;
2434
2435   if (GET_CODE (dest) == SUBREG)
2436     first_regno = REGNO (SUBREG_REG (dest)) + SUBREG_WORD (dest);
2437   else
2438     first_regno = REGNO (dest);
2439
2440   last_regno = first_regno + HARD_REGNO_NREGS (first_regno, GET_MODE (dest));
2441
2442   if (GET_CODE (x) == CLOBBER)
2443     for (i = first_regno; i < last_regno; i++)
2444       CLEAR_HARD_REG_BIT (current_live_regs, i);
2445   else
2446     for (i = first_regno; i < last_regno; i++)
2447       {
2448         SET_HARD_REG_BIT (current_live_regs, i);
2449         CLEAR_HARD_REG_BIT (pending_dead_regs, i);
2450       }
2451 }
2452
2453 /* Similar to next_insn, but ignores insns in the delay slots of
2454    an annulled branch.  */
2455
2456 static rtx
2457 next_insn_no_annul (insn)
2458      rtx insn;
2459 {
2460   if (insn)
2461     {
2462       /* If INSN is an annulled branch, skip any insns from the target
2463          of the branch.  */
2464       if (INSN_ANNULLED_BRANCH_P (insn)
2465           && NEXT_INSN (PREV_INSN (insn)) != insn)
2466         while (INSN_FROM_TARGET_P (NEXT_INSN (insn)))
2467           insn = NEXT_INSN (insn);
2468
2469       insn = NEXT_INSN (insn);
2470       if (insn && GET_CODE (insn) == INSN
2471           && GET_CODE (PATTERN (insn)) == SEQUENCE)
2472         insn = XVECEXP (PATTERN (insn), 0, 0);
2473     }
2474
2475   return insn;
2476 }
2477 \f
2478 /* A subroutine of mark_target_live_regs.  Search forward from TARGET
2479    looking for registers that are set before they are used.  These are dead. 
2480    Stop after passing a few conditional jumps, and/or a small
2481    number of unconditional branches.  */
2482
2483 static rtx
2484 find_dead_or_set_registers (target, res, jump_target, jump_count, set, needed)
2485      rtx target;
2486      struct resources *res;
2487      rtx *jump_target;
2488      int jump_count;
2489      struct resources set, needed;
2490 {
2491   HARD_REG_SET scratch;
2492   rtx insn, next;
2493   rtx jump_insn = 0;
2494   int i;
2495
2496   for (insn = target; insn; insn = next)
2497     {
2498       rtx this_jump_insn = insn;
2499
2500       next = NEXT_INSN (insn);
2501       switch (GET_CODE (insn))
2502         {
2503         case CODE_LABEL:
2504           /* After a label, any pending dead registers that weren't yet
2505              used can be made dead.  */
2506           AND_COMPL_HARD_REG_SET (pending_dead_regs, needed.regs);
2507           AND_COMPL_HARD_REG_SET (res->regs, pending_dead_regs);
2508           CLEAR_HARD_REG_SET (pending_dead_regs);
2509
2510           if (CODE_LABEL_NUMBER (insn) < max_label_num_after_reload)
2511             {
2512               /* All spill registers are dead at a label, so kill all of the
2513                  ones that aren't needed also.  */
2514               COPY_HARD_REG_SET (scratch, used_spill_regs);
2515               AND_COMPL_HARD_REG_SET (scratch, needed.regs);
2516               AND_COMPL_HARD_REG_SET (res->regs, scratch);
2517             }
2518           continue;
2519
2520         case BARRIER:
2521         case NOTE:
2522           continue;
2523
2524         case INSN:
2525           if (GET_CODE (PATTERN (insn)) == USE)
2526             {
2527               /* If INSN is a USE made by update_block, we care about the
2528                  underlying insn.  Any registers set by the underlying insn
2529                  are live since the insn is being done somewhere else.  */
2530               if (GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
2531                 mark_set_resources (XEXP (PATTERN (insn), 0), res, 0, 1);
2532
2533               /* All other USE insns are to be ignored.  */
2534               continue;
2535             }
2536           else if (GET_CODE (PATTERN (insn)) == CLOBBER)
2537             continue;
2538           else if (GET_CODE (PATTERN (insn)) == SEQUENCE)
2539             {
2540               /* An unconditional jump can be used to fill the delay slot
2541                  of a call, so search for a JUMP_INSN in any position.  */
2542               for (i = 0; i < XVECLEN (PATTERN (insn), 0); i++)
2543                 {
2544                   this_jump_insn = XVECEXP (PATTERN (insn), 0, i);
2545                   if (GET_CODE (this_jump_insn) == JUMP_INSN)
2546                     break;
2547                 }
2548             }
2549         }
2550
2551       if (GET_CODE (this_jump_insn) == JUMP_INSN)
2552         {
2553           if (jump_count++ < 10)
2554             {
2555               if (simplejump_p (this_jump_insn)
2556                   || GET_CODE (PATTERN (this_jump_insn)) == RETURN)
2557                 {
2558                   next = JUMP_LABEL (this_jump_insn);
2559                   if (jump_insn == 0)
2560                     {
2561                       jump_insn = insn;
2562                       if (jump_target)
2563                         *jump_target = JUMP_LABEL (this_jump_insn);
2564                     }
2565                 }
2566               else if (condjump_p (this_jump_insn)
2567                        || condjump_in_parallel_p (this_jump_insn))
2568                 {
2569                   struct resources target_set, target_res;
2570                   struct resources fallthrough_res;
2571
2572                   /* We can handle conditional branches here by following
2573                      both paths, and then IOR the results of the two paths
2574                      together, which will give us registers that are dead
2575                      on both paths.  Since this is expensive, we give it
2576                      a much higher cost than unconditional branches.  The
2577                      cost was chosen so that we will follow at most 1
2578                      conditional branch.  */
2579
2580                   jump_count += 4;
2581                   if (jump_count >= 10)
2582                     break;
2583
2584                   mark_referenced_resources (insn, &needed, 1);
2585
2586                   /* For an annulled branch, mark_set_resources ignores slots
2587                      filled by instructions from the target.  This is correct
2588                      if the branch is not taken.  Since we are following both
2589                      paths from the branch, we must also compute correct info
2590                      if the branch is taken.  We do this by inverting all of
2591                      the INSN_FROM_TARGET_P bits, calling mark_set_resources,
2592                      and then inverting the INSN_FROM_TARGET_P bits again.  */
2593
2594                   if (GET_CODE (PATTERN (insn)) == SEQUENCE
2595                       && INSN_ANNULLED_BRANCH_P (this_jump_insn))
2596                     {
2597                       for (i = 1; i < XVECLEN (PATTERN (insn), 0); i++)
2598                         INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i))
2599                           = ! INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i));
2600
2601                       target_set = set;
2602                       mark_set_resources (insn, &target_set, 0, 1);
2603
2604                       for (i = 1; i < XVECLEN (PATTERN (insn), 0); i++)
2605                         INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i))
2606                           = ! INSN_FROM_TARGET_P (XVECEXP (PATTERN (insn), 0, i));
2607
2608                       mark_set_resources (insn, &set, 0, 1);
2609                     }
2610                   else
2611                     {
2612                       mark_set_resources (insn, &set, 0, 1);
2613                       target_set = set;
2614                     }
2615
2616                   target_res = *res;
2617                   COPY_HARD_REG_SET (scratch, target_set.regs);
2618                   AND_COMPL_HARD_REG_SET (scratch, needed.regs);
2619                   AND_COMPL_HARD_REG_SET (target_res.regs, scratch);
2620
2621                   fallthrough_res = *res;
2622                   COPY_HARD_REG_SET (scratch, set.regs);
2623                   AND_COMPL_HARD_REG_SET (scratch, needed.regs);
2624                   AND_COMPL_HARD_REG_SET (fallthrough_res.regs, scratch);
2625
2626                   find_dead_or_set_registers (JUMP_LABEL (this_jump_insn),
2627                                               &target_res, 0, jump_count,
2628                                               target_set, needed);
2629                   find_dead_or_set_registers (next,
2630                                               &fallthrough_res, 0, jump_count,
2631                                               set, needed);
2632                   IOR_HARD_REG_SET (fallthrough_res.regs, target_res.regs);
2633                   AND_HARD_REG_SET (res->regs, fallthrough_res.regs);
2634                   break;
2635                 }
2636               else
2637                 break;
2638             }
2639           else
2640             {
2641               /* Don't try this optimization if we expired our jump count
2642                  above, since that would mean there may be an infinite loop
2643                  in the function being compiled.  */
2644               jump_insn = 0;
2645               break;
2646             }
2647         }
2648
2649       mark_referenced_resources (insn, &needed, 1);
2650       mark_set_resources (insn, &set, 0, 1);
2651
2652       COPY_HARD_REG_SET (scratch, set.regs);
2653       AND_COMPL_HARD_REG_SET (scratch, needed.regs);
2654       AND_COMPL_HARD_REG_SET (res->regs, scratch);
2655     }
2656
2657   return jump_insn;
2658 }
2659
2660 /* Set the resources that are live at TARGET.
2661
2662    If TARGET is zero, we refer to the end of the current function and can
2663    return our precomputed value.
2664
2665    Otherwise, we try to find out what is live by consulting the basic block
2666    information.  This is tricky, because we must consider the actions of
2667    reload and jump optimization, which occur after the basic block information
2668    has been computed.
2669
2670    Accordingly, we proceed as follows::
2671
2672    We find the previous BARRIER and look at all immediately following labels
2673    (with no intervening active insns) to see if any of them start a basic
2674    block.  If we hit the start of the function first, we use block 0.
2675
2676    Once we have found a basic block and a corresponding first insns, we can
2677    accurately compute the live status from basic_block_live_regs and
2678    reg_renumber.  (By starting at a label following a BARRIER, we are immune
2679    to actions taken by reload and jump.)  Then we scan all insns between
2680    that point and our target.  For each CLOBBER (or for call-clobbered regs
2681    when we pass a CALL_INSN), mark the appropriate registers are dead.  For
2682    a SET, mark them as live.
2683
2684    We have to be careful when using REG_DEAD notes because they are not
2685    updated by such things as find_equiv_reg.  So keep track of registers
2686    marked as dead that haven't been assigned to, and mark them dead at the
2687    next CODE_LABEL since reload and jump won't propagate values across labels.
2688
2689    If we cannot find the start of a basic block (should be a very rare
2690    case, if it can happen at all), mark everything as potentially live.
2691
2692    Next, scan forward from TARGET looking for things set or clobbered
2693    before they are used.  These are not live.
2694
2695    Because we can be called many times on the same target, save our results
2696    in a hash table indexed by INSN_UID.  */
2697
2698 static void
2699 mark_target_live_regs (target, res)
2700      rtx target;
2701      struct resources *res;
2702 {
2703   int b = -1;
2704   int i;
2705   struct target_info *tinfo;
2706   rtx insn, next;
2707   rtx jump_insn = 0;
2708   rtx jump_target;
2709   HARD_REG_SET scratch;
2710   struct resources set, needed;
2711   int jump_count = 0;
2712
2713   /* Handle end of function.  */
2714   if (target == 0)
2715     {
2716       *res = end_of_function_needs;
2717       return;
2718     }
2719
2720   /* We have to assume memory is needed, but the CC isn't.  */
2721   res->memory = 1;
2722   res->volatil = res->unch_memory = 0;
2723   res->cc = 0;
2724
2725   /* See if we have computed this value already.  */
2726   for (tinfo = target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME];
2727        tinfo; tinfo = tinfo->next)
2728     if (tinfo->uid == INSN_UID (target))
2729       break;
2730
2731   /* Start by getting the basic block number.  If we have saved information,
2732      we can get it from there unless the insn at the start of the basic block
2733      has been deleted.  */
2734   if (tinfo && tinfo->block != -1
2735       && ! INSN_DELETED_P (basic_block_head[tinfo->block]))
2736     b = tinfo->block;
2737
2738   if (b == -1)
2739     b = find_basic_block (target);
2740
2741   if (tinfo)
2742     {
2743       /* If the information is up-to-date, use it.  Otherwise, we will
2744          update it below.  */
2745       if (b == tinfo->block && b != -1 && tinfo->bb_tick == bb_ticks[b])
2746         {
2747           COPY_HARD_REG_SET (res->regs, tinfo->live_regs);
2748           return;
2749         }
2750     }
2751   else
2752     {
2753       /* Allocate a place to put our results and chain it into the 
2754          hash table.  */
2755       tinfo = (struct target_info *) oballoc (sizeof (struct target_info));
2756       tinfo->uid = INSN_UID (target);
2757       tinfo->block = b;
2758       tinfo->next = target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME];
2759       target_hash_table[INSN_UID (target) % TARGET_HASH_PRIME] = tinfo;
2760     }
2761
2762   CLEAR_HARD_REG_SET (pending_dead_regs);
2763
2764   /* If we found a basic block, get the live registers from it and update
2765      them with anything set or killed between its start and the insn before
2766      TARGET.  Otherwise, we must assume everything is live.  */
2767   if (b != -1)
2768     {
2769       regset regs_live = basic_block_live_at_start[b];
2770       int j;
2771       int regno;
2772       rtx start_insn, stop_insn;
2773
2774       /* Compute hard regs live at start of block -- this is the real hard regs
2775          marked live, plus live pseudo regs that have been renumbered to
2776          hard regs.  */
2777
2778       REG_SET_TO_HARD_REG_SET (current_live_regs, regs_live);
2779
2780       EXECUTE_IF_SET_IN_REG_SET (regs_live, 0, i,
2781                                  {
2782                                    if ((regno = reg_renumber[i]) >= 0)
2783                                      for (j = regno;
2784                                           j < regno + HARD_REGNO_NREGS (regno,
2785                                                                         PSEUDO_REGNO_MODE (i));
2786                                           j++)
2787                                        SET_HARD_REG_BIT (current_live_regs, j);
2788                                  });
2789
2790       /* Get starting and ending insn, handling the case where each might
2791          be a SEQUENCE.  */
2792       start_insn = (b == 0 ? get_insns () : basic_block_head[b]);
2793       stop_insn = target;
2794
2795       if (GET_CODE (start_insn) == INSN
2796           && GET_CODE (PATTERN (start_insn)) == SEQUENCE)
2797         start_insn = XVECEXP (PATTERN (start_insn), 0, 0);
2798
2799       if (GET_CODE (stop_insn) == INSN
2800           && GET_CODE (PATTERN (stop_insn)) == SEQUENCE)
2801         stop_insn = next_insn (PREV_INSN (stop_insn));
2802
2803       for (insn = start_insn; insn != stop_insn;
2804            insn = next_insn_no_annul (insn))
2805         {
2806           rtx link;
2807           rtx real_insn = insn;
2808
2809           /* If this insn is from the target of a branch, it isn't going to
2810              be used in the sequel.  If it is used in both cases, this
2811              test will not be true.  */
2812           if (INSN_FROM_TARGET_P (insn))
2813             continue;
2814
2815           /* If this insn is a USE made by update_block, we care about the
2816              underlying insn.  */
2817           if (GET_CODE (insn) == INSN && GET_CODE (PATTERN (insn)) == USE
2818               && GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
2819               real_insn = XEXP (PATTERN (insn), 0);
2820
2821           if (GET_CODE (real_insn) == CALL_INSN)
2822             {
2823               /* CALL clobbers all call-used regs that aren't fixed except
2824                  sp, ap, and fp.  Do this before setting the result of the
2825                  call live.  */
2826               for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
2827                 if (call_used_regs[i]
2828                     && i != STACK_POINTER_REGNUM && i != FRAME_POINTER_REGNUM
2829                     && i != ARG_POINTER_REGNUM
2830 #if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
2831                     && i != HARD_FRAME_POINTER_REGNUM
2832 #endif
2833 #if ARG_POINTER_REGNUM != FRAME_POINTER_REGNUM
2834                     && ! (i == ARG_POINTER_REGNUM && fixed_regs[i])
2835 #endif
2836 #ifdef PIC_OFFSET_TABLE_REGNUM
2837                     && ! (i == PIC_OFFSET_TABLE_REGNUM && flag_pic)
2838 #endif
2839                     )
2840                   CLEAR_HARD_REG_BIT (current_live_regs, i);
2841
2842               /* A CALL_INSN sets any global register live, since it may
2843                  have been modified by the call.  */
2844               for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
2845                 if (global_regs[i])
2846                   SET_HARD_REG_BIT (current_live_regs, i);
2847             }
2848
2849           /* Mark anything killed in an insn to be deadened at the next
2850              label.  Ignore USE insns; the only REG_DEAD notes will be for
2851              parameters.  But they might be early.  A CALL_INSN will usually
2852              clobber registers used for parameters.  It isn't worth bothering
2853              with the unlikely case when it won't.  */
2854           if ((GET_CODE (real_insn) == INSN
2855                && GET_CODE (PATTERN (real_insn)) != USE
2856                && GET_CODE (PATTERN (real_insn)) != CLOBBER)
2857               || GET_CODE (real_insn) == JUMP_INSN
2858               || GET_CODE (real_insn) == CALL_INSN)
2859             {
2860               for (link = REG_NOTES (real_insn); link; link = XEXP (link, 1))
2861                 if (REG_NOTE_KIND (link) == REG_DEAD
2862                     && GET_CODE (XEXP (link, 0)) == REG
2863                     && REGNO (XEXP (link, 0)) < FIRST_PSEUDO_REGISTER)
2864                   {
2865                     int first_regno = REGNO (XEXP (link, 0));
2866                     int last_regno
2867                       = (first_regno
2868                          + HARD_REGNO_NREGS (first_regno,
2869                                              GET_MODE (XEXP (link, 0))));
2870                          
2871                     for (i = first_regno; i < last_regno; i++)
2872                       SET_HARD_REG_BIT (pending_dead_regs, i);
2873                   }
2874
2875               note_stores (PATTERN (real_insn), update_live_status);
2876
2877               /* If any registers were unused after this insn, kill them.
2878                  These notes will always be accurate.  */
2879               for (link = REG_NOTES (real_insn); link; link = XEXP (link, 1))
2880                 if (REG_NOTE_KIND (link) == REG_UNUSED
2881                     && GET_CODE (XEXP (link, 0)) == REG
2882                     && REGNO (XEXP (link, 0)) < FIRST_PSEUDO_REGISTER)
2883                   {
2884                     int first_regno = REGNO (XEXP (link, 0));
2885                     int last_regno
2886                       = (first_regno
2887                          + HARD_REGNO_NREGS (first_regno,
2888                                              GET_MODE (XEXP (link, 0))));
2889                          
2890                     for (i = first_regno; i < last_regno; i++)
2891                       CLEAR_HARD_REG_BIT (current_live_regs, i);
2892                   }
2893             }
2894
2895           else if (GET_CODE (real_insn) == CODE_LABEL)
2896             {
2897               /* A label clobbers the pending dead registers since neither
2898                  reload nor jump will propagate a value across a label.  */
2899               AND_COMPL_HARD_REG_SET (current_live_regs, pending_dead_regs);
2900               CLEAR_HARD_REG_SET (pending_dead_regs);
2901             }
2902
2903           /* The beginning of the epilogue corresponds to the end of the
2904              RTL chain when there are no epilogue insns.  Certain resources
2905              are implicitly required at that point.  */
2906           else if (GET_CODE (real_insn) == NOTE
2907                    && NOTE_LINE_NUMBER (real_insn) == NOTE_INSN_EPILOGUE_BEG)
2908             IOR_HARD_REG_SET (current_live_regs, start_of_epilogue_needs.regs);
2909         }
2910
2911       COPY_HARD_REG_SET (res->regs, current_live_regs);
2912       tinfo->block = b;
2913       tinfo->bb_tick = bb_ticks[b];
2914     }
2915   else
2916     /* We didn't find the start of a basic block.  Assume everything
2917        in use.  This should happen only extremely rarely.  */
2918     SET_HARD_REG_SET (res->regs);
2919
2920   CLEAR_RESOURCE (&set);
2921   CLEAR_RESOURCE (&needed);
2922
2923   jump_insn = find_dead_or_set_registers (target, res, &jump_target, 0,
2924                                           set, needed);
2925
2926   /* If we hit an unconditional branch, we have another way of finding out
2927      what is live: we can see what is live at the branch target and include
2928      anything used but not set before the branch.  The only things that are
2929      live are those that are live using the above test and the test below.  */
2930
2931   if (jump_insn)
2932     {
2933       struct resources new_resources;
2934       rtx stop_insn = next_active_insn (jump_insn);
2935
2936       mark_target_live_regs (next_active_insn (jump_target), &new_resources);
2937       CLEAR_RESOURCE (&set);
2938       CLEAR_RESOURCE (&needed);
2939
2940       /* Include JUMP_INSN in the needed registers.  */
2941       for (insn = target; insn != stop_insn; insn = next_active_insn (insn))
2942         {
2943           mark_referenced_resources (insn, &needed, 1);
2944
2945           COPY_HARD_REG_SET (scratch, needed.regs);
2946           AND_COMPL_HARD_REG_SET (scratch, set.regs);
2947           IOR_HARD_REG_SET (new_resources.regs, scratch);
2948
2949           mark_set_resources (insn, &set, 0, 1);
2950         }
2951
2952       AND_HARD_REG_SET (res->regs, new_resources.regs);
2953     }
2954
2955   COPY_HARD_REG_SET (tinfo->live_regs, res->regs);
2956 }
2957 \f
2958 /* Scan a function looking for insns that need a delay slot and find insns to
2959    put into the delay slot.
2960
2961    NON_JUMPS_P is non-zero if we are to only try to fill non-jump insns (such
2962    as calls).  We do these first since we don't want jump insns (that are
2963    easier to fill) to get the only insns that could be used for non-jump insns.
2964    When it is zero, only try to fill JUMP_INSNs.
2965
2966    When slots are filled in this manner, the insns (including the
2967    delay_insn) are put together in a SEQUENCE rtx.  In this fashion,
2968    it is possible to tell whether a delay slot has really been filled
2969    or not.  `final' knows how to deal with this, by communicating
2970    through FINAL_SEQUENCE.  */
2971
2972 static void
2973 fill_simple_delay_slots (first, non_jumps_p)
2974      rtx first;
2975      int non_jumps_p;
2976 {
2977   register rtx insn, pat, trial, next_trial;
2978   register int i, j;
2979   int num_unfilled_slots = unfilled_slots_next - unfilled_slots_base;
2980   struct resources needed, set;
2981   int slots_to_fill, slots_filled;
2982   rtx delay_list;
2983
2984   for (i = 0; i < num_unfilled_slots; i++)
2985     {
2986       int flags;
2987       /* Get the next insn to fill.  If it has already had any slots assigned,
2988          we can't do anything with it.  Maybe we'll improve this later.  */
2989
2990       insn = unfilled_slots_base[i];
2991       if (insn == 0
2992           || INSN_DELETED_P (insn)
2993           || (GET_CODE (insn) == INSN
2994               && GET_CODE (PATTERN (insn)) == SEQUENCE)
2995           || (GET_CODE (insn) == JUMP_INSN && non_jumps_p)
2996           || (GET_CODE (insn) != JUMP_INSN && ! non_jumps_p))
2997         continue;
2998      
2999       if (GET_CODE (insn) == JUMP_INSN)
3000         flags = get_jump_flags (insn, JUMP_LABEL (insn));
3001       else
3002         flags = get_jump_flags (insn, NULL_RTX);
3003       slots_to_fill = num_delay_slots (insn);
3004       if (slots_to_fill == 0)
3005         abort ();
3006
3007       /* This insn needs, or can use, some delay slots.  SLOTS_TO_FILL
3008          says how many.  After initialization, first try optimizing
3009
3010          call _foo              call _foo
3011          nop                    add %o7,.-L1,%o7
3012          b,a L1
3013          nop
3014
3015          If this case applies, the delay slot of the call is filled with
3016          the unconditional jump.  This is done first to avoid having the
3017          delay slot of the call filled in the backward scan.  Also, since
3018          the unconditional jump is likely to also have a delay slot, that
3019          insn must exist when it is subsequently scanned.
3020
3021          This is tried on each insn with delay slots as some machines
3022          have insns which perform calls, but are not represented as 
3023          CALL_INSNs.  */
3024
3025       slots_filled = 0;
3026       delay_list = 0;
3027
3028       if ((trial = next_active_insn (insn))
3029           && GET_CODE (trial) == JUMP_INSN
3030           && simplejump_p (trial)
3031           && eligible_for_delay (insn, slots_filled, trial, flags)
3032           && no_labels_between_p (insn, trial))
3033         {
3034           rtx *tmp;
3035           slots_filled++;
3036           delay_list = add_to_delay_list (trial, delay_list);
3037
3038           /* TRIAL may have had its delay slot filled, then unfilled.  When
3039              the delay slot is unfilled, TRIAL is placed back on the unfilled
3040              slots obstack.  Unfortunately, it is placed on the end of the
3041              obstack, not in its original location.  Therefore, we must search
3042              from entry i + 1 to the end of the unfilled slots obstack to
3043              try and find TRIAL.  */
3044           tmp = &unfilled_slots_base[i + 1];
3045           while (*tmp != trial && tmp != unfilled_slots_next)
3046             tmp++;
3047
3048           /* Remove the unconditional jump from consideration for delay slot
3049              filling and unthread it.   */
3050           if (*tmp == trial)
3051             *tmp = 0;
3052           {
3053             rtx next = NEXT_INSN (trial);
3054             rtx prev = PREV_INSN (trial);
3055             if (prev)
3056               NEXT_INSN (prev) = next;
3057             if (next)
3058               PREV_INSN (next) = prev;
3059           }
3060         }
3061
3062       /* Now, scan backwards from the insn to search for a potential
3063          delay-slot candidate.  Stop searching when a label or jump is hit.
3064
3065          For each candidate, if it is to go into the delay slot (moved
3066          forward in execution sequence), it must not need or set any resources
3067          that were set by later insns and must not set any resources that
3068          are needed for those insns.
3069          
3070          The delay slot insn itself sets resources unless it is a call
3071          (in which case the called routine, not the insn itself, is doing
3072          the setting).  */
3073
3074       if (slots_filled < slots_to_fill)
3075         {
3076           CLEAR_RESOURCE (&needed);
3077           CLEAR_RESOURCE (&set);
3078           mark_set_resources (insn, &set, 0, 0);
3079           mark_referenced_resources (insn, &needed, 0);
3080
3081           for (trial = prev_nonnote_insn (insn); ! stop_search_p (trial, 1);
3082                trial = next_trial)
3083             {
3084               next_trial = prev_nonnote_insn (trial);
3085
3086               /* This must be an INSN or CALL_INSN.  */
3087               pat = PATTERN (trial);
3088
3089               /* USE and CLOBBER at this level was just for flow; ignore it.  */
3090               if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
3091                 continue;
3092
3093               /* Check for resource conflict first, to avoid unnecessary 
3094                  splitting.  */
3095               if (! insn_references_resource_p (trial, &set, 1)
3096                   && ! insn_sets_resource_p (trial, &set, 1)
3097                   && ! insn_sets_resource_p (trial, &needed, 1)
3098 #ifdef HAVE_cc0
3099                   /* Can't separate set of cc0 from its use.  */
3100                   && ! (reg_mentioned_p (cc0_rtx, pat)
3101                         && ! sets_cc0_p (cc0_rtx, pat))
3102 #endif
3103                   )
3104                 {
3105                   trial = try_split (pat, trial, 1);
3106                   next_trial = prev_nonnote_insn (trial);
3107                   if (eligible_for_delay (insn, slots_filled, trial, flags))
3108                     {
3109                       /* In this case, we are searching backward, so if we
3110                          find insns to put on the delay list, we want
3111                          to put them at the head, rather than the
3112                          tail, of the list.  */
3113
3114                       update_reg_dead_notes (trial, insn);
3115                       delay_list = gen_rtx (INSN_LIST, VOIDmode,
3116                                             trial, delay_list);
3117                       update_block (trial, trial);
3118                       delete_insn (trial);
3119                       if (slots_to_fill == ++slots_filled)
3120                         break;
3121                       continue;
3122                     }
3123                 }
3124
3125               mark_set_resources (trial, &set, 0, 1);
3126               mark_referenced_resources (trial, &needed, 1);
3127             }
3128         }
3129
3130       /* If all needed slots haven't been filled, we come here.  */
3131
3132       /* Try to optimize case of jumping around a single insn.  */
3133 #if defined(ANNUL_IFFALSE_SLOTS) || defined(ANNUL_IFTRUE_SLOTS)
3134       if (slots_filled != slots_to_fill
3135           && delay_list == 0
3136           && GET_CODE (insn) == JUMP_INSN 
3137           && (condjump_p (insn) || condjump_in_parallel_p (insn)))
3138         {
3139           delay_list = optimize_skip (insn);
3140           if (delay_list)
3141             slots_filled += 1;
3142         }
3143 #endif
3144
3145       /* Try to get insns from beyond the insn needing the delay slot.
3146          These insns can neither set or reference resources set in insns being
3147          skipped, cannot set resources in the insn being skipped, and, if this
3148          is a CALL_INSN (or a CALL_INSN is passed), cannot trap (because the
3149          call might not return).
3150
3151          There used to be code which continued past the target label if
3152          we saw all uses of the target label.  This code did not work,
3153          because it failed to account for some instructions which were
3154          both annulled and marked as from the target.  This can happen as a
3155          result of optimize_skip.  Since this code was redundant with
3156          fill_eager_delay_slots anyways, it was just deleted.  */
3157
3158       if (slots_filled != slots_to_fill
3159           && (GET_CODE (insn) != JUMP_INSN
3160               || ((condjump_p (insn) || condjump_in_parallel_p (insn))
3161                    && ! simplejump_p (insn)
3162                    && JUMP_LABEL (insn) != 0)))
3163         {
3164           rtx target = 0;
3165           int maybe_never = 0;
3166           struct resources needed_at_jump;
3167
3168           CLEAR_RESOURCE (&needed);
3169           CLEAR_RESOURCE (&set);
3170
3171           if (GET_CODE (insn) == CALL_INSN)
3172             {
3173               mark_set_resources (insn, &set, 0, 1);
3174               mark_referenced_resources (insn, &needed, 1);
3175               maybe_never = 1;
3176             }
3177           else 
3178             {
3179               mark_set_resources (insn, &set, 0, 1);
3180               mark_referenced_resources (insn, &needed, 1);
3181               if (GET_CODE (insn) == JUMP_INSN)
3182                 target = JUMP_LABEL (insn);
3183             }
3184
3185           for (trial = next_nonnote_insn (insn); trial; trial = next_trial)
3186             {
3187               rtx pat, trial_delay;
3188
3189               next_trial = next_nonnote_insn (trial);
3190
3191               if (GET_CODE (trial) == CODE_LABEL
3192                   || GET_CODE (trial) == BARRIER)
3193                 break;
3194
3195               /* We must have an INSN, JUMP_INSN, or CALL_INSN.  */
3196               pat = PATTERN (trial);
3197
3198               /* Stand-alone USE and CLOBBER are just for flow.  */
3199               if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
3200                 continue;
3201
3202               /* If this already has filled delay slots, get the insn needing
3203                  the delay slots.  */
3204               if (GET_CODE (pat) == SEQUENCE)
3205                 trial_delay = XVECEXP (pat, 0, 0);
3206               else
3207                 trial_delay = trial;
3208
3209               /* If this is a jump insn to our target, indicate that we have
3210                  seen another jump to it.  If we aren't handling a conditional
3211                  jump, stop our search. Otherwise, compute the needs at its
3212                  target and add them to NEEDED.  */
3213               if (GET_CODE (trial_delay) == JUMP_INSN)
3214                 {
3215                   if (target == 0)
3216                     break;
3217                   else if (JUMP_LABEL (trial_delay) != target)
3218                     {
3219                       mark_target_live_regs
3220                         (next_active_insn (JUMP_LABEL (trial_delay)),
3221                          &needed_at_jump);
3222                       needed.memory |= needed_at_jump.memory;
3223                       needed.unch_memory |= needed_at_jump.unch_memory;
3224                       IOR_HARD_REG_SET (needed.regs, needed_at_jump.regs);
3225                     }
3226                 }
3227
3228               /* See if we have a resource problem before we try to
3229                  split.   */
3230               if (target == 0
3231                   && GET_CODE (pat) != SEQUENCE
3232                   && ! insn_references_resource_p (trial, &set, 1)
3233                   && ! insn_sets_resource_p (trial, &set, 1)
3234                   && ! insn_sets_resource_p (trial, &needed, 1)
3235 #ifdef HAVE_cc0
3236                   && ! (reg_mentioned_p (cc0_rtx, pat) && ! sets_cc0_p (pat))
3237 #endif
3238                   && ! (maybe_never && may_trap_p (pat))
3239                   && (trial = try_split (pat, trial, 0))
3240                   && eligible_for_delay (insn, slots_filled, trial, flags))
3241                 {
3242                   next_trial = next_nonnote_insn (trial);
3243                   delay_list = add_to_delay_list (trial, delay_list);
3244
3245 #ifdef HAVE_cc0
3246                   if (reg_mentioned_p (cc0_rtx, pat))
3247                     link_cc0_insns (trial);
3248 #endif
3249
3250                   delete_insn (trial);
3251                   if (slots_to_fill == ++slots_filled)
3252                     break;
3253                   continue;
3254                 }
3255
3256               mark_set_resources (trial, &set, 0, 1);
3257               mark_referenced_resources (trial, &needed, 1);
3258
3259               /* Ensure we don't put insns between the setting of cc and the
3260                  comparison by moving a setting of cc into an earlier delay
3261                  slot since these insns could clobber the condition code.  */
3262               set.cc = 1;
3263
3264               /* If this is a call or jump, we might not get here.  */
3265               if (GET_CODE (trial_delay) == CALL_INSN
3266                   || GET_CODE (trial_delay) == JUMP_INSN)
3267                 maybe_never = 1;
3268             }
3269
3270           /* If there are slots left to fill and our search was stopped by an
3271              unconditional branch, try the insn at the branch target.  We can
3272              redirect the branch if it works. 
3273
3274              Don't do this if the insn at the branch target is a branch.  */
3275           if (slots_to_fill != slots_filled
3276               && trial
3277               && GET_CODE (trial) == JUMP_INSN
3278               && simplejump_p (trial)
3279               && (target == 0 || JUMP_LABEL (trial) == target)
3280               && (next_trial = next_active_insn (JUMP_LABEL (trial))) != 0
3281               && ! (GET_CODE (next_trial) == INSN
3282                     && GET_CODE (PATTERN (next_trial)) == SEQUENCE)
3283               && GET_CODE (next_trial) != JUMP_INSN
3284               && ! insn_references_resource_p (next_trial, &set, 1)
3285               && ! insn_sets_resource_p (next_trial, &set, 1)
3286               && ! insn_sets_resource_p (next_trial, &needed, 1)
3287 #ifdef HAVE_cc0
3288               && ! reg_mentioned_p (cc0_rtx, PATTERN (next_trial))
3289 #endif
3290               && ! (maybe_never && may_trap_p (PATTERN (next_trial)))
3291               && (next_trial = try_split (PATTERN (next_trial), next_trial, 0))
3292               && eligible_for_delay (insn, slots_filled, next_trial, flags))
3293             {
3294               rtx new_label = next_active_insn (next_trial);
3295
3296               if (new_label != 0)
3297                 new_label = get_label_before (new_label);
3298               else
3299                 new_label = find_end_label ();
3300
3301               delay_list 
3302                 = add_to_delay_list (copy_rtx (next_trial), delay_list);
3303               slots_filled++;
3304               reorg_redirect_jump (trial, new_label);
3305
3306               /* If we merged because we both jumped to the same place,
3307                  redirect the original insn also.  */
3308               if (target)
3309                 reorg_redirect_jump (insn, new_label);
3310             }
3311         }
3312
3313       /* If this is an unconditional jump, then try to get insns from the
3314          target of the jump.  */
3315       if (GET_CODE (insn) == JUMP_INSN
3316           && simplejump_p (insn)
3317           && slots_filled != slots_to_fill)
3318         delay_list
3319           = fill_slots_from_thread (insn, const_true_rtx,
3320                                     next_active_insn (JUMP_LABEL (insn)),
3321                                     NULL, 1, 1,
3322                                     own_thread_p (JUMP_LABEL (insn),
3323                                                   JUMP_LABEL (insn), 0),
3324                                     0, slots_to_fill, &slots_filled);
3325
3326       if (delay_list)
3327         unfilled_slots_base[i]
3328           = emit_delay_sequence (insn, delay_list,
3329                                  slots_filled, slots_to_fill);
3330
3331       if (slots_to_fill == slots_filled)
3332         unfilled_slots_base[i] = 0;
3333
3334       note_delay_statistics (slots_filled, 0);
3335     }
3336
3337 #ifdef DELAY_SLOTS_FOR_EPILOGUE
3338   /* See if the epilogue needs any delay slots.  Try to fill them if so.
3339      The only thing we can do is scan backwards from the end of the 
3340      function.  If we did this in a previous pass, it is incorrect to do it
3341      again.  */
3342   if (current_function_epilogue_delay_list)
3343     return;
3344
3345   slots_to_fill = DELAY_SLOTS_FOR_EPILOGUE;
3346   if (slots_to_fill == 0)
3347     return;
3348
3349   slots_filled = 0;
3350   CLEAR_RESOURCE (&set);
3351
3352   /* The frame pointer and stack pointer are needed at the beginning of
3353      the epilogue, so instructions setting them can not be put in the
3354      epilogue delay slot.  However, everything else needed at function
3355      end is safe, so we don't want to use end_of_function_needs here.  */
3356   CLEAR_RESOURCE (&needed);
3357   if (frame_pointer_needed)
3358     {
3359       SET_HARD_REG_BIT (needed.regs, FRAME_POINTER_REGNUM);
3360 #if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
3361       SET_HARD_REG_BIT (needed.regs, HARD_FRAME_POINTER_REGNUM);
3362 #endif
3363 #ifdef EXIT_IGNORE_STACK
3364       if (! EXIT_IGNORE_STACK)
3365 #endif
3366         SET_HARD_REG_BIT (needed.regs, STACK_POINTER_REGNUM);
3367     }
3368   else
3369     SET_HARD_REG_BIT (needed.regs, STACK_POINTER_REGNUM);
3370
3371 #ifdef EPILOGUE_USES
3372   for (i = 0; i <FIRST_PSEUDO_REGISTER; i++)
3373     {
3374       if (EPILOGUE_USES (i))
3375         SET_HARD_REG_BIT (needed.regs, i);
3376     }
3377 #endif
3378
3379   for (trial = get_last_insn (); ! stop_search_p (trial, 1);
3380        trial = PREV_INSN (trial))
3381     {
3382       if (GET_CODE (trial) == NOTE)
3383         continue;
3384       pat = PATTERN (trial);
3385       if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
3386         continue;
3387
3388       if (! insn_references_resource_p (trial, &set, 1)
3389           && ! insn_sets_resource_p (trial, &needed, 1)
3390           && ! insn_sets_resource_p (trial, &set, 1)
3391 #ifdef HAVE_cc0
3392           /* Don't want to mess with cc0 here.  */
3393           && ! reg_mentioned_p (cc0_rtx, pat)
3394 #endif
3395           )
3396         {
3397           trial = try_split (pat, trial, 1);
3398           if (ELIGIBLE_FOR_EPILOGUE_DELAY (trial, slots_filled))
3399             {
3400               /* Here as well we are searching backward, so put the
3401                  insns we find on the head of the list.  */
3402
3403               current_function_epilogue_delay_list
3404                 = gen_rtx (INSN_LIST, VOIDmode, trial,
3405                            current_function_epilogue_delay_list);
3406               mark_referenced_resources (trial, &end_of_function_needs, 1);
3407               update_block (trial, trial);
3408               delete_insn (trial);
3409
3410               /* Clear deleted bit so final.c will output the insn.  */
3411               INSN_DELETED_P (trial) = 0;
3412
3413               if (slots_to_fill == ++slots_filled)
3414                 break;
3415               continue;
3416             }
3417         }
3418
3419       mark_set_resources (trial, &set, 0, 1);
3420       mark_referenced_resources (trial, &needed, 1);
3421     }
3422
3423   note_delay_statistics (slots_filled, 0);
3424 #endif
3425 }
3426 \f
3427 /* Try to find insns to place in delay slots.
3428
3429    INSN is the jump needing SLOTS_TO_FILL delay slots.  It tests CONDITION
3430    or is an unconditional branch if CONDITION is const_true_rtx.
3431    *PSLOTS_FILLED is updated with the number of slots that we have filled.
3432
3433    THREAD is a flow-of-control, either the insns to be executed if the
3434    branch is true or if the branch is false, THREAD_IF_TRUE says which.
3435
3436    OPPOSITE_THREAD is the thread in the opposite direction.  It is used
3437    to see if any potential delay slot insns set things needed there.
3438
3439    LIKELY is non-zero if it is extremely likely that the branch will be
3440    taken and THREAD_IF_TRUE is set.  This is used for the branch at the
3441    end of a loop back up to the top.
3442
3443    OWN_THREAD and OWN_OPPOSITE_THREAD are true if we are the only user of the
3444    thread.  I.e., it is the fallthrough code of our jump or the target of the
3445    jump when we are the only jump going there.
3446
3447    If OWN_THREAD is false, it must be the "true" thread of a jump.  In that
3448    case, we can only take insns from the head of the thread for our delay
3449    slot.  We then adjust the jump to point after the insns we have taken.  */
3450
3451 static rtx
3452 fill_slots_from_thread (insn, condition, thread, opposite_thread, likely,
3453                         thread_if_true, own_thread, own_opposite_thread,
3454                         slots_to_fill, pslots_filled)
3455      rtx insn;
3456      rtx condition;
3457      rtx thread, opposite_thread;
3458      int likely;
3459      int thread_if_true;
3460      int own_thread, own_opposite_thread;
3461      int slots_to_fill, *pslots_filled;
3462 {
3463   rtx new_thread;
3464   rtx delay_list = 0;
3465   struct resources opposite_needed, set, needed;
3466   rtx trial;
3467   int lose = 0;
3468   int must_annul = 0;
3469   int flags;
3470
3471   /* Validate our arguments.  */
3472   if ((condition == const_true_rtx && ! thread_if_true)
3473       || (! own_thread && ! thread_if_true))
3474     abort ();
3475
3476   flags = get_jump_flags (insn, JUMP_LABEL (insn));
3477
3478   /* If our thread is the end of subroutine, we can't get any delay
3479      insns from that.  */
3480   if (thread == 0)
3481     return 0;
3482
3483   /* If this is an unconditional branch, nothing is needed at the
3484      opposite thread.  Otherwise, compute what is needed there.  */
3485   if (condition == const_true_rtx)
3486     CLEAR_RESOURCE (&opposite_needed);
3487   else
3488     mark_target_live_regs (opposite_thread, &opposite_needed);
3489
3490   /* If the insn at THREAD can be split, do it here to avoid having to
3491      update THREAD and NEW_THREAD if it is done in the loop below.  Also
3492      initialize NEW_THREAD.  */
3493
3494   new_thread = thread = try_split (PATTERN (thread), thread, 0);
3495
3496   /* Scan insns at THREAD.  We are looking for an insn that can be removed
3497      from THREAD (it neither sets nor references resources that were set
3498      ahead of it and it doesn't set anything needs by the insns ahead of
3499      it) and that either can be placed in an annulling insn or aren't
3500      needed at OPPOSITE_THREAD.  */
3501
3502   CLEAR_RESOURCE (&needed);
3503   CLEAR_RESOURCE (&set);
3504
3505   /* If we do not own this thread, we must stop as soon as we find
3506      something that we can't put in a delay slot, since all we can do
3507      is branch into THREAD at a later point.  Therefore, labels stop
3508      the search if this is not the `true' thread.  */
3509
3510   for (trial = thread;
3511        ! stop_search_p (trial, ! thread_if_true) && (! lose || own_thread);
3512        trial = next_nonnote_insn (trial))
3513     {
3514       rtx pat, old_trial;
3515
3516       /* If we have passed a label, we no longer own this thread.  */
3517       if (GET_CODE (trial) == CODE_LABEL)
3518         {
3519           own_thread = 0;
3520           continue;
3521         }
3522
3523       pat = PATTERN (trial);
3524       if (GET_CODE (pat) == USE || GET_CODE (pat) == CLOBBER)
3525         continue;
3526
3527       /* If TRIAL conflicts with the insns ahead of it, we lose.  Also,
3528          don't separate or copy insns that set and use CC0.  */
3529       if (! insn_references_resource_p (trial, &set, 1)
3530           && ! insn_sets_resource_p (trial, &set, 1)
3531           && ! insn_sets_resource_p (trial, &needed, 1)
3532 #ifdef HAVE_cc0
3533           && ! (reg_mentioned_p (cc0_rtx, pat)
3534                 && (! own_thread || ! sets_cc0_p (pat)))
3535 #endif
3536           )
3537         {
3538           rtx prior_insn;
3539
3540           /* If TRIAL is redundant with some insn before INSN, we don't
3541              actually need to add it to the delay list; we can merely pretend
3542              we did.  */
3543           if (prior_insn = redundant_insn (trial, insn, delay_list))
3544             {
3545               fix_reg_dead_note (prior_insn, insn);
3546               if (own_thread)
3547                 {
3548                   update_block (trial, thread);
3549                   if (trial == thread)
3550                     {
3551                       thread = next_active_insn (thread);
3552                       if (new_thread == trial)
3553                         new_thread = thread;
3554                     }
3555
3556                   delete_insn (trial);
3557                 }
3558               else
3559                 {
3560                   update_reg_unused_notes (prior_insn, trial);
3561                   new_thread = next_active_insn (trial);
3562                 }
3563
3564               continue;
3565             }
3566
3567           /* There are two ways we can win:  If TRIAL doesn't set anything
3568              needed at the opposite thread and can't trap, or if it can
3569              go into an annulled delay slot.  */
3570           if (condition == const_true_rtx
3571               || (! insn_sets_resource_p (trial, &opposite_needed, 1)
3572                   && ! may_trap_p (pat)))
3573             {
3574               old_trial = trial;
3575               trial = try_split (pat, trial, 0);
3576               if (new_thread == old_trial)
3577                 new_thread = trial;
3578               if (thread == old_trial)
3579                 thread = trial;
3580               pat = PATTERN (trial);
3581               if (eligible_for_delay (insn, *pslots_filled, trial, flags))
3582                 goto winner;
3583             }
3584           else if (0
3585 #ifdef ANNUL_IFTRUE_SLOTS
3586                    || ! thread_if_true
3587 #endif
3588 #ifdef ANNUL_IFFALSE_SLOTS
3589                    || thread_if_true
3590 #endif
3591                    )
3592             {
3593               old_trial = trial;
3594               trial = try_split (pat, trial, 0);
3595               if (new_thread == old_trial)
3596                 new_thread = trial;
3597               if (thread == old_trial)
3598                 thread = trial;
3599               pat = PATTERN (trial);
3600               if ((thread_if_true
3601                    ? eligible_for_annul_false (insn, *pslots_filled, trial, flags)
3602                    : eligible_for_annul_true (insn, *pslots_filled, trial, flags)))
3603                 {
3604                   rtx temp;
3605
3606                   must_annul = 1;
3607                 winner:
3608
3609 #ifdef HAVE_cc0
3610                   if (reg_mentioned_p (cc0_rtx, pat))
3611                     link_cc0_insns (trial);
3612 #endif
3613
3614                   /* If we own this thread, delete the insn.  If this is the
3615                      destination of a branch, show that a basic block status
3616                      may have been updated.  In any case, mark the new
3617                      starting point of this thread.  */
3618                   if (own_thread)
3619                     {
3620                       update_block (trial, thread);
3621                       if (trial == thread)
3622                         {
3623                           thread = next_active_insn (thread);
3624                           if (new_thread == trial)
3625                             new_thread = thread;
3626                         }
3627                       delete_insn (trial);
3628                     }
3629                   else
3630                     new_thread = next_active_insn (trial);
3631
3632                   temp = own_thread ? trial : copy_rtx (trial);
3633                   if (thread_if_true)
3634                     INSN_FROM_TARGET_P (temp) = 1;
3635
3636                   delay_list = add_to_delay_list (temp, delay_list);
3637
3638                   if (slots_to_fill == ++(*pslots_filled))
3639                     {
3640                       /* Even though we have filled all the slots, we
3641                          may be branching to a location that has a
3642                          redundant insn.  Skip any if so.  */
3643                       while (new_thread && ! own_thread
3644                              && ! insn_sets_resource_p (new_thread, &set, 1)
3645                              && ! insn_sets_resource_p (new_thread, &needed, 1)
3646                              && ! insn_references_resource_p (new_thread,
3647                                                               &set, 1)
3648                              && redundant_insn (new_thread, insn, delay_list))
3649                         new_thread = next_active_insn (new_thread);
3650                       break;
3651                     }
3652
3653                   continue;
3654                 }
3655             }
3656         }
3657
3658       /* This insn can't go into a delay slot.  */
3659       lose = 1;
3660       mark_set_resources (trial, &set, 0, 1);
3661       mark_referenced_resources (trial, &needed, 1);
3662
3663       /* Ensure we don't put insns between the setting of cc and the comparison
3664          by moving a setting of cc into an earlier delay slot since these insns
3665          could clobber the condition code.  */
3666       set.cc = 1;
3667
3668       /* If this insn is a register-register copy and the next insn has
3669          a use of our destination, change it to use our source.  That way,
3670          it will become a candidate for our delay slot the next time
3671          through this loop.  This case occurs commonly in loops that
3672          scan a list.
3673
3674          We could check for more complex cases than those tested below,
3675          but it doesn't seem worth it.  It might also be a good idea to try
3676          to swap the two insns.  That might do better.
3677
3678          We can't do this if the next insn modifies our destination, because
3679          that would make the replacement into the insn invalid.  We also can't
3680          do this if it modifies our source, because it might be an earlyclobber
3681          operand.  This latter test also prevents updating the contents of
3682          a PRE_INC.  */
3683
3684       if (GET_CODE (trial) == INSN && GET_CODE (pat) == SET
3685           && GET_CODE (SET_SRC (pat)) == REG
3686           && GET_CODE (SET_DEST (pat)) == REG)
3687         {
3688           rtx next = next_nonnote_insn (trial);
3689
3690           if (next && GET_CODE (next) == INSN
3691               && GET_CODE (PATTERN (next)) != USE
3692               && ! reg_set_p (SET_DEST (pat), next)
3693               && ! reg_set_p (SET_SRC (pat), next)
3694               && reg_referenced_p (SET_DEST (pat), PATTERN (next)))
3695             validate_replace_rtx (SET_DEST (pat), SET_SRC (pat), next);
3696         }
3697     }
3698
3699   /* If we stopped on a branch insn that has delay slots, see if we can
3700      steal some of the insns in those slots.  */
3701   if (trial && GET_CODE (trial) == INSN
3702       && GET_CODE (PATTERN (trial)) == SEQUENCE
3703       && GET_CODE (XVECEXP (PATTERN (trial), 0, 0)) == JUMP_INSN)
3704     {
3705       /* If this is the `true' thread, we will want to follow the jump,
3706          so we can only do this if we have taken everything up to here.  */
3707       if (thread_if_true && trial == new_thread)
3708         delay_list
3709           = steal_delay_list_from_target (insn, condition, PATTERN (trial),
3710                                           delay_list, &set, &needed,
3711                                           &opposite_needed, slots_to_fill,
3712                                           pslots_filled, &must_annul,
3713                                           &new_thread);
3714       else if (! thread_if_true)
3715         delay_list
3716           = steal_delay_list_from_fallthrough (insn, condition,
3717                                                PATTERN (trial),
3718                                                delay_list, &set, &needed,
3719                                                &opposite_needed, slots_to_fill,
3720                                                pslots_filled, &must_annul);
3721     }
3722
3723   /* If we haven't found anything for this delay slot and it is very
3724      likely that the branch will be taken, see if the insn at our target
3725      increments or decrements a register with an increment that does not
3726      depend on the destination register.  If so, try to place the opposite
3727      arithmetic insn after the jump insn and put the arithmetic insn in the
3728      delay slot.  If we can't do this, return.  */
3729   if (delay_list == 0 && likely && new_thread
3730       && GET_CODE (new_thread) == INSN
3731       && GET_CODE (PATTERN (new_thread)) != ASM_INPUT
3732       && asm_noperands (PATTERN (new_thread)) < 0)
3733     {
3734       rtx pat = PATTERN (new_thread);
3735       rtx dest;
3736       rtx src;
3737
3738       trial = new_thread;
3739       pat = PATTERN (trial);
3740
3741       if (GET_CODE (trial) != INSN || GET_CODE (pat) != SET
3742           || ! eligible_for_delay (insn, 0, trial, flags))
3743         return 0;
3744
3745       dest = SET_DEST (pat), src = SET_SRC (pat);
3746       if ((GET_CODE (src) == PLUS || GET_CODE (src) == MINUS)
3747           && rtx_equal_p (XEXP (src, 0), dest)
3748           && ! reg_overlap_mentioned_p (dest, XEXP (src, 1)))
3749         {
3750           rtx other = XEXP (src, 1);
3751           rtx new_arith;
3752           rtx ninsn;
3753
3754           /* If this is a constant adjustment, use the same code with
3755              the negated constant.  Otherwise, reverse the sense of the
3756              arithmetic.  */
3757           if (GET_CODE (other) == CONST_INT)
3758             new_arith = gen_rtx (GET_CODE (src), GET_MODE (src), dest,
3759                                  negate_rtx (GET_MODE (src), other));
3760           else
3761             new_arith = gen_rtx (GET_CODE (src) == PLUS ? MINUS : PLUS,
3762                                  GET_MODE (src), dest, other);
3763
3764           ninsn = emit_insn_after (gen_rtx (SET, VOIDmode, dest, new_arith),
3765                                    insn);
3766
3767           if (recog_memoized (ninsn) < 0
3768               || (insn_extract (ninsn),
3769                   ! constrain_operands (INSN_CODE (ninsn), 1)))
3770             {
3771               delete_insn (ninsn);
3772               return 0;
3773             }
3774
3775           if (own_thread)
3776             {
3777               update_block (trial, thread);
3778               if (trial == thread)
3779                 {
3780                   thread = next_active_insn (thread);
3781                   if (new_thread == trial)
3782                     new_thread = thread;
3783                 }
3784               delete_insn (trial);
3785             }
3786           else
3787             new_thread = next_active_insn (trial);
3788
3789           ninsn = own_thread ? trial : copy_rtx (trial);
3790           if (thread_if_true)
3791             INSN_FROM_TARGET_P (ninsn) = 1;
3792
3793           delay_list = add_to_delay_list (ninsn, NULL_RTX);
3794           (*pslots_filled)++;
3795         }
3796     }
3797
3798   if (delay_list && must_annul)
3799     INSN_ANNULLED_BRANCH_P (insn) = 1;
3800
3801   /* If we are to branch into the middle of this thread, find an appropriate
3802      label or make a new one if none, and redirect INSN to it.  If we hit the
3803      end of the function, use the end-of-function label.  */
3804   if (new_thread != thread)
3805     {
3806       rtx label;
3807
3808       if (! thread_if_true)
3809         abort ();
3810
3811       if (new_thread && GET_CODE (new_thread) == JUMP_INSN
3812           && (simplejump_p (new_thread)
3813               || GET_CODE (PATTERN (new_thread)) == RETURN)
3814           && redirect_with_delay_list_safe_p (insn,
3815                                               JUMP_LABEL (new_thread),
3816                                               delay_list))
3817         new_thread = follow_jumps (JUMP_LABEL (new_thread));
3818
3819       if (new_thread == 0)
3820         label = find_end_label ();
3821       else if (GET_CODE (new_thread) == CODE_LABEL)
3822         label = new_thread;
3823       else
3824         label = get_label_before (new_thread);
3825
3826       reorg_redirect_jump (insn, label);
3827     }
3828
3829   return delay_list;
3830 }
3831 \f
3832 /* Make another attempt to find insns to place in delay slots.
3833
3834    We previously looked for insns located in front of the delay insn
3835    and, for non-jump delay insns, located behind the delay insn.
3836
3837    Here only try to schedule jump insns and try to move insns from either
3838    the target or the following insns into the delay slot.  If annulling is
3839    supported, we will be likely to do this.  Otherwise, we can do this only
3840    if safe.  */
3841
3842 static void
3843 fill_eager_delay_slots (first)
3844      rtx first;
3845 {
3846   register rtx insn;
3847   register int i;
3848   int num_unfilled_slots = unfilled_slots_next - unfilled_slots_base;
3849
3850   for (i = 0; i < num_unfilled_slots; i++)
3851     {
3852       rtx condition;
3853       rtx target_label, insn_at_target, fallthrough_insn;
3854       rtx delay_list = 0;
3855       int own_target;
3856       int own_fallthrough;
3857       int prediction, slots_to_fill, slots_filled;
3858
3859       insn = unfilled_slots_base[i];
3860       if (insn == 0
3861           || INSN_DELETED_P (insn)
3862           || GET_CODE (insn) != JUMP_INSN
3863           || ! (condjump_p (insn) || condjump_in_parallel_p (insn)))
3864         continue;
3865
3866       slots_to_fill = num_delay_slots (insn);
3867       if (slots_to_fill == 0)
3868         abort ();
3869
3870       slots_filled = 0;
3871       target_label = JUMP_LABEL (insn);
3872       condition = get_branch_condition (insn, target_label);
3873
3874       if (condition == 0)
3875         continue;
3876
3877       /* Get the next active fallthrough and target insns and see if we own
3878          them.  Then see whether the branch is likely true.  We don't need
3879          to do a lot of this for unconditional branches.  */
3880
3881       insn_at_target = next_active_insn (target_label);
3882       own_target = own_thread_p (target_label, target_label, 0);
3883
3884       if (condition == const_true_rtx)
3885         {
3886           own_fallthrough = 0;
3887           fallthrough_insn = 0;
3888           prediction = 2;
3889         }
3890       else
3891         {
3892           fallthrough_insn = next_active_insn (insn);
3893           own_fallthrough = own_thread_p (NEXT_INSN (insn), NULL_RTX, 1);
3894           prediction = mostly_true_jump (insn, condition);
3895         }
3896
3897       /* If this insn is expected to branch, first try to get insns from our
3898          target, then our fallthrough insns.  If it is not, expected to branch,
3899          try the other order.  */
3900
3901       if (prediction > 0)
3902         {
3903           delay_list
3904             = fill_slots_from_thread (insn, condition, insn_at_target,
3905                                       fallthrough_insn, prediction == 2, 1,
3906                                       own_target, own_fallthrough,
3907                                       slots_to_fill, &slots_filled);
3908
3909           if (delay_list == 0 && own_fallthrough)
3910             {
3911               /* Even though we didn't find anything for delay slots,
3912                  we might have found a redundant insn which we deleted
3913                  from the thread that was filled.  So we have to recompute
3914                  the next insn at the target.  */
3915               target_label = JUMP_LABEL (insn);
3916               insn_at_target = next_active_insn (target_label);
3917
3918               delay_list
3919                 = fill_slots_from_thread (insn, condition, fallthrough_insn,
3920                                           insn_at_target, 0, 0,
3921                                           own_fallthrough, own_target,
3922                                           slots_to_fill, &slots_filled);
3923             }
3924         }
3925       else
3926         {
3927           if (own_fallthrough)
3928             delay_list
3929               = fill_slots_from_thread (insn, condition, fallthrough_insn,
3930                                         insn_at_target, 0, 0,
3931                                         own_fallthrough, own_target,
3932                                         slots_to_fill, &slots_filled);
3933
3934           if (delay_list == 0)
3935             delay_list
3936               = fill_slots_from_thread (insn, condition, insn_at_target,
3937                                         next_active_insn (insn), 0, 1,
3938                                         own_target, own_fallthrough,
3939                                         slots_to_fill, &slots_filled);
3940         }
3941
3942       if (delay_list)
3943         unfilled_slots_base[i]
3944           = emit_delay_sequence (insn, delay_list,
3945                                  slots_filled, slots_to_fill);
3946
3947       if (slots_to_fill == slots_filled)
3948         unfilled_slots_base[i] = 0;
3949
3950       note_delay_statistics (slots_filled, 1);
3951     }
3952 }
3953 \f
3954 /* Once we have tried two ways to fill a delay slot, make a pass over the
3955    code to try to improve the results and to do such things as more jump
3956    threading.  */
3957
3958 static void
3959 relax_delay_slots (first)
3960      rtx first;
3961 {
3962   register rtx insn, next, pat;
3963   register rtx trial, delay_insn, target_label;
3964
3965   /* Look at every JUMP_INSN and see if we can improve it.  */
3966   for (insn = first; insn; insn = next)
3967     {
3968       rtx other;
3969
3970       next = next_active_insn (insn);
3971
3972       /* If this is a jump insn, see if it now jumps to a jump, jumps to
3973          the next insn, or jumps to a label that is not the last of a
3974          group of consecutive labels.  */
3975       if (GET_CODE (insn) == JUMP_INSN
3976           && (condjump_p (insn) || condjump_in_parallel_p (insn))
3977           && (target_label = JUMP_LABEL (insn)) != 0)
3978         {
3979           target_label = follow_jumps (target_label);
3980           target_label = prev_label (next_active_insn (target_label));
3981
3982           if (target_label == 0)
3983             target_label = find_end_label ();
3984
3985           if (next_active_insn (target_label) == next
3986               && ! condjump_in_parallel_p (insn))
3987             {
3988               delete_jump (insn);
3989               continue;
3990             }
3991
3992           if (target_label != JUMP_LABEL (insn))
3993             reorg_redirect_jump (insn, target_label);
3994
3995           /* See if this jump branches around a unconditional jump.
3996              If so, invert this jump and point it to the target of the
3997              second jump.  */
3998           if (next && GET_CODE (next) == JUMP_INSN
3999               && (simplejump_p (next) || GET_CODE (PATTERN (next)) == RETURN)
4000               && next_active_insn (target_label) == next_active_insn (next)
4001               && no_labels_between_p (insn, next))
4002             {
4003               rtx label = JUMP_LABEL (next);
4004
4005               /* Be careful how we do this to avoid deleting code or
4006                  labels that are momentarily dead.  See similar optimization
4007                  in jump.c.
4008
4009                  We also need to ensure we properly handle the case when
4010                  invert_jump fails.  */
4011
4012               ++LABEL_NUSES (target_label);
4013               if (label)
4014                 ++LABEL_NUSES (label);
4015
4016               if (invert_jump (insn, label))
4017                 {
4018                   delete_insn (next);
4019                   next = insn;
4020                 }
4021
4022               if (label)
4023                 --LABEL_NUSES (label);
4024
4025               if (--LABEL_NUSES (target_label) == 0)
4026                 delete_insn (target_label);
4027
4028               continue;
4029             }
4030         }
4031           
4032       /* If this is an unconditional jump and the previous insn is a
4033          conditional jump, try reversing the condition of the previous
4034          insn and swapping our targets.  The next pass might be able to
4035          fill the slots.
4036
4037          Don't do this if we expect the conditional branch to be true, because
4038          we would then be making the more common case longer.  */
4039
4040       if (GET_CODE (insn) == JUMP_INSN
4041           && (simplejump_p (insn) || GET_CODE (PATTERN (insn)) == RETURN)
4042           && (other = prev_active_insn (insn)) != 0
4043           && (condjump_p (other) || condjump_in_parallel_p (other))
4044           && no_labels_between_p (other, insn)
4045           && 0 < mostly_true_jump (other,
4046                                    get_branch_condition (other,
4047                                                          JUMP_LABEL (other))))
4048         {
4049           rtx other_target = JUMP_LABEL (other);
4050           target_label = JUMP_LABEL (insn);
4051
4052           /* Increment the count of OTHER_TARGET, so it doesn't get deleted
4053              as we move the label.  */
4054           if (other_target)
4055             ++LABEL_NUSES (other_target);
4056
4057           if (invert_jump (other, target_label))
4058             reorg_redirect_jump (insn, other_target);
4059
4060           if (other_target)
4061             --LABEL_NUSES (other_target);
4062         }
4063
4064       /* Now look only at cases where we have filled a delay slot.  */
4065       if (GET_CODE (insn) != INSN
4066           || GET_CODE (PATTERN (insn)) != SEQUENCE)
4067         continue;
4068
4069       pat = PATTERN (insn);
4070       delay_insn = XVECEXP (pat, 0, 0);
4071
4072       /* See if the first insn in the delay slot is redundant with some
4073          previous insn.  Remove it from the delay slot if so; then set up
4074          to reprocess this insn.  */
4075       if (redundant_insn (XVECEXP (pat, 0, 1), delay_insn, 0))
4076         {
4077           delete_from_delay_slot (XVECEXP (pat, 0, 1));
4078           next = prev_active_insn (next);
4079           continue;
4080         }
4081
4082       /* Now look only at the cases where we have a filled JUMP_INSN.  */
4083       if (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)) != JUMP_INSN
4084           || ! (condjump_p (XVECEXP (PATTERN (insn), 0, 0))
4085                 || condjump_in_parallel_p (XVECEXP (PATTERN (insn), 0, 0))))
4086         continue;
4087
4088       target_label = JUMP_LABEL (delay_insn);
4089
4090       if (target_label)
4091         {
4092           /* If this jump goes to another unconditional jump, thread it, but
4093              don't convert a jump into a RETURN here.  */
4094           trial = follow_jumps (target_label);
4095           /* We use next_real_insn instead of next_active_insn, so that
4096              the special USE insns emitted by reorg won't be ignored.
4097              If they are ignored, then they will get deleted if target_label
4098              is now unreachable, and that would cause mark_target_live_regs
4099              to fail.  */
4100           trial = prev_label (next_real_insn (trial));
4101           if (trial == 0 && target_label != 0)
4102             trial = find_end_label ();
4103
4104           if (trial != target_label 
4105               && redirect_with_delay_slots_safe_p (delay_insn, trial, insn))
4106             {
4107               reorg_redirect_jump (delay_insn, trial);
4108               target_label = trial;
4109             }
4110
4111           /* If the first insn at TARGET_LABEL is redundant with a previous
4112              insn, redirect the jump to the following insn process again.  */
4113           trial = next_active_insn (target_label);
4114           if (trial && GET_CODE (PATTERN (trial)) != SEQUENCE
4115               && redundant_insn (trial, insn, 0))
4116             {
4117               rtx tmp;
4118
4119               /* Figure out where to emit the special USE insn so we don't
4120                  later incorrectly compute register live/death info.  */
4121               tmp = next_active_insn (trial);
4122               if (tmp == 0)
4123                 tmp = find_end_label ();
4124
4125               /* Insert the special USE insn and update dataflow info.  */
4126               update_block (trial, tmp);
4127
4128               /* Now emit a label before the special USE insn, and
4129                  redirect our jump to the new label.  */ 
4130               target_label = get_label_before (PREV_INSN (tmp));
4131               reorg_redirect_jump (delay_insn, target_label);
4132               next = insn;
4133               continue;
4134             }
4135
4136           /* Similarly, if it is an unconditional jump with one insn in its
4137              delay list and that insn is redundant, thread the jump.  */
4138           if (trial && GET_CODE (PATTERN (trial)) == SEQUENCE
4139               && XVECLEN (PATTERN (trial), 0) == 2
4140               && GET_CODE (XVECEXP (PATTERN (trial), 0, 0)) == JUMP_INSN
4141               && (simplejump_p (XVECEXP (PATTERN (trial), 0, 0))
4142                   || GET_CODE (PATTERN (XVECEXP (PATTERN (trial), 0, 0))) == RETURN)
4143               && redundant_insn (XVECEXP (PATTERN (trial), 0, 1), insn, 0))
4144             {
4145               target_label = JUMP_LABEL (XVECEXP (PATTERN (trial), 0, 0));
4146               if (target_label == 0)
4147                 target_label = find_end_label ();
4148
4149               if (redirect_with_delay_slots_safe_p (delay_insn, target_label, 
4150                                                     insn))
4151                 {
4152                   reorg_redirect_jump (delay_insn, target_label);
4153                   next = insn;
4154                   continue;
4155                 }
4156             }
4157         }
4158
4159       if (! INSN_ANNULLED_BRANCH_P (delay_insn)
4160           && prev_active_insn (target_label) == insn
4161           && ! condjump_in_parallel_p (delay_insn)
4162 #ifdef HAVE_cc0
4163           /* If the last insn in the delay slot sets CC0 for some insn,
4164              various code assumes that it is in a delay slot.  We could
4165              put it back where it belonged and delete the register notes,
4166              but it doesn't seem worthwhile in this uncommon case.  */
4167           && ! find_reg_note (XVECEXP (pat, 0, XVECLEN (pat, 0) - 1),
4168                               REG_CC_USER, NULL_RTX)
4169 #endif
4170           )
4171         {
4172           int i;
4173
4174           /* All this insn does is execute its delay list and jump to the
4175              following insn.  So delete the jump and just execute the delay
4176              list insns.
4177
4178              We do this by deleting the INSN containing the SEQUENCE, then
4179              re-emitting the insns separately, and then deleting the jump.
4180              This allows the count of the jump target to be properly
4181              decremented.  */
4182
4183           /* Clear the from target bit, since these insns are no longer
4184              in delay slots.  */
4185           for (i = 0; i < XVECLEN (pat, 0); i++)
4186             INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)) = 0;
4187
4188           trial = PREV_INSN (insn);
4189           delete_insn (insn);
4190           emit_insn_after (pat, trial);
4191           delete_scheduled_jump (delay_insn);
4192           continue;
4193         }
4194
4195       /* See if this is an unconditional jump around a single insn which is
4196          identical to the one in its delay slot.  In this case, we can just
4197          delete the branch and the insn in its delay slot.  */
4198       if (next && GET_CODE (next) == INSN
4199           && prev_label (next_active_insn (next)) == target_label
4200           && simplejump_p (insn)
4201           && XVECLEN (pat, 0) == 2
4202           && rtx_equal_p (PATTERN (next), PATTERN (XVECEXP (pat, 0, 1))))
4203         {
4204           delete_insn (insn);
4205           continue;
4206         }
4207
4208       /* See if this jump (with its delay slots) branches around another
4209          jump (without delay slots).  If so, invert this jump and point
4210          it to the target of the second jump.  We cannot do this for
4211          annulled jumps, though.  Again, don't convert a jump to a RETURN
4212          here.  */
4213       if (! INSN_ANNULLED_BRANCH_P (delay_insn)
4214           && next && GET_CODE (next) == JUMP_INSN
4215           && (simplejump_p (next) || GET_CODE (PATTERN (next)) == RETURN)
4216           && next_active_insn (target_label) == next_active_insn (next)
4217           && no_labels_between_p (insn, next))
4218         {
4219           rtx label = JUMP_LABEL (next);
4220           rtx old_label = JUMP_LABEL (delay_insn);
4221
4222           if (label == 0)
4223             label = find_end_label ();
4224
4225           if (redirect_with_delay_slots_safe_p (delay_insn, label, insn))
4226             {
4227               /* Be careful how we do this to avoid deleting code or labels
4228                  that are momentarily dead.  See similar optimization in
4229                  jump.c  */
4230               if (old_label)
4231                 ++LABEL_NUSES (old_label);
4232
4233               if (invert_jump (delay_insn, label))
4234                 {
4235                   int i;
4236
4237                   /* Must update the INSN_FROM_TARGET_P bits now that
4238                      the branch is reversed, so that mark_target_live_regs
4239                      will handle the delay slot insn correctly.  */
4240                   for (i = 1; i < XVECLEN (PATTERN (insn), 0); i++)
4241                     {
4242                       rtx slot = XVECEXP (PATTERN (insn), 0, i);
4243                       INSN_FROM_TARGET_P (slot) = ! INSN_FROM_TARGET_P (slot);
4244                     }
4245
4246                   delete_insn (next);
4247                   next = insn;
4248                 }
4249
4250               if (old_label && --LABEL_NUSES (old_label) == 0)
4251                 delete_insn (old_label);
4252               continue;
4253             }
4254         }
4255
4256       /* If we own the thread opposite the way this insn branches, see if we
4257          can merge its delay slots with following insns.  */
4258       if (INSN_FROM_TARGET_P (XVECEXP (pat, 0, 1))
4259           && own_thread_p (NEXT_INSN (insn), 0, 1))
4260         try_merge_delay_insns (insn, next);
4261       else if (! INSN_FROM_TARGET_P (XVECEXP (pat, 0, 1))
4262                && own_thread_p (target_label, target_label, 0))
4263         try_merge_delay_insns (insn, next_active_insn (target_label));
4264
4265       /* If we get here, we haven't deleted INSN.  But we may have deleted
4266          NEXT, so recompute it.  */
4267       next = next_active_insn (insn);
4268     }
4269 }
4270 \f
4271 #ifdef HAVE_return
4272
4273 /* Look for filled jumps to the end of function label.  We can try to convert
4274    them into RETURN insns if the insns in the delay slot are valid for the
4275    RETURN as well.  */
4276
4277 static void
4278 make_return_insns (first)
4279      rtx first;
4280 {
4281   rtx insn, jump_insn, pat;
4282   rtx real_return_label = end_of_function_label;
4283   int slots, i;
4284
4285   /* See if there is a RETURN insn in the function other than the one we
4286      made for END_OF_FUNCTION_LABEL.  If so, set up anything we can't change
4287      into a RETURN to jump to it.  */
4288   for (insn = first; insn; insn = NEXT_INSN (insn))
4289     if (GET_CODE (insn) == JUMP_INSN && GET_CODE (PATTERN (insn)) == RETURN)
4290       {
4291         real_return_label = get_label_before (insn);
4292         break;
4293       }
4294   
4295   /* Show an extra usage of REAL_RETURN_LABEL so it won't go away if it
4296      was equal to END_OF_FUNCTION_LABEL.  */
4297   LABEL_NUSES (real_return_label)++;
4298
4299   /* Clear the list of insns to fill so we can use it.  */
4300   obstack_free (&unfilled_slots_obstack, unfilled_firstobj);
4301
4302   for (insn = first; insn; insn = NEXT_INSN (insn))
4303     {
4304       int flags;
4305
4306       /* Only look at filled JUMP_INSNs that go to the end of function
4307          label.  */
4308       if (GET_CODE (insn) != INSN
4309           || GET_CODE (PATTERN (insn)) != SEQUENCE
4310           || GET_CODE (XVECEXP (PATTERN (insn), 0, 0)) != JUMP_INSN
4311           || JUMP_LABEL (XVECEXP (PATTERN (insn), 0, 0)) != end_of_function_label)
4312         continue;
4313
4314       pat = PATTERN (insn);
4315       jump_insn = XVECEXP (pat, 0, 0);
4316
4317       /* If we can't make the jump into a RETURN, try to redirect it to the best
4318          RETURN and go on to the next insn.  */
4319       if (! reorg_redirect_jump (jump_insn, NULL_RTX))
4320         {
4321           /* Make sure redirecting the jump will not invalidate the delay
4322              slot insns.  */
4323           if (redirect_with_delay_slots_safe_p (jump_insn,
4324                                                 real_return_label,
4325                                                 insn))
4326             reorg_redirect_jump (jump_insn, real_return_label);
4327           continue;
4328         }
4329
4330       /* See if this RETURN can accept the insns current in its delay slot.
4331          It can if it has more or an equal number of slots and the contents
4332          of each is valid.  */
4333
4334       flags = get_jump_flags (jump_insn, JUMP_LABEL (jump_insn));
4335       slots = num_delay_slots (jump_insn);
4336       if (slots >= XVECLEN (pat, 0) - 1)
4337         {
4338           for (i = 1; i < XVECLEN (pat, 0); i++)
4339             if (! (
4340 #ifdef ANNUL_IFFALSE_SLOTS
4341                    (INSN_ANNULLED_BRANCH_P (jump_insn)
4342                     && INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)))
4343                    ? eligible_for_annul_false (jump_insn, i - 1,
4344                                                XVECEXP (pat, 0, i), flags) :
4345 #endif
4346 #ifdef ANNUL_IFTRUE_SLOTS
4347                    (INSN_ANNULLED_BRANCH_P (jump_insn)
4348                     && ! INSN_FROM_TARGET_P (XVECEXP (pat, 0, i)))
4349                    ? eligible_for_annul_true (jump_insn, i - 1,
4350                                               XVECEXP (pat, 0, i), flags) :
4351 #endif
4352                    eligible_for_delay (jump_insn, i -1, XVECEXP (pat, 0, i), flags)))
4353               break;
4354         }
4355       else
4356         i = 0;
4357
4358       if (i == XVECLEN (pat, 0))
4359         continue;
4360
4361       /* We have to do something with this insn.  If it is an unconditional
4362          RETURN, delete the SEQUENCE and output the individual insns,
4363          followed by the RETURN.  Then set things up so we try to find
4364          insns for its delay slots, if it needs some.  */
4365       if (GET_CODE (PATTERN (jump_insn)) == RETURN)
4366         {
4367           rtx prev = PREV_INSN (insn);
4368
4369           delete_insn (insn);
4370           for (i = 1; i < XVECLEN (pat, 0); i++)
4371             prev = emit_insn_after (PATTERN (XVECEXP (pat, 0, i)), prev);
4372
4373           insn = emit_jump_insn_after (PATTERN (jump_insn), prev);
4374           emit_barrier_after (insn);
4375
4376           if (slots)
4377             obstack_ptr_grow (&unfilled_slots_obstack, insn);
4378         }
4379       else
4380         /* It is probably more efficient to keep this with its current
4381            delay slot as a branch to a RETURN.  */
4382         reorg_redirect_jump (jump_insn, real_return_label);
4383     }
4384
4385   /* Now delete REAL_RETURN_LABEL if we never used it.  Then try to fill any
4386      new delay slots we have created.  */
4387   if (--LABEL_NUSES (real_return_label) == 0)
4388     delete_insn (real_return_label);
4389
4390   fill_simple_delay_slots (first, 1);
4391   fill_simple_delay_slots (first, 0);
4392 }
4393 #endif
4394 \f
4395 /* Try to find insns to place in delay slots.  */
4396
4397 void
4398 dbr_schedule (first, file)
4399      rtx first;
4400      FILE *file;
4401 {
4402   rtx insn, next, epilogue_insn = 0;
4403   int i;
4404 #if 0
4405   int old_flag_no_peephole = flag_no_peephole;
4406
4407   /* Execute `final' once in prescan mode to delete any insns that won't be
4408      used.  Don't let final try to do any peephole optimization--it will
4409      ruin dataflow information for this pass.  */
4410
4411   flag_no_peephole = 1;
4412   final (first, 0, NO_DEBUG, 1, 1);
4413   flag_no_peephole = old_flag_no_peephole;
4414 #endif
4415
4416   /* If the current function has no insns other than the prologue and 
4417      epilogue, then do not try to fill any delay slots.  */
4418   if (n_basic_blocks == 0)
4419     return;
4420
4421   /* Find the highest INSN_UID and allocate and initialize our map from
4422      INSN_UID's to position in code.  */
4423   for (max_uid = 0, insn = first; insn; insn = NEXT_INSN (insn))
4424     {
4425       if (INSN_UID (insn) > max_uid)
4426         max_uid = INSN_UID (insn);
4427       if (GET_CODE (insn) == NOTE
4428           && NOTE_LINE_NUMBER (insn) == NOTE_INSN_EPILOGUE_BEG)
4429         epilogue_insn = insn;
4430     }
4431
4432   uid_to_ruid = (int *) alloca ((max_uid + 1) * sizeof (int *));
4433   for (i = 0, insn = first; insn; i++, insn = NEXT_INSN (insn))
4434     uid_to_ruid[INSN_UID (insn)] = i;
4435   
4436   /* Initialize the list of insns that need filling.  */
4437   if (unfilled_firstobj == 0)
4438     {
4439       gcc_obstack_init (&unfilled_slots_obstack);
4440       unfilled_firstobj = (rtx *) obstack_alloc (&unfilled_slots_obstack, 0);
4441     }
4442
4443   for (insn = next_active_insn (first); insn; insn = next_active_insn (insn))
4444     {
4445       rtx target;
4446
4447       INSN_ANNULLED_BRANCH_P (insn) = 0;
4448       INSN_FROM_TARGET_P (insn) = 0;
4449
4450       /* Skip vector tables.  We can't get attributes for them.  */
4451       if (GET_CODE (insn) == JUMP_INSN
4452           && (GET_CODE (PATTERN (insn)) == ADDR_VEC
4453               || GET_CODE (PATTERN (insn)) == ADDR_DIFF_VEC))
4454         continue;
4455     
4456       if (num_delay_slots (insn) > 0)
4457         obstack_ptr_grow (&unfilled_slots_obstack, insn);
4458
4459       /* Ensure all jumps go to the last of a set of consecutive labels.  */
4460       if (GET_CODE (insn) == JUMP_INSN 
4461           && (condjump_p (insn) || condjump_in_parallel_p (insn))
4462           && JUMP_LABEL (insn) != 0
4463           && ((target = prev_label (next_active_insn (JUMP_LABEL (insn))))
4464               != JUMP_LABEL (insn)))
4465         redirect_jump (insn, target);
4466     }
4467
4468   /* Indicate what resources are required to be valid at the end of the current
4469      function.  The condition code never is and memory always is.  If the
4470      frame pointer is needed, it is and so is the stack pointer unless
4471      EXIT_IGNORE_STACK is non-zero.  If the frame pointer is not needed, the
4472      stack pointer is.  Registers used to return the function value are
4473      needed.  Registers holding global variables are needed.  */
4474
4475   end_of_function_needs.cc = 0;
4476   end_of_function_needs.memory = 1;
4477   end_of_function_needs.unch_memory = 0;
4478   CLEAR_HARD_REG_SET (end_of_function_needs.regs);
4479
4480   if (frame_pointer_needed)
4481     {
4482       SET_HARD_REG_BIT (end_of_function_needs.regs, FRAME_POINTER_REGNUM);
4483 #if HARD_FRAME_POINTER_REGNUM != FRAME_POINTER_REGNUM
4484       SET_HARD_REG_BIT (end_of_function_needs.regs, HARD_FRAME_POINTER_REGNUM);
4485 #endif
4486 #ifdef EXIT_IGNORE_STACK
4487       if (! EXIT_IGNORE_STACK)
4488 #endif
4489         SET_HARD_REG_BIT (end_of_function_needs.regs, STACK_POINTER_REGNUM);
4490     }
4491   else
4492     SET_HARD_REG_BIT (end_of_function_needs.regs, STACK_POINTER_REGNUM);
4493
4494   if (current_function_return_rtx != 0
4495       && GET_CODE (current_function_return_rtx) == REG)
4496     mark_referenced_resources (current_function_return_rtx,
4497                                &end_of_function_needs, 1);
4498
4499   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
4500     if (global_regs[i]
4501 #ifdef EPILOGUE_USES
4502         || EPILOGUE_USES (i)
4503 #endif
4504         )
4505       SET_HARD_REG_BIT (end_of_function_needs.regs, i);
4506
4507   /* The registers required to be live at the end of the function are
4508      represented in the flow information as being dead just prior to
4509      reaching the end of the function.  For example, the return of a value
4510      might be represented by a USE of the return register immediately
4511      followed by an unconditional jump to the return label where the
4512      return label is the end of the RTL chain.  The end of the RTL chain
4513      is then taken to mean that the return register is live.
4514
4515      This sequence is no longer maintained when epilogue instructions are
4516      added to the RTL chain.  To reconstruct the original meaning, the
4517      start of the epilogue (NOTE_INSN_EPILOGUE_BEG) is regarded as the
4518      point where these registers become live (start_of_epilogue_needs).
4519      If epilogue instructions are present, the registers set by those
4520      instructions won't have been processed by flow.  Thus, those
4521      registers are additionally required at the end of the RTL chain
4522      (end_of_function_needs).  */
4523
4524   start_of_epilogue_needs = end_of_function_needs;
4525
4526   while (epilogue_insn = next_nonnote_insn (epilogue_insn))
4527     mark_set_resources (epilogue_insn, &end_of_function_needs, 0, 1);
4528
4529   /* Show we haven't computed an end-of-function label yet.  */
4530   end_of_function_label = 0;
4531
4532   /* Allocate and initialize the tables used by mark_target_live_regs.  */
4533   target_hash_table
4534     = (struct target_info **) alloca ((TARGET_HASH_PRIME
4535                                        * sizeof (struct target_info *)));
4536   bzero ((char *) target_hash_table,
4537          TARGET_HASH_PRIME * sizeof (struct target_info *));
4538
4539   bb_ticks = (int *) alloca (n_basic_blocks * sizeof (int));
4540   bzero ((char *) bb_ticks, n_basic_blocks * sizeof (int));
4541
4542   /* Initialize the statistics for this function.  */
4543   bzero ((char *) num_insns_needing_delays, sizeof num_insns_needing_delays);
4544   bzero ((char *) num_filled_delays, sizeof num_filled_delays);
4545
4546   /* Now do the delay slot filling.  Try everything twice in case earlier
4547      changes make more slots fillable.  */
4548
4549   for (reorg_pass_number = 0;
4550        reorg_pass_number < MAX_REORG_PASSES;
4551        reorg_pass_number++)
4552     {
4553       fill_simple_delay_slots (first, 1);
4554       fill_simple_delay_slots (first, 0);
4555       fill_eager_delay_slots (first);
4556       relax_delay_slots (first);
4557     }
4558
4559   /* Delete any USE insns made by update_block; subsequent passes don't need
4560      them or know how to deal with them.  */
4561   for (insn = first; insn; insn = next)
4562     {
4563       next = NEXT_INSN (insn);
4564
4565       if (GET_CODE (insn) == INSN && GET_CODE (PATTERN (insn)) == USE
4566           && GET_RTX_CLASS (GET_CODE (XEXP (PATTERN (insn), 0))) == 'i')
4567         next = delete_insn (insn);
4568     }
4569
4570   /* If we made an end of function label, indicate that it is now
4571      safe to delete it by undoing our prior adjustment to LABEL_NUSES.
4572      If it is now unused, delete it.  */
4573   if (end_of_function_label && --LABEL_NUSES (end_of_function_label) == 0)
4574     delete_insn (end_of_function_label);
4575
4576 #ifdef HAVE_return
4577   if (HAVE_return && end_of_function_label != 0)
4578     make_return_insns (first);
4579 #endif
4580
4581   obstack_free (&unfilled_slots_obstack, unfilled_firstobj);
4582
4583   /* It is not clear why the line below is needed, but it does seem to be.  */
4584   unfilled_firstobj = (rtx *) obstack_alloc (&unfilled_slots_obstack, 0);
4585
4586   /* Reposition the prologue and epilogue notes in case we moved the
4587      prologue/epilogue insns.  */
4588   reposition_prologue_and_epilogue_notes (first);
4589
4590   if (file)
4591     {
4592       register int i, j, need_comma;
4593
4594       for (reorg_pass_number = 0;
4595            reorg_pass_number < MAX_REORG_PASSES;
4596            reorg_pass_number++)
4597         {
4598           fprintf (file, ";; Reorg pass #%d:\n", reorg_pass_number + 1);
4599           for (i = 0; i < NUM_REORG_FUNCTIONS; i++)
4600             {
4601               need_comma = 0;
4602               fprintf (file, ";; Reorg function #%d\n", i);
4603
4604               fprintf (file, ";; %d insns needing delay slots\n;; ",
4605                        num_insns_needing_delays[i][reorg_pass_number]);
4606
4607               for (j = 0; j < MAX_DELAY_HISTOGRAM; j++)
4608                 if (num_filled_delays[i][j][reorg_pass_number])
4609                   {
4610                     if (need_comma)
4611                       fprintf (file, ", ");
4612                     need_comma = 1;
4613                     fprintf (file, "%d got %d delays",
4614                              num_filled_delays[i][j][reorg_pass_number], j);
4615                   }
4616               fprintf (file, "\n");
4617             }
4618         }
4619     }
4620 }
4621 #endif /* DELAY_SLOTS */