OSDN Git Service

2009-04-10 Robert Dewar <dewar@adacore.com>
[pf3gnuchains/gcc-fork.git] / gcc / ipa-inline.c
1 /* Inlining decision heuristics.
2    Copyright (C) 2003, 2004, 2007, 2008, 2009 Free Software Foundation, Inc.
3    Contributed by Jan Hubicka
4
5 This file is part of GCC.
6
7 GCC is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 3, or (at your option) any later
10 version.
11
12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GCC; see the file COPYING3.  If not see
19 <http://www.gnu.org/licenses/>.  */
20
21 /*  Inlining decision heuristics
22
23     We separate inlining decisions from the inliner itself and store it
24     inside callgraph as so called inline plan.  Refer to cgraph.c
25     documentation about particular representation of inline plans in the
26     callgraph.
27
28     There are three major parts of this file:
29
30     cgraph_mark_inline implementation
31
32       This function allows to mark given call inline and performs necessary
33       modifications of cgraph (production of the clones and updating overall
34       statistics)
35
36     inlining heuristics limits
37
38       These functions allow to check that particular inlining is allowed
39       by the limits specified by user (allowed function growth, overall unit
40       growth and so on).
41
42     inlining heuristics
43
44       This is implementation of IPA pass aiming to get as much of benefit
45       from inlining obeying the limits checked above.
46
47       The implementation of particular heuristics is separated from
48       the rest of code to make it easier to replace it with more complicated
49       implementation in the future.  The rest of inlining code acts as a
50       library aimed to modify the callgraph and verify that the parameters
51       on code size growth fits.
52
53       To mark given call inline, use cgraph_mark_inline function, the
54       verification is performed by cgraph_default_inline_p and
55       cgraph_check_inline_limits.
56
57       The heuristics implements simple knapsack style algorithm ordering
58       all functions by their "profitability" (estimated by code size growth)
59       and inlining them in priority order.
60
61       cgraph_decide_inlining implements heuristics taking whole callgraph
62       into account, while cgraph_decide_inlining_incrementally considers
63       only one function at a time and is used by early inliner.
64
65    The inliner itself is split into several passes:
66
67    pass_inline_parameters
68
69      This pass computes local properties of functions that are used by inliner:
70      estimated function body size, whether function is inlinable at all and
71      stack frame consumption.
72
73      Before executing any of inliner passes, this local pass has to be applied
74      to each function in the callgraph (ie run as subpass of some earlier
75      IPA pass).  The results are made out of date by any optimization applied
76      on the function body.
77
78    pass_early_inlining
79
80      Simple local inlining pass inlining callees into current function.  This
81      pass makes no global whole compilation unit analysis and this when allowed
82      to do inlining expanding code size it might result in unbounded growth of
83      whole unit.
84
85      The pass is run during conversion into SSA form.  Only functions already
86      converted into SSA form are inlined, so the conversion must happen in
87      topological order on the callgraph (that is maintained by pass manager).
88      The functions after inlining are early optimized so the early inliner sees
89      unoptimized function itself, but all considered callees are already
90      optimized allowing it to unfold abstraction penalty on C++ effectively and
91      cheaply.
92
93    pass_ipa_early_inlining
94
95      With profiling, the early inlining is also necessary to reduce
96      instrumentation costs on program with high abstraction penalty (doing
97      many redundant calls).  This can't happen in parallel with early
98      optimization and profile instrumentation, because we would end up
99      re-instrumenting already instrumented function bodies we brought in via
100      inlining.
101
102      To avoid this, this pass is executed as IPA pass before profiling.  It is
103      simple wrapper to pass_early_inlining and ensures first inlining.
104
105    pass_ipa_inline
106
107      This is the main pass implementing simple greedy algorithm to do inlining
108      of small functions that results in overall growth of compilation unit and
109      inlining of functions called once.  The pass compute just so called inline
110      plan (representation of inlining to be done in callgraph) and unlike early
111      inlining it is not performing the inlining itself.
112
113    pass_apply_inline
114
115      This pass performs actual inlining according to pass_ipa_inline on given
116      function.  Possible the function body before inlining is saved when it is
117      needed for further inlining later.
118  */
119
120 #include "config.h"
121 #include "system.h"
122 #include "coretypes.h"
123 #include "tm.h"
124 #include "tree.h"
125 #include "tree-inline.h"
126 #include "langhooks.h"
127 #include "flags.h"
128 #include "cgraph.h"
129 #include "diagnostic.h"
130 #include "timevar.h"
131 #include "params.h"
132 #include "fibheap.h"
133 #include "intl.h"
134 #include "tree-pass.h"
135 #include "hashtab.h"
136 #include "coverage.h"
137 #include "ggc.h"
138 #include "tree-flow.h"
139 #include "rtl.h"
140 #include "ipa-prop.h"
141
142 /* Mode incremental inliner operate on:
143
144    In ALWAYS_INLINE only functions marked
145    always_inline are inlined.  This mode is used after detecting cycle during
146    flattening.
147
148    In SIZE mode, only functions that reduce function body size after inlining
149    are inlined, this is used during early inlining.
150
151    in ALL mode, everything is inlined.  This is used during flattening.  */
152 enum inlining_mode {
153   INLINE_NONE = 0,
154   INLINE_ALWAYS_INLINE,
155   INLINE_SIZE,
156   INLINE_ALL
157 };
158 static bool
159 cgraph_decide_inlining_incrementally (struct cgraph_node *, enum inlining_mode,
160                                       int);
161
162
163 /* Statistics we collect about inlining algorithm.  */
164 static int ncalls_inlined;
165 static int nfunctions_inlined;
166 static int overall_insns;
167 static gcov_type max_count;
168
169 /* Holders of ipa cgraph hooks: */
170 static struct cgraph_node_hook_list *function_insertion_hook_holder;
171
172 static inline struct inline_summary *
173 inline_summary (struct cgraph_node *node)
174 {
175   return &node->local.inline_summary;
176 }
177
178 /* Estimate size of the function after inlining WHAT into TO.  */
179
180 static int
181 cgraph_estimate_size_after_inlining (int times, struct cgraph_node *to,
182                                      struct cgraph_node *what)
183 {
184   int size;
185   tree fndecl = what->decl, arg;
186   int call_insns = PARAM_VALUE (PARAM_INLINE_CALL_COST);
187
188   for (arg = DECL_ARGUMENTS (fndecl); arg; arg = TREE_CHAIN (arg))
189     call_insns += estimate_move_cost (TREE_TYPE (arg));
190   size = (what->global.insns - call_insns) * times + to->global.insns;
191   gcc_assert (size >= 0);
192   return size;
193 }
194
195 /* E is expected to be an edge being inlined.  Clone destination node of
196    the edge and redirect it to the new clone.
197    DUPLICATE is used for bookkeeping on whether we are actually creating new
198    clones or re-using node originally representing out-of-line function call.
199    */
200 void
201 cgraph_clone_inlined_nodes (struct cgraph_edge *e, bool duplicate,
202                             bool update_original)
203 {
204   HOST_WIDE_INT peak;
205
206   if (duplicate)
207     {
208       /* We may eliminate the need for out-of-line copy to be output.
209          In that case just go ahead and re-use it.  */
210       if (!e->callee->callers->next_caller
211           && !e->callee->needed
212           && !cgraph_new_nodes)
213         {
214           gcc_assert (!e->callee->global.inlined_to);
215           if (e->callee->analyzed)
216             overall_insns -= e->callee->global.insns, nfunctions_inlined++;
217           duplicate = false;
218         }
219       else
220         {
221           struct cgraph_node *n;
222           n = cgraph_clone_node (e->callee, e->count, e->frequency, e->loop_nest, 
223                                  update_original);
224           cgraph_redirect_edge_callee (e, n);
225         }
226     }
227
228   if (e->caller->global.inlined_to)
229     e->callee->global.inlined_to = e->caller->global.inlined_to;
230   else
231     e->callee->global.inlined_to = e->caller;
232   e->callee->global.stack_frame_offset
233     = e->caller->global.stack_frame_offset
234       + inline_summary (e->caller)->estimated_self_stack_size;
235   peak = e->callee->global.stack_frame_offset
236       + inline_summary (e->callee)->estimated_self_stack_size;
237   if (e->callee->global.inlined_to->global.estimated_stack_size < peak)
238     e->callee->global.inlined_to->global.estimated_stack_size = peak;
239
240   /* Recursively clone all bodies.  */
241   for (e = e->callee->callees; e; e = e->next_callee)
242     if (!e->inline_failed)
243       cgraph_clone_inlined_nodes (e, duplicate, update_original);
244 }
245
246 /* Mark edge E as inlined and update callgraph accordingly.  UPDATE_ORIGINAL
247    specify whether profile of original function should be updated.  If any new
248    indirect edges are discovered in the process, add them to NEW_EDGES, unless
249    it is NULL.  Return true iff any new callgraph edges were discovered as a
250    result of inlining.  */
251
252 static bool
253 cgraph_mark_inline_edge (struct cgraph_edge *e, bool update_original,
254                          VEC (cgraph_edge_p, heap) **new_edges)
255 {
256   int old_insns = 0, new_insns = 0;
257   struct cgraph_node *to = NULL, *what;
258   struct cgraph_edge *curr = e;
259
260   if (e->callee->inline_decl)
261     cgraph_redirect_edge_callee (e, cgraph_node (e->callee->inline_decl));
262
263   gcc_assert (e->inline_failed);
264   e->inline_failed = CIF_OK;
265
266   if (!e->callee->global.inlined)
267     DECL_POSSIBLY_INLINED (e->callee->decl) = true;
268   e->callee->global.inlined = true;
269
270   cgraph_clone_inlined_nodes (e, true, update_original);
271
272   what = e->callee;
273
274   /* Now update size of caller and all functions caller is inlined into.  */
275   for (;e && !e->inline_failed; e = e->caller->callers)
276     {
277       old_insns = e->caller->global.insns;
278       new_insns = cgraph_estimate_size_after_inlining (1, e->caller,
279                                                        what);
280       gcc_assert (new_insns >= 0);
281       to = e->caller;
282       to->global.insns = new_insns;
283     }
284   gcc_assert (what->global.inlined_to == to);
285   if (new_insns > old_insns)
286     overall_insns += new_insns - old_insns;
287   ncalls_inlined++;
288
289   if (flag_indirect_inlining)
290     return ipa_propagate_indirect_call_infos (curr, new_edges);
291   else
292     return false;
293 }
294
295 /* Mark all calls of EDGE->CALLEE inlined into EDGE->CALLER.
296    Return following unredirected edge in the list of callers
297    of EDGE->CALLEE  */
298
299 static struct cgraph_edge *
300 cgraph_mark_inline (struct cgraph_edge *edge)
301 {
302   struct cgraph_node *to = edge->caller;
303   struct cgraph_node *what = edge->callee;
304   struct cgraph_edge *e, *next;
305
306   gcc_assert (!gimple_call_cannot_inline_p (edge->call_stmt));
307   /* Look for all calls, mark them inline and clone recursively
308      all inlined functions.  */
309   for (e = what->callers; e; e = next)
310     {
311       next = e->next_caller;
312       if (e->caller == to && e->inline_failed)
313         {
314           cgraph_mark_inline_edge (e, true, NULL);
315           if (e == edge)
316             edge = next;
317         }
318     }
319
320   return edge;
321 }
322
323 /* Estimate the growth caused by inlining NODE into all callees.  */
324
325 static int
326 cgraph_estimate_growth (struct cgraph_node *node)
327 {
328   int growth = 0;
329   struct cgraph_edge *e;
330   bool self_recursive = false;
331
332   if (node->global.estimated_growth != INT_MIN)
333     return node->global.estimated_growth;
334
335   for (e = node->callers; e; e = e->next_caller)
336     {
337       if (e->caller == node)
338         self_recursive = true;
339       if (e->inline_failed)
340         growth += (cgraph_estimate_size_after_inlining (1, e->caller, node)
341                    - e->caller->global.insns);
342     }
343
344   /* ??? Wrong for non-trivially self recursive functions or cases where
345      we decide to not inline for different reasons, but it is not big deal
346      as in that case we will keep the body around, but we will also avoid
347      some inlining.  */
348   if (!node->needed && !DECL_EXTERNAL (node->decl) && !self_recursive)
349     growth -= node->global.insns;
350
351   node->global.estimated_growth = growth;
352   return growth;
353 }
354
355 /* Return false when inlining WHAT into TO is not good idea
356    as it would cause too large growth of function bodies.  
357    When ONE_ONLY is true, assume that only one call site is going
358    to be inlined, otherwise figure out how many call sites in
359    TO calls WHAT and verify that all can be inlined.
360    */
361
362 static bool
363 cgraph_check_inline_limits (struct cgraph_node *to, struct cgraph_node *what,
364                             cgraph_inline_failed_t *reason, bool one_only)
365 {
366   int times = 0;
367   struct cgraph_edge *e;
368   int newsize;
369   int limit;
370   HOST_WIDE_INT stack_size_limit, inlined_stack;
371
372   if (one_only)
373     times = 1;
374   else
375     for (e = to->callees; e; e = e->next_callee)
376       if (e->callee == what)
377         times++;
378
379   if (to->global.inlined_to)
380     to = to->global.inlined_to;
381
382   /* When inlining large function body called once into small function,
383      take the inlined function as base for limiting the growth.  */
384   if (inline_summary (to)->self_insns > inline_summary(what)->self_insns)
385     limit = inline_summary (to)->self_insns;
386   else
387     limit = inline_summary (what)->self_insns;
388
389   limit += limit * PARAM_VALUE (PARAM_LARGE_FUNCTION_GROWTH) / 100;
390
391   /* Check the size after inlining against the function limits.  But allow
392      the function to shrink if it went over the limits by forced inlining.  */
393   newsize = cgraph_estimate_size_after_inlining (times, to, what);
394   if (newsize >= to->global.insns
395       && newsize > PARAM_VALUE (PARAM_LARGE_FUNCTION_INSNS)
396       && newsize > limit)
397     {
398       if (reason)
399         *reason = CIF_LARGE_FUNCTION_GROWTH_LIMIT;
400       return false;
401     }
402
403   stack_size_limit = inline_summary (to)->estimated_self_stack_size;
404
405   stack_size_limit += stack_size_limit * PARAM_VALUE (PARAM_STACK_FRAME_GROWTH) / 100;
406
407   inlined_stack = (to->global.stack_frame_offset
408                    + inline_summary (to)->estimated_self_stack_size
409                    + what->global.estimated_stack_size);
410   if (inlined_stack  > stack_size_limit
411       && inlined_stack > PARAM_VALUE (PARAM_LARGE_STACK_FRAME))
412     {
413       if (reason)
414         *reason = CIF_LARGE_STACK_FRAME_GROWTH_LIMIT;
415       return false;
416     }
417   return true;
418 }
419
420 /* Return true when function N is small enough to be inlined.  */
421
422 static bool
423 cgraph_default_inline_p (struct cgraph_node *n, cgraph_inline_failed_t *reason)
424 {
425   tree decl = n->decl;
426
427   if (n->inline_decl)
428     decl = n->inline_decl;
429   if (!flag_inline_small_functions && !DECL_DECLARED_INLINE_P (decl))
430     {
431       if (reason)
432         *reason = CIF_FUNCTION_NOT_INLINE_CANDIDATE;
433       return false;
434     }
435
436   if (!DECL_STRUCT_FUNCTION (decl)->cfg)
437     {
438       if (reason)
439         *reason = CIF_BODY_NOT_AVAILABLE;
440       return false;
441     }
442
443   if (DECL_DECLARED_INLINE_P (decl))
444     {
445       if (n->global.insns >= MAX_INLINE_INSNS_SINGLE)
446         {
447           if (reason)
448             *reason = CIF_MAX_INLINE_INSNS_SINGLE_LIMIT;
449           return false;
450         }
451     }
452   else
453     {
454       if (n->global.insns >= MAX_INLINE_INSNS_AUTO)
455         {
456           if (reason)
457             *reason = CIF_MAX_INLINE_INSNS_AUTO_LIMIT;
458           return false;
459         }
460     }
461
462   return true;
463 }
464
465 /* Return true when inlining WHAT would create recursive inlining.
466    We call recursive inlining all cases where same function appears more than
467    once in the single recursion nest path in the inline graph.  */
468
469 static bool
470 cgraph_recursive_inlining_p (struct cgraph_node *to,
471                              struct cgraph_node *what,
472                              cgraph_inline_failed_t *reason)
473 {
474   bool recursive;
475   if (to->global.inlined_to)
476     recursive = what->decl == to->global.inlined_to->decl;
477   else
478     recursive = what->decl == to->decl;
479   /* Marking recursive function inline has sane semantic and thus we should
480      not warn on it.  */
481   if (recursive && reason)
482     *reason = (what->local.disregard_inline_limits
483                ? CIF_RECURSIVE_INLINING : CIF_UNSPECIFIED);
484   return recursive;
485 }
486
487 /* A cost model driving the inlining heuristics in a way so the edges with
488    smallest badness are inlined first.  After each inlining is performed
489    the costs of all caller edges of nodes affected are recomputed so the
490    metrics may accurately depend on values such as number of inlinable callers
491    of the function or function body size.  */
492
493 static int
494 cgraph_edge_badness (struct cgraph_edge *edge)
495 {
496   int badness;
497   int growth =
498     cgraph_estimate_size_after_inlining (1, edge->caller, edge->callee);
499
500   growth -= edge->caller->global.insns;
501
502   /* Always prefer inlining saving code size.  */
503   if (growth <= 0)
504     badness = INT_MIN - growth;
505
506   /* When profiling is available, base priorities -(#calls / growth).
507      So we optimize for overall number of "executed" inlined calls.  */
508   else if (max_count)
509     badness = ((int)((double)edge->count * INT_MIN / max_count)) / growth;
510
511   /* When function local profile is available, base priorities on
512      growth / frequency, so we optimize for overall frequency of inlined
513      calls.  This is not too accurate since while the call might be frequent
514      within function, the function itself is infrequent.
515
516      Other objective to optimize for is number of different calls inlined.
517      We add the estimated growth after inlining all functions to bias the
518      priorities slightly in this direction (so fewer times called functions
519      of the same size gets priority).  */
520   else if (flag_guess_branch_prob)
521     {
522       int div = edge->frequency * 100 / CGRAPH_FREQ_BASE;
523       int growth =
524         cgraph_estimate_size_after_inlining (1, edge->caller, edge->callee);
525       growth -= edge->caller->global.insns;
526       badness = growth * 256;
527
528       /* Decrease badness if call is nested.  */
529       /* Compress the range so we don't overflow.  */
530       if (div > 256)
531         div = 256 + ceil_log2 (div) - 8;
532       if (div < 1)
533         div = 1;
534       if (badness > 0)
535         badness /= div;
536       badness += cgraph_estimate_growth (edge->callee);
537     }
538   /* When function local profile is not available or it does not give
539      useful information (ie frequency is zero), base the cost on
540      loop nest and overall size growth, so we optimize for overall number
541      of functions fully inlined in program.  */
542   else
543     {
544       int nest = MIN (edge->loop_nest, 8);
545       badness = cgraph_estimate_growth (edge->callee) * 256;
546
547       /* Decrease badness if call is nested.  */
548       if (badness > 0)    
549         badness >>= nest;
550       else
551         {
552           badness <<= nest;
553         }
554     }
555   /* Make recursive inlining happen always after other inlining is done.  */
556   if (cgraph_recursive_inlining_p (edge->caller, edge->callee, NULL))
557     return badness + 1;
558   else
559     return badness;
560 }
561
562 /* Recompute heap nodes for each of caller edge.  */
563
564 static void
565 update_caller_keys (fibheap_t heap, struct cgraph_node *node,
566                     bitmap updated_nodes)
567 {
568   struct cgraph_edge *edge;
569   cgraph_inline_failed_t failed_reason;
570
571   if (!node->local.inlinable || node->local.disregard_inline_limits
572       || node->global.inlined_to)
573     return;
574   if (bitmap_bit_p (updated_nodes, node->uid))
575     return;
576   bitmap_set_bit (updated_nodes, node->uid);
577   node->global.estimated_growth = INT_MIN;
578
579   if (!node->local.inlinable)
580     return;
581   /* Prune out edges we won't inline into anymore.  */
582   if (!cgraph_default_inline_p (node, &failed_reason))
583     {
584       for (edge = node->callers; edge; edge = edge->next_caller)
585         if (edge->aux)
586           {
587             fibheap_delete_node (heap, (fibnode_t) edge->aux);
588             edge->aux = NULL;
589             if (edge->inline_failed)
590               edge->inline_failed = failed_reason;
591           }
592       return;
593     }
594
595   for (edge = node->callers; edge; edge = edge->next_caller)
596     if (edge->inline_failed)
597       {
598         int badness = cgraph_edge_badness (edge);
599         if (edge->aux)
600           {
601             fibnode_t n = (fibnode_t) edge->aux;
602             gcc_assert (n->data == edge);
603             if (n->key == badness)
604               continue;
605
606             /* fibheap_replace_key only increase the keys.  */
607             if (fibheap_replace_key (heap, n, badness))
608               continue;
609             fibheap_delete_node (heap, (fibnode_t) edge->aux);
610           }
611         edge->aux = fibheap_insert (heap, badness, edge);
612       }
613 }
614
615 /* Recompute heap nodes for each of caller edges of each of callees.  */
616
617 static void
618 update_callee_keys (fibheap_t heap, struct cgraph_node *node,
619                     bitmap updated_nodes)
620 {
621   struct cgraph_edge *e;
622   node->global.estimated_growth = INT_MIN;
623
624   for (e = node->callees; e; e = e->next_callee)
625     if (e->inline_failed)
626       update_caller_keys (heap, e->callee, updated_nodes);
627     else if (!e->inline_failed)
628       update_callee_keys (heap, e->callee, updated_nodes);
629 }
630
631 /* Enqueue all recursive calls from NODE into priority queue depending on
632    how likely we want to recursively inline the call.  */
633
634 static void
635 lookup_recursive_calls (struct cgraph_node *node, struct cgraph_node *where,
636                         fibheap_t heap)
637 {
638   static int priority;
639   struct cgraph_edge *e;
640   for (e = where->callees; e; e = e->next_callee)
641     if (e->callee == node)
642       {
643         /* When profile feedback is available, prioritize by expected number
644            of calls.  Without profile feedback we maintain simple queue
645            to order candidates via recursive depths.  */
646         fibheap_insert (heap,
647                         !max_count ? priority++
648                         : -(e->count / ((max_count + (1<<24) - 1) / (1<<24))),
649                         e);
650       }
651   for (e = where->callees; e; e = e->next_callee)
652     if (!e->inline_failed)
653       lookup_recursive_calls (node, e->callee, heap);
654 }
655
656 /* Decide on recursive inlining: in the case function has recursive calls,
657    inline until body size reaches given argument.  If any new indirect edges
658    are discovered in the process, add them to *NEW_EDGES, unless NEW_EDGES
659    is NULL.  */
660
661 static bool
662 cgraph_decide_recursive_inlining (struct cgraph_node *node,
663                                   VEC (cgraph_edge_p, heap) **new_edges)
664 {
665   int limit = PARAM_VALUE (PARAM_MAX_INLINE_INSNS_RECURSIVE_AUTO);
666   int max_depth = PARAM_VALUE (PARAM_MAX_INLINE_RECURSIVE_DEPTH_AUTO);
667   int probability = PARAM_VALUE (PARAM_MIN_INLINE_RECURSIVE_PROBABILITY);
668   fibheap_t heap;
669   struct cgraph_edge *e;
670   struct cgraph_node *master_clone, *next;
671   int depth = 0;
672   int n = 0;
673
674   if (optimize_function_for_size_p (DECL_STRUCT_FUNCTION (node->decl))
675       || (!flag_inline_functions && !DECL_DECLARED_INLINE_P (node->decl)))
676     return false;
677
678   if (DECL_DECLARED_INLINE_P (node->decl))
679     {
680       limit = PARAM_VALUE (PARAM_MAX_INLINE_INSNS_RECURSIVE);
681       max_depth = PARAM_VALUE (PARAM_MAX_INLINE_RECURSIVE_DEPTH);
682     }
683
684   /* Make sure that function is small enough to be considered for inlining.  */
685   if (!max_depth
686       || cgraph_estimate_size_after_inlining (1, node, node)  >= limit)
687     return false;
688   heap = fibheap_new ();
689   lookup_recursive_calls (node, node, heap);
690   if (fibheap_empty (heap))
691     {
692       fibheap_delete (heap);
693       return false;
694     }
695
696   if (dump_file)
697     fprintf (dump_file, 
698              "  Performing recursive inlining on %s\n",
699              cgraph_node_name (node));
700
701   /* We need original clone to copy around.  */
702   master_clone = cgraph_clone_node (node, node->count, CGRAPH_FREQ_BASE, 1, false);
703   master_clone->needed = true;
704   for (e = master_clone->callees; e; e = e->next_callee)
705     if (!e->inline_failed)
706       cgraph_clone_inlined_nodes (e, true, false);
707
708   /* Do the inlining and update list of recursive call during process.  */
709   while (!fibheap_empty (heap)
710          && (cgraph_estimate_size_after_inlining (1, node, master_clone)
711              <= limit))
712     {
713       struct cgraph_edge *curr
714         = (struct cgraph_edge *) fibheap_extract_min (heap);
715       struct cgraph_node *cnode;
716
717       depth = 1;
718       for (cnode = curr->caller;
719            cnode->global.inlined_to; cnode = cnode->callers->caller)
720         if (node->decl == curr->callee->decl)
721           depth++;
722       if (depth > max_depth)
723         {
724           if (dump_file)
725             fprintf (dump_file, 
726                      "   maximal depth reached\n");
727           continue;
728         }
729
730       if (max_count)
731         {
732           if (!cgraph_maybe_hot_edge_p (curr))
733             {
734               if (dump_file)
735                 fprintf (dump_file, "   Not inlining cold call\n");
736               continue;
737             }
738           if (curr->count * 100 / node->count < probability)
739             {
740               if (dump_file)
741                 fprintf (dump_file, 
742                          "   Probability of edge is too small\n");
743               continue;
744             }
745         }
746
747       if (dump_file)
748         {
749           fprintf (dump_file, 
750                    "   Inlining call of depth %i", depth);
751           if (node->count)
752             {
753               fprintf (dump_file, " called approx. %.2f times per call",
754                        (double)curr->count / node->count);
755             }
756           fprintf (dump_file, "\n");
757         }
758       cgraph_redirect_edge_callee (curr, master_clone);
759       cgraph_mark_inline_edge (curr, false, new_edges);
760       lookup_recursive_calls (node, curr->callee, heap);
761       n++;
762     }
763   if (!fibheap_empty (heap) && dump_file)
764     fprintf (dump_file, "    Recursive inlining growth limit met.\n");
765
766   fibheap_delete (heap);
767   if (dump_file)
768     fprintf (dump_file, 
769              "\n   Inlined %i times, body grown from %i to %i insns\n", n,
770              master_clone->global.insns, node->global.insns);
771
772   /* Remove master clone we used for inlining.  We rely that clones inlined
773      into master clone gets queued just before master clone so we don't
774      need recursion.  */
775   for (node = cgraph_nodes; node != master_clone;
776        node = next)
777     {
778       next = node->next;
779       if (node->global.inlined_to == master_clone)
780         cgraph_remove_node (node);
781     }
782   cgraph_remove_node (master_clone);
783   /* FIXME: Recursive inlining actually reduces number of calls of the
784      function.  At this place we should probably walk the function and
785      inline clones and compensate the counts accordingly.  This probably
786      doesn't matter much in practice.  */
787   return n > 0;
788 }
789
790 /* Set inline_failed for all callers of given function to REASON.  */
791
792 static void
793 cgraph_set_inline_failed (struct cgraph_node *node,
794                           cgraph_inline_failed_t reason)
795 {
796   struct cgraph_edge *e;
797
798   if (dump_file)
799     fprintf (dump_file, "Inlining failed: %s\n",
800              cgraph_inline_failed_string (reason));
801   for (e = node->callers; e; e = e->next_caller)
802     if (e->inline_failed)
803       e->inline_failed = reason;
804 }
805
806 /* Given whole compilation unit estimate of INSNS, compute how large we can
807    allow the unit to grow.  */
808 static int
809 compute_max_insns (int insns)
810 {
811   int max_insns = insns;
812   if (max_insns < PARAM_VALUE (PARAM_LARGE_UNIT_INSNS))
813     max_insns = PARAM_VALUE (PARAM_LARGE_UNIT_INSNS);
814
815   return ((HOST_WIDEST_INT) max_insns
816           * (100 + PARAM_VALUE (PARAM_INLINE_UNIT_GROWTH)) / 100);
817 }
818
819 /* Compute badness of all edges in NEW_EDGES and add them to the HEAP.  */
820 static void
821 add_new_edges_to_heap (fibheap_t heap, VEC (cgraph_edge_p, heap) *new_edges)
822 {
823   while (VEC_length (cgraph_edge_p, new_edges) > 0)
824     {
825       struct cgraph_edge *edge = VEC_pop (cgraph_edge_p, new_edges);
826
827       gcc_assert (!edge->aux);
828       edge->aux = fibheap_insert (heap, cgraph_edge_badness (edge), edge);
829     }
830 }
831
832
833 /* We use greedy algorithm for inlining of small functions:
834    All inline candidates are put into prioritized heap based on estimated
835    growth of the overall number of instructions and then update the estimates.
836
837    INLINED and INLINED_CALEES are just pointers to arrays large enough
838    to be passed to cgraph_inlined_into and cgraph_inlined_callees.  */
839
840 static void
841 cgraph_decide_inlining_of_small_functions (void)
842 {
843   struct cgraph_node *node;
844   struct cgraph_edge *edge;
845   cgraph_inline_failed_t failed_reason;
846   fibheap_t heap = fibheap_new ();
847   bitmap updated_nodes = BITMAP_ALLOC (NULL);
848   int min_insns, max_insns;
849   VEC (cgraph_edge_p, heap) *new_indirect_edges = NULL;
850
851   if (flag_indirect_inlining)
852     new_indirect_edges = VEC_alloc (cgraph_edge_p, heap, 8);
853
854   if (dump_file)
855     fprintf (dump_file, "\nDeciding on smaller functions:\n");
856
857   /* Put all inline candidates into the heap.  */
858
859   for (node = cgraph_nodes; node; node = node->next)
860     {
861       if (!node->local.inlinable || !node->callers
862           || node->local.disregard_inline_limits)
863         continue;
864       if (dump_file)
865         fprintf (dump_file, "Considering inline candidate %s.\n", cgraph_node_name (node));
866
867       node->global.estimated_growth = INT_MIN;
868       if (!cgraph_default_inline_p (node, &failed_reason))
869         {
870           cgraph_set_inline_failed (node, failed_reason);
871           continue;
872         }
873
874       for (edge = node->callers; edge; edge = edge->next_caller)
875         if (edge->inline_failed)
876           {
877             gcc_assert (!edge->aux);
878             edge->aux = fibheap_insert (heap, cgraph_edge_badness (edge), edge);
879           }
880     }
881
882   max_insns = compute_max_insns (overall_insns);
883   min_insns = overall_insns;
884
885   while (overall_insns <= max_insns
886          && (edge = (struct cgraph_edge *) fibheap_extract_min (heap)))
887     {
888       int old_insns = overall_insns;
889       struct cgraph_node *where;
890       int growth =
891         cgraph_estimate_size_after_inlining (1, edge->caller, edge->callee);
892       cgraph_inline_failed_t not_good = CIF_OK;
893
894       growth -= edge->caller->global.insns;
895
896       if (dump_file)
897         {
898           fprintf (dump_file, 
899                    "\nConsidering %s with %i insns\n",
900                    cgraph_node_name (edge->callee),
901                    edge->callee->global.insns);
902           fprintf (dump_file, 
903                    " to be inlined into %s\n"
904                    " Estimated growth after inlined into all callees is %+i insns.\n"
905                    " Estimated badness is %i, frequency %.2f.\n",
906                    cgraph_node_name (edge->caller),
907                    cgraph_estimate_growth (edge->callee),
908                    cgraph_edge_badness (edge),
909                    edge->frequency / (double)CGRAPH_FREQ_BASE);
910           if (edge->count)
911             fprintf (dump_file," Called "HOST_WIDEST_INT_PRINT_DEC"x\n", edge->count);
912         }
913       gcc_assert (edge->aux);
914       edge->aux = NULL;
915       if (!edge->inline_failed)
916         continue;
917
918       /* When not having profile info ready we don't weight by any way the
919          position of call in procedure itself.  This means if call of
920          function A from function B seems profitable to inline, the recursive
921          call of function A in inline copy of A in B will look profitable too
922          and we end up inlining until reaching maximal function growth.  This
923          is not good idea so prohibit the recursive inlining.
924
925          ??? When the frequencies are taken into account we might not need this
926          restriction.
927
928          We need to be cureful here, in some testcases, e.g. directivec.c in
929          libcpp, we can estimate self recursive function to have negative growth
930          for inlining completely.
931          */
932       if (!edge->count)
933         {
934           where = edge->caller;
935           while (where->global.inlined_to)
936             {
937               if (where->decl == edge->callee->decl)
938                 break;
939               where = where->callers->caller;
940             }
941           if (where->global.inlined_to)
942             {
943               edge->inline_failed
944                 = (edge->callee->local.disregard_inline_limits
945                    ? CIF_RECURSIVE_INLINING : CIF_UNSPECIFIED);
946               if (dump_file)
947                 fprintf (dump_file, " inline_failed:Recursive inlining performed only for function itself.\n");
948               continue;
949             }
950         }
951
952       if (!cgraph_maybe_hot_edge_p (edge))
953         not_good = CIF_UNLIKELY_CALL;
954       if (!flag_inline_functions
955           && !DECL_DECLARED_INLINE_P (edge->callee->decl))
956         not_good = CIF_NOT_DECLARED_INLINED;
957       if (optimize_function_for_size_p (DECL_STRUCT_FUNCTION(edge->caller->decl)))
958         not_good = CIF_OPTIMIZING_FOR_SIZE;
959       if (not_good && growth > 0 && cgraph_estimate_growth (edge->callee) > 0)
960         {
961           if (!cgraph_recursive_inlining_p (edge->caller, edge->callee,
962                                             &edge->inline_failed))
963             {
964               edge->inline_failed = not_good;
965               if (dump_file)
966                 fprintf (dump_file, " inline_failed:%s.\n",
967                          cgraph_inline_failed_string (edge->inline_failed));
968             }
969           continue;
970         }
971       if (!cgraph_default_inline_p (edge->callee, &edge->inline_failed))
972         {
973           if (!cgraph_recursive_inlining_p (edge->caller, edge->callee,
974                                             &edge->inline_failed))
975             {
976               if (dump_file)
977                 fprintf (dump_file, " inline_failed:%s.\n",
978                          cgraph_inline_failed_string (edge->inline_failed));
979             }
980           continue;
981         }
982       if (!tree_can_inline_p (edge->caller->decl, edge->callee->decl))
983         {
984           gimple_call_set_cannot_inline (edge->call_stmt, true);
985           edge->inline_failed = CIF_TARGET_OPTION_MISMATCH;
986           if (dump_file)
987             fprintf (dump_file, " inline_failed:%s.\n",
988                      cgraph_inline_failed_string (edge->inline_failed));
989           continue;
990         }
991       if (cgraph_recursive_inlining_p (edge->caller, edge->callee,
992                                        &edge->inline_failed))
993         {
994           where = edge->caller;
995           if (where->global.inlined_to)
996             where = where->global.inlined_to;
997           if (!cgraph_decide_recursive_inlining (where,
998                                                  flag_indirect_inlining
999                                                  ? &new_indirect_edges : NULL))
1000             continue;
1001           if (flag_indirect_inlining)
1002             add_new_edges_to_heap (heap, new_indirect_edges);
1003           update_callee_keys (heap, where, updated_nodes);
1004         }
1005       else
1006         {
1007           struct cgraph_node *callee;
1008           if (gimple_call_cannot_inline_p (edge->call_stmt)
1009               || !cgraph_check_inline_limits (edge->caller, edge->callee,
1010                                               &edge->inline_failed, true))
1011             {
1012               if (dump_file)
1013                 fprintf (dump_file, " Not inlining into %s:%s.\n",
1014                          cgraph_node_name (edge->caller),
1015                          cgraph_inline_failed_string (edge->inline_failed));
1016               continue;
1017             }
1018           callee = edge->callee;
1019           cgraph_mark_inline_edge (edge, true, &new_indirect_edges);
1020           if (flag_indirect_inlining)
1021             add_new_edges_to_heap (heap, new_indirect_edges);
1022
1023           update_callee_keys (heap, callee, updated_nodes);
1024         }
1025       where = edge->caller;
1026       if (where->global.inlined_to)
1027         where = where->global.inlined_to;
1028
1029       /* Our profitability metric can depend on local properties
1030          such as number of inlinable calls and size of the function body.
1031          After inlining these properties might change for the function we
1032          inlined into (since it's body size changed) and for the functions
1033          called by function we inlined (since number of it inlinable callers
1034          might change).  */
1035       update_caller_keys (heap, where, updated_nodes);
1036       bitmap_clear (updated_nodes);
1037
1038       if (dump_file)
1039         {
1040           fprintf (dump_file, 
1041                    " Inlined into %s which now has %i insns,"
1042                    "net change of %+i insns.\n",
1043                    cgraph_node_name (edge->caller),
1044                    edge->caller->global.insns,
1045                    overall_insns - old_insns);
1046         }
1047       if (min_insns > overall_insns)
1048         {
1049           min_insns = overall_insns;
1050           max_insns = compute_max_insns (min_insns);
1051
1052           if (dump_file)
1053             fprintf (dump_file, "New minimal insns reached: %i\n", min_insns);
1054         }
1055     }
1056   while ((edge = (struct cgraph_edge *) fibheap_extract_min (heap)) != NULL)
1057     {
1058       gcc_assert (edge->aux);
1059       edge->aux = NULL;
1060       if (!edge->callee->local.disregard_inline_limits && edge->inline_failed
1061           && !cgraph_recursive_inlining_p (edge->caller, edge->callee,
1062                                            &edge->inline_failed))
1063         edge->inline_failed = CIF_INLINE_UNIT_GROWTH_LIMIT;
1064     }
1065
1066   if (new_indirect_edges)
1067     VEC_free (cgraph_edge_p, heap, new_indirect_edges);
1068   fibheap_delete (heap);
1069   BITMAP_FREE (updated_nodes);
1070 }
1071
1072 /* Decide on the inlining.  We do so in the topological order to avoid
1073    expenses on updating data structures.  */
1074
1075 static unsigned int
1076 cgraph_decide_inlining (void)
1077 {
1078   struct cgraph_node *node;
1079   int nnodes;
1080   struct cgraph_node **order =
1081     XCNEWVEC (struct cgraph_node *, cgraph_n_nodes);
1082   int old_insns = 0;
1083   int i;
1084   int initial_insns = 0;
1085   bool redo_always_inline = true;
1086
1087   cgraph_remove_function_insertion_hook (function_insertion_hook_holder);
1088
1089   max_count = 0;
1090   for (node = cgraph_nodes; node; node = node->next)
1091     if (node->analyzed && (node->needed || node->reachable))
1092       {
1093         struct cgraph_edge *e;
1094
1095         initial_insns += inline_summary (node)->self_insns;
1096         gcc_assert (inline_summary (node)->self_insns == node->global.insns);
1097         for (e = node->callees; e; e = e->next_callee)
1098           if (max_count < e->count)
1099             max_count = e->count;
1100       }
1101   overall_insns = initial_insns;
1102   gcc_assert (!max_count || (profile_info && flag_branch_probabilities));
1103
1104   nnodes = cgraph_postorder (order);
1105
1106   if (dump_file)
1107     fprintf (dump_file,
1108              "\nDeciding on inlining.  Starting with %i insns.\n",
1109              initial_insns);
1110
1111   for (node = cgraph_nodes; node; node = node->next)
1112     node->aux = 0;
1113
1114   if (dump_file)
1115     fprintf (dump_file, "\nInlining always_inline functions:\n");
1116
1117   /* In the first pass mark all always_inline edges.  Do this with a priority
1118      so none of our later choices will make this impossible.  */
1119   while (redo_always_inline)
1120     {
1121       redo_always_inline = false;
1122       for (i = nnodes - 1; i >= 0; i--)
1123         {
1124           struct cgraph_edge *e, *next;
1125
1126           node = order[i];
1127
1128           /* Handle nodes to be flattened, but don't update overall unit
1129              size.  */
1130           if (lookup_attribute ("flatten",
1131                                 DECL_ATTRIBUTES (node->decl)) != NULL)
1132             {
1133               if (dump_file)
1134                 fprintf (dump_file,
1135                          "Flattening %s\n", cgraph_node_name (node));
1136               cgraph_decide_inlining_incrementally (node, INLINE_ALL, 0);
1137             }
1138
1139           if (!node->local.disregard_inline_limits)
1140             continue;
1141           if (dump_file)
1142             fprintf (dump_file,
1143                      "\nConsidering %s %i insns (always inline)\n",
1144                      cgraph_node_name (node), node->global.insns);
1145           old_insns = overall_insns;
1146           for (e = node->callers; e; e = next)
1147             {
1148               next = e->next_caller;
1149               if (!e->inline_failed
1150                   || gimple_call_cannot_inline_p (e->call_stmt))
1151                 continue;
1152               if (cgraph_recursive_inlining_p (e->caller, e->callee,
1153                                                &e->inline_failed))
1154                 continue;
1155               if (!tree_can_inline_p (e->caller->decl, e->callee->decl))
1156                 {
1157                   gimple_call_set_cannot_inline (e->call_stmt, true);
1158                   continue;
1159                 }
1160               if (cgraph_mark_inline_edge (e, true, NULL))
1161                 redo_always_inline = true;
1162               if (dump_file)
1163                 fprintf (dump_file,
1164                          " Inlined into %s which now has %i insns.\n",
1165                          cgraph_node_name (e->caller),
1166                          e->caller->global.insns);
1167             }
1168           /* Inlining self recursive function might introduce new calls to
1169              themselves we didn't see in the loop above.  Fill in the proper
1170              reason why inline failed.  */
1171           for (e = node->callers; e; e = e->next_caller)
1172             if (e->inline_failed)
1173               e->inline_failed = CIF_RECURSIVE_INLINING;
1174           if (dump_file)
1175             fprintf (dump_file, 
1176                      " Inlined for a net change of %+i insns.\n",
1177                      overall_insns - old_insns);
1178         }
1179     }
1180
1181   cgraph_decide_inlining_of_small_functions ();
1182
1183   if (flag_inline_functions_called_once)
1184     {
1185       if (dump_file)
1186         fprintf (dump_file, "\nDeciding on functions called once:\n");
1187
1188       /* And finally decide what functions are called once.  */
1189       for (i = nnodes - 1; i >= 0; i--)
1190         {
1191           node = order[i];
1192
1193           if (node->callers
1194               && !node->callers->next_caller
1195               && !node->needed
1196               && node->local.inlinable
1197               && node->callers->inline_failed
1198               && !gimple_call_cannot_inline_p (node->callers->call_stmt)
1199               && !DECL_EXTERNAL (node->decl)
1200               && !DECL_COMDAT (node->decl))
1201             {
1202               if (dump_file)
1203                 {
1204                   fprintf (dump_file,
1205                            "\nConsidering %s %i insns.\n",
1206                            cgraph_node_name (node), node->global.insns);
1207                   fprintf (dump_file,
1208                            " Called once from %s %i insns.\n",
1209                            cgraph_node_name (node->callers->caller),
1210                            node->callers->caller->global.insns);
1211                 }
1212
1213               old_insns = overall_insns;
1214
1215               if (cgraph_check_inline_limits (node->callers->caller, node,
1216                                               NULL, false))
1217                 {
1218                   cgraph_mark_inline (node->callers);
1219                   if (dump_file)
1220                     fprintf (dump_file,
1221                              " Inlined into %s which now has %i insns"
1222                              " for a net change of %+i insns.\n",
1223                              cgraph_node_name (node->callers->caller),
1224                              node->callers->caller->global.insns,
1225                              overall_insns - old_insns);
1226                 }
1227               else
1228                 {
1229                   if (dump_file)
1230                     fprintf (dump_file,
1231                              " Inline limit reached, not inlined.\n");
1232                 }
1233             }
1234         }
1235     }
1236
1237   /* Free ipa-prop structures if they are no longer needed.  */
1238   if (flag_indirect_inlining)
1239     free_all_ipa_structures_after_iinln ();
1240
1241   if (dump_file)
1242     fprintf (dump_file,
1243              "\nInlined %i calls, eliminated %i functions, "
1244              "%i insns turned to %i insns.\n\n",
1245              ncalls_inlined, nfunctions_inlined, initial_insns,
1246              overall_insns);
1247   free (order);
1248   return 0;
1249 }
1250
1251 /* Try to inline edge E from incremental inliner.  MODE specifies mode
1252    of inliner.
1253
1254    We are detecting cycles by storing mode of inliner into cgraph_node last
1255    time we visited it in the recursion.  In general when mode is set, we have
1256    recursive inlining, but as an special case, we want to try harder inline
1257    ALWAYS_INLINE functions: consider callgraph a->b->c->b, with a being
1258    flatten, b being always inline.  Flattening 'a' will collapse
1259    a->b->c before hitting cycle.  To accommodate always inline, we however
1260    need to inline a->b->c->b.
1261
1262    So after hitting cycle first time, we switch into ALWAYS_INLINE mode and
1263    stop inlining only after hitting ALWAYS_INLINE in ALWAY_INLINE mode.  */
1264 static bool
1265 try_inline (struct cgraph_edge *e, enum inlining_mode mode, int depth)
1266 {
1267   struct cgraph_node *callee = e->callee;
1268   enum inlining_mode callee_mode = (enum inlining_mode) (size_t) callee->aux;
1269   bool always_inline = e->callee->local.disregard_inline_limits;
1270
1271   /* We've hit cycle?  */
1272   if (callee_mode)
1273     {
1274       /* It is first time we see it and we are not in ALWAY_INLINE only
1275          mode yet.  and the function in question is always_inline.  */
1276       if (always_inline && mode != INLINE_ALWAYS_INLINE)
1277         {
1278           if (dump_file)
1279             {
1280               indent_to (dump_file, depth);
1281               fprintf (dump_file,
1282                        "Hit cycle in %s, switching to always inline only.\n",
1283                        cgraph_node_name (callee));
1284             }
1285           mode = INLINE_ALWAYS_INLINE;
1286         }
1287       /* Otherwise it is time to give up.  */
1288       else
1289         {
1290           if (dump_file)
1291             {
1292               indent_to (dump_file, depth);
1293               fprintf (dump_file,
1294                        "Not inlining %s into %s to avoid cycle.\n",
1295                        cgraph_node_name (callee),
1296                        cgraph_node_name (e->caller));
1297             }
1298           e->inline_failed = (e->callee->local.disregard_inline_limits
1299                               ? CIF_RECURSIVE_INLINING : CIF_UNSPECIFIED);
1300           return false;
1301         }
1302     }
1303       
1304   callee->aux = (void *)(size_t) mode;
1305   if (dump_file)
1306     {
1307       indent_to (dump_file, depth);
1308       fprintf (dump_file, " Inlining %s into %s.\n",
1309                cgraph_node_name (e->callee),
1310                cgraph_node_name (e->caller));
1311     }
1312   if (e->inline_failed)
1313     {
1314       cgraph_mark_inline (e);
1315
1316       /* In order to fully inline always_inline functions, we need to
1317          recurse here, since the inlined functions might not be processed by
1318          incremental inlining at all yet.  
1319
1320          Also flattening needs to be done recursively.  */
1321
1322       if (mode == INLINE_ALL || always_inline)
1323         cgraph_decide_inlining_incrementally (e->callee, mode, depth + 1);
1324     }
1325   callee->aux = (void *)(size_t) callee_mode;
1326   return true;
1327 }
1328
1329 /* Decide on the inlining.  We do so in the topological order to avoid
1330    expenses on updating data structures.  
1331    DEPTH is depth of recursion, used only for debug output.  */
1332
1333 static bool
1334 cgraph_decide_inlining_incrementally (struct cgraph_node *node,
1335                                       enum inlining_mode mode,
1336                                       int depth)
1337 {
1338   struct cgraph_edge *e;
1339   bool inlined = false;
1340   cgraph_inline_failed_t failed_reason;
1341   enum inlining_mode old_mode;
1342
1343 #ifdef ENABLE_CHECKING
1344   verify_cgraph_node (node);
1345 #endif
1346
1347   old_mode = (enum inlining_mode) (size_t)node->aux;
1348
1349   if (mode != INLINE_ALWAYS_INLINE
1350       && lookup_attribute ("flatten", DECL_ATTRIBUTES (node->decl)) != NULL)
1351     {
1352       if (dump_file)
1353         {
1354           indent_to (dump_file, depth);
1355           fprintf (dump_file, "Flattening %s\n", cgraph_node_name (node));
1356         }
1357       mode = INLINE_ALL;
1358     }
1359
1360   node->aux = (void *)(size_t) mode;
1361
1362   /* First of all look for always inline functions.  */
1363   for (e = node->callees; e; e = e->next_callee)
1364     {
1365       if (!e->callee->local.disregard_inline_limits
1366           && (mode != INLINE_ALL || !e->callee->local.inlinable))
1367         continue;
1368       if (gimple_call_cannot_inline_p (e->call_stmt))
1369         continue;
1370       /* When the edge is already inlined, we just need to recurse into
1371          it in order to fully flatten the leaves.  */
1372       if (!e->inline_failed && mode == INLINE_ALL)
1373         {
1374           inlined |= try_inline (e, mode, depth);
1375           continue;
1376         }
1377       if (dump_file)
1378         {
1379           indent_to (dump_file, depth);
1380           fprintf (dump_file,
1381                    "Considering to always inline inline candidate %s.\n",
1382                    cgraph_node_name (e->callee));
1383         }
1384       if (cgraph_recursive_inlining_p (node, e->callee, &e->inline_failed))
1385         {
1386           if (dump_file)
1387             {
1388               indent_to (dump_file, depth);
1389               fprintf (dump_file, "Not inlining: recursive call.\n");
1390             }
1391           continue;
1392         }
1393       if (!tree_can_inline_p (node->decl, e->callee->decl))
1394         {
1395           gimple_call_set_cannot_inline (e->call_stmt, true);
1396           if (dump_file)
1397             {
1398               indent_to (dump_file, depth);
1399               fprintf (dump_file,
1400                        "Not inlining: Target specific option mismatch.\n");
1401             }
1402           continue;
1403         }
1404       if (gimple_in_ssa_p (DECL_STRUCT_FUNCTION (node->decl))
1405           != gimple_in_ssa_p (DECL_STRUCT_FUNCTION (e->callee->decl)))
1406         {
1407           if (dump_file)
1408             {
1409               indent_to (dump_file, depth);
1410               fprintf (dump_file, "Not inlining: SSA form does not match.\n");
1411             }
1412           continue;
1413         }
1414       if (!e->callee->analyzed && !e->callee->inline_decl)
1415         {
1416           if (dump_file)
1417             {
1418               indent_to (dump_file, depth);
1419               fprintf (dump_file,
1420                        "Not inlining: Function body no longer available.\n");
1421             }
1422           continue;
1423         }
1424       inlined |= try_inline (e, mode, depth);
1425     }
1426
1427   /* Now do the automatic inlining.  */
1428   if (mode != INLINE_ALL && mode != INLINE_ALWAYS_INLINE)
1429     for (e = node->callees; e; e = e->next_callee)
1430       {
1431         if (!e->callee->local.inlinable
1432             || !e->inline_failed
1433             || e->callee->local.disregard_inline_limits)
1434           continue;
1435         if (dump_file)
1436           fprintf (dump_file, "Considering inline candidate %s.\n",
1437                    cgraph_node_name (e->callee));
1438         if (cgraph_recursive_inlining_p (node, e->callee, &e->inline_failed))
1439           {
1440             if (dump_file)
1441               {
1442                 indent_to (dump_file, depth);
1443                 fprintf (dump_file, "Not inlining: recursive call.\n");
1444               }
1445             continue;
1446           }
1447         if (gimple_in_ssa_p (DECL_STRUCT_FUNCTION (node->decl))
1448             != gimple_in_ssa_p (DECL_STRUCT_FUNCTION (e->callee->decl)))
1449           {
1450             if (dump_file)
1451               {
1452                 indent_to (dump_file, depth);
1453                 fprintf (dump_file, "Not inlining: SSA form does not match.\n");
1454               }
1455             continue;
1456           }
1457         /* When the function body would grow and inlining the function won't
1458            eliminate the need for offline copy of the function, don't inline.
1459          */
1460         if ((mode == INLINE_SIZE
1461              || (!flag_inline_functions
1462                  && !DECL_DECLARED_INLINE_P (e->callee->decl)))
1463             && (cgraph_estimate_size_after_inlining (1, e->caller, e->callee)
1464                 > e->caller->global.insns)
1465             && cgraph_estimate_growth (e->callee) > 0)
1466           {
1467             if (dump_file)
1468               {
1469                 indent_to (dump_file, depth);
1470                 fprintf (dump_file,
1471                          "Not inlining: code size would grow by %i insns.\n",
1472                          cgraph_estimate_size_after_inlining (1, e->caller,
1473                                                               e->callee)
1474                          - e->caller->global.insns);
1475               }
1476             continue;
1477           }
1478         if (!cgraph_check_inline_limits (node, e->callee, &e->inline_failed,
1479                                         false)
1480             || gimple_call_cannot_inline_p (e->call_stmt))
1481           {
1482             if (dump_file)
1483               {
1484                 indent_to (dump_file, depth);
1485                 fprintf (dump_file, "Not inlining: %s.\n",
1486                          cgraph_inline_failed_string (e->inline_failed));
1487               }
1488             continue;
1489           }
1490         if (!e->callee->analyzed && !e->callee->inline_decl)
1491           {
1492             if (dump_file)
1493               {
1494                 indent_to (dump_file, depth);
1495                 fprintf (dump_file,
1496                          "Not inlining: Function body no longer available.\n");
1497               }
1498             continue;
1499           }
1500         if (!tree_can_inline_p (node->decl, e->callee->decl))
1501           {
1502             gimple_call_set_cannot_inline (e->call_stmt, true);
1503             if (dump_file)
1504               {
1505                 indent_to (dump_file, depth);
1506                 fprintf (dump_file,
1507                          "Not inlining: Target specific option mismatch.\n");
1508               }
1509             continue;
1510           }
1511         if (cgraph_default_inline_p (e->callee, &failed_reason))
1512           inlined |= try_inline (e, mode, depth);
1513       }
1514   node->aux = (void *)(size_t) old_mode;
1515   return inlined;
1516 }
1517
1518 /* Because inlining might remove no-longer reachable nodes, we need to
1519    keep the array visible to garbage collector to avoid reading collected
1520    out nodes.  */
1521 static int nnodes;
1522 static GTY ((length ("nnodes"))) struct cgraph_node **order;
1523
1524 /* Do inlining of small functions.  Doing so early helps profiling and other
1525    passes to be somewhat more effective and avoids some code duplication in
1526    later real inlining pass for testcases with very many function calls.  */
1527 static unsigned int
1528 cgraph_early_inlining (void)
1529 {
1530   struct cgraph_node *node = cgraph_node (current_function_decl);
1531   unsigned int todo = 0;
1532
1533   if (sorrycount || errorcount)
1534     return 0;
1535   if (cgraph_decide_inlining_incrementally (node, INLINE_SIZE, 0))
1536     {
1537       timevar_push (TV_INTEGRATION);
1538       todo = optimize_inline_calls (current_function_decl);
1539       timevar_pop (TV_INTEGRATION);
1540     }
1541   cfun->always_inline_functions_inlined = true;
1542   return todo;
1543 }
1544
1545 /* When inlining shall be performed.  */
1546 static bool
1547 cgraph_gate_early_inlining (void)
1548 {
1549   return flag_early_inlining;
1550 }
1551
1552 struct gimple_opt_pass pass_early_inline = 
1553 {
1554  {
1555   GIMPLE_PASS,
1556   "einline",                            /* name */
1557   cgraph_gate_early_inlining,           /* gate */
1558   cgraph_early_inlining,                /* execute */
1559   NULL,                                 /* sub */
1560   NULL,                                 /* next */
1561   0,                                    /* static_pass_number */
1562   TV_INLINE_HEURISTICS,                 /* tv_id */
1563   0,                                    /* properties_required */
1564   0,                                    /* properties_provided */
1565   0,                                    /* properties_destroyed */
1566   0,                                    /* todo_flags_start */
1567   TODO_dump_func                        /* todo_flags_finish */
1568  }
1569 };
1570
1571 /* When inlining shall be performed.  */
1572 static bool
1573 cgraph_gate_ipa_early_inlining (void)
1574 {
1575   return (flag_early_inlining
1576           && (flag_branch_probabilities || flag_test_coverage
1577               || profile_arc_flag));
1578 }
1579
1580 /* IPA pass wrapper for early inlining pass.  We need to run early inlining
1581    before tree profiling so we have stand alone IPA pass for doing so.  */
1582 struct simple_ipa_opt_pass pass_ipa_early_inline = 
1583 {
1584  {
1585   SIMPLE_IPA_PASS,
1586   "einline_ipa",                        /* name */
1587   cgraph_gate_ipa_early_inlining,       /* gate */
1588   NULL,                                 /* execute */
1589   NULL,                                 /* sub */
1590   NULL,                                 /* next */
1591   0,                                    /* static_pass_number */
1592   TV_INLINE_HEURISTICS,                 /* tv_id */
1593   0,                                    /* properties_required */
1594   0,                                    /* properties_provided */
1595   0,                                    /* properties_destroyed */
1596   0,                                    /* todo_flags_start */
1597   TODO_dump_cgraph                      /* todo_flags_finish */
1598  }
1599 };
1600
1601 /* Compute parameters of functions used by inliner.  */
1602 unsigned int
1603 compute_inline_parameters (struct cgraph_node *node)
1604 {
1605   HOST_WIDE_INT self_stack_size;
1606
1607   gcc_assert (!node->global.inlined_to);
1608
1609   /* Estimate the stack size for the function.  But not at -O0
1610      because estimated_stack_frame_size is a quadratic problem.  */
1611   self_stack_size = optimize ? estimated_stack_frame_size () : 0;
1612   inline_summary (node)->estimated_self_stack_size = self_stack_size;
1613   node->global.estimated_stack_size = self_stack_size;
1614   node->global.stack_frame_offset = 0;
1615
1616   /* Can this function be inlined at all?  */
1617   node->local.inlinable = tree_inlinable_function_p (current_function_decl);
1618
1619   /* Estimate the number of instructions for this function.
1620      ??? At -O0 we don't use this information except for the dumps, and
1621          even then only for always_inline functions.  But disabling this
1622          causes ICEs in the inline heuristics...  */
1623   inline_summary (node)->self_insns
1624       = estimate_num_insns_fn (current_function_decl, &eni_inlining_weights);
1625   if (node->local.inlinable && !node->local.disregard_inline_limits)
1626     node->local.disregard_inline_limits
1627       = DECL_DISREGARD_INLINE_LIMITS (current_function_decl);
1628
1629   /* Inlining characteristics are maintained by the cgraph_mark_inline.  */
1630   node->global.insns = inline_summary (node)->self_insns;
1631   return 0;
1632 }
1633
1634
1635 /* Compute parameters of functions used by inliner using
1636    current_function_decl.  */
1637 static unsigned int
1638 compute_inline_parameters_for_current (void)
1639 {
1640   compute_inline_parameters (cgraph_node (current_function_decl));
1641   return 0;
1642 }
1643
1644 struct gimple_opt_pass pass_inline_parameters = 
1645 {
1646  {
1647   GIMPLE_PASS,
1648   NULL,                                 /* name */
1649   NULL,                                 /* gate */
1650   compute_inline_parameters_for_current,/* execute */
1651   NULL,                                 /* sub */
1652   NULL,                                 /* next */
1653   0,                                    /* static_pass_number */
1654   TV_INLINE_HEURISTICS,                 /* tv_id */
1655   0,                                    /* properties_required */
1656   0,                                    /* properties_provided */
1657   0,                                    /* properties_destroyed */
1658   0,                                    /* todo_flags_start */
1659   0                                     /* todo_flags_finish */
1660  }
1661 };
1662
1663 /* This function performs intraprocedural analyzis in NODE that is required to
1664    inline indirect calls.  */
1665 static void
1666 inline_indirect_intraprocedural_analysis (struct cgraph_node *node)
1667 {
1668   struct cgraph_edge *cs;
1669
1670   if (!flag_ipa_cp)
1671     {
1672       ipa_initialize_node_params (node);
1673       ipa_detect_param_modifications (node);
1674     }
1675   ipa_analyze_params_uses (node);
1676
1677   if (!flag_ipa_cp)
1678     for (cs = node->callees; cs; cs = cs->next_callee)
1679       {
1680         ipa_count_arguments (cs);
1681         ipa_compute_jump_functions (cs);
1682       }
1683
1684   if (dump_file)
1685     {
1686       ipa_print_node_params (dump_file, node);
1687       ipa_print_node_jump_functions (dump_file, node);
1688     }
1689 }
1690
1691 /* Note function body size.  */
1692 static void
1693 analyze_function (struct cgraph_node *node)
1694 {
1695   push_cfun (DECL_STRUCT_FUNCTION (node->decl));
1696   current_function_decl = node->decl;
1697
1698   compute_inline_parameters (node);
1699   if (flag_indirect_inlining)
1700     inline_indirect_intraprocedural_analysis (node);
1701
1702   current_function_decl = NULL;
1703   pop_cfun ();
1704 }
1705
1706 /* Called when new function is inserted to callgraph late.  */
1707 static void
1708 add_new_function (struct cgraph_node *node, void *data ATTRIBUTE_UNUSED)
1709 {
1710   analyze_function (node);
1711 }
1712
1713 /* Note function body size.  */
1714 static void
1715 inline_generate_summary (void)
1716 {
1717   struct cgraph_node *node;
1718
1719   function_insertion_hook_holder =
1720       cgraph_add_function_insertion_hook (&add_new_function, NULL);
1721
1722   if (flag_indirect_inlining)
1723     {
1724       ipa_register_cgraph_hooks ();
1725       ipa_check_create_node_params ();
1726       ipa_check_create_edge_args ();
1727     }
1728
1729   for (node = cgraph_nodes; node; node = node->next)
1730     if (node->analyzed)
1731       analyze_function (node);
1732   
1733   return;
1734 }
1735
1736 /* Apply inline plan to function.  */
1737 static unsigned int
1738 inline_transform (struct cgraph_node *node)
1739 {
1740   unsigned int todo = 0;
1741   struct cgraph_edge *e;
1742
1743   /* We might need the body of this function so that we can expand
1744      it inline somewhere else.  */
1745   if (cgraph_preserve_function_body_p (node->decl))
1746     save_inline_function_body (node);
1747
1748   for (e = node->callees; e; e = e->next_callee)
1749     if (!e->inline_failed || warn_inline)
1750       break;
1751
1752   if (e)
1753     {
1754       timevar_push (TV_INTEGRATION);
1755       todo = optimize_inline_calls (current_function_decl);
1756       timevar_pop (TV_INTEGRATION);
1757     }
1758   cfun->always_inline_functions_inlined = true;
1759   cfun->after_inlining = true;
1760   return todo | execute_fixup_cfg ();
1761 }
1762
1763 struct ipa_opt_pass pass_ipa_inline = 
1764 {
1765  {
1766   IPA_PASS,
1767   "inline",                             /* name */
1768   NULL,                                 /* gate */
1769   cgraph_decide_inlining,               /* execute */
1770   NULL,                                 /* sub */
1771   NULL,                                 /* next */
1772   0,                                    /* static_pass_number */
1773   TV_INLINE_HEURISTICS,                 /* tv_id */
1774   0,                                    /* properties_required */
1775   0,                                    /* properties_provided */
1776   0,                                    /* properties_destroyed */
1777   TODO_remove_functions,                /* todo_flags_finish */
1778   TODO_dump_cgraph | TODO_dump_func
1779   | TODO_remove_functions               /* todo_flags_finish */
1780  },
1781  inline_generate_summary,               /* generate_summary */
1782  NULL,                                  /* write_summary */
1783  NULL,                                  /* read_summary */
1784  NULL,                                  /* function_read_summary */
1785  0,                                     /* TODOs */
1786  inline_transform,                      /* function_transform */
1787  NULL,                                  /* variable_transform */
1788 };
1789
1790
1791 #include "gt-ipa-inline.h"