OSDN Git Service

Fix compile time warnings for arm-pe target.
[pf3gnuchains/gcc-fork.git] / gcc / config / arm / arm.c
index fcb7f83..9311ba4 100644 (file)
@@ -1,8 +1,8 @@
-/* Output routines for GCC for ARM/RISCiX.
-   Copyright (C) 1991, 1993, 1994, 1995, 1996 Free Software Foundation, Inc.
+/* Output routines for GCC for ARM.
+   Copyright (C) 1991, 93, 94, 95, 96, 97, 98, 99, 2000 Free Software Foundation, Inc.
    Contributed by Pieter `Tiggr' Schoenmakers (rcpieter@win.tue.nl)
-             and Martin Simmons (@harleqn.co.uk).
-   More major hacks by Richard Earnshaw (rwe11@cl.cam.ac.uk)
+   and Martin Simmons (@harleqn.co.uk).
+   More major hacks by Richard Earnshaw (rearnsha@arm.com).
 
 This file is part of GNU CC.
 
@@ -21,11 +21,11 @@ along with GNU CC; see the file COPYING.  If not, write to
 the Free Software Foundation, 59 Temple Place - Suite 330,
 Boston, MA 02111-1307, USA.  */
     
-#include <stdio.h>
-#include <string.h>
-#include "assert.h"
 #include "config.h"
+#include "system.h"
 #include "rtl.h"
+#include "tree.h"
+#include "tm_p.h"
 #include "regs.h"
 #include "hard-reg-set.h"
 #include "real.h"
@@ -36,47 +36,141 @@ Boston, MA 02111-1307, USA.  */
 #include "insn-attr.h"
 #include "flags.h"
 #include "reload.h"
-#include "tree.h"
+#include "function.h"
 #include "expr.h"
+#include "toplev.h"
+#include "recog.h"
+#include "ggc.h"
+#include "except.h"
+#include "tm_p.h"
+
+/* Forward definitions of types.  */
+typedef struct minipool_node    Mnode;
+typedef struct minipool_fixup   Mfix;
+
+/* In order to improve the layout of the prototypes below
+   some short type abbreviations are defined here.  */
+#define Hint     HOST_WIDE_INT
+#define Mmode    enum machine_mode
+#define Ulong    unsigned long
+
+/* Forward function declarations.  */
+static void      arm_add_gc_roots              PARAMS ((void));
+static int       arm_gen_constant              PARAMS ((enum rtx_code, Mmode, Hint, rtx, rtx, int, int));
+static int       arm_naked_function_p          PARAMS ((tree));
+static Ulong     bit_count                     PARAMS ((signed int));
+static int       const_ok_for_op               PARAMS ((Hint, enum rtx_code));
+static int       eliminate_lr2ip               PARAMS ((rtx *));
+static rtx      emit_multi_reg_push            PARAMS ((int));
+static rtx      emit_sfm                       PARAMS ((int, int));
+static char *    fp_const_from_val             PARAMS ((REAL_VALUE_TYPE *));
+static int       function_really_clobbers_lr   PARAMS ((rtx));
+static arm_cc    get_arm_condition_code                PARAMS ((rtx));
+static void      init_fpa_table                        PARAMS ((void));
+static Hint      int_log2                      PARAMS ((Hint));
+static rtx       is_jump_table                         PARAMS ((rtx));
+static char *    output_multi_immediate                PARAMS ((rtx *, char *, char *, int, Hint));
+static int       pattern_really_clobbers_lr    PARAMS ((rtx));
+static void      print_multi_reg               PARAMS ((FILE *, char *, int, int, int));
+static Mmode     select_dominance_cc_mode      PARAMS ((rtx, rtx, Hint));
+static char *    shift_op                      PARAMS ((rtx, Hint *));
+static void      arm_init_machine_status       PARAMS ((struct function *));
+static void      arm_mark_machine_status        PARAMS ((struct function *));
+static int       number_of_first_bit_set        PARAMS ((int));
+static void      replace_symbols_in_block       PARAMS ((tree, rtx, rtx));
+static void      thumb_exit                     PARAMS ((FILE *, int, rtx));
+static void      thumb_pushpop                  PARAMS ((FILE *, int, int));
+static char *    thumb_condition_code           PARAMS ((rtx, int));
+static rtx      is_jump_table                  PARAMS ((rtx));
+static Hint     get_jump_table_size            PARAMS ((rtx));
+static Mnode *   move_minipool_fix_forward_ref  PARAMS ((Mnode *, Mnode *, Hint));
+static Mnode *   add_minipool_forward_ref      PARAMS ((Mfix *));
+static Mnode *   move_minipool_fix_backward_ref PARAMS ((Mnode *, Mnode *, Hint));
+static Mnode *   add_minipool_backward_ref      PARAMS ((Mfix *));
+static void     assign_minipool_offsets        PARAMS ((Mfix *));
+static void     arm_print_value                PARAMS ((FILE *, rtx));
+static void     dump_minipool                  PARAMS ((rtx));
+static int      arm_barrier_cost               PARAMS ((rtx));
+static Mfix *    create_fix_barrier            PARAMS ((Mfix *, Hint));
+static void     push_minipool_barrier          PARAMS ((rtx, Hint));
+static void     push_minipool_fix              PARAMS ((rtx, Hint, rtx *, Mmode, rtx));
+static void     note_invalid_constants         PARAMS ((rtx, Hint));
+\f
+#undef Hint
+#undef Mmode
+#undef Ulong
 
 /* The maximum number of insns skipped which will be conditionalised if
    possible.  */
-#define MAX_INSNS_SKIPPED  5
-
-/* Some function declarations.  */
-extern FILE *asm_out_file;
-extern char *output_multi_immediate ();
-extern void arm_increase_location ();
+static int max_insns_skipped = 5;
 
-HOST_WIDE_INT int_log2 PROTO ((HOST_WIDE_INT));
-static int get_prologue_size PROTO ((void));
-static int arm_gen_constant PROTO ((enum rtx_code, enum machine_mode,
-                                   HOST_WIDE_INT, rtx, rtx, int, int));
+extern FILE * asm_out_file;
 
-/*  Define the information needed to generate branch insns.  This is
-   stored from the compare operation. */
+/* True if we are currently building a constant table.  */
+int making_const_table;
 
+/* Define the information needed to generate branch insns.  This is
+   stored from the compare operation.  */
 rtx arm_compare_op0, arm_compare_op1;
-int arm_compare_fp;
 
-/* What type of cpu are we compiling for? */
-enum processor_type arm_cpu;
-
-/* What type of floating point are we compiling for? */
+/* What type of floating point are we tuning for?  */
 enum floating_point_type arm_fpu;
 
-/* What program mode is the cpu running in? 26-bit mode or 32-bit mode */
+/* What type of floating point instructions are available?  */
+enum floating_point_type arm_fpu_arch;
+
+/* What program mode is the cpu running in? 26-bit mode or 32-bit mode.  */
 enum prog_mode_type arm_prgmode;
 
-char *target_cpu_name = ARM_CPU_NAME;
-char *target_fpe_name = NULL;
+/* Set by the -mfp=... option.  */
+const char * target_fp_name = NULL;
+
+/* Used to parse -mstructure_size_boundary command line option.  */
+const char * structure_size_string = NULL;
+int    arm_structure_size_boundary = DEFAULT_STRUCTURE_SIZE_BOUNDARY;
+
+/* Bit values used to identify processor capabilities.  */
+#define FL_CO_PROC    (1 << 0)        /* Has external co-processor bus */
+#define FL_FAST_MULT  (1 << 1)        /* Fast multiply */
+#define FL_MODE26     (1 << 2)        /* 26-bit mode support */
+#define FL_MODE32     (1 << 3)        /* 32-bit mode support */
+#define FL_ARCH4      (1 << 4)        /* Architecture rel 4 */
+#define FL_ARCH5      (1 << 5)        /* Architecture rel 5 */
+#define FL_THUMB      (1 << 6)        /* Thumb aware */
+#define FL_LDSCHED    (1 << 7)       /* Load scheduling necessary */
+#define FL_STRONG     (1 << 8)       /* StrongARM */
+
+/* The bits in this mask specify which instructions we are
+   allowed to generate.  */
+static int insn_flags = 0;
+
+/* The bits in this mask specify which instruction scheduling options should
+   be used.  Note - there is an overlap with the FL_FAST_MULT.  For some
+   hardware we want to be able to generate the multiply instructions, but to
+   tune as if they were not present in the architecture.  */
+static int tune_flags = 0;
+
+/* The following are used in the arm.md file as equivalents to bits
+   in the above two flag variables.  */
 
 /* Nonzero if this is an "M" variant of the processor.  */
 int arm_fast_multiply = 0;
 
-/* Nonzero if this chip support the ARM Architecture 4 extensions */
+/* Nonzero if this chip supports the ARM Architecture 4 extensions.  */
 int arm_arch4 = 0;
 
+/* Nonzero if this chip supports the ARM Architecture 5 extensions.  */
+int arm_arch5 = 0;
+
+/* Nonzero if this chip can benefit from load scheduling.  */
+int arm_ld_sched = 0;
+
+/* Nonzero if this chip is a StrongARM.  */
+int arm_is_strong = 0;
+
+/* Nonzero if this chip is a an ARM6 or an ARM7.  */
+int arm_is_6_or_7 = 0;
+
 /* In case of a PRE_INC, POST_INC, PRE_DEC, POST_DEC memory reference, we
    must report the mode of the memory reference from PRINT_OPERAND to
    PRINT_OPERAND_ADDRESS.  */
@@ -85,31 +179,23 @@ enum machine_mode output_memory_reference_mode;
 /* Nonzero if the prologue must setup `fp'.  */
 int current_function_anonymous_args;
 
-/* Location counter of .text segment.  */
-int arm_text_location = 0;
+/* The register number to be used for the PIC offset register.  */
+const char * arm_pic_register_string = NULL;
+int arm_pic_register = 9;
 
 /* Set to one if we think that lr is only saved because of subroutine calls,
-   but all of these can be `put after' return insns */
+   but all of these can be `put after' return insns */
 int lr_save_eliminated;
 
-/* A hash table is used to store text segment labels and their associated
-   offset from the start of the text segment.  */
-struct label_offset
-{
-  char *name;
-  int offset;
-  struct label_offset *cdr;
-};
-
-#define LABEL_HASH_SIZE  257
-
-static struct label_offset *offset_table[LABEL_HASH_SIZE];
-
 /* Set to 1 when a return insn is output, this means that the epilogue
-   is not needed. */
+   is not needed.  */
+int return_used_this_function;
 
-static int return_used_this_function;
+/* Set to 1 after arm_reorg has started.  Reset to start at the start of
+   the next function.  */
+static int after_arm_reorg = 0;
 
+/* The maximum number of insns to be used when loading a constant.  */
 static int arm_constant_limit = 3;
 
 /* For an explanation of these variables, see final_prescan_insn below.  */
@@ -119,193 +205,509 @@ rtx arm_target_insn;
 int arm_target_label;
 
 /* The condition codes of the ARM, and the inverse function.  */
-char *arm_condition_codes[] =
+char * arm_condition_codes[] =
 {
   "eq", "ne", "cs", "cc", "mi", "pl", "vs", "vc",
   "hi", "ls", "ge", "lt", "gt", "le", "al", "nv"
 };
 
-static enum arm_cond_code get_arm_condition_code ();
-
+#define streq(string1, string2) (strcmp (string1, string2) == 0)
 \f
-/* Initialization code */
-
-#define FL_CO_PROC    0x01            /* Has external co-processor bus */
-#define FL_FAST_MULT  0x02            /* Fast multiply */
-#define FL_MODE26     0x04            /* 26-bit mode support */
-#define FL_MODE32     0x08            /* 32-bit mode support */
-#define FL_ARCH4      0x10            /* Architecture rel 4 */
-#define FL_THUMB      0x20            /* Thumb aware */
+/* Initialization code.  */
+
 struct processors
 {
-  char *name;
-  enum processor_type type;
+  char *       name;
   unsigned int flags;
 };
 
 /* Not all of these give usefully different compilation alternatives,
    but there is no simple way of generalizing them.  */
-static struct processors all_procs[] =
-{
-  {"arm2",     PROCESSOR_ARM2, FL_CO_PROC | FL_MODE26},
-  {"arm250",   PROCESSOR_ARM2, FL_CO_PROC | FL_MODE26},
-  {"arm3",     PROCESSOR_ARM2, FL_CO_PROC | FL_MODE26},
-  {"arm6",     PROCESSOR_ARM6, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm60",    PROCESSOR_ARM6, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm600",   PROCESSOR_ARM6, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm610",   PROCESSOR_ARM6, FL_MODE32 | FL_MODE26},
-  {"arm620",   PROCESSOR_ARM6, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm7",     PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm70",    PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm7d",    PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm7di",   PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm7dm",   PROCESSOR_ARM7, (FL_CO_PROC | FL_FAST_MULT | FL_MODE32
-                                | FL_MODE26)},
-  {"arm7dmi",  PROCESSOR_ARM7, (FL_CO_PROC | FL_FAST_MULT | FL_MODE32
-                                | FL_MODE26)},
-  {"arm700",   PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm700i",  PROCESSOR_ARM7, FL_CO_PROC | FL_MODE32 | FL_MODE26},
-  {"arm710",   PROCESSOR_ARM7, FL_MODE32 | FL_MODE26},
-  {"arm710c",  PROCESSOR_ARM7, FL_MODE32 | FL_MODE26},
-  {"arm7500",  PROCESSOR_ARM7, FL_MODE32 | FL_MODE26},
-  {"arm7tdmi", PROCESSOR_ARM7, (FL_CO_PROC | FL_FAST_MULT | FL_MODE32
-                                | FL_ARCH4 | FL_THUMB)},
-  {NULL, 0, 0}
+static struct processors all_cores[] =
+{
+  /* ARM Cores */
+  
+  {"arm2",     FL_CO_PROC | FL_MODE26 },
+  {"arm250",   FL_CO_PROC | FL_MODE26 },
+  {"arm3",     FL_CO_PROC | FL_MODE26 },
+  {"arm6",     FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm60",    FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm600",   FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm610",                FL_MODE26 | FL_MODE32 },
+  {"arm620",   FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm7",     FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  /* arm7m doesn't exist on its own, but only with D, (and I), but
+     those don't alter the code, so arm7m is sometimes used.  */
+  {"arm7m",    FL_CO_PROC | FL_MODE26 | FL_MODE32 | FL_FAST_MULT },
+  {"arm7d",    FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm7dm",   FL_CO_PROC | FL_MODE26 | FL_MODE32 | FL_FAST_MULT },
+  {"arm7di",   FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm7dmi",  FL_CO_PROC | FL_MODE26 | FL_MODE32 | FL_FAST_MULT },
+  {"arm70",    FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm700",   FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm700i",  FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm710",                FL_MODE26 | FL_MODE32 },
+  {"arm720",                FL_MODE26 | FL_MODE32 },
+  {"arm710c",               FL_MODE26 | FL_MODE32 },
+  {"arm7100",               FL_MODE26 | FL_MODE32 },
+  {"arm7500",               FL_MODE26 | FL_MODE32 },
+  /* Doesn't have an external co-proc, but does have embedded fpu.  */
+  {"arm7500fe",        FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  {"arm7tdmi", FL_CO_PROC |             FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB },
+  {"arm8",                  FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED },
+  {"arm810",                FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED },
+  {"arm9",                              FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB | FL_LDSCHED },
+  {"arm920",                            FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED },
+  {"arm920t",                           FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB | FL_LDSCHED },
+  {"arm9tdmi",                          FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB | FL_LDSCHED },
+  {"strongarm",                     FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED | FL_STRONG },
+  {"strongarm110",           FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED | FL_STRONG },
+  {"strongarm1100",          FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 |            FL_LDSCHED | FL_STRONG },
+  
+  {NULL, 0}
+};
+
+static struct processors all_architectures[] =
+{
+  /* ARM Architectures */
+  
+  { "armv2",     FL_CO_PROC | FL_MODE26 },
+  { "armv2a",    FL_CO_PROC | FL_MODE26 },
+  { "armv3",     FL_CO_PROC | FL_MODE26 | FL_MODE32 },
+  { "armv3m",    FL_CO_PROC | FL_MODE26 | FL_MODE32 | FL_FAST_MULT },
+  { "armv4",     FL_CO_PROC | FL_MODE26 | FL_MODE32 | FL_FAST_MULT | FL_ARCH4 },
+  /* Strictly, FL_MODE26 is a permitted option for v4t, but there are no
+     implementations that support it, so we will leave it out for now.  */
+  { "armv4t",    FL_CO_PROC |             FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB },
+  { "armv5",     FL_CO_PROC |             FL_MODE32 | FL_FAST_MULT | FL_ARCH4 | FL_THUMB | FL_ARCH5 },
+  { NULL, 0 }
+};
+
+/* This is a magic stucture.  The 'string' field is magically filled in
+   with a pointer to the value specified by the user on the command line
+   assuming that the user has specified such a value.  */
+
+struct arm_cpu_select arm_select[] =
+{
+  /* string      name            processors  */        
+  { NULL,      "-mcpu=",       all_cores  },
+  { NULL,      "-march=",      all_architectures },
+  { NULL,      "-mtune=",      all_cores }
 };
 
+/* Return the number of bits set in value' */
+static unsigned long
+bit_count (value)
+     signed int value;
+{
+  unsigned long count = 0;
+  
+  while (value)
+    {
+      value &= ~(value & - value);
+      ++ count;
+    }
+
+  return count;
+}
+
 /* Fix up any incompatible options that the user has specified.
    This has now turned into a maze.  */
 void
 arm_override_options ()
 {
-  int arm_thumb_aware = 0;
+  unsigned i;
+  
+  /* Set up the flags based on the cpu/architecture selected by the user.  */
+  for (i = sizeof (arm_select) / sizeof (arm_select[0]); i--;)
+    {
+      struct arm_cpu_select * ptr = arm_select + i;
+      
+      if (ptr->string != NULL && ptr->string[0] != '\0')
+        {
+         const struct processors * sel;
+
+          for (sel = ptr->processors; sel->name != NULL; sel ++)
+            if (streq (ptr->string, sel->name))
+              {
+               if (i == 2)
+                 tune_flags = sel->flags;
+               else
+                 {
+                   /* If we have been given an architecture and a processor
+                      make sure that they are compatible.  We only generate
+                      a warning though, and we prefer the CPU over the
+                      architecture.  */
+                   if (insn_flags != 0 && (insn_flags ^ sel->flags))
+                     warning ("switch -mcpu=%s conflicts with -march= switch",
+                              ptr->string);
+                   
+                   insn_flags = sel->flags;
+                 }
+               
+                break;
+              }
+
+          if (sel->name == NULL)
+            error ("bad value (%s) for %s switch", ptr->string, ptr->name);
+        }
+    }
+  
+  /* If the user did not specify a processor, choose one for them.  */
+  if (insn_flags == 0)
+    {
+      struct processors * sel;
+      unsigned int        sought;
+      static struct cpu_default
+      {
+       int    cpu;
+       char * name;
+      }
+      cpu_defaults[] =
+      {
+       { TARGET_CPU_arm2,      "arm2" },
+       { TARGET_CPU_arm6,      "arm6" },
+       { TARGET_CPU_arm610,    "arm610" },
+       { TARGET_CPU_arm710,    "arm710" },
+       { TARGET_CPU_arm7m,     "arm7m" },
+       { TARGET_CPU_arm7500fe, "arm7500fe" },
+       { TARGET_CPU_arm7tdmi,  "arm7tdmi" },
+       { TARGET_CPU_arm8,      "arm8" },
+       { TARGET_CPU_arm810,    "arm810" },
+       { TARGET_CPU_arm9,      "arm9" },
+       { TARGET_CPU_strongarm, "strongarm" },
+       { TARGET_CPU_generic,   "arm" },
+       { 0, 0 }
+      };
+      struct cpu_default * def;
+         
+      /* Find the default.  */
+      for (def = cpu_defaults; def->name; def ++)
+       if (def->cpu == TARGET_CPU_DEFAULT)
+         break;
 
-  if (write_symbols != NO_DEBUG && flag_omit_frame_pointer)
-    warning ("-g with -fomit-frame-pointer may not give sensible debugging");
+      /* Make sure we found the default CPU.  */
+      if (def->name == NULL)
+       abort ();
+      
+      /* Find the default CPU's flags.  */
+      for (sel = all_cores; sel->name != NULL; sel ++)
+       if (streq (def->name, sel->name))
+         break;
+      
+      if (sel->name == NULL)
+       abort ();
 
-  if (TARGET_POKE_FUNCTION_NAME)
-    target_flags |= ARM_FLAG_APCS_FRAME;
+      insn_flags = sel->flags;
+      
+      /* Now check to see if the user has specified some command line
+        switch that require certain abilities from the cpu.  */
+      sought = 0;
+      
+      if (TARGET_INTERWORK || TARGET_THUMB)
+       {
+         sought |= (FL_THUMB | FL_MODE32);
+         
+         /* Force apcs-32 to be used for interworking.  */
+         target_flags |= ARM_FLAG_APCS_32;
+
+         /* There are no ARM processors that support both APCS-26 and
+            interworking.  Therefore we force FL_MODE26 to be removed
+            from insn_flags here (if it was set), so that the search
+            below will always be able to find a compatible processor.  */
+         insn_flags &= ~ FL_MODE26;
+       }
+      else if (! TARGET_APCS_32)
+       sought |= FL_MODE26;
+      
+      if (sought != 0 && ((sought & insn_flags) != sought))
+       {
+         /* Try to locate a CPU type that supports all of the abilities
+            of the default CPU, plus the extra abilities requested by
+            the user.  */
+         for (sel = all_cores; sel->name != NULL; sel ++)
+           if ((sel->flags & sought) == (sought | insn_flags))
+             break;
 
-  if (TARGET_6)
+         if (sel->name == NULL)
+           {
+             unsigned int        current_bit_count = 0;
+             struct processors * best_fit = NULL;
+             
+             /* Ideally we would like to issue an error message here
+                saying that it was not possible to find a CPU compatible
+                with the default CPU, but which also supports the command
+                line options specified by the programmer, and so they
+                ought to use the -mcpu=<name> command line option to
+                override the default CPU type.
+
+                Unfortunately this does not work with multilibing.  We
+                need to be able to support multilibs for -mapcs-26 and for
+                -mthumb-interwork and there is no CPU that can support both
+                options.  Instead if we cannot find a cpu that has both the
+                characteristics of the default cpu and the given command line
+                options we scan the array again looking for a best match.  */
+             for (sel = all_cores; sel->name != NULL; sel ++)
+               if ((sel->flags & sought) == sought)
+                 {
+                   unsigned int count;
+
+                   count = bit_count (sel->flags & insn_flags);
+
+                   if (count >= current_bit_count)
+                     {
+                       best_fit = sel;
+                       current_bit_count = count;
+                     }
+                 }
+
+             if (best_fit == NULL)
+               abort ();
+             else
+               sel = best_fit;
+           }
+
+         insn_flags = sel->flags;
+       }
+    }
+  
+  /* If tuning has not been specified, tune for whichever processor or
+     architecture has been selected.  */
+  if (tune_flags == 0)
+    tune_flags = insn_flags;
+  
+  /* Make sure that the processor choice does not conflict with any of the
+     other command line choices.  */
+  if (TARGET_APCS_32 && !(insn_flags & FL_MODE32))
+    {
+      /* If APCS-32 was not the default then it must have been set by the
+        user, so issue a warning message.  If the user has specified
+        "-mapcs-32 -mcpu=arm2" then we loose here.  */
+      if ((TARGET_DEFAULT & ARM_FLAG_APCS_32) == 0)
+       warning ("target CPU does not support APCS-32" );
+      target_flags &= ~ ARM_FLAG_APCS_32;
+    }
+  else if (! TARGET_APCS_32 && !(insn_flags & FL_MODE26))
     {
-      warning ("Option '-m6' deprecated.  Use: '-mapcs-32' or -mcpu-<proc>");
+      warning ("target CPU does not support APCS-26" );
       target_flags |= ARM_FLAG_APCS_32;
-      arm_cpu = PROCESSOR_ARM6;
+    }
+  
+  if (TARGET_INTERWORK && !(insn_flags & FL_THUMB))
+    {
+      warning ("target CPU does not support interworking" );
+      target_flags &= ~ARM_FLAG_INTERWORK;
+    }
+  
+  if (TARGET_THUMB && !(insn_flags & FL_THUMB))
+    {
+      warning ("target CPU does not supoport THUMB instructions.");
+      target_flags &= ~ARM_FLAG_THUMB;
     }
 
-  if (TARGET_3)
+  if (TARGET_APCS_FRAME && TARGET_THUMB)
     {
-      warning ("Option '-m3' deprecated.  Use: '-mapcs-26' or -mcpu-<proc>");
-      target_flags &= ~ARM_FLAG_APCS_32;
-      arm_cpu = PROCESSOR_ARM2;
+      /* warning ("ignoring -mapcs-frame because -mthumb was used."); */
+      target_flags &= ~ARM_FLAG_APCS_FRAME;
     }
+  
+  /* TARGET_BACKTRACE calls leaf_function_p, which causes a crash if done
+     from here where no function is being compiled currently.  */
+  if ((target_flags & (THUMB_FLAG_LEAF_BACKTRACE | THUMB_FLAG_BACKTRACE))
+      && TARGET_ARM)
+    warning ("enabling backtrace support is only meaningful when compiling for the Thumb.");
 
-  if ((TARGET_3 || TARGET_6) && target_cpu_name != NULL)
-    fatal ("Incompatible mix of old and new options.  -m%d and -mcpu-%s",
-          TARGET_3 ? 3 : 6, target_cpu_name);
+  if (TARGET_ARM && TARGET_CALLEE_INTERWORKING)
+    warning ("enabling callee interworking support is only meaningful when compiling for the Thumb.");
 
+  if (TARGET_ARM && TARGET_CALLER_INTERWORKING)
+    warning ("enabling caller interworking support is only meaningful when compiling for the Thumb.");
+
+  /* If interworking is enabled then APCS-32 must be selected as well.  */
+  if (TARGET_INTERWORK)
+    {
+      if (! TARGET_APCS_32)
+       warning ("interworking forces APCS-32 to be used" );
+      target_flags |= ARM_FLAG_APCS_32;
+    }
+  
+  if (TARGET_APCS_STACK && ! TARGET_APCS_FRAME)
+    {
+      warning ("-mapcs-stack-check incompatible with -mno-apcs-frame");
+      target_flags |= ARM_FLAG_APCS_FRAME;
+    }
+  
+  if (TARGET_POKE_FUNCTION_NAME)
+    target_flags |= ARM_FLAG_APCS_FRAME;
+  
   if (TARGET_APCS_REENT && flag_pic)
     fatal ("-fpic and -mapcs-reent are incompatible");
-
+  
   if (TARGET_APCS_REENT)
     warning ("APCS reentrant code not supported.  Ignored");
-
-  if (flag_pic)
-    warning ("Position independent code not supported.  Ignored");
-
+  
+  /* If this target is normally configured to use APCS frames, warn if they
+     are turned off and debugging is turned on.  */
+  if (TARGET_ARM
+      && write_symbols != NO_DEBUG
+      && ! TARGET_APCS_FRAME
+      && (TARGET_DEFAULT & ARM_FLAG_APCS_FRAME))
+    warning ("-g with -mno-apcs-frame may not give sensible debugging");
+  
+  /* If stack checking is disabled, we can use r10 as the PIC register,
+     which keeps r9 available.  */
+  if (flag_pic && ! TARGET_APCS_STACK)
+    arm_pic_register = 10;
+  
   if (TARGET_APCS_FLOAT)
     warning ("Passing floating point arguments in fp regs not yet supported");
-
-  if (TARGET_APCS_STACK && ! TARGET_APCS)
+  
+  /* Initialise boolean versions of the flags, for use in the arm.md file.  */
+  arm_fast_multiply = (insn_flags & FL_FAST_MULT) != 0;
+  arm_arch4         = (insn_flags & FL_ARCH4) != 0;
+  arm_arch5         = (insn_flags & FL_ARCH5) != 0;
+  
+  arm_ld_sched      = (tune_flags & FL_LDSCHED) != 0;
+  arm_is_strong     = (tune_flags & FL_STRONG) != 0;
+  arm_is_6_or_7     = (((tune_flags & (FL_MODE26 | FL_MODE32))
+                      && !(tune_flags & FL_ARCH4))) != 0;
+  
+  /* Default value for floating point code... if no co-processor
+     bus, then schedule for emulated floating point.  Otherwise,
+     assume the user has an FPA.
+     Note: this does not prevent use of floating point instructions,
+     -msoft-float does that.  */
+  arm_fpu = (tune_flags & FL_CO_PROC) ? FP_HARD : FP_SOFT3;
+  
+  if (target_fp_name)
     {
-      warning ("-mapcs-stack-check incompatible with -mno-apcs-frame");
-      target_flags |= ARM_FLAG_APCS_FRAME;
+      if (streq (target_fp_name, "2"))
+       arm_fpu_arch = FP_SOFT2;
+      else if (streq (target_fp_name, "3"))
+       arm_fpu_arch = FP_SOFT3;
+      else
+       fatal ("Invalid floating point emulation option: -mfpe-%s",
+              target_fp_name);
     }
-
-  arm_cpu = TARGET_6 ? PROCESSOR_ARM6: PROCESSOR_ARM2;
-  arm_fpu = FP_HARD;
-
-  if (target_cpu_name != NULL)
+  else
+    arm_fpu_arch = FP_DEFAULT;
+  
+  if (TARGET_FPE && arm_fpu != FP_HARD)
+    arm_fpu = FP_SOFT2;
+  
+  /* For arm2/3 there is no need to do any scheduling if there is only
+     a floating point emulator, or we are doing software floating-point.  */
+  if ((TARGET_SOFT_FLOAT || arm_fpu != FP_HARD)
+      && (tune_flags & FL_MODE32) == 0)
+    flag_schedule_insns = flag_schedule_insns_after_reload = 0;
+  
+  arm_prog_mode = TARGET_APCS_32 ? PROG_MODE_PROG32 : PROG_MODE_PROG26;
+  
+  if (structure_size_string != NULL)
     {
-      char *c = target_cpu_name;
-      struct processors *proc;
-
-      /* Match against the supported types.  */
-      for (proc = all_procs; proc->name != NULL; proc++)
-       {
-         if (strcmp (proc->name, c) == 0)
-           break;
-       }
-
-      if (proc->name)
-       {
-         arm_cpu = proc->type;
-
-         /* Default value for floating point code... if no co-processor
-            bus, then schedule for emulated floating point.  Otherwise,
-            assume the user has an FPA, unless overridden with -mfpe-...  */
-         if (proc->flags & FL_CO_PROC == 0)
-           arm_fpu = FP_SOFT3;
-         else
-           arm_fpu = FP_HARD;
-         arm_fast_multiply = (proc->flags & FL_FAST_MULT) != 0;
-         arm_arch4 = (proc->flags & FL_ARCH4) != 0;
-         arm_thumb_aware = (proc->flags & FL_THUMB) != 0;
-         /* Processors with a load delay slot can load constants faster,
-            from the pool than it takes to construct them, so reduce the
-            complexity of the constant that we will try to generate
-            inline.  */
-       }
+      int size = strtol (structure_size_string, NULL, 0);
+      
+      if (size == 8 || size == 32)
+       arm_structure_size_boundary = size;
       else
-       fatal ("Unrecognized cpu type: %s", target_cpu_name);
+       warning ("Structure size boundary can only be set to 8 or 32");
     }
 
-  if (target_fpe_name)
+  if (arm_pic_register_string != NULL)
     {
-      if (strcmp (target_fpe_name, "2") == 0)
-       arm_fpu = FP_SOFT2;
-      else if (strcmp (target_fpe_name, "3") == 0)
-       arm_fpu = FP_SOFT3;
+      int pic_register;
+
+      if (! flag_pic)
+       warning ("-mpic-register= is useless without -fpic");
+
+      pic_register = decode_reg_name (arm_pic_register_string);
+      
+      /* Prevent the user from choosing an obviously stupid PIC register.  */
+      if (pic_register < 0 || call_used_regs[pic_register]
+         || pic_register == HARD_FRAME_POINTER_REGNUM
+         || pic_register == STACK_POINTER_REGNUM
+         || pic_register >= PC_REGNUM)
+       error ("Unable to use '%s' for PIC register", arm_pic_register_string);
       else
-       fatal ("Invalid floating point emulation option: -mfpe-%s",
-              target_fpe_name);
+       arm_pic_register = pic_register;
     }
 
-  if (TARGET_THUMB_INTERWORK && ! arm_thumb_aware)
+  if (TARGET_THUMB && flag_schedule_insns)
     {
-      warning ("This processor variant does not support Thumb interworking");
-      target_flags &= ~ARM_FLAG_THUMB;
+      /* Don't warn since it's on by default in -O2.  */
+      flag_schedule_insns = 0;
     }
 
-  if (TARGET_FPE && arm_fpu != FP_HARD)
-    arm_fpu = FP_SOFT2;
-
-  /* For arm2/3 there is no need to do any scheduling if there is only
-     a floating point emulator, or we are doing software floating-point.  */
-  if ((TARGET_SOFT_FLOAT || arm_fpu != FP_HARD) && arm_cpu == PROCESSOR_ARM2)
-    flag_schedule_insns = flag_schedule_insns_after_reload = 0;
-
-  arm_prog_mode = TARGET_APCS_32 ? PROG_MODE_PROG32 : PROG_MODE_PROG26;
+  /* If optimizing for space, don't synthesize constants.
+     For processors with load scheduling, it never costs more than 2 cycles
+     to load a constant, and the load scheduler may well reduce that to 1.  */
+  if (optimize_size || (tune_flags & FL_LDSCHED))
+    arm_constant_limit = 1;
+  
+  /* If optimizing for size, bump the number of instructions that we
+     are prepared to conditionally execute (even on a StrongARM). 
+     Otherwise for the StrongARM, which has early execution of branches,
+     a sequence that is worth skipping is shorter.  */
+  if (optimize_size)
+    max_insns_skipped = 6;
+  else if (arm_is_strong)
+    max_insns_skipped = 3;
+
+  /* Register global variables with the garbage collector.  */
+  arm_add_gc_roots ();
 }
 
+static void
+arm_add_gc_roots ()
+{
+  ggc_add_rtx_root (&arm_compare_op0, 1);
+  ggc_add_rtx_root (&arm_compare_op1, 1);
+  ggc_add_rtx_root (&arm_target_insn, 1); /* Not sure this is really a root */
+  /* XXX: What about the minipool tables?  */
+}
 \f
-/* Return 1 if it is possible to return using a single instruction */
-
+/* Return 1 if it is possible to return using a single instruction.  */
 int
-use_return_insn ()
+use_return_insn (iscond)
+     int iscond;
 {
   int regno;
 
-  if (!reload_completed ||current_function_pretend_args_size
+  /* Never use a return instruction before reload has run.  */
+  if (! reload_completed
+      /* Or if the function is variadic.  */
+      || current_function_pretend_args_size
       || current_function_anonymous_args
-      || (get_frame_size () && !(TARGET_APCS || frame_pointer_needed)))
+      /* Of if the function calls __builtin_eh_return () */
+      || cfun->machine->eh_epilogue_sp_ofs != NULL
+      /* Or if there is no frame pointer and there is a stack adjustment.  */
+      || ((get_frame_size () + current_function_outgoing_args_size != 0)
+         && ! frame_pointer_needed))
+    return 0;
+
+  /* Can't be done if interworking with Thumb, and any registers have been
+     stacked.  Similarly, on StrongARM, conditional returns are expensive
+     if they aren't taken and registers have been stacked.  */
+  if (iscond && arm_is_strong && frame_pointer_needed)
     return 0;
+  
+  if ((iscond && arm_is_strong)
+      || TARGET_INTERWORK)
+    {
+      for (regno = 0; regno <= LAST_ARM_REGNUM; regno++)
+       if (regs_ever_live[regno] && ! call_used_regs[regno])
+         return 0;
 
+      if (flag_pic && regs_ever_live[PIC_OFFSET_TABLE_REGNUM])
+       return 0;
+    }
+      
   /* Can't be done if any of the FPU regs are pushed, since this also
-     requires an insn */
-  for (regno = 20; regno < 24; regno++)
-    if (regs_ever_live[regno])
-      return 0;
+     requires an insn.  */
+  if (TARGET_HARD_FLOAT)
+    for (regno = FIRST_ARM_FP_REGNUM; regno <= LAST_ARM_FP_REGNUM; regno++)
+      if (regs_ever_live[regno] && ! call_used_regs[regno])
+       return 0;
 
   /* If a function is naked, don't use the "return" insn.  */
   if (arm_naked_function_p (current_function_decl))
@@ -320,30 +722,37 @@ int
 const_ok_for_arm (i)
      HOST_WIDE_INT i;
 {
-  unsigned HOST_WIDE_INT mask = ~0xFF;
-
+  unsigned HOST_WIDE_INT mask = ~ HOST_UINT (0xFF);
+
+  /* For machines with >32 bit HOST_WIDE_INT, the bits above bit 31 must 
+     be all zero, or all one.  */
+  if ((i & ~ HOST_UINT (0xffffffff)) != 0
+      && ((i & ~ HOST_UINT (0xffffffff)) 
+         != ((~ HOST_UINT (0))
+             & ~ HOST_UINT (0xffffffff))))
+    return FALSE;
+  
   /* Fast return for 0 and powers of 2 */
   if ((i & (i - 1)) == 0)
     return TRUE;
 
   do
     {
-      if ((i & mask & (unsigned HOST_WIDE_INT) 0xffffffff) == 0)
+      if ((i & mask & HOST_UINT (0xffffffff)) == 0)
         return TRUE;
       mask =
-         (mask << 2) | ((mask & (unsigned HOST_WIDE_INT) 0xffffffff)
-                        >> (32 - 2)) | ~((unsigned HOST_WIDE_INT) 0xffffffff);
-    } while (mask != ~0xFF);
+         (mask << 2) | ((mask & HOST_UINT (0xffffffff))
+                        >> (32 - 2)) | ~(HOST_UINT (0xffffffff));
+    } while (mask != ~ HOST_UINT (0xFF));
 
   return FALSE;
 }
 
-/* Return true if I is a valid constant for the operation CODE. */
-int
-const_ok_for_op (i, code, mode)
+/* Return true if I is a valid constant for the operation CODE.  */
+static int
+const_ok_for_op (i, code)
      HOST_WIDE_INT i;
      enum rtx_code code;
-     enum machine_mode mode;
 {
   if (const_ok_for_arm (i))
     return 1;
@@ -389,31 +798,39 @@ arm_split_constant (code, mode, val, target, source, subtargets)
       || (GET_CODE (target) == REG && GET_CODE (source) == REG
          && REGNO (target) != REGNO (source)))
     {
-      rtx temp;
-
-      if (arm_gen_constant (code, mode, val, target, source, 1, 0)
-         > arm_constant_limit + (code != SET))
+      /* After arm_reorg has been called, we can't fix up expensive
+        constants by pushing them into memory so we must synthesise
+        them in-line, regardless of the cost.  This is only likely to
+        be more costly on chips that have load delay slots and we are
+        compiling without running the scheduler (so no splitting
+        occurred before the final instruction emission).
+
+        Ref: gcc -O1 -mcpu=strongarm gcc.c-torture/compile/980506-2.c
+      */
+      if (! after_arm_reorg
+         && (arm_gen_constant (code, mode, val, target, source, 1, 0)
+             > arm_constant_limit + (code != SET)))
        {
          if (code == SET)
            {
              /* Currently SET is the only monadic value for CODE, all
                 the rest are diadic.  */
-             emit_insn (gen_rtx (SET, VOIDmode, target, GEN_INT (val)));
+             emit_insn (gen_rtx_SET (VOIDmode, target, GEN_INT (val)));
              return 1;
            }
          else
            {
              rtx temp = subtargets ? gen_reg_rtx (mode) : target;
 
-             emit_insn (gen_rtx (SET, VOIDmode, temp, GEN_INT (val)));
+             emit_insn (gen_rtx_SET (VOIDmode, temp, GEN_INT (val)));
              /* For MINUS, the value is subtracted from, since we never
                 have subtraction of a constant.  */
              if (code == MINUS)
-               emit_insn (gen_rtx (SET, VOIDmode, target,
-                                   gen_rtx (code, mode, temp, source)));
+               emit_insn (gen_rtx_SET (VOIDmode, target,
+                                       gen_rtx_MINUS (mode, temp, source)));
              else
-               emit_insn (gen_rtx (SET, VOIDmode, target,
-                                   gen_rtx (code, mode, source, temp)));
+               emit_insn (gen_rtx_SET (VOIDmode, target,
+                                       gen_rtx (code, mode, source, temp)));
              return 2;
            }
        }
@@ -424,7 +841,7 @@ arm_split_constant (code, mode, val, target, source, subtargets)
 
 /* As above, but extra parameter GENERATE which, if clear, suppresses
    RTL generation.  */
-int
+static int
 arm_gen_constant (code, mode, val, target, source, subtargets, generate)
      enum rtx_code code;
      enum machine_mode mode;
@@ -434,7 +851,6 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
      int subtargets;
      int generate;
 {
-  int can_add = 0;
   int can_invert = 0;
   int can_negate = 0;
   int can_negate_initial = 0;
@@ -446,11 +862,10 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
   int clear_zero_bit_copies = 0;
   int set_zero_bit_copies = 0;
   int insns = 0;
-  rtx new_src;
   unsigned HOST_WIDE_INT temp1, temp2;
-  unsigned HOST_WIDE_INT remainder = val & 0xffffffff;
+  unsigned HOST_WIDE_INT remainder = val & HOST_UINT (0xffffffff);
 
-  /* find out which operations are safe for a given CODE.  Also do a quick
+  /* Find out which operations are safe for a given CODE.  Also do a quick
      check for degenerate cases; these can occur when DImode operations
      are split.  */
   switch (code)
@@ -467,11 +882,11 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       break;
 
     case IOR:
-      if (remainder == 0xffffffff)
+      if (remainder == HOST_UINT (0xffffffff))
        {
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target,
-                               GEN_INT (ARM_SIGN_EXTEND (val))));
+           emit_insn (gen_rtx_SET (VOIDmode, target,
+                                   GEN_INT (ARM_SIGN_EXTEND (val))));
          return 1;
        }
       if (remainder == 0)
@@ -479,7 +894,7 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
          if (reload_completed && rtx_equal_p (target, source))
            return 0;
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target, source));
+           emit_insn (gen_rtx_SET (VOIDmode, target, source));
          return 1;
        }
       break;
@@ -488,15 +903,15 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       if (remainder == 0)
        {
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target, const0_rtx));
+           emit_insn (gen_rtx_SET (VOIDmode, target, const0_rtx));
          return 1;
        }
-      if (remainder == 0xffffffff)
+      if (remainder == HOST_UINT (0xffffffff))
        {
          if (reload_completed && rtx_equal_p (target, source))
            return 0;
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target, source));
+           emit_insn (gen_rtx_SET (VOIDmode, target, source));
          return 1;
        }
       can_invert = 1;
@@ -508,14 +923,14 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
          if (reload_completed && rtx_equal_p (target, source))
            return 0;
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target, source));
+           emit_insn (gen_rtx_SET (VOIDmode, target, source));
          return 1;
        }
-      if (remainder == 0xffffffff)
+      if (remainder == HOST_UINT (0xffffffff))
        {
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target,
-                               gen_rtx (NOT, mode, source)));
+           emit_insn (gen_rtx_SET (VOIDmode, target,
+                                   gen_rtx_NOT (mode, source)));
          return 1;
        }
 
@@ -528,15 +943,16 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       if (remainder == 0)
        {
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target,
-                               gen_rtx (NEG, mode, source)));
+           emit_insn (gen_rtx_SET (VOIDmode, target,
+                                   gen_rtx_NEG (mode, source)));
          return 1;
        }
       if (const_ok_for_arm (val))
        {
          if (generate)
-           emit_insn (gen_rtx (SET, VOIDmode, target, 
-                               gen_rtx (MINUS, mode, GEN_INT (val), source)));
+           emit_insn (gen_rtx_SET (VOIDmode, target, 
+                                   gen_rtx_MINUS (mode, GEN_INT (val),
+                                                  source)));
          return 1;
        }
       can_negate = 1;
@@ -547,23 +963,21 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       abort ();
     }
 
-  /* If we can do it in one insn get out quickly */
+  /* If we can do it in one insn get out quickly */
   if (const_ok_for_arm (val)
       || (can_negate_initial && const_ok_for_arm (-val))
       || (can_invert && const_ok_for_arm (~val)))
     {
       if (generate)
-       emit_insn (gen_rtx (SET, VOIDmode, target,
-                           (source ? gen_rtx (code, mode, source,
-                                              GEN_INT (val))
-                            : GEN_INT (val))));
+       emit_insn (gen_rtx_SET (VOIDmode, target,
+                               (source ? gen_rtx (code, mode, source,
+                                                  GEN_INT (val))
+                                : GEN_INT (val))));
       return 1;
     }
 
-
   /* Calculate a few attributes that may be useful for specific
-     optimizations. */
-
+     optimizations.  */
   for (i = 31; i >= 0; i--)
     {
       if ((remainder & (1 << i)) == 0)
@@ -610,9 +1024,9 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
            {
              if (generate)
                {
-                 new_src = subtargets ? gen_reg_rtx (mode) : target;
-                 emit_insn (gen_rtx (SET, VOIDmode, new_src, 
-                                     GEN_INT (temp1)));
+                 rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
+                 emit_insn (gen_rtx_SET (VOIDmode, new_src, 
+                                         GEN_INT (temp1)));
                  emit_insn (gen_ashrsi3 (target, new_src, 
                                          GEN_INT (set_sign_bit_copies - 1)));
                }
@@ -625,9 +1039,9 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
            {
              if (generate)
                {
-                 new_src = subtargets ? gen_reg_rtx (mode) : target;
-                 emit_insn (gen_rtx (SET, VOIDmode, new_src,
-                                     GEN_INT (temp1)));
+                 rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
+                 emit_insn (gen_rtx_SET (VOIDmode, new_src,
+                                         GEN_INT (temp1)));
                  emit_insn (gen_ashrsi3 (target, new_src, 
                                          GEN_INT (set_sign_bit_copies - 1)));
                }
@@ -640,51 +1054,55 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
         word.  We only look for the simplest cases, to do more would cost
         too much.  Be careful, however, not to generate this when the
         alternative would take fewer insns.  */
-      if (val & 0xffff0000)
+      if (val & HOST_UINT (0xffff0000))
        {
-         temp1 = remainder & 0xffff0000;
+         temp1 = remainder & HOST_UINT (0xffff0000);
          temp2 = remainder & 0x0000ffff;
 
-         /* Overlaps outside this range are best done using other methods. */
+         /* Overlaps outside this range are best done using other methods.  */
          for (i = 9; i < 24; i++)
            {
-             if ((((temp2 | (temp2 << i)) & 0xffffffff) == remainder)
+             if ((((temp2 | (temp2 << i))
+                   & HOST_UINT (0xffffffff)) == remainder)
                  && ! const_ok_for_arm (temp2))
                {
-                 insns = arm_gen_constant (code, mode, temp2,
-                                           new_src = (subtargets
-                                                      ? gen_reg_rtx (mode)
-                                                      : target),
+                 rtx new_src = (subtargets
+                                ? (generate ? gen_reg_rtx (mode) : NULL_RTX)
+                                : target);
+                 insns = arm_gen_constant (code, mode, temp2, new_src,
                                            source, subtargets, generate);
                  source = new_src;
                  if (generate)
-                   emit_insn (gen_rtx (SET, VOIDmode, target,
-                                       gen_rtx (IOR, mode,
-                                                gen_rtx (ASHIFT, mode, source,
-                                                         GEN_INT (i)),
-                                                source)));
+                   emit_insn (gen_rtx_SET
+                              (VOIDmode, target,
+                               gen_rtx_IOR (mode,
+                                            gen_rtx_ASHIFT (mode, source,
+                                                            GEN_INT (i)),
+                                            source)));
                  return insns + 1;
                }
            }
 
-         /* Don't duplicate cases already considered. */
+         /* Don't duplicate cases already considered.  */
          for (i = 17; i < 24; i++)
            {
              if (((temp1 | (temp1 >> i)) == remainder)
                  && ! const_ok_for_arm (temp1))
                {
-                 insns = arm_gen_constant (code, mode, temp1,
-                                           new_src = (subtargets
-                                                      ? gen_reg_rtx (mode)
-                                                      : target),
+                 rtx new_src = (subtargets
+                                ? (generate ? gen_reg_rtx (mode) : NULL_RTX)
+                                : target);
+                 insns = arm_gen_constant (code, mode, temp1, new_src,
                                            source, subtargets, generate);
                  source = new_src;
                  if (generate)
-                   emit_insn (gen_rtx (SET, VOIDmode, target,
-                                       gen_rtx (IOR, mode,
-                                                gen_rtx (LSHIFTRT, mode,
-                                                         source, GEN_INT (i)),
-                                                source)));
+                   emit_insn
+                     (gen_rtx_SET (VOIDmode, target,
+                                   gen_rtx_IOR
+                                   (mode,
+                                    gen_rtx_LSHIFTRT (mode, source,
+                                                      GEN_INT (i)),
+                                    source)));
                  return insns + 1;
                }
            }
@@ -693,10 +1111,11 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
 
     case IOR:
     case XOR:
-      /* If we have IOR or XOR, and the inverse of the constant can be loaded
-        in a single instruction, and we can find a temporary to put it in,
+      /* If we have IOR or XOR, and the constant can be loaded in a
+        single instruction, and we can find a temporary to put it in,
         then this can be done in two instructions instead of 3-4.  */
       if (subtargets
+         /* TARGET can't be NULL if SUBTARGETS is 0 */
          || (reload_completed && ! reg_mentioned_p (target, source)))
        {
          if (const_ok_for_arm (ARM_SIGN_EXTEND (~ val)))
@@ -705,10 +1124,9 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
                {
                  rtx sub = subtargets ? gen_reg_rtx (mode) : target;
 
-                 emit_insn (gen_rtx (SET, VOIDmode, sub,
-                                     GEN_INT (ARM_SIGN_EXTEND (~ val))));
-                 emit_insn (gen_rtx (SET, VOIDmode, target, 
-                                     gen_rtx (code, mode, source, sub)));
+                 emit_insn (gen_rtx_SET (VOIDmode, sub, GEN_INT (val)));
+                 emit_insn (gen_rtx_SET (VOIDmode, target, 
+                                         gen_rtx (code, mode, source, sub)));
                }
              return 2;
            }
@@ -725,14 +1143,15 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
              rtx sub = subtargets ? gen_reg_rtx (mode) : target;
              rtx shift = GEN_INT (set_sign_bit_copies);
 
-             emit_insn (gen_rtx (SET, VOIDmode, sub,
-                                 gen_rtx (NOT, mode, 
-                                          gen_rtx (ASHIFT, mode, source, 
-                                                   shift))));
-             emit_insn (gen_rtx (SET, VOIDmode, target,
-                                 gen_rtx (NOT, mode,
-                                          gen_rtx (LSHIFTRT, mode, sub,
-                                                   shift))));
+             emit_insn (gen_rtx_SET (VOIDmode, sub,
+                                     gen_rtx_NOT (mode, 
+                                                  gen_rtx_ASHIFT (mode,
+                                                                  source, 
+                                                                  shift))));
+             emit_insn (gen_rtx_SET (VOIDmode, target,
+                                     gen_rtx_NOT (mode,
+                                                  gen_rtx_LSHIFTRT (mode, sub,
+                                                                    shift))));
            }
          return 2;
        }
@@ -745,14 +1164,15 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
              rtx sub = subtargets ? gen_reg_rtx (mode) : target;
              rtx shift = GEN_INT (set_zero_bit_copies);
 
-             emit_insn (gen_rtx (SET, VOIDmode, sub,
-                                 gen_rtx (NOT, mode,
-                                          gen_rtx (LSHIFTRT, mode, source,
-                                                   shift))));
-             emit_insn (gen_rtx (SET, VOIDmode, target,
-                                 gen_rtx (NOT, mode,
-                                          gen_rtx (ASHIFT, mode, sub,
-                                                   shift))));
+             emit_insn (gen_rtx_SET (VOIDmode, sub,
+                                     gen_rtx_NOT (mode,
+                                                  gen_rtx_LSHIFTRT (mode,
+                                                                    source,
+                                                                    shift))));
+             emit_insn (gen_rtx_SET (VOIDmode, target,
+                                     gen_rtx_NOT (mode,
+                                                  gen_rtx_ASHIFT (mode, sub,
+                                                                  shift))));
            }
          return 2;
        }
@@ -762,16 +1182,16 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
          if (generate)
            {
              rtx sub = subtargets ? gen_reg_rtx (mode) : target;
-             emit_insn (gen_rtx (SET, VOIDmode, sub,
-                                 gen_rtx (NOT, mode, source)));
+             emit_insn (gen_rtx_SET (VOIDmode, sub,
+                                     gen_rtx_NOT (mode, source)));
              source = sub;
              if (subtargets)
                sub = gen_reg_rtx (mode);
-             emit_insn (gen_rtx (SET, VOIDmode, sub,
-                                 gen_rtx (AND, mode, source, 
-                                          GEN_INT (temp1))));
-             emit_insn (gen_rtx (SET, VOIDmode, target,
-                                 gen_rtx (NOT, mode, sub)));
+             emit_insn (gen_rtx_SET (VOIDmode, sub,
+                                     gen_rtx_AND (mode, source, 
+                                                  GEN_INT (temp1))));
+             emit_insn (gen_rtx_SET (VOIDmode, target,
+                                     gen_rtx_NOT (mode, sub)));
            }
          return 3;
        }
@@ -781,32 +1201,34 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       /* See if two shifts will do 2 or more insn's worth of work.  */
       if (clear_sign_bit_copies >= 16 && clear_sign_bit_copies < 24)
        {
-         HOST_WIDE_INT shift_mask = ((0xffffffff 
+         HOST_WIDE_INT shift_mask = (((HOST_UINT (0xffffffff))
                                       << (32 - clear_sign_bit_copies))
-                                     & 0xffffffff);
-         rtx new_source;
-         rtx shift;
+                                     & HOST_UINT (0xffffffff));
 
-         if ((remainder | shift_mask) != 0xffffffff)
+         if ((remainder | shift_mask) != HOST_UINT (0xffffffff))
            {
              if (generate)
                {
-                 new_source = subtargets ? gen_reg_rtx (mode) : target;
+                 rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
                  insns = arm_gen_constant (AND, mode, remainder | shift_mask,
-                                           new_source, source, subtargets, 1);
-                 source = new_source;
+                                           new_src, source, subtargets, 1);
+                 source = new_src;
                }
              else
-               insns = arm_gen_constant (AND, mode, remainder | shift_mask,
-                                         new_source, source, subtargets, 0);
+               {
+                 rtx targ = subtargets ? NULL_RTX : target;
+                 insns = arm_gen_constant (AND, mode, remainder | shift_mask,
+                                           targ, source, subtargets, 0);
+               }
            }
 
          if (generate)
            {
-             shift = GEN_INT (clear_sign_bit_copies);
-             new_source = subtargets ? gen_reg_rtx (mode) : target;
-             emit_insn (gen_ashlsi3 (new_source, source, shift));
-             emit_insn (gen_lshrsi3 (target, new_source, shift));
+             rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
+             rtx shift = GEN_INT (clear_sign_bit_copies);
+
+             emit_insn (gen_ashlsi3 (new_src, source, shift));
+             emit_insn (gen_lshrsi3 (target, new_src, shift));
            }
 
          return insns + 2;
@@ -815,29 +1237,33 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       if (clear_zero_bit_copies >= 16 && clear_zero_bit_copies < 24)
        {
          HOST_WIDE_INT shift_mask = (1 << clear_zero_bit_copies) - 1;
-         rtx new_source;
-         rtx shift;
          
-         if ((remainder | shift_mask) != 0xffffffff)
+         if ((remainder | shift_mask) != HOST_UINT (0xffffffff))
            {
              if (generate)
                {
-                 new_source = subtargets ? gen_reg_rtx (mode) : target;
+                 rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
+
                  insns = arm_gen_constant (AND, mode, remainder | shift_mask,
-                                           new_source, source, subtargets, 1);
-                 source = new_source;
+                                           new_src, source, subtargets, 1);
+                 source = new_src;
                }
              else
-               insns = arm_gen_constant (AND, mode, remainder | shift_mask,
-                                         new_source, source, subtargets, 0);
+               {
+                 rtx targ = subtargets ? NULL_RTX : target;
+
+                 insns = arm_gen_constant (AND, mode, remainder | shift_mask,
+                                           targ, source, subtargets, 0);
+               }
            }
 
          if (generate)
            {
-             shift = GEN_INT (clear_zero_bit_copies);
-             new_source = subtargets ? gen_reg_rtx (mode) : target;
-             emit_insn (gen_lshrsi3 (new_source, source, shift));
-             emit_insn (gen_ashlsi3 (target, new_source, shift));
+             rtx new_src = subtargets ? gen_reg_rtx (mode) : target;
+             rtx shift = GEN_INT (clear_zero_bit_copies);
+
+             emit_insn (gen_lshrsi3 (new_src, source, shift));
+             emit_insn (gen_ashlsi3 (target, new_src, shift));
            }
 
          return insns + 2;
@@ -854,9 +1280,9 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
       num_bits_set++;
 
   if (code == AND || (can_invert && num_bits_set > 16))
-    remainder = (~remainder) & 0xffffffff;
+    remainder = (~remainder) & HOST_UINT (0xffffffff);
   else if (code == PLUS && num_bits_set > 16)
-    remainder = (-remainder) & 0xffffffff;
+    remainder = (-remainder) & HOST_UINT (0xffffffff);
   else
     {
       can_invert = 0;
@@ -868,7 +1294,7 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
      We start by looking for the largest block of zeros that are aligned on
      a 2-bit boundary, we then fill up the temps, wrapping around to the
      top of the word when we drop off the bottom.
-     In the worst case this code should produce no more than four insns. */
+     In the worst case this code should produce no more than four insns.  */
   {
     int best_start = 0;
     int best_consecutive_zeros = 0;
@@ -895,7 +1321,7 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
 
     /* Now start emitting the insns, starting with the one with the highest
        bit set: we do this so that the smallest number will be emitted last;
-       this is more likely to be combinable with addressing insns. */
+       this is more likely to be combinable with addressing insns.  */
     i = best_start;
     do
       {
@@ -912,46 +1338,48 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
                                 | ((i < end) ? (0xff >> (32 - end)) : 0));
            remainder &= ~temp1;
 
+           if (generate)
+             {
+               rtx new_src;
+
+               if (code == SET)
+                 emit_insn (gen_rtx_SET (VOIDmode,
+                                         new_src = (subtargets
+                                                    ? gen_reg_rtx (mode)
+                                                    : target),
+                                         GEN_INT (can_invert
+                                                  ? ~temp1 : temp1)));
+               else if (code == MINUS)
+                 emit_insn (gen_rtx_SET (VOIDmode,
+                                         new_src = (subtargets
+                                                    ? gen_reg_rtx (mode)
+                                                    : target),
+                                         gen_rtx (code, mode, GEN_INT (temp1),
+                                                  source)));
+               else
+                 emit_insn (gen_rtx_SET (VOIDmode,
+                                         new_src = (remainder
+                                                    ? (subtargets
+                                                       ? gen_reg_rtx (mode)
+                                                       : target)
+                                                    : target),
+                                         gen_rtx (code, mode, source,
+                                                  GEN_INT (can_invert ? ~temp1
+                                                           : (can_negate
+                                                              ? -temp1
+                                                              : temp1)))));
+               source = new_src;
+             }
+
            if (code == SET)
              {
-               if (generate)
-                 emit_insn (gen_rtx (SET, VOIDmode,
-                                     new_src = (subtargets
-                                                ? gen_reg_rtx (mode)
-                                                : target),
-                                     GEN_INT (can_invert ? ~temp1 : temp1)));
                can_invert = 0;
                code = PLUS;
              }
            else if (code == MINUS)
-             {
-               if (generate)
-                 emit_insn (gen_rtx (SET, VOIDmode,
-                                     new_src = (subtargets
-                                                ? gen_reg_rtx (mode)
-                                                : target),
-                                     gen_rtx (code, mode, GEN_INT (temp1),
-                                              source)));
-               code = PLUS;
-             }
-           else
-             {
-               if (generate)
-                 emit_insn (gen_rtx (SET, VOIDmode,
-                                     new_src = (remainder
-                                                ? (subtargets
-                                                   ? gen_reg_rtx (mode)
-                                                   : target)
-                                                : target),
-                                     gen_rtx (code, mode, source,
-                                              GEN_INT (can_invert ? ~temp1
-                                                       : (can_negate
-                                                          ? -temp1
-                                                          : temp1)))));
-             }
+             code = PLUS;
 
            insns++;
-           source = new_src;
            i -= 6;
          }
        i -= 2;
@@ -960,4351 +1388,8410 @@ arm_gen_constant (code, mode, val, target, source, subtargets, generate)
   return insns;
 }
 
-/* Handle aggregates that are not laid out in a BLKmode element.
-   This is a sub-element of RETURN_IN_MEMORY.  */
-int
-arm_return_in_memory (type)
-     tree type;
+/* Canonicalize a comparison so that we are more likely to recognize it.
+   This can be done for a few constant compares, where we can make the
+   immediate value easier to load.  */
+enum rtx_code
+arm_canonicalize_comparison (code, op1)
+     enum rtx_code code;
+     rtx * op1;
 {
-  if (TREE_CODE (type) == RECORD_TYPE)
+  unsigned HOST_WIDE_INT i = INTVAL (*op1);
+
+  switch (code)
     {
-      tree field;
+    case EQ:
+    case NE:
+      return code;
 
-      /* For a struct, we can return in a register if every element was a
-        bit-field.  */
-      for (field = TYPE_FIELDS (type); field;  field = TREE_CHAIN (field))
-       if (TREE_CODE (field) != FIELD_DECL
-           || ! DECL_BIT_FIELD_TYPE (field))
-         return 1;
+    case GT:
+    case LE:
+      if (i != (((HOST_UINT (1)) << (HOST_BITS_PER_WIDE_INT - 1))
+               - 1)
+         && (const_ok_for_arm (i+1) || const_ok_for_arm (- (i+1))))
+       {
+         *op1 = GEN_INT (i+1);
+         return code == GT ? GE : LT;
+       }
+      break;
 
-      return 0;
-    }
-  else if (TREE_CODE (type) == UNION_TYPE)
-    {
-      tree field;
+    case GE:
+    case LT:
+      if (i != ((HOST_UINT (1)) << (HOST_BITS_PER_WIDE_INT - 1))
+         && (const_ok_for_arm (i-1) || const_ok_for_arm (- (i-1))))
+       {
+         *op1 = GEN_INT (i-1);
+         return code == GE ? GT : LE;
+       }
+      break;
 
-      /* Unions can be returned in registers if every element is
-        integral, or can be returned in an integer register.  */
-      for (field = TYPE_FIELDS (type); field; field = TREE_CHAIN (field))
+    case GTU:
+    case LEU:
+      if (i != ~ (HOST_UINT (0))
+         && (const_ok_for_arm (i+1) || const_ok_for_arm (- (i+1))))
        {
-         if (TREE_CODE (field) != FIELD_DECL
-             || (AGGREGATE_TYPE_P (TREE_TYPE (field))
-                 && RETURN_IN_MEMORY (TREE_TYPE (field)))
-             || FLOAT_TYPE_P (TREE_TYPE (field)))
-           return 1;
+         *op1 = GEN_INT (i + 1);
+         return code == GTU ? GEU : LTU;
        }
-      return 0;
-    }
-  /* XXX Not sure what should be done for other aggregates, so put them in
-     memory. */
-  return 1;
-}
+      break;
 
-#define REG_OR_SUBREG_REG(X)                                           \
-  (GET_CODE (X) == REG                                                 \
-   || (GET_CODE (X) == SUBREG && GET_CODE (SUBREG_REG (X)) == REG))
+    case GEU:
+    case LTU:
+      if (i != 0
+         && (const_ok_for_arm (i - 1) || const_ok_for_arm (- (i - 1))))
+       {
+         *op1 = GEN_INT (i - 1);
+         return code == GEU ? GTU : LEU;
+       }
+      break;
 
-#define REG_OR_SUBREG_RTX(X)                   \
-   (GET_CODE (X) == REG ? (X) : SUBREG_REG (X))
+    default:
+      abort ();
+    }
 
-#define ARM_FRAME_RTX(X)                               \
-  ((X) == frame_pointer_rtx || (X) == stack_pointer_rtx        \
-   || (X) == arg_pointer_rtx)
+  return code;
+}
 
+/* Decide whether a type should be returned in memory (true)
+   or in a register (false).  This is called by the macro
+   RETURN_IN_MEMORY.  */
 int
-arm_rtx_costs (x, code, outer_code)
-     rtx x;
-     enum rtx_code code, outer_code;
+arm_return_in_memory (type)
+     tree type;
 {
-  enum machine_mode mode = GET_MODE (x);
-  enum rtx_code subcode;
-  int extra_cost;
-
-  switch (code)
+  if (! AGGREGATE_TYPE_P (type))
+    /* All simple types are returned in registers.  */
+    return 0;
+  
+  /* For the arm-wince targets we choose to be compitable with Microsoft's
+     ARM and Thumb compilers, which always return aggregates in memory.  */
+#ifndef ARM_WINCE
+  
+  if (int_size_in_bytes (type) > 4)
+    /* All structures/unions bigger than one word are returned in memory.  */
+    return 1;
+  
+  if (TREE_CODE (type) == RECORD_TYPE)
     {
-    case MEM:
-      /* Memory costs quite a lot for the first word, but subsequent words
-        load at the equivalent of a single insn each.  */
-      return (10 + 4 * ((GET_MODE_SIZE (mode) - 1) / UNITS_PER_WORD)
-             + (CONSTANT_POOL_ADDRESS_P (x) ? 4 : 0));
-
-    case DIV:
-    case MOD:
-      return 100;
-
-    case ROTATE:
-      if (mode == SImode && GET_CODE (XEXP (x, 1)) == REG)
-       return 4;
-      /* Fall through */
-    case ROTATERT:
-      if (mode != SImode)
-       return 8;
-      /* Fall through */
-    case ASHIFT: case LSHIFTRT: case ASHIFTRT:
-      if (mode == DImode)
-       return (8 + (GET_CODE (XEXP (x, 1)) == CONST_INT ? 0 : 8)
-               + ((GET_CODE (XEXP (x, 0)) == REG 
-                   || (GET_CODE (XEXP (x, 0)) == SUBREG
-                       && GET_CODE (SUBREG_REG (XEXP (x, 0))) == REG))
-                  ? 0 : 8));
-      return (1 + ((GET_CODE (XEXP (x, 0)) == REG
-                   || (GET_CODE (XEXP (x, 0)) == SUBREG
-                       && GET_CODE (SUBREG_REG (XEXP (x, 0))) == REG))
-                  ? 0 : 4)
-             + ((GET_CODE (XEXP (x, 1)) == REG
-                 || (GET_CODE (XEXP (x, 1)) == SUBREG
-                     && GET_CODE (SUBREG_REG (XEXP (x, 1))) == REG)
-                 || (GET_CODE (XEXP (x, 1)) == CONST_INT))
-                ? 0 : 4));
+      tree field;
 
-    case MINUS:
-      if (mode == DImode)
-       return (4 + (REG_OR_SUBREG_REG (XEXP (x, 1)) ? 0 : 8)
-               + ((REG_OR_SUBREG_REG (XEXP (x, 0))
-                   || (GET_CODE (XEXP (x, 0)) == CONST_INT
-                      && const_ok_for_arm (INTVAL (XEXP (x, 0)))))
-                  ? 0 : 8));
+      /* For a struct the APCS says that we only return in a register
+        if the type is 'integer like' and every addressable element
+        has an offset of zero.  For practical purposes this means
+        that the structure can have at most one non bit-field element
+        and that this element must be the first one in the structure.  */
+      
+      /* Find the first field, ignoring non FIELD_DECL things which will
+        have been created by C++.  */
+      for (field = TYPE_FIELDS (type);
+          field && TREE_CODE (field) != FIELD_DECL;
+          field = TREE_CHAIN (field))
+       continue;
+      
+      if (field == NULL)
+       return 0; /* An empty structure.  Allowed by an extension to ANSI C.  */
 
-      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
-       return (2 + ((REG_OR_SUBREG_REG (XEXP (x, 1))
-                     || (GET_CODE (XEXP (x, 1)) == CONST_DOUBLE
-                         && const_double_rtx_ok_for_fpu (XEXP (x, 1))))
-                    ? 0 : 8)
-               + ((REG_OR_SUBREG_REG (XEXP (x, 0))
-                   || (GET_CODE (XEXP (x, 0)) == CONST_DOUBLE
-                       && const_double_rtx_ok_for_fpu (XEXP (x, 0))))
-                  ? 0 : 8));
+      /* Check that the first field is valid for returning in a register.  */
 
-      if (((GET_CODE (XEXP (x, 0)) == CONST_INT
-           && const_ok_for_arm (INTVAL (XEXP (x, 0)))
-           && REG_OR_SUBREG_REG (XEXP (x, 1))))
-         || (((subcode = GET_CODE (XEXP (x, 1))) == ASHIFT
-              || subcode == ASHIFTRT || subcode == LSHIFTRT
-              || subcode == ROTATE || subcode == ROTATERT
-              || (subcode == MULT
-                  && GET_CODE (XEXP (XEXP (x, 1), 1)) == CONST_INT
-                  && ((INTVAL (XEXP (XEXP (x, 1), 1)) &
-                       (INTVAL (XEXP (XEXP (x, 1), 1)) - 1)) == 0)))
-             && REG_OR_SUBREG_REG (XEXP (XEXP (x, 1), 0))
-             && (REG_OR_SUBREG_REG (XEXP (XEXP (x, 1), 1))
-                 || GET_CODE (XEXP (XEXP (x, 1), 1)) == CONST_INT)
-             && REG_OR_SUBREG_REG (XEXP (x, 0))))
+      /* ... Floats are not allowed */
+      if (FLOAT_TYPE_P (TREE_TYPE (field)))
        return 1;
-      /* Fall through */
-
-    case PLUS: 
-      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
-       return (2 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 8)
-               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
-                   || (GET_CODE (XEXP (x, 1)) == CONST_DOUBLE
-                       && const_double_rtx_ok_for_fpu (XEXP (x, 1))))
-                  ? 0 : 8));
-
-      /* Fall through */
-    case AND: case XOR: case IOR: 
-      extra_cost = 0;
-
-      /* Normally the frame registers will be spilt into reg+const during
-        reload, so it is a bad idea to combine them with other instructions,
-        since then they might not be moved outside of loops.  As a compromise
-        we allow integration with ops that have a constant as their second
-        operand.  */
-      if ((REG_OR_SUBREG_REG (XEXP (x, 0))
-          && ARM_FRAME_RTX (REG_OR_SUBREG_RTX (XEXP (x, 0)))
-          && GET_CODE (XEXP (x, 1)) != CONST_INT)
-         || (REG_OR_SUBREG_REG (XEXP (x, 0))
-             && ARM_FRAME_RTX (REG_OR_SUBREG_RTX (XEXP (x, 0)))))
-       extra_cost = 4;
-
-      if (mode == DImode)
-       return (4 + extra_cost + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 8)
-               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
-                   || (GET_CODE (XEXP (x, 1)) == CONST_INT
-                       && const_ok_for_op (INTVAL (XEXP (x, 1)), code, mode)))
-                  ? 0 : 8));
-
-      if (REG_OR_SUBREG_REG (XEXP (x, 0)))
-       return (1 + (GET_CODE (XEXP (x, 1)) == CONST_INT ? 0 : extra_cost)
-               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
-                   || (GET_CODE (XEXP (x, 1)) == CONST_INT
-                       && const_ok_for_op (INTVAL (XEXP (x, 1)), code, mode)))
-                  ? 0 : 4));
-
-      else if (REG_OR_SUBREG_REG (XEXP (x, 1)))
-       return (1 + extra_cost
-               + ((((subcode = GET_CODE (XEXP (x, 0))) == ASHIFT
-                    || subcode == LSHIFTRT || subcode == ASHIFTRT
-                    || subcode == ROTATE || subcode == ROTATERT
-                    || (subcode == MULT
-                        && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT
-                        && ((INTVAL (XEXP (XEXP (x, 0), 1)) &
-                             (INTVAL (XEXP (XEXP (x, 0), 1)) - 1)) == 0))
-                   && (REG_OR_SUBREG_REG (XEXP (XEXP (x, 0), 0)))
-                   && ((REG_OR_SUBREG_REG (XEXP (XEXP (x, 0), 1)))
-                       || GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT)))
-                  ? 0 : 4));
-
-      return 8;
-
-    case MULT:
-      if (arm_fast_multiply && mode == DImode
-         && (GET_CODE (XEXP (x, 0)) == GET_CODE (XEXP (x, 1)))
-         && (GET_CODE (XEXP (x, 0)) == ZERO_EXTEND
-             || GET_CODE (XEXP (x, 0)) == SIGN_EXTEND))
-       return 8;
-
-      if (GET_MODE_CLASS (mode) == MODE_FLOAT
-         || mode == DImode)
-       return 30;
 
-      if (GET_CODE (XEXP (x, 1)) == CONST_INT)
+      /* ... Aggregates that are not themselves valid for returning in
+        a register are not allowed.  */
+      if (RETURN_IN_MEMORY (TREE_TYPE (field)))
+       return 1;
+      
+      /* Now check the remaining fields, if any.  Only bitfields are allowed,
+        since they are not addressable.  */
+      for (field = TREE_CHAIN (field);
+          field;
+          field = TREE_CHAIN (field))
        {
-         unsigned HOST_WIDE_INT i = (INTVAL (XEXP (x, 1))
-                                     & (unsigned HOST_WIDE_INT) 0xffffffff);
-         int add_cost = const_ok_for_arm (i) ? 4 : 8;
-         int j;
-         int booth_unit_size = (arm_fast_multiply ? 8 : 2);
-
-         for (j = 0; i && j < 32; j += booth_unit_size)
-           {
-             i >>= booth_unit_size;
-             add_cost += 2;
-           }
-
-         return add_cost;
+         if (TREE_CODE (field) != FIELD_DECL)
+           continue;
+         
+         if (! DECL_BIT_FIELD_TYPE (field))
+           return 1;
        }
 
-      return ((arm_fast_multiply ? 8 : 30)
-             + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4)
-             + (REG_OR_SUBREG_REG (XEXP (x, 1)) ? 0 : 4));
-
-    case NEG:
-      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
-       return 4 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 6);
-      /* Fall through */
-    case NOT:
-      if (mode == DImode)
-       return 4 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4);
-
-      return 1 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4);
-
-    case IF_THEN_ELSE:
-      if (GET_CODE (XEXP (x, 1)) == PC || GET_CODE (XEXP (x, 2)) == PC)
-       return 14;
-      return 2;
-
-    case COMPARE:
-      return 1;
-
-    case ABS:
-      return 4 + (mode == DImode ? 4 : 0);
+      return 0;
+    }
+  
+  if (TREE_CODE (type) == UNION_TYPE)
+    {
+      tree field;
 
-    case SIGN_EXTEND:
-      if (GET_MODE (XEXP (x, 0)) == QImode)
-       return (4 + (mode == DImode ? 4 : 0)
-               + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
-      /* Fall through */
-    case ZERO_EXTEND:
-      switch (GET_MODE (XEXP (x, 0)))
+      /* Unions can be returned in registers if every element is
+        integral, or can be returned in an integer register.  */
+      for (field = TYPE_FIELDS (type);
+          field;
+          field = TREE_CHAIN (field))
        {
-       case QImode:
-         return (1 + (mode == DImode ? 4 : 0)
-                 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+         if (TREE_CODE (field) != FIELD_DECL)
+           continue;
 
-       case HImode:
-         return (4 + (mode == DImode ? 4 : 0)
-                 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
-
-       case SImode:
-         return (1 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+         if (FLOAT_TYPE_P (TREE_TYPE (field)))
+           return 1;
+         
+         if (RETURN_IN_MEMORY (TREE_TYPE (field)))
+           return 1;
        }
-      abort ();
-
-    default:
-      return 99;
+      
+      return 0;
     }
+#endif /* not ARM_WINCE */  
+  
+  /* Return all other types in memory.  */
+  return 1;
 }
-     
-/* This code has been fixed for cross compilation. */
-
-static int fpa_consts_inited = 0;
-
-char *strings_fpa[8] = {
-  "0",   "1",   "2",   "3",
-  "4",   "5",   "0.5", "10"
-};
 
-static REAL_VALUE_TYPE values_fpa[8];
-
-static void
-init_fpa_table ()
+/* Initialize a variable CUM of type CUMULATIVE_ARGS
+   for a call to a function whose data type is FNTYPE.
+   For a library call, FNTYPE is NULL.  */
+void
+arm_init_cumulative_args (pcum, fntype, libname, indirect)
+     CUMULATIVE_ARGS * pcum;
+     tree fntype;
+     rtx libname  ATTRIBUTE_UNUSED;
+     int indirect ATTRIBUTE_UNUSED;
 {
-  int i;
-  REAL_VALUE_TYPE r;
+  /* On the ARM, the offset starts at 0.  */
+  pcum->nregs = ((fntype && aggregate_value_p (TREE_TYPE (fntype))) ? 1 : 0);
+  
+  pcum->call_cookie = CALL_NORMAL;
 
-  for (i = 0; i < 8; i++)
+  if (TARGET_LONG_CALLS)
+    pcum->call_cookie = CALL_LONG;
+    
+  /* Check for long call/short call attributes.  The attributes
+     override any command line option.  */
+  if (fntype)
     {
-      r = REAL_VALUE_ATOF (strings_fpa[i], DFmode);
-      values_fpa[i] = r;
+      if (lookup_attribute ("short_call", TYPE_ATTRIBUTES (fntype)))
+       pcum->call_cookie = CALL_SHORT;
+      else if (lookup_attribute ("long_call", TYPE_ATTRIBUTES (fntype)))
+       pcum->call_cookie = CALL_LONG;
     }
-
-  fpa_consts_inited = 1;
 }
 
-/* Return TRUE if rtx X is a valid immediate FPU constant. */
-
-int
-const_double_rtx_ok_for_fpu (x)
-     rtx x;
+/* Determine where to put an argument to a function.
+   Value is zero to push the argument on the stack,
+   or a hard register in which to store the argument.
+
+   MODE is the argument's machine mode.
+   TYPE is the data type of the argument (as a tree).
+    This is null for libcalls where that information may
+    not be available.
+   CUM is a variable of type CUMULATIVE_ARGS which gives info about
+    the preceding args and about the function being called.
+   NAMED is nonzero if this argument is a named parameter
+    (otherwise it is an extra parameter matching an ellipsis).  */
+rtx
+arm_function_arg (pcum, mode, type, named)
+     CUMULATIVE_ARGS * pcum;
+     enum machine_mode mode;
+     tree type ATTRIBUTE_UNUSED;
+     int named;
 {
-  REAL_VALUE_TYPE r;
-  int i;
+  if (mode == VOIDmode)
+    /* Compute operand 2 of the call insn.  */
+    return GEN_INT (pcum->call_cookie);
   
-  if (!fpa_consts_inited)
-    init_fpa_table ();
+  if (! named || pcum->nregs >= NUM_ARG_REGS)
+    return NULL_RTX;
   
-  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
-  if (REAL_VALUE_MINUS_ZERO (r))
-    return 0;
-
-  for (i = 0; i < 8; i++)
-    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
-      return 1;
-
-  return 0;
+  return gen_rtx_REG (mode, pcum->nregs);
 }
+\f
+/* Encode the current state of the #pragma [no_]long_calls.  */
+typedef enum
+{
+  OFF,         /* No #pramgma [no_]long_calls is in effect.  */
+  LONG,                /* #pragma long_calls is in effect.  */
+  SHORT                /* #pragma no_long_calls is in effect.  */
+} arm_pragma_enum;
 
-/* Return TRUE if rtx X is a valid immediate FPU constant. */
+static arm_pragma_enum arm_pragma_long_calls = OFF;
 
+/* Handle pragmas for compatibility with Intel's compilers.
+   FIXME: This is incomplete, since it does not handle all
+   the pragmas that the Intel compilers understand.  */
 int
-neg_const_double_rtx_ok_for_fpu (x)
-     rtx x;
+arm_process_pragma (p_getc, p_ungetc, pname)
+     int (*  p_getc)   PARAMS ((void)) ATTRIBUTE_UNUSED;
+     void (* p_ungetc) PARAMS ((int))  ATTRIBUTE_UNUSED;
+     char *  pname;
 {
-  REAL_VALUE_TYPE r;
-  int i;
-  
-  if (!fpa_consts_inited)
-    init_fpa_table ();
-  
-  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
-  r = REAL_VALUE_NEGATE (r);
-  if (REAL_VALUE_MINUS_ZERO (r))
+  /* Should be pragma 'far' or equivalent for callx/balx here.  */
+  if (strcmp (pname, "long_calls") == 0)
+    arm_pragma_long_calls = LONG;
+  else if (strcmp (pname, "no_long_calls") == 0)
+    arm_pragma_long_calls = SHORT;
+  else if (strcmp (pname, "long_calls_off") == 0)
+    arm_pragma_long_calls = OFF;
+  else
     return 0;
-
-  for (i = 0; i < 8; i++)
-    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
-      return 1;
-
-  return 0;
+  
+  return 1;
 }
 \f
-/* Predicates for `match_operand' and `match_operator'.  */
-
-/* s_register_operand is the same as register_operand, but it doesn't accept
-   (SUBREG (MEM)...).
-
-   This function exists because at the time it was put in it led to better
-   code.  SUBREG(MEM) always needs a reload in the places where
-   s_register_operand is used, and this seemed to lead to excessive
-   reloading.  */
-
+/* Return nonzero if IDENTIFIER with arguments ARGS is a valid machine specific
+   attribute for TYPE.  The attributes in ATTRIBUTES have previously been
+   assigned to TYPE.  */
 int
-s_register_operand (op, mode)
-     register rtx op;
-     enum machine_mode mode;
+arm_valid_type_attribute_p (type, attributes, identifier, args)
+     tree type;
+     tree attributes ATTRIBUTE_UNUSED;
+     tree identifier;
+     tree args;
 {
-  if (GET_MODE (op) != mode && mode != VOIDmode)
+  if (   TREE_CODE (type) != FUNCTION_TYPE
+      && TREE_CODE (type) != METHOD_TYPE
+      && TREE_CODE (type) != FIELD_DECL
+      && TREE_CODE (type) != TYPE_DECL)
     return 0;
 
-  if (GET_CODE (op) == SUBREG)
-    op = SUBREG_REG (op);
-
-  /* We don't consider registers whose class is NO_REGS
-     to be a register operand.  */
-  return (GET_CODE (op) == REG
-         && (REGNO (op) >= FIRST_PSEUDO_REGISTER
-             || REGNO_REG_CLASS (REGNO (op)) != NO_REGS));
+  /* Function calls made to this symbol must be done indirectly, because
+     it may lie outside of the 26 bit addressing range of a normal function
+     call.  */
+  if (is_attribute_p ("long_call", identifier))
+    return (args == NULL_TREE);
+  
+  /* Whereas these functions are always known to reside within the 26 bit
+     addressing range.  */
+  if (is_attribute_p ("short_call", identifier))
+    return (args == NULL_TREE);
+  
+  return 0;
 }
 
-/* Only accept reg, subreg(reg), const_int.  */
-
+/* Return 0 if the attributes for two types are incompatible, 1 if they
+   are compatible, and 2 if they are nearly compatible (which causes a
+   warning to be generated).  */
 int
-reg_or_int_operand (op, mode)
-     register rtx op;
-     enum machine_mode mode;
+arm_comp_type_attributes (type1, type2)
+     tree type1;
+     tree type2;
 {
-  if (GET_CODE (op) == CONST_INT)
+  int l1, l2, s1, s2;
+  
+  /* Check for mismatch of non-default calling convention.  */
+  if (TREE_CODE (type1) != FUNCTION_TYPE)
     return 1;
 
-  if (GET_MODE (op) != mode && mode != VOIDmode)
-    return 0;
+  /* Check for mismatched call attributes.  */
+  l1 = lookup_attribute ("long_call", TYPE_ATTRIBUTES (type1)) != NULL;
+  l2 = lookup_attribute ("long_call", TYPE_ATTRIBUTES (type2)) != NULL;
+  s1 = lookup_attribute ("short_call", TYPE_ATTRIBUTES (type1)) != NULL;
+  s2 = lookup_attribute ("short_call", TYPE_ATTRIBUTES (type2)) != NULL;
 
-  if (GET_CODE (op) == SUBREG)
-    op = SUBREG_REG (op);
+  /* Only bother to check if an attribute is defined.  */
+  if (l1 | l2 | s1 | s2)
+    {
+      /* If one type has an attribute, the other must have the same attribute.  */
+      if ((l1 != l2) || (s1 != s2))
+       return 0;
 
-  /* We don't consider registers whose class is NO_REGS
-     to be a register operand.  */
-  return (GET_CODE (op) == REG
-         && (REGNO (op) >= FIRST_PSEUDO_REGISTER
-             || REGNO_REG_CLASS (REGNO (op)) != NO_REGS));
+      /* Disallow mixed attributes.  */
+      if ((l1 & s2) || (l2 & s1))
+       return 0;
+    }
+  
+  return 1;
 }
 
-/* Return 1 if OP is an item in memory, given that we are in reload.  */
-
-int
-reload_memory_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
+/*  Encode long_call or short_call attribute by prefixing
+    symbol name in DECL with a special character FLAG.  */
+void
+arm_encode_call_attribute (decl, flag)
+  tree decl;
+  char flag;
 {
-  int regno = true_regnum (op);
+  const char * str = XSTR (XEXP (DECL_RTL (decl), 0), 0);
+  int          len = strlen (str);
+  char *       newstr;
 
-  return (! CONSTANT_P (op)
-         && (regno == -1
-             || (GET_CODE (op) == REG
-                 && REGNO (op) >= FIRST_PSEUDO_REGISTER)));
-}
+  if (TREE_CODE (decl) != FUNCTION_DECL)
+    return;
 
-/* Return TRUE for valid operands for the rhs of an ARM instruction.  */
+  /* Do not allow weak functions to be treated as short call.  */
+  if (DECL_WEAK (decl) && flag == SHORT_CALL_FLAG_CHAR)
+    return;
+  
+  if (ggc_p)
+    newstr = ggc_alloc_string (NULL, len + 2);
+  else
+    newstr = permalloc (len + 2);
 
-int
-arm_rhs_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  return (s_register_operand (op, mode)
-         || (GET_CODE (op) == CONST_INT && const_ok_for_arm (INTVAL (op))));
-}
+  sprintf (newstr, "%c%s", flag, str);
 
-/* Return TRUE for valid operands for the rhs of an ARM instruction, or a load.
- */
+  XSTR (XEXP (DECL_RTL (decl), 0), 0) = newstr;
+}
 
-int
-arm_rhsm_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
+/*  Assigns default attributes to newly defined type.  This is used to
+    set short_call/long_call attributes for function types of
+    functions defined inside corresponding #pragma scopes.  */
+void
+arm_set_default_type_attributes (type)
+  tree type;
 {
-  return (s_register_operand (op, mode)
-         || (GET_CODE (op) == CONST_INT && const_ok_for_arm (INTVAL (op)))
-         || memory_operand (op, mode));
-}
+  /* Add __attribute__ ((long_call)) to all functions, when
+     inside #pragma long_calls or __attribute__ ((short_call)),
+     when inside #pragma no_long_calls.  */
+  if (TREE_CODE (type) == FUNCTION_TYPE || TREE_CODE (type) == METHOD_TYPE)
+    {
+      tree type_attr_list, attr_name;
+      type_attr_list = TYPE_ATTRIBUTES (type);
 
-/* Return TRUE for valid operands for the rhs of an ARM instruction, or if a
-   constant that is valid when negated.  */
+      if (arm_pragma_long_calls == LONG)
+       attr_name = get_identifier ("long_call");
+      else if (arm_pragma_long_calls == SHORT)
+       attr_name = get_identifier ("short_call");
+      else
+       return;
 
-int
-arm_add_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  return (s_register_operand (op, mode)
-         || (GET_CODE (op) == CONST_INT
-             && (const_ok_for_arm (INTVAL (op))
-                 || const_ok_for_arm (-INTVAL (op)))));
+      type_attr_list = tree_cons (attr_name, NULL_TREE, type_attr_list);
+      TYPE_ATTRIBUTES (type) = type_attr_list;
+    }
 }
-
-int
-arm_not_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
+\f
+/* Return 1 if the operand is a SYMBOL_REF for a function known to be
+   defined within the current compilation unit.  If this caanot be
+   determined, then 0 is returned.  */
+static int
+current_file_function_operand (sym_ref)
+  rtx sym_ref;
 {
-  return (s_register_operand (op, mode)
-         || (GET_CODE (op) == CONST_INT
-             && (const_ok_for_arm (INTVAL (op))
-                 || const_ok_for_arm (~INTVAL (op)))));
-}
+  /* This is a bit of a fib.  A function will have a short call flag
+     applied to its name if it has the short call attribute, or it has
+     already been defined within the current compilation unit.  */
+  if (ENCODED_SHORT_CALL_ATTR_P (XSTR (sym_ref, 0)))
+    return 1;
 
-/* Return TRUE if the operand is a memory reference which contains an
-   offsettable address.  */
-int
-offsettable_memory_operand (op, mode)
-     register rtx op;
-     enum machine_mode mode;
-{
-  if (mode == VOIDmode)
-    mode = GET_MODE (op);
+  /* The current funciton is always defined within the current compilation
+     unit.  if it s a weak defintion however, then this may not be the real
+     defintion of the function, and so we have to say no.  */
+  if (sym_ref == XEXP (DECL_RTL (current_function_decl), 0)
+      && ! DECL_WEAK (current_function_decl))
+    return 1;
 
-  return (mode == GET_MODE (op)
-         && GET_CODE (op) == MEM
-         && offsettable_address_p (reload_completed | reload_in_progress,
-                                   mode, XEXP (op, 0)));
+  /* We cannot make the determination - default to returning 0.  */
+  return 0;
 }
 
-/* Return TRUE if the operand is a memory reference which is, or can be
-   made word aligned by adjusting the offset.  */
+/* Return non-zero if a 32 bit "long_call" should be generated for
+   this call.  We generate a long_call if the function:
+
+        a.  has an __attribute__((long call))
+     or b.  is within the scope of a #pragma long_calls
+     or c.  the -mlong-calls command line switch has been specified
+
+   However we do not generate a long call if the function:
+   
+        d.  has an __attribute__ ((short_call))
+     or e.  is inside the scope of a #pragma no_long_calls
+     or f.  has an __attribute__ ((section))
+     or g.  is defined within the current compilation unit.
+   
+   This function will be called by C fragments contained in the machine
+   description file.  CALL_REF and CALL_COOKIE correspond to the matched
+   rtl operands.  CALL_SYMBOL is used to distinguish between
+   two different callers of the function.  It is set to 1 in the
+   "call_symbol" and "call_symbol_value" patterns and to 0 in the "call"
+   and "call_value" patterns.  This is because of the difference in the
+   SYM_REFs passed by these patterns.  */
 int
-alignable_memory_operand (op, mode)
-     register rtx op;
-     enum machine_mode mode;
+arm_is_longcall_p (sym_ref, call_cookie, call_symbol)
+  rtx sym_ref;
+  int call_cookie;
+  int call_symbol;
 {
-  rtx reg;
+  if (! call_symbol)
+    {
+      if (GET_CODE (sym_ref) != MEM)
+       return 0;
 
-  if (mode == VOIDmode)
-    mode = GET_MODE (op);
+      sym_ref = XEXP (sym_ref, 0);
+    }
 
-  if (mode != GET_MODE (op) || GET_CODE (op) != MEM)
+  if (GET_CODE (sym_ref) != SYMBOL_REF)
     return 0;
 
-  op = XEXP (op, 0);
+  if (call_cookie & CALL_SHORT)
+    return 0;
 
-  return ((GET_CODE (reg = op) == REG
-          || (GET_CODE (op) == SUBREG
-              && GET_CODE (reg = SUBREG_REG (op)) == REG)
-          || (GET_CODE (op) == PLUS
-              && GET_CODE (XEXP (op, 1)) == CONST_INT
-              && (GET_CODE (reg = XEXP (op, 0)) == REG
-                  || (GET_CODE (XEXP (op, 0)) == SUBREG
-                      && GET_CODE (reg = SUBREG_REG (XEXP (op, 0))) == REG))))
-         && REGNO_POINTER_ALIGN (REGNO (reg)) >= 4);
+  if (TARGET_LONG_CALLS && flag_function_sections)
+    return 1;
+  
+  if (current_file_function_operand (sym_ref, VOIDmode))
+    return 0;
+  
+  return (call_cookie & CALL_LONG)
+    || ENCODED_LONG_CALL_ATTR_P (XSTR (sym_ref, 0))
+    || TARGET_LONG_CALLS;
 }
-
-/* Return TRUE for valid operands for the rhs of an FPU instruction.  */
-
+\f
 int
-fpu_rhs_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
+legitimate_pic_operand_p (x)
+     rtx x;
 {
-  if (s_register_operand (op, mode))
-    return TRUE;
-  else if (GET_CODE (op) == CONST_DOUBLE)
-    return (const_double_rtx_ok_for_fpu (op));
+  if (CONSTANT_P (x)
+      && flag_pic
+      && (GET_CODE (x) == SYMBOL_REF
+         || (GET_CODE (x) == CONST
+             && GET_CODE (XEXP (x, 0)) == PLUS
+             && GET_CODE (XEXP (XEXP (x, 0), 0)) == SYMBOL_REF)))
+    return 0;
 
-  return FALSE;
+  return 1;
 }
 
-int
-fpu_add_operand (op, mode)
-     rtx op;
+rtx
+legitimize_pic_address (orig, mode, reg)
+     rtx orig;
      enum machine_mode mode;
+     rtx reg;
 {
-  if (s_register_operand (op, mode))
-    return TRUE;
-  else if (GET_CODE (op) == CONST_DOUBLE)
-    return (const_double_rtx_ok_for_fpu (op) 
-           || neg_const_double_rtx_ok_for_fpu (op));
+  if (GET_CODE (orig) == SYMBOL_REF)
+    {
+      rtx pic_ref, address;
+      rtx insn;
+      int subregs = 0;
 
-  return FALSE;
-}
+      if (reg == 0)
+       {
+         if (reload_in_progress || reload_completed)
+           abort ();
+         else
+           reg = gen_reg_rtx (Pmode);
 
-/* Return nonzero if OP is a constant power of two.  */
+         subregs = 1;
+       }
 
-int
-power_of_two_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  if (GET_CODE (op) == CONST_INT)
-    {
-      HOST_WIDE_INT value = INTVAL(op);
-      return value != 0  &&  (value & (value - 1)) == 0;
+#ifdef AOF_ASSEMBLER
+      /* The AOF assembler can generate relocations for these directly, and
+        understands that the PIC register has to be added into the offset.  */
+      insn = emit_insn (gen_pic_load_addr_based (reg, orig));
+#else
+      if (subregs)
+       address = gen_reg_rtx (Pmode);
+      else
+       address = reg;
+
+      emit_insn (gen_pic_load_addr (address, orig));
+
+      pic_ref = gen_rtx_MEM (Pmode,
+                            gen_rtx_PLUS (Pmode, pic_offset_table_rtx,
+                                          address));
+      RTX_UNCHANGING_P (pic_ref) = 1;
+      insn = emit_move_insn (reg, pic_ref);
+#endif
+      current_function_uses_pic_offset_table = 1;
+      /* Put a REG_EQUAL note on this insn, so that it can be optimized
+        by loop.  */
+      REG_NOTES (insn) = gen_rtx_EXPR_LIST (REG_EQUAL, orig,
+                                           REG_NOTES (insn));
+      return reg;
     }
-  return FALSE;
-}
+  else if (GET_CODE (orig) == CONST)
+    {
+      rtx base, offset;
 
-/* Return TRUE for a valid operand of a DImode operation.
-   Either: REG, CONST_DOUBLE or MEM(DImode_address).
-   Note that this disallows MEM(REG+REG), but allows
-   MEM(PRE/POST_INC/DEC(REG)).  */
+      if (GET_CODE (XEXP (orig, 0)) == PLUS
+         && XEXP (XEXP (orig, 0), 0) == pic_offset_table_rtx)
+       return orig;
 
-int
-di_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  if (s_register_operand (op, mode))
-    return TRUE;
+      if (reg == 0)
+       {
+         if (reload_in_progress || reload_completed)
+           abort ();
+         else
+           reg = gen_reg_rtx (Pmode);
+       }
 
-  switch (GET_CODE (op))
-    {
-    case CONST_DOUBLE:
-    case CONST_INT:
-      return TRUE;
+      if (GET_CODE (XEXP (orig, 0)) == PLUS)
+       {
+         base = legitimize_pic_address (XEXP (XEXP (orig, 0), 0), Pmode, reg);
+         offset = legitimize_pic_address (XEXP (XEXP (orig, 0), 1), Pmode,
+                                          base == reg ? 0 : reg);
+       }
+      else
+       abort ();
 
-    case MEM:
-      return memory_address_p (DImode, XEXP (op, 0));
+      if (GET_CODE (offset) == CONST_INT)
+       {
+         /* The base register doesn't really matter, we only want to
+            test the index for the appropriate mode.  */
+         GO_IF_LEGITIMATE_INDEX (mode, 0, offset, win);
 
-    default:
-      return FALSE;
-    }
-}
+         if (! reload_in_progress && ! reload_completed)
+           offset = force_reg (Pmode, offset);
+         else
+           abort ();
 
-/* Return TRUE for a valid operand of a DFmode operation when -msoft-float.
-   Either: REG, CONST_DOUBLE or MEM(DImode_address).
-   Note that this disallows MEM(REG+REG), but allows
-   MEM(PRE/POST_INC/DEC(REG)).  */
+       win:
+         if (GET_CODE (offset) == CONST_INT)
+           return plus_constant_for_output (base, INTVAL (offset));
+       }
 
-int
-soft_df_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  if (s_register_operand (op, mode))
-    return TRUE;
-
-  switch (GET_CODE (op))
-    {
-    case CONST_DOUBLE:
-      return TRUE;
-
-    case MEM:
-      return memory_address_p (DFmode, XEXP (op, 0));
+      if (GET_MODE_SIZE (mode) > 4
+         && (GET_MODE_CLASS (mode) == MODE_INT
+             || TARGET_SOFT_FLOAT))
+       {
+         emit_insn (gen_addsi3 (reg, base, offset));
+         return reg;
+       }
 
-    default:
-      return FALSE;
+      return gen_rtx_PLUS (Pmode, base, offset);
     }
-}
-
-/* Return TRUE for valid index operands. */
-
-int
-index_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  return (s_register_operand(op, mode)
-         || (immediate_operand (op, mode)
-             && INTVAL (op) < 4096 && INTVAL (op) > -4096));
-}
-
-/* Return TRUE for valid shifts by a constant. This also accepts any
-   power of two on the (somewhat overly relaxed) assumption that the
-   shift operator in this case was a mult. */
-
-int
-const_shift_operand (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  return (power_of_two_operand (op, mode)
-         || (immediate_operand (op, mode)
-             && (INTVAL (op) < 32 && INTVAL (op) > 0)));
-}
-
-/* Return TRUE for arithmetic operators which can be combined with a multiply
-   (shift).  */
-
-int
-shiftable_operator (x, mode)
-     rtx x;
-     enum machine_mode mode;
-{
-  if (GET_MODE (x) != mode)
-    return FALSE;
-  else
+  else if (GET_CODE (orig) == LABEL_REF)
     {
-      enum rtx_code code = GET_CODE (x);
-
-      return (code == PLUS || code == MINUS
-             || code == IOR || code == XOR || code == AND);
+      current_function_uses_pic_offset_table = 1;
+      
+      if (NEED_GOT_RELOC)
+       {
+         rtx pic_ref, address = gen_reg_rtx (Pmode);
+         
+         emit_insn (gen_pic_load_addr (address, orig));
+         pic_ref = gen_rtx_PLUS (Pmode, pic_offset_table_rtx, address);
+         
+         emit_move_insn (address, pic_ref);
+         return address;
+       }
     }
+
+  return orig;
 }
 
-/* Return TRUE for shift operators. */
+static rtx pic_rtx;
 
 int
-shift_operator (x, mode)
+is_pic (x)
      rtx x;
-     enum machine_mode mode;
-{
-  if (GET_MODE (x) != mode)
-    return FALSE;
-  else
-    {
-      enum rtx_code code = GET_CODE (x);
-
-      if (code == MULT)
-       return power_of_two_operand (XEXP (x, 1));
-
-      return (code == ASHIFT || code == ASHIFTRT || code == LSHIFTRT
-             || code == ROTATERT);
-    }
-}
-
-int equality_operator (x, mode)
-     rtx x;
-     enum machine_mode mode;
 {
-  return GET_CODE (x) == EQ || GET_CODE (x) == NE;
+  if (x == pic_rtx)
+    return 1;
+  return 0;
 }
 
-/* Return TRUE for SMIN SMAX UMIN UMAX operators. */
-
-int
-minmax_operator (x, mode)
-     rtx x;
-     enum machine_mode mode;
+void
+arm_finalize_pic ()
 {
-  enum rtx_code code = GET_CODE (x);
+#ifndef AOF_ASSEMBLER
+  rtx l1, pic_tmp, pic_tmp2, seq;
+  rtx global_offset_table;
 
-  if (GET_MODE (x) != mode)
-    return FALSE;
+  if (current_function_uses_pic_offset_table == 0 || TARGET_SINGLE_PIC_BASE)
+    return;
 
-  return code == SMIN || code == SMAX || code == UMIN || code == UMAX;
-}
+  if (! flag_pic)
+    abort ();
 
-/* return TRUE if x is EQ or NE */
+  start_sequence ();
+  l1 = gen_label_rtx ();
 
-/* Return TRUE if this is the condition code register, if we aren't given
-   a mode, accept any class CCmode register */
+  global_offset_table = gen_rtx_SYMBOL_REF (Pmode, "_GLOBAL_OFFSET_TABLE_");
+  /* On the ARM the PC register contains 'dot + 8' at the time of the
+     addition, on the Thumb it is 'dot + 4'.  */
+  pic_tmp = plus_constant (gen_rtx_LABEL_REF (Pmode, l1), TARGET_ARM ? 8 : 4);
+  if (GOT_PCREL)
+    pic_tmp2 = gen_rtx_CONST (VOIDmode,
+                           gen_rtx_PLUS (Pmode, global_offset_table, pc_rtx));
+  else
+    pic_tmp2 = gen_rtx_CONST (VOIDmode, global_offset_table);
 
-int
-cc_register (x, mode)
-     rtx x;
-     enum machine_mode mode;
-{
-  if (mode == VOIDmode)
-    {
-      mode = GET_MODE (x);
-      if (GET_MODE_CLASS (mode) != MODE_CC)
-       return FALSE;
-    }
+  pic_rtx = gen_rtx_CONST (Pmode, gen_rtx_MINUS (Pmode, pic_tmp2, pic_tmp));
+  
+  emit_insn (gen_pic_load_addr (pic_offset_table_rtx, pic_rtx));
+  if (TARGET_ARM)
+    emit_insn (gen_pic_add_dot_plus_eight (pic_offset_table_rtx, l1));
+  else
+    emit_insn (gen_pic_add_dot_plus_four (pic_offset_table_rtx, l1));
 
-  if (mode == GET_MODE (x) && GET_CODE (x) == REG && REGNO (x) == 24)
-    return TRUE;
+  seq = gen_sequence ();
+  end_sequence ();
+  emit_insn_after (seq, get_insns ());
 
-  return FALSE;
+  /* Need to emit this whether or not we obey regdecls,
+     since setjmp/longjmp can cause life info to screw up.  */
+  emit_insn (gen_rtx_USE (VOIDmode, pic_offset_table_rtx));
+#endif /* AOF_ASSEMBLER */
 }
 
-/* Return TRUE if this is the condition code register, if we aren't given
-   a mode, accept any class CCmode register which indicates a dominance
-   expression.  */
-
-int
-dominant_cc_register (x, mode)
-     rtx x;
-     enum machine_mode mode;
-{
-  if (mode == VOIDmode)
-    {
-      mode = GET_MODE (x);
-      if (GET_MODE_CLASS (mode) != MODE_CC)
-       return FALSE;
-    }
-
-  if (mode != CC_DNEmode && mode != CC_DEQmode
-      && mode != CC_DLEmode && mode != CC_DLTmode
-      && mode != CC_DGEmode && mode != CC_DGTmode
-      && mode != CC_DLEUmode && mode != CC_DLTUmode
-      && mode != CC_DGEUmode && mode != CC_DGTUmode)
-    return FALSE;
+#define REG_OR_SUBREG_REG(X)                                           \
+  (GET_CODE (X) == REG                                                 \
+   || (GET_CODE (X) == SUBREG && GET_CODE (SUBREG_REG (X)) == REG))
 
-  if (mode == GET_MODE (x) && GET_CODE (x) == REG && REGNO (x) == 24)
-    return TRUE;
+#define REG_OR_SUBREG_RTX(X)                   \
+   (GET_CODE (X) == REG ? (X) : SUBREG_REG (X))
 
-  return FALSE;
-}
+#ifndef COSTS_N_INSNS
+#define COSTS_N_INSNS(N) ((N) * 4 - 2)
+#endif
 
-/* Return TRUE if X references a SYMBOL_REF.  */
 int
-symbol_mentioned_p (x)
+arm_rtx_costs (x, code, outer)
      rtx x;
+     enum rtx_code code;
+     enum rtx_code outer;
 {
-  register char *fmt;
-  register int i;
-
-  if (GET_CODE (x) == SYMBOL_REF)
-    return 1;
+  enum machine_mode mode = GET_MODE (x);
+  enum rtx_code subcode;
+  int extra_cost;
 
-  fmt = GET_RTX_FORMAT (GET_CODE (x));
-  for (i = GET_RTX_LENGTH (GET_CODE (x)) - 1; i >= 0; i--)
+  if (TARGET_THUMB)
     {
-      if (fmt[i] == 'E')
+      switch (code)
        {
-         register int j;
+       case ASHIFT:
+       case ASHIFTRT:
+       case LSHIFTRT:
+       case ROTATERT:  
+       case PLUS:
+       case MINUS:
+       case COMPARE:
+       case NEG:
+       case NOT:       
+         return COSTS_N_INSNS (1);
+         
+       case MULT:                                                      
+         if (GET_CODE (XEXP (x, 1)) == CONST_INT)                      
+           {                                                           
+             int cycles = 0;                                           
+             unsigned HOST_WIDE_INT i = INTVAL (XEXP (x, 1));
+             
+             while (i)                                         
+               {                                                       
+                 i >>= 2;                                              
+                 cycles ++;                                            
+               }                                                       
+             return COSTS_N_INSNS (2) + cycles;                        
+           }
+         return COSTS_N_INSNS (1) + 16;
+         
+       case SET:                                                       
+         return (COSTS_N_INSNS (1)                                     
+                 + 4 * ((GET_CODE (SET_SRC (x)) == MEM)                
+                        + GET_CODE (SET_DEST (x)) == MEM));
+         
+       case CONST_INT:                                         
+         if (outer == SET)                                             
+           {                                                   
+             if ((unsigned HOST_WIDE_INT) INTVAL (x) < 256)            
+               return 0;                                               
+             if (thumb_shiftable_const (INTVAL (x)))                   
+               return COSTS_N_INSNS (2);                               
+             return COSTS_N_INSNS (3);                         
+           }                                                           
+         else if (outer == PLUS                                        
+                  && INTVAL (x) < 256 && INTVAL (x) > -256)            
+           return 0;                                                   
+         else if (outer == COMPARE                                     
+                  && (unsigned HOST_WIDE_INT) INTVAL (x) < 256)        
+           return 0;                                                   
+         else if (outer == ASHIFT || outer == ASHIFTRT         
+                  || outer == LSHIFTRT)                                
+           return 0;                                                   
+         return COSTS_N_INSNS (2);
+         
+       case CONST:                                                     
+       case CONST_DOUBLE:                                              
+       case LABEL_REF:                                         
+       case SYMBOL_REF:                                                
+         return COSTS_N_INSNS (3);
+         
+       case UDIV:
+       case UMOD:
+       case DIV:
+       case MOD:
+         return 100;
+
+       case TRUNCATE:
+         return 99;
+
+       case AND:
+       case XOR:
+       case IOR: 
+         /* XXX guess. */
+         return 8;
+
+       case ADDRESSOF:
+       case MEM:
+         /* XXX another guess.  */
+         /* Memory costs quite a lot for the first word, but subsequent words
+            load at the equivalent of a single insn each.  */
+         return (10 + 4 * ((GET_MODE_SIZE (mode) - 1) / UNITS_PER_WORD)
+                 + (CONSTANT_POOL_ADDRESS_P (x) ? 4 : 0));
+
+       case IF_THEN_ELSE:
+         /* XXX a guess. */
+         if (GET_CODE (XEXP (x, 1)) == PC || GET_CODE (XEXP (x, 2)) == PC)
+           return 14;
+         return 2;
 
-         for (j = XVECLEN (x, i) - 1; j >= 0; j--)
-           if (symbol_mentioned_p (XVECEXP (x, i, j)))
-             return 1;
+       case ZERO_EXTEND:
+         /* XXX still guessing.  */
+         switch (GET_MODE (XEXP (x, 0)))
+           {
+           case QImode:
+             return (1 + (mode == DImode ? 4 : 0)
+                     + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+             
+           case HImode:
+             return (4 + (mode == DImode ? 4 : 0)
+                     + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+             
+           case SImode:
+             return (1 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+         
+           default:
+             return 99;
+           }
+         
+       default:
+         return 99;
+#if 0    
+       case FFS:
+       case FLOAT:
+       case FIX:
+       case UNSIGNED_FIX:
+         /* XXX guess */
+         fprintf (stderr, "unexpected code for thumb in rtx_costs: %s\n",
+                  rtx_name[code]);
+         abort ();
+#endif
        }
-      else if (fmt[i] == 'e' && symbol_mentioned_p (XEXP (x, i)))
-       return 1;
     }
+  
+  switch (code)
+    {
+    case MEM:
+      /* Memory costs quite a lot for the first word, but subsequent words
+        load at the equivalent of a single insn each.  */
+      return (10 + 4 * ((GET_MODE_SIZE (mode) - 1) / UNITS_PER_WORD)
+             + (CONSTANT_POOL_ADDRESS_P (x) ? 4 : 0));
 
-  return 0;
-}
+    case DIV:
+    case MOD:
+      return 100;
 
-/* Return TRUE if X references a LABEL_REF.  */
-int
-label_mentioned_p (x)
-     rtx x;
-{
-  register char *fmt;
-  register int i;
+    case ROTATE:
+      if (mode == SImode && GET_CODE (XEXP (x, 1)) == REG)
+       return 4;
+      /* Fall through */
+    case ROTATERT:
+      if (mode != SImode)
+       return 8;
+      /* Fall through */
+    case ASHIFT: case LSHIFTRT: case ASHIFTRT:
+      if (mode == DImode)
+       return (8 + (GET_CODE (XEXP (x, 1)) == CONST_INT ? 0 : 8)
+               + ((GET_CODE (XEXP (x, 0)) == REG 
+                   || (GET_CODE (XEXP (x, 0)) == SUBREG
+                       && GET_CODE (SUBREG_REG (XEXP (x, 0))) == REG))
+                  ? 0 : 8));
+      return (1 + ((GET_CODE (XEXP (x, 0)) == REG
+                   || (GET_CODE (XEXP (x, 0)) == SUBREG
+                       && GET_CODE (SUBREG_REG (XEXP (x, 0))) == REG))
+                  ? 0 : 4)
+             + ((GET_CODE (XEXP (x, 1)) == REG
+                 || (GET_CODE (XEXP (x, 1)) == SUBREG
+                     && GET_CODE (SUBREG_REG (XEXP (x, 1))) == REG)
+                 || (GET_CODE (XEXP (x, 1)) == CONST_INT))
+                ? 0 : 4));
 
-  if (GET_CODE (x) == LABEL_REF)
-    return 1;
+    case MINUS:
+      if (mode == DImode)
+       return (4 + (REG_OR_SUBREG_REG (XEXP (x, 1)) ? 0 : 8)
+               + ((REG_OR_SUBREG_REG (XEXP (x, 0))
+                   || (GET_CODE (XEXP (x, 0)) == CONST_INT
+                      && const_ok_for_arm (INTVAL (XEXP (x, 0)))))
+                  ? 0 : 8));
 
-  fmt = GET_RTX_FORMAT (GET_CODE (x));
-  for (i = GET_RTX_LENGTH (GET_CODE (x)) - 1; i >= 0; i--)
-    {
-      if (fmt[i] == 'E')
-       {
-         register int j;
+      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
+       return (2 + ((REG_OR_SUBREG_REG (XEXP (x, 1))
+                     || (GET_CODE (XEXP (x, 1)) == CONST_DOUBLE
+                         && const_double_rtx_ok_for_fpu (XEXP (x, 1))))
+                    ? 0 : 8)
+               + ((REG_OR_SUBREG_REG (XEXP (x, 0))
+                   || (GET_CODE (XEXP (x, 0)) == CONST_DOUBLE
+                       && const_double_rtx_ok_for_fpu (XEXP (x, 0))))
+                  ? 0 : 8));
 
-         for (j = XVECLEN (x, i) - 1; j >= 0; j--)
-           if (label_mentioned_p (XVECEXP (x, i, j)))
-             return 1;
-       }
-      else if (fmt[i] == 'e' && label_mentioned_p (XEXP (x, i)))
+      if (((GET_CODE (XEXP (x, 0)) == CONST_INT
+           && const_ok_for_arm (INTVAL (XEXP (x, 0)))
+           && REG_OR_SUBREG_REG (XEXP (x, 1))))
+         || (((subcode = GET_CODE (XEXP (x, 1))) == ASHIFT
+              || subcode == ASHIFTRT || subcode == LSHIFTRT
+              || subcode == ROTATE || subcode == ROTATERT
+              || (subcode == MULT
+                  && GET_CODE (XEXP (XEXP (x, 1), 1)) == CONST_INT
+                  && ((INTVAL (XEXP (XEXP (x, 1), 1)) &
+                       (INTVAL (XEXP (XEXP (x, 1), 1)) - 1)) == 0)))
+             && REG_OR_SUBREG_REG (XEXP (XEXP (x, 1), 0))
+             && (REG_OR_SUBREG_REG (XEXP (XEXP (x, 1), 1))
+                 || GET_CODE (XEXP (XEXP (x, 1), 1)) == CONST_INT)
+             && REG_OR_SUBREG_REG (XEXP (x, 0))))
        return 1;
-    }
+      /* Fall through */
 
-  return 0;
-}
+    case PLUS: 
+      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
+       return (2 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 8)
+               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
+                   || (GET_CODE (XEXP (x, 1)) == CONST_DOUBLE
+                       && const_double_rtx_ok_for_fpu (XEXP (x, 1))))
+                  ? 0 : 8));
 
-enum rtx_code
-minmax_code (x)
-     rtx x;
-{
-  enum rtx_code code = GET_CODE (x);
+      /* Fall through */
+    case AND: case XOR: case IOR: 
+      extra_cost = 0;
 
-  if (code == SMAX)
-    return GE;
-  else if (code == SMIN)
-    return LE;
-  else if (code == UMIN)
-    return LEU;
-  else if (code == UMAX)
-    return GEU;
+      /* Normally the frame registers will be spilt into reg+const during
+        reload, so it is a bad idea to combine them with other instructions,
+        since then they might not be moved outside of loops.  As a compromise
+        we allow integration with ops that have a constant as their second
+        operand.  */
+      if ((REG_OR_SUBREG_REG (XEXP (x, 0))
+          && ARM_FRAME_RTX (REG_OR_SUBREG_RTX (XEXP (x, 0)))
+          && GET_CODE (XEXP (x, 1)) != CONST_INT)
+         || (REG_OR_SUBREG_REG (XEXP (x, 0))
+             && ARM_FRAME_RTX (REG_OR_SUBREG_RTX (XEXP (x, 0)))))
+       extra_cost = 4;
 
-  abort ();
-}
+      if (mode == DImode)
+       return (4 + extra_cost + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 8)
+               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
+                   || (GET_CODE (XEXP (x, 1)) == CONST_INT
+                       && const_ok_for_op (INTVAL (XEXP (x, 1)), code)))
+                  ? 0 : 8));
 
-/* Return 1 if memory locations are adjacent */
+      if (REG_OR_SUBREG_REG (XEXP (x, 0)))
+       return (1 + (GET_CODE (XEXP (x, 1)) == CONST_INT ? 0 : extra_cost)
+               + ((REG_OR_SUBREG_REG (XEXP (x, 1))
+                   || (GET_CODE (XEXP (x, 1)) == CONST_INT
+                       && const_ok_for_op (INTVAL (XEXP (x, 1)), code)))
+                  ? 0 : 4));
 
-int
-adjacent_mem_locations (a, b)
-     rtx a, b;
-{
-  int val0 = 0, val1 = 0;
-  int reg0, reg1;
-  
-  if ((GET_CODE (XEXP (a, 0)) == REG
-       || (GET_CODE (XEXP (a, 0)) == PLUS
-          && GET_CODE (XEXP (XEXP (a, 0), 1)) == CONST_INT))
-      && (GET_CODE (XEXP (b, 0)) == REG
-         || (GET_CODE (XEXP (b, 0)) == PLUS
-             && GET_CODE (XEXP (XEXP (b, 0), 1)) == CONST_INT)))
-    {
-      if (GET_CODE (XEXP (a, 0)) == PLUS)
-        {
-         reg0 = REGNO (XEXP (XEXP (a, 0), 0));
-         val0 = INTVAL (XEXP (XEXP (a, 0), 1));
-        }
-      else
-       reg0 = REGNO (XEXP (a, 0));
-      if (GET_CODE (XEXP (b, 0)) == PLUS)
-        {
-         reg1 = REGNO (XEXP (XEXP (b, 0), 0));
-         val1 = INTVAL (XEXP (XEXP (b, 0), 1));
-        }
-      else
-       reg1 = REGNO (XEXP (b, 0));
-      return (reg0 == reg1) && ((val1 - val0) == 4 || (val0 - val1) == 4);
-    }
-  return 0;
-}
+      else if (REG_OR_SUBREG_REG (XEXP (x, 1)))
+       return (1 + extra_cost
+               + ((((subcode = GET_CODE (XEXP (x, 0))) == ASHIFT
+                    || subcode == LSHIFTRT || subcode == ASHIFTRT
+                    || subcode == ROTATE || subcode == ROTATERT
+                    || (subcode == MULT
+                        && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT
+                        && ((INTVAL (XEXP (XEXP (x, 0), 1)) &
+                             (INTVAL (XEXP (XEXP (x, 0), 1)) - 1)) == 0)))
+                   && (REG_OR_SUBREG_REG (XEXP (XEXP (x, 0), 0)))
+                   && ((REG_OR_SUBREG_REG (XEXP (XEXP (x, 0), 1)))
+                       || GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT))
+                  ? 0 : 4));
 
-/* Return 1 if OP is a load multiple operation.  It is known to be
-   parallel and the first section will be tested. */
+      return 8;
 
-int
-load_multiple_operation (op, mode)
-     rtx op;
-     enum machine_mode mode;
-{
-  HOST_WIDE_INT count = XVECLEN (op, 0);
-  int dest_regno;
-  rtx src_addr;
-  HOST_WIDE_INT i = 1, base = 0;
-  rtx elt;
+    case MULT:
+      /* There is no point basing this on the tuning, since it is always the
+        fast variant if it exists at all.  */
+      if (arm_fast_multiply && mode == DImode
+         && (GET_CODE (XEXP (x, 0)) == GET_CODE (XEXP (x, 1)))
+         && (GET_CODE (XEXP (x, 0)) == ZERO_EXTEND
+             || GET_CODE (XEXP (x, 0)) == SIGN_EXTEND))
+       return 8;
 
-  if (count <= 1
-      || GET_CODE (XVECEXP (op, 0, 0)) != SET)
-    return 0;
+      if (GET_MODE_CLASS (mode) == MODE_FLOAT
+         || mode == DImode)
+       return 30;
 
-  /* Check to see if this might be a write-back */
-  if (GET_CODE (SET_SRC (elt = XVECEXP (op, 0, 0))) == PLUS)
-    {
-      i++;
-      base = 1;
+      if (GET_CODE (XEXP (x, 1)) == CONST_INT)
+       {
+         unsigned HOST_WIDE_INT i = (INTVAL (XEXP (x, 1))
+                                     & HOST_UINT (0xffffffff));
+         int add_cost = const_ok_for_arm (i) ? 4 : 8;
+         int j;
+         
+         /* Tune as appropriate.  */ 
+         int booth_unit_size = ((tune_flags & FL_FAST_MULT) ? 8 : 2);
+         
+         for (j = 0; i && j < 32; j += booth_unit_size)
+           {
+             i >>= booth_unit_size;
+             add_cost += 2;
+           }
 
-      /* Now check it more carefully */
-      if (GET_CODE (SET_DEST (elt)) != REG
-          || GET_CODE (XEXP (SET_SRC (elt), 0)) != REG
-          || REGNO (XEXP (SET_SRC (elt), 0)) != REGNO (SET_DEST (elt))
-          || GET_CODE (XEXP (SET_SRC (elt), 1)) != CONST_INT
-          || INTVAL (XEXP (SET_SRC (elt), 1)) != (count - 2) * 4
-          || GET_CODE (XVECEXP (op, 0, count - 1)) != CLOBBER
-          || GET_CODE (XEXP (XVECEXP (op, 0, count - 1), 0)) != REG
-          || REGNO (XEXP (XVECEXP (op, 0, count - 1), 0))
-              != REGNO (SET_DEST (elt)))
-        return 0;
+         return add_cost;
+       }
 
-      count--;
-    }
+      return (((tune_flags & FL_FAST_MULT) ? 8 : 30)
+             + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4)
+             + (REG_OR_SUBREG_REG (XEXP (x, 1)) ? 0 : 4));
 
-  /* Perform a quick check so we don't blow up below.  */
-  if (count <= i
-      || GET_CODE (XVECEXP (op, 0, i - 1)) != SET
-      || GET_CODE (SET_DEST (XVECEXP (op, 0, i - 1))) != REG
-      || GET_CODE (SET_SRC (XVECEXP (op, 0, i - 1))) != MEM)
-    return 0;
+    case TRUNCATE:
+      if (arm_fast_multiply && mode == SImode
+         && GET_CODE (XEXP (x, 0)) == LSHIFTRT
+         && GET_CODE (XEXP (XEXP (x, 0), 0)) == MULT
+         && (GET_CODE (XEXP (XEXP (XEXP (x, 0), 0), 0))
+             == GET_CODE (XEXP (XEXP (XEXP (x, 0), 0), 1)))
+         && (GET_CODE (XEXP (XEXP (XEXP (x, 0), 0), 0)) == ZERO_EXTEND
+             || GET_CODE (XEXP (XEXP (XEXP (x, 0), 0), 0)) == SIGN_EXTEND))
+       return 8;
+      return 99;
 
-  dest_regno = REGNO (SET_DEST (XVECEXP (op, 0, i - 1)));
-  src_addr = XEXP (SET_SRC (XVECEXP (op, 0, i - 1)), 0);
+    case NEG:
+      if (GET_MODE_CLASS (mode) == MODE_FLOAT)
+       return 4 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 6);
+      /* Fall through */
+    case NOT:
+      if (mode == DImode)
+       return 4 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4);
 
-  for (; i < count; i++)
-    {
-      rtx elt = XVECEXP (op, 0, i);
+      return 1 + (REG_OR_SUBREG_REG (XEXP (x, 0)) ? 0 : 4);
 
-      if (GET_CODE (elt) != SET
-          || GET_CODE (SET_DEST (elt)) != REG
-          || GET_MODE (SET_DEST (elt)) != SImode
-          || REGNO (SET_DEST (elt)) != dest_regno + i - base
-          || GET_CODE (SET_SRC (elt)) != MEM
-          || GET_MODE (SET_SRC (elt)) != SImode
-          || GET_CODE (XEXP (SET_SRC (elt), 0)) != PLUS
-          || ! rtx_equal_p (XEXP (XEXP (SET_SRC (elt), 0), 0), src_addr)
-          || GET_CODE (XEXP (XEXP (SET_SRC (elt), 0), 1)) != CONST_INT
-          || INTVAL (XEXP (XEXP (SET_SRC (elt), 0), 1)) != (i - base) * 4)
-        return 0;
-    }
+    case IF_THEN_ELSE:
+      if (GET_CODE (XEXP (x, 1)) == PC || GET_CODE (XEXP (x, 2)) == PC)
+       return 14;
+      return 2;
 
-  return 1;
-}
+    case COMPARE:
+      return 1;
 
-/* Return 1 if OP is a store multiple operation.  It is known to be
-   parallel and the first section will be tested. */
+    case ABS:
+      return 4 + (mode == DImode ? 4 : 0);
+
+    case SIGN_EXTEND:
+      if (GET_MODE (XEXP (x, 0)) == QImode)
+       return (4 + (mode == DImode ? 4 : 0)
+               + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+      /* Fall through */
+    case ZERO_EXTEND:
+      switch (GET_MODE (XEXP (x, 0)))
+       {
+       case QImode:
+         return (1 + (mode == DImode ? 4 : 0)
+                 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+
+       case HImode:
+         return (4 + (mode == DImode ? 4 : 0)
+                 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+
+       case SImode:
+         return (1 + (GET_CODE (XEXP (x, 0)) == MEM ? 10 : 0));
+
+       default:
+         break;
+       }
+      abort ();
+
+    case CONST_INT:                                            
+      if (const_ok_for_arm (INTVAL (x)))                       
+       return outer == SET ? 2 : -1;                   
+      else if (outer == AND                            
+              && const_ok_for_arm (~ INTVAL (x)))              
+       return -1;                                              
+      else if ((outer == COMPARE                       
+               || outer == PLUS || outer == MINUS)     
+              && const_ok_for_arm (- INTVAL (x)))              
+       return -1;                                              
+      else                                                     
+       return 5;
+      
+    case CONST:                                                        
+    case LABEL_REF:                                            
+    case SYMBOL_REF:                                           
+      return 6;
+      
+    case CONST_DOUBLE:                                         
+      if (const_double_rtx_ok_for_fpu (x))                     
+       return outer == SET ? 2 : -1;                   
+      else if ((outer == COMPARE || outer == PLUS)     
+              && neg_const_double_rtx_ok_for_fpu (x))          
+       return -1;                                              
+      return 7;
+      
+    default:
+      return 99;
+    }
+}
 
 int
-store_multiple_operation (op, mode)
-     rtx op;
-     enum machine_mode mode;
+arm_adjust_cost (insn, link, dep, cost)
+     rtx insn;
+     rtx link;
+     rtx dep;
+     int cost;
 {
-  HOST_WIDE_INT count = XVECLEN (op, 0);
-  int src_regno;
-  rtx dest_addr;
-  HOST_WIDE_INT i = 1, base = 0;
-  rtx elt;
+  rtx i_pat, d_pat;
 
-  if (count <= 1
-      || GET_CODE (XVECEXP (op, 0, 0)) != SET)
+  /* XXX This is not strictly true for the FPA.  */
+  if (REG_NOTE_KIND (link) == REG_DEP_ANTI
+      || REG_NOTE_KIND (link) == REG_DEP_OUTPUT)
     return 0;
 
-  /* Check to see if this might be a write-back */
-  if (GET_CODE (SET_SRC (elt = XVECEXP (op, 0, 0))) == PLUS)
+  /* Call insns don't incur a stall, even if they follow a load.  */
+  if (REG_NOTE_KIND (link) == 0
+      && GET_CODE (insn) == CALL_INSN)
+    return 1;
+
+  if ((i_pat = single_set (insn)) != NULL
+      && GET_CODE (SET_SRC (i_pat)) == MEM
+      && (d_pat = single_set (dep)) != NULL
+      && GET_CODE (SET_DEST (d_pat)) == MEM)
     {
-      i++;
-      base = 1;
+      /* This is a load after a store, there is no conflict if the load reads
+        from a cached area.  Assume that loads from the stack, and from the
+        constant pool are cached, and that others will miss.  This is a 
+        hack.  */
+      
+      if (CONSTANT_POOL_ADDRESS_P (XEXP (SET_SRC (i_pat), 0))
+         || reg_mentioned_p (stack_pointer_rtx, XEXP (SET_SRC (i_pat), 0))
+         || reg_mentioned_p (frame_pointer_rtx, XEXP (SET_SRC (i_pat), 0))
+         || reg_mentioned_p (hard_frame_pointer_rtx, 
+                             XEXP (SET_SRC (i_pat), 0)))
+       return 1;
+    }
 
-      /* Now check it more carefully */
-      if (GET_CODE (SET_DEST (elt)) != REG
-          || GET_CODE (XEXP (SET_SRC (elt), 0)) != REG
-          || REGNO (XEXP (SET_SRC (elt), 0)) != REGNO (SET_DEST (elt))
-          || GET_CODE (XEXP (SET_SRC (elt), 1)) != CONST_INT
-          || INTVAL (XEXP (SET_SRC (elt), 1)) != (count - 2) * 4
-          || GET_CODE (XVECEXP (op, 0, count - 1)) != CLOBBER
-          || GET_CODE (XEXP (XVECEXP (op, 0, count - 1), 0)) != REG
-          || REGNO (XEXP (XVECEXP (op, 0, count - 1), 0))
-              != REGNO (SET_DEST (elt)))
-        return 0;
+  return cost;
+}
 
-      count--;
-    }
+/* This code has been fixed for cross compilation.  */
 
-  /* Perform a quick check so we don't blow up below.  */
-  if (count <= i
-      || GET_CODE (XVECEXP (op, 0, i - 1)) != SET
-      || GET_CODE (SET_DEST (XVECEXP (op, 0, i - 1))) != MEM
-      || GET_CODE (SET_SRC (XVECEXP (op, 0, i - 1))) != REG)
-    return 0;
+static int fpa_consts_inited = 0;
 
-  src_regno = REGNO (SET_SRC (XVECEXP (op, 0, i - 1)));
-  dest_addr = XEXP (SET_DEST (XVECEXP (op, 0, i - 1)), 0);
+char * strings_fpa[8] =
+{
+  "0",   "1",   "2",   "3",
+  "4",   "5",   "0.5", "10"
+};
 
-  for (; i < count; i++)
-    {
-      elt = XVECEXP (op, 0, i);
+static REAL_VALUE_TYPE values_fpa[8];
 
-      if (GET_CODE (elt) != SET
-          || GET_CODE (SET_SRC (elt)) != REG
-          || GET_MODE (SET_SRC (elt)) != SImode
-          || REGNO (SET_SRC (elt)) != src_regno + i - base
-          || GET_CODE (SET_DEST (elt)) != MEM
-          || GET_MODE (SET_DEST (elt)) != SImode
-          || GET_CODE (XEXP (SET_DEST (elt), 0)) != PLUS
-          || ! rtx_equal_p (XEXP (XEXP (SET_DEST (elt), 0), 0), dest_addr)
-          || GET_CODE (XEXP (XEXP (SET_DEST (elt), 0), 1)) != CONST_INT
-          || INTVAL (XEXP (XEXP (SET_DEST (elt), 0), 1)) != (i - base) * 4)
-        return 0;
+static void
+init_fpa_table ()
+{
+  int i;
+  REAL_VALUE_TYPE r;
+
+  for (i = 0; i < 8; i++)
+    {
+      r = REAL_VALUE_ATOF (strings_fpa[i], DFmode);
+      values_fpa[i] = r;
     }
 
-  return 1;
+  fpa_consts_inited = 1;
 }
 
+/* Return TRUE if rtx X is a valid immediate FPU constant.  */
+
 int
-load_multiple_sequence (operands, nops, regs, base, load_offset)
-     rtx *operands;
-     int nops;
-     int *regs;
-     int *base;
-     HOST_WIDE_INT *load_offset;
+const_double_rtx_ok_for_fpu (x)
+     rtx x;
 {
-  int unsorted_regs[4];
-  HOST_WIDE_INT unsorted_offsets[4];
-  int order[4];
-  int base_reg;
+  REAL_VALUE_TYPE r;
   int i;
+  
+  if (!fpa_consts_inited)
+    init_fpa_table ();
+  
+  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
+  if (REAL_VALUE_MINUS_ZERO (r))
+    return 0;
 
-  /* Can only handle 2, 3, or 4 insns at present, though could be easily
-     extended if required.  */
-  if (nops < 2 || nops > 4)
-    abort ();
+  for (i = 0; i < 8; i++)
+    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
+      return 1;
 
-  /* Loop over the operands and check that the memory references are
-     suitable (ie immediate offsets from the same base register).  At
-     the same time, extract the target register, and the memory
-     offsets.  */
-  for (i = 0; i < nops; i++)
-    {
-      rtx reg;
-      rtx offset;
+  return 0;
+}
 
-      if (GET_CODE (operands[nops + i]) != MEM)
-       abort ();
+/* Return TRUE if rtx X is a valid immediate FPU constant.  */
 
-      /* Don't reorder volatile memory references; it doesn't seem worth
-        looking for the case where the order is ok anyway.  */
-      if (MEM_VOLATILE_P (operands[nops + i]))
-       return 0;
+int
+neg_const_double_rtx_ok_for_fpu (x)
+     rtx x;
+{
+  REAL_VALUE_TYPE r;
+  int i;
+  
+  if (!fpa_consts_inited)
+    init_fpa_table ();
+  
+  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
+  r = REAL_VALUE_NEGATE (r);
+  if (REAL_VALUE_MINUS_ZERO (r))
+    return 0;
 
-      offset = const0_rtx;
+  for (i = 0; i < 8; i++)
+    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
+      return 1;
 
-      if ((GET_CODE (reg = XEXP (operands[nops + i], 0)) == REG
-          || (GET_CODE (reg) == SUBREG
-              && GET_CODE (reg = SUBREG_REG (reg)) == REG))
-         || (GET_CODE (XEXP (operands[nops + i], 0)) == PLUS
-             && ((GET_CODE (reg = XEXP (XEXP (operands[nops + i], 0), 0))
-                  == REG)
-                 || (GET_CODE (reg) == SUBREG
-                     && GET_CODE (reg = SUBREG_REG (reg)) == REG))
-             && (GET_CODE (offset = XEXP (XEXP (operands[nops + i], 0), 1))
-                 == CONST_INT)))
-       {
-         if (i == 0)
-           {
-             base_reg = REGNO(reg);
-             unsorted_regs[0] = (GET_CODE (operands[i]) == REG
-                                 ? REGNO (operands[i])
-                                 : REGNO (SUBREG_REG (operands[i])));
-             order[0] = 0;
-           }
-         else 
-           {
-             if (base_reg != REGNO (reg))
-               /* Not addressed from the same base register.  */
-               return 0;
+  return 0;
+}
+\f
+/* Predicates for `match_operand' and `match_operator'.  */
 
-             unsorted_regs[i] = (GET_CODE (operands[i]) == REG
-                                 ? REGNO (operands[i])
-                                 : REGNO (SUBREG_REG (operands[i])));
-             if (unsorted_regs[i] < unsorted_regs[order[0]])
-               order[0] = i;
-           }
+/* s_register_operand is the same as register_operand, but it doesn't accept
+   (SUBREG (MEM)...).
 
-         /* If it isn't an integer register, or if it overwrites the
-            base register but isn't the last insn in the list, then
-            we can't do this.  */
-         if (unsorted_regs[i] < 0 || unsorted_regs[i] > 14
-             || (i != nops - 1 && unsorted_regs[i] == base_reg))
-           return 0;
+   This function exists because at the time it was put in it led to better
+   code.  SUBREG(MEM) always needs a reload in the places where
+   s_register_operand is used, and this seemed to lead to excessive
+   reloading.  */
 
-         unsorted_offsets[i] = INTVAL (offset);
-       }
-      else
-       /* Not a suitable memory address.  */
-       return 0;
-    }
+int
+s_register_operand (op, mode)
+     register rtx op;
+     enum machine_mode mode;
+{
+  if (GET_MODE (op) != mode && mode != VOIDmode)
+    return 0;
 
-  /* All the useful information has now been extracted from the
-     operands into unsorted_regs and unsorted_offsets; additionally,
-     order[0] has been set to the lowest numbered register in the
-     list.  Sort the registers into order, and check that the memory
-     offsets are ascending and adjacent.  */
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-  for (i = 1; i < nops; i++)
-    {
-      int j;
+  /* We don't consider registers whose class is NO_REGS
+     to be a register operand.  */
+  /* XXX might have to check for lo regs only for thumb ??? */
+  return (GET_CODE (op) == REG
+         && (REGNO (op) >= FIRST_PSEUDO_REGISTER
+             || REGNO_REG_CLASS (REGNO (op)) != NO_REGS));
+}
 
-      order[i] = order[i - 1];
-      for (j = 0; j < nops; j++)
-       if (unsorted_regs[j] > unsorted_regs[order[i - 1]]
-           && (order[i] == order[i - 1]
-               || unsorted_regs[j] < unsorted_regs[order[i]]))
-         order[i] = j;
+/* Only accept reg, subreg(reg), const_int.  */
 
-      /* Have we found a suitable register? if not, one must be used more
-        than once.  */
-      if (order[i] == order[i - 1])
-       return 0;
+int
+reg_or_int_operand (op, mode)
+     register rtx op;
+     enum machine_mode mode;
+{
+  if (GET_CODE (op) == CONST_INT)
+    return 1;
 
-      /* Is the memory address adjacent and ascending? */
-      if (unsorted_offsets[order[i]] != unsorted_offsets[order[i - 1]] + 4)
-       return 0;
-    }
+  if (GET_MODE (op) != mode && mode != VOIDmode)
+    return 0;
 
-  if (base)
-    {
-      *base = base_reg;
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-      for (i = 0; i < nops; i++)
-       regs[i] = unsorted_regs[order[i]];
+  /* We don't consider registers whose class is NO_REGS
+     to be a register operand.  */
+  return (GET_CODE (op) == REG
+         && (REGNO (op) >= FIRST_PSEUDO_REGISTER
+             || REGNO_REG_CLASS (REGNO (op)) != NO_REGS));
+}
 
-      *load_offset = unsorted_offsets[order[0]];
-    }
+/* Return 1 if OP is an item in memory, given that we are in reload.  */
 
-  if (unsorted_offsets[order[0]] == 0)
-    return 1; /* ldmia */
+int
+arm_reload_memory_operand (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+{
+  int regno = true_regnum (op);
 
-  if (unsorted_offsets[order[0]] == 4)
-    return 2; /* ldmib */
+  return (! CONSTANT_P (op)
+         && (regno == -1
+             || (GET_CODE (op) == REG
+                 && REGNO (op) >= FIRST_PSEUDO_REGISTER)));
+}
 
-  if (unsorted_offsets[order[nops - 1]] == 0)
-    return 3; /* ldmda */
+/* Return 1 if OP is a valid memory address, but not valid for a signed byte
+   memory access (architecture V4).
+   MODE is QImode if called when computing contraints, or VOIDmode when
+   emitting patterns.  In this latter case we cannot use memory_operand()
+   because it will fail on badly formed MEMs, which is precisly what we are
+   trying to catch.  */
+int
+bad_signed_byte_operand (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+{
+#if 0
+  if ((mode == QImode && ! memory_operand (op, mode)) || GET_CODE (op) != MEM)
+    return 0;
+#endif
+  if (GET_CODE (op) != MEM)
+    return 0;
 
-  if (unsorted_offsets[order[nops - 1]] == -4)
-    return 4; /* ldmdb */
+  op = XEXP (op, 0);
 
-  /* Can't do it without setting up the offset, only do this if it takes
-     no more than one insn.  */
-  return (const_ok_for_arm (unsorted_offsets[order[0]]) 
-         || const_ok_for_arm (-unsorted_offsets[order[0]])) ? 5 : 0;
-}
+  /* A sum of anything more complex than reg + reg or reg + const is bad.  */
+  if ((GET_CODE (op) == PLUS || GET_CODE (op) == MINUS)
+      && (! s_register_operand (XEXP (op, 0), VOIDmode)
+         || (! s_register_operand (XEXP (op, 1), VOIDmode)
+             && GET_CODE (XEXP (op, 1)) != CONST_INT)))
+    return 1;
 
-char *
-emit_ldm_seq (operands, nops)
-     rtx *operands;
-     int nops;
-{
-  int regs[4];
-  int base_reg;
-  HOST_WIDE_INT offset;
-  char buf[100];
-  int i;
+  /* Big constants are also bad.  */
+  if (GET_CODE (op) == PLUS && GET_CODE (XEXP (op, 1)) == CONST_INT
+      && (INTVAL (XEXP (op, 1)) > 0xff
+         || -INTVAL (XEXP (op, 1)) > 0xff))
+    return 1;
 
-  switch (load_multiple_sequence (operands, nops, regs, &base_reg, &offset))
-    {
-    case 1:
-      strcpy (buf, "ldm%?ia\t");
-      break;
+  /* Everything else is good, or can will automatically be made so.  */
+  return 0;
+}
 
-    case 2:
-      strcpy (buf, "ldm%?ib\t");
-      break;
+/* Return TRUE for valid operands for the rhs of an ARM instruction.  */
 
-    case 3:
-      strcpy (buf, "ldm%?da\t");
-      break;
+int
+arm_rhs_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  return (s_register_operand (op, mode)
+         || (GET_CODE (op) == CONST_INT && const_ok_for_arm (INTVAL (op))));
+}
 
-    case 4:
-      strcpy (buf, "ldm%?db\t");
-      break;
+/* Return TRUE for valid operands for the rhs of an ARM instruction, or a load.
+ */
 
-    case 5:
-      if (offset >= 0)
-       sprintf (buf, "add%%?\t%s%s, %s%s, #%ld", REGISTER_PREFIX,
-                reg_names[regs[0]], REGISTER_PREFIX, reg_names[base_reg],
-                (long) offset);
-      else
-       sprintf (buf, "sub%%?\t%s%s, %s%s, #%ld", REGISTER_PREFIX,
-                reg_names[regs[0]], REGISTER_PREFIX, reg_names[base_reg],
-                (long) -offset);
-      output_asm_insn (buf, operands);
-      base_reg = regs[0];
-      strcpy (buf, "ldm%?ia\t");
-      break;
+int
+arm_rhsm_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  return (s_register_operand (op, mode)
+         || (GET_CODE (op) == CONST_INT && const_ok_for_arm (INTVAL (op)))
+         || memory_operand (op, mode));
+}
 
-    default:
-      abort ();
-    }
+/* Return TRUE for valid operands for the rhs of an ARM instruction, or if a
+   constant that is valid when negated.  */
 
-  sprintf (buf + strlen (buf), "%s%s, {%s%s", REGISTER_PREFIX, 
-          reg_names[base_reg], REGISTER_PREFIX, reg_names[regs[0]]);
+int
+arm_add_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  if (TARGET_THUMB)
+    return thumb_cmp_operand (op, mode);
+  
+  return (s_register_operand (op, mode)
+         || (GET_CODE (op) == CONST_INT
+             && (const_ok_for_arm (INTVAL (op))
+                 || const_ok_for_arm (-INTVAL (op)))));
+}
 
-  for (i = 1; i < nops; i++)
-    sprintf (buf + strlen (buf), ", %s%s", REGISTER_PREFIX,
-            reg_names[regs[i]]);
+int
+arm_not_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  return (s_register_operand (op, mode)
+         || (GET_CODE (op) == CONST_INT
+             && (const_ok_for_arm (INTVAL (op))
+                 || const_ok_for_arm (~INTVAL (op)))));
+}
 
-  strcat (buf, "}\t%@ phole ldm");
+/* Return TRUE if the operand is a memory reference which contains an
+   offsettable address.  */
+int
+offsettable_memory_operand (op, mode)
+     register rtx op;
+     enum machine_mode mode;
+{
+  if (mode == VOIDmode)
+    mode = GET_MODE (op);
 
-  output_asm_insn (buf, operands);
-  return "";
+  return (mode == GET_MODE (op)
+         && GET_CODE (op) == MEM
+         && offsettable_address_p (reload_completed | reload_in_progress,
+                                   mode, XEXP (op, 0)));
 }
 
+/* Return TRUE if the operand is a memory reference which is, or can be
+   made word aligned by adjusting the offset.  */
 int
-store_multiple_sequence (operands, nops, regs, base, load_offset)
-     rtx *operands;
-     int nops;
-     int *regs;
-     int *base;
-     HOST_WIDE_INT *load_offset;
+alignable_memory_operand (op, mode)
+     register rtx op;
+     enum machine_mode mode;
 {
-  int unsorted_regs[4];
-  HOST_WIDE_INT unsorted_offsets[4];
-  int order[4];
-  int base_reg;
-  int i;
+  rtx reg;
 
-  /* Can only handle 2, 3, or 4 insns at present, though could be easily
-     extended if required.  */
-  if (nops < 2 || nops > 4)
-    abort ();
+  if (mode == VOIDmode)
+    mode = GET_MODE (op);
 
-  /* Loop over the operands and check that the memory references are
-     suitable (ie immediate offsets from the same base register).  At
-     the same time, extract the target register, and the memory
-     offsets.  */
-  for (i = 0; i < nops; i++)
-    {
-      rtx reg;
-      rtx offset;
+  if (mode != GET_MODE (op) || GET_CODE (op) != MEM)
+    return 0;
 
-      if (GET_CODE (operands[nops + i]) != MEM)
-       abort ();
+  op = XEXP (op, 0);
 
-      /* Don't reorder volatile memory references; it doesn't seem worth
-        looking for the case where the order is ok anyway.  */
-      if (MEM_VOLATILE_P (operands[nops + i]))
-       return 0;
+  return ((GET_CODE (reg = op) == REG
+          || (GET_CODE (op) == SUBREG
+              && GET_CODE (reg = SUBREG_REG (op)) == REG)
+          || (GET_CODE (op) == PLUS
+              && GET_CODE (XEXP (op, 1)) == CONST_INT
+              && (GET_CODE (reg = XEXP (op, 0)) == REG
+                  || (GET_CODE (XEXP (op, 0)) == SUBREG
+                      && GET_CODE (reg = SUBREG_REG (XEXP (op, 0))) == REG))))
+         && REGNO_POINTER_ALIGN (REGNO (reg)) >= 32);
+}
 
-      offset = const0_rtx;
+/* Similar to s_register_operand, but does not allow hard integer 
+   registers.  */
+int
+f_register_operand (op, mode)
+     register rtx op;
+     enum machine_mode mode;
+{
+  if (GET_MODE (op) != mode && mode != VOIDmode)
+    return 0;
 
-      if ((GET_CODE (reg = XEXP (operands[nops + i], 0)) == REG
-          || (GET_CODE (reg) == SUBREG
-              && GET_CODE (reg = SUBREG_REG (reg)) == REG))
-         || (GET_CODE (XEXP (operands[nops + i], 0)) == PLUS
-             && ((GET_CODE (reg = XEXP (XEXP (operands[nops + i], 0), 0))
-                  == REG)
-                 || (GET_CODE (reg) == SUBREG
-                     && GET_CODE (reg = SUBREG_REG (reg)) == REG))
-             && (GET_CODE (offset = XEXP (XEXP (operands[nops + i], 0), 1))
-                 == CONST_INT)))
-       {
-         if (i == 0)
-           {
-             base_reg = REGNO(reg);
-             unsorted_regs[0] = (GET_CODE (operands[i]) == REG
-                                 ? REGNO (operands[i])
-                                 : REGNO (SUBREG_REG (operands[i])));
-             order[0] = 0;
-           }
-         else 
-           {
-             if (base_reg != REGNO (reg))
-               /* Not addressed from the same base register.  */
-               return 0;
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-             unsorted_regs[i] = (GET_CODE (operands[i]) == REG
-                                 ? REGNO (operands[i])
-                                 : REGNO (SUBREG_REG (operands[i])));
-             if (unsorted_regs[i] < unsorted_regs[order[0]])
-               order[0] = i;
-           }
+  /* We don't consider registers whose class is NO_REGS
+     to be a register operand.  */
+  return (GET_CODE (op) == REG
+         && (REGNO (op) >= FIRST_PSEUDO_REGISTER
+             || REGNO_REG_CLASS (REGNO (op)) == FPU_REGS));
+}
 
-         /* If it isn't an integer register, then we can't do this.  */
-         if (unsorted_regs[i] < 0 || unsorted_regs[i] > 14)
-           return 0;
+/* Return TRUE for valid operands for the rhs of an FPU instruction.  */
 
-         unsorted_offsets[i] = INTVAL (offset);
-       }
-      else
-       /* Not a suitable memory address.  */
-       return 0;
-    }
+int
+fpu_rhs_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-  /* All the useful information has now been extracted from the
-     operands into unsorted_regs and unsorted_offsets; additionally,
-     order[0] has been set to the lowest numbered register in the
-     list.  Sort the registers into order, and check that the memory
-     offsets are ascending and adjacent.  */
+  if (GET_MODE (op) != mode && mode != VOIDmode)
+    return FALSE;
 
-  for (i = 1; i < nops; i++)
-    {
-      int j;
+  if (GET_CODE (op) == CONST_DOUBLE)
+    return const_double_rtx_ok_for_fpu (op);
 
-      order[i] = order[i - 1];
-      for (j = 0; j < nops; j++)
-       if (unsorted_regs[j] > unsorted_regs[order[i - 1]]
-           && (order[i] == order[i - 1]
-               || unsorted_regs[j] < unsorted_regs[order[i]]))
-         order[i] = j;
+  return FALSE;
+}
 
-      /* Have we found a suitable register? if not, one must be used more
-        than once.  */
-      if (order[i] == order[i - 1])
-       return 0;
+int
+fpu_add_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-      /* Is the memory address adjacent and ascending? */
-      if (unsorted_offsets[order[i]] != unsorted_offsets[order[i - 1]] + 4)
-       return 0;
-    }
+  if (GET_MODE (op) != mode && mode != VOIDmode)
+    return FALSE;
 
-  if (base)
-    {
-      *base = base_reg;
+  if (GET_CODE (op) == CONST_DOUBLE)
+    return (const_double_rtx_ok_for_fpu (op) 
+           || neg_const_double_rtx_ok_for_fpu (op));
 
-      for (i = 0; i < nops; i++)
-       regs[i] = unsorted_regs[order[i]];
+  return FALSE;
+}
 
-      *load_offset = unsorted_offsets[order[0]];
-    }
+/* Return nonzero if OP is a constant power of two.  */
 
-  if (unsorted_offsets[order[0]] == 0)
-    return 1; /* stmia */
-
-  if (unsorted_offsets[order[0]] == 4)
-    return 2; /* stmib */
-
-  if (unsorted_offsets[order[nops - 1]] == 0)
-    return 3; /* stmda */
-
-  if (unsorted_offsets[order[nops - 1]] == -4)
-    return 4; /* stmdb */
-
-  return 0;
+int
+power_of_two_operand (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+{
+  if (GET_CODE (op) == CONST_INT)
+    {
+      HOST_WIDE_INT value = INTVAL (op);
+      return value != 0  &&  (value & (value - 1)) == 0;
+    }
+  return FALSE;
 }
 
-char *
-emit_stm_seq (operands, nops)
-     rtx *operands;
-     int nops;
+/* Return TRUE for a valid operand of a DImode operation.
+   Either: REG, SUBREG, CONST_DOUBLE or MEM(DImode_address).
+   Note that this disallows MEM(REG+REG), but allows
+   MEM(PRE/POST_INC/DEC(REG)).  */
+
+int
+di_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
 {
-  int regs[4];
-  int base_reg;
-  HOST_WIDE_INT offset;
-  char buf[100];
-  int i;
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-  switch (store_multiple_sequence (operands, nops, regs, &base_reg, &offset))
-    {
-    case 1:
-      strcpy (buf, "stm%?ia\t");
-      break;
+  if (mode != VOIDmode && GET_MODE (op) != VOIDmode && GET_MODE (op) != DImode)
+    return FALSE;
 
-    case 2:
-      strcpy (buf, "stm%?ib\t");
-      break;
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-    case 3:
-      strcpy (buf, "stm%?da\t");
-      break;
+  switch (GET_CODE (op))
+    {
+    case CONST_DOUBLE:
+    case CONST_INT:
+      return TRUE;
 
-    case 4:
-      strcpy (buf, "stm%?db\t");
-      break;
+    case MEM:
+      return memory_address_p (DImode, XEXP (op, 0));
 
     default:
-      abort ();
+      return FALSE;
     }
+}
 
-  sprintf (buf + strlen (buf), "%s%s, {%s%s", REGISTER_PREFIX, 
-          reg_names[base_reg], REGISTER_PREFIX, reg_names[regs[0]]);
+/* Like di_operand, but don't accept constants.  */
+int
+nonimmediate_di_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-  for (i = 1; i < nops; i++)
-    sprintf (buf + strlen (buf), ", %s%s", REGISTER_PREFIX,
-            reg_names[regs[i]]);
+  if (mode != VOIDmode && GET_MODE (op) != VOIDmode && GET_MODE (op) != DImode)
+    return FALSE;
 
-  strcat (buf, "}\t%@ phole stm");
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-  output_asm_insn (buf, operands);
-  return "";
+  if (GET_CODE (op) == MEM)
+    return memory_address_p (DImode, XEXP (op, 0));
+
+  return FALSE;
 }
 
+/* Return TRUE for a valid operand of a DFmode operation when -msoft-float.
+   Either: REG, SUBREG, CONST_DOUBLE or MEM(DImode_address).
+   Note that this disallows MEM(REG+REG), but allows
+   MEM(PRE/POST_INC/DEC(REG)).  */
+
 int
-multi_register_push (op, mode)
+soft_df_operand (op, mode)
      rtx op;
      enum machine_mode mode;
 {
-  if (GET_CODE (op) != PARALLEL
-      || (GET_CODE (XVECEXP (op, 0, 0)) != SET)
-      || (GET_CODE (SET_SRC (XVECEXP (op, 0, 0))) != UNSPEC)
-      || (XINT (SET_SRC (XVECEXP (op, 0, 0)), 1) != 2))
-    return 0;
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-  return 1;
-}
+  if (mode != VOIDmode && GET_MODE (op) != mode)
+    return FALSE;
 
-\f
-/* Routines for use with attributes */
+  if (GET_CODE (op) == SUBREG && CONSTANT_P (SUBREG_REG (op)))
+    return FALSE;
+  
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
+  
+  switch (GET_CODE (op))
+    {
+    case CONST_DOUBLE:
+      return TRUE;
+
+    case MEM:
+      return memory_address_p (DFmode, XEXP (op, 0));
+
+    default:
+      return FALSE;
+    }
+}
 
+/* Like soft_df_operand, but don't accept constants.  */
 int
-const_pool_offset (symbol)
-     rtx symbol;
+nonimmediate_soft_df_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
 {
-  return get_pool_offset (symbol) - get_pool_size () - get_prologue_size ();
-}
+  if (s_register_operand (op, mode))
+    return TRUE;
 
-/* Return nonzero if ATTR is a valid attribute for DECL.
-   ATTRIBUTES are any existing attributes and ARGS are the arguments
-   supplied with ATTR.
+  if (mode != VOIDmode && GET_MODE (op) != mode)
+    return FALSE;
 
-   Supported attributes:
+  if (GET_CODE (op) == SUBREG)
+    op = SUBREG_REG (op);
 
-   naked: don't output any prologue or epilogue code, the user is assumed
-   to do the right thing.  */
+  if (GET_CODE (op) == MEM)
+    return memory_address_p (DFmode, XEXP (op, 0));
+  return FALSE;
+}
 
+/* Return TRUE for valid index operands.  */
 int
-arm_valid_machine_decl_attribute (decl, attributes, attr, args)
-     tree decl;
-     tree attributes;
-     tree attr;
-     tree args;
+index_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
 {
-  if (args != NULL_TREE)
-    return 0;
-
-  if (is_attribute_p ("naked", attr))
-    return TREE_CODE (decl) == FUNCTION_DECL;
-  return 0;
+  return (s_register_operand (op, mode)
+         || (immediate_operand (op, mode)
+             && (GET_CODE (op) != CONST_INT
+                 || (INTVAL (op) < 4096 && INTVAL (op) > -4096))));
 }
 
-/* Return non-zero if FUNC is a naked function.  */
+/* Return TRUE for valid shifts by a constant. This also accepts any
+   power of two on the (somewhat overly relaxed) assumption that the
+   shift operator in this case was a mult.  */
 
-static int
-arm_naked_function_p (func)
-     tree func;
+int
+const_shift_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
 {
-  tree a;
-
-  if (TREE_CODE (func) != FUNCTION_DECL)
-    abort ();
-
-  a = lookup_attribute ("naked", DECL_MACHINE_ATTRIBUTES (func));
-  return a != NULL_TREE;
+  return (power_of_two_operand (op, mode)
+         || (immediate_operand (op, mode)
+             && (GET_CODE (op) != CONST_INT
+                 || (INTVAL (op) < 32 && INTVAL (op) > 0))));
 }
-\f
-/* Routines for use in generating RTL */
 
-rtx
-arm_gen_load_multiple (base_regno, count, from, up, write_back)
-     int base_regno;
-     int count;
-     rtx from;
-     int up;
-     int write_back;
-{
-  int i = 0, j;
-  rtx result;
-  int sign = up ? 1 : -1;
+/* Return TRUE for arithmetic operators which can be combined with a multiply
+   (shift).  */
 
-  result = gen_rtx (PARALLEL, VOIDmode,
-                    rtvec_alloc (count + (write_back ? 2 : 0)));
-  if (write_back)
+int
+shiftable_operator (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  if (GET_MODE (x) != mode)
+    return FALSE;
+  else
     {
-      XVECEXP (result, 0, 0)
-       = gen_rtx (SET, GET_MODE (from), from,
-                  plus_constant (from, count * 4 * sign));
-      i = 1;
-      count++;
-    }
+      enum rtx_code code = GET_CODE (x);
 
-  for (j = 0; i < count; i++, j++)
-    {
-      XVECEXP (result, 0, i)
-       = gen_rtx (SET, VOIDmode, gen_rtx (REG, SImode, base_regno + j),
-                  gen_rtx (MEM, SImode,
-                           plus_constant (from, j * 4 * sign)));
+      return (code == PLUS || code == MINUS
+             || code == IOR || code == XOR || code == AND);
     }
-
-  if (write_back)
-    XVECEXP (result, 0, i) = gen_rtx (CLOBBER, SImode, from);
-
-  return result;
 }
 
-rtx
-arm_gen_store_multiple (base_regno, count, to, up, write_back)
-     int base_regno;
-     int count;
-     rtx to;
-     int up;
-     int write_back;
-{
-  int i = 0, j;
-  rtx result;
-  int sign = up ? 1 : -1;
+/* Return TRUE for binary logical operators.  */
 
-  result = gen_rtx (PARALLEL, VOIDmode,
-                    rtvec_alloc (count + (write_back ? 2 : 0)));
-  if (write_back)
+int
+logical_binary_operator (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  if (GET_MODE (x) != mode)
+    return FALSE;
+  else
     {
-      XVECEXP (result, 0, 0)
-       = gen_rtx (SET, GET_MODE (to), to,
-                  plus_constant (to, count * 4 * sign));
-      i = 1;
-      count++;
+      enum rtx_code code = GET_CODE (x);
+
+      return (code == IOR || code == XOR || code == AND);
     }
+}
 
-  for (j = 0; i < count; i++, j++)
+/* Return TRUE for shift operators.  */
+
+int
+shift_operator (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  if (GET_MODE (x) != mode)
+    return FALSE;
+  else
     {
-      XVECEXP (result, 0, i)
-       = gen_rtx (SET, VOIDmode,
-                  gen_rtx (MEM, SImode, plus_constant (to, j * 4 * sign)),
-                  gen_rtx (REG, SImode, base_regno + j));
-    }
+      enum rtx_code code = GET_CODE (x);
 
-  if (write_back)
-    XVECEXP (result, 0, i) = gen_rtx (CLOBBER, SImode, to);
+      if (code == MULT)
+       return power_of_two_operand (XEXP (x, 1), mode);
 
-  return result;
+      return (code == ASHIFT || code == ASHIFTRT || code == LSHIFTRT
+             || code == ROTATERT);
+    }
 }
 
+/* Return TRUE if x is EQ or NE.  */
 int
-arm_gen_movstrqi (operands)
-     rtx *operands;
+equality_operator (x, mode)
+     rtx x;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
-  HOST_WIDE_INT in_words_to_go, out_words_to_go, last_bytes;
-  int i, r;
-  rtx src, dst;
-  rtx st_src, st_dst, end_src, end_dst, fin_src, fin_dst;
-  rtx part_bytes_reg = NULL;
-  extern int optimize;
-
-  if (GET_CODE (operands[2]) != CONST_INT
-      || GET_CODE (operands[3]) != CONST_INT
-      || INTVAL (operands[2]) > 64
-      || INTVAL (operands[3]) & 3)
-    return 0;
+  return GET_CODE (x) == EQ || GET_CODE (x) == NE;
+}
 
-  st_dst = XEXP (operands[0], 0);
-  st_src = XEXP (operands[1], 0);
-  fin_dst = dst = copy_to_mode_reg (SImode, st_dst);
-  fin_src = src = copy_to_mode_reg (SImode, st_src);
+/* Return TRUE for SMIN SMAX UMIN UMAX operators.  */
+int
+minmax_operator (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  enum rtx_code code = GET_CODE (x);
 
-  in_words_to_go = (INTVAL (operands[2]) + 3) / 4;
-  out_words_to_go = INTVAL (operands[2]) / 4;
-  last_bytes = INTVAL (operands[2]) & 3;
+  if (GET_MODE (x) != mode)
+    return FALSE;
 
-  if (out_words_to_go != in_words_to_go && ((in_words_to_go - 1) & 3) != 0)
-    part_bytes_reg = gen_rtx (REG, SImode, (in_words_to_go - 1) & 3);
+  return code == SMIN || code == SMAX || code == UMIN || code == UMAX;
+}
 
-  for (i = 0; in_words_to_go >= 2; i+=4)
+/* Return TRUE if this is the condition code register, if we aren't given
+   a mode, accept any class CCmode register.  */
+int
+cc_register (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  if (mode == VOIDmode)
     {
-      emit_insn (arm_gen_load_multiple (0, (in_words_to_go > 4 
-                                           ? 4 : in_words_to_go),
-                                        src, TRUE, TRUE));
-      if (out_words_to_go)
-       {
-         if (out_words_to_go != 1)
-           emit_insn (arm_gen_store_multiple (0, (out_words_to_go > 4
-                                                  ? 4 : out_words_to_go),
-                                              dst, TRUE, TRUE));
-         else
-           {
-             emit_move_insn (gen_rtx (MEM, SImode, dst),
-                             gen_rtx (REG, SImode, 0));
-             emit_insn (gen_addsi3 (dst, dst, GEN_INT (4)));
-           }
-       }
-
-      in_words_to_go -= in_words_to_go < 4 ? in_words_to_go : 4;
-      out_words_to_go -= out_words_to_go < 4 ? out_words_to_go : 4;
+      mode = GET_MODE (x);
+      
+      if (GET_MODE_CLASS (mode) != MODE_CC)
+       return FALSE;
     }
 
-  /* OUT_WORDS_TO_GO will be zero here if there are byte stores to do.  */
-  if (out_words_to_go)
-  {
-    rtx sreg;
-
-    emit_move_insn (sreg = gen_reg_rtx (SImode), gen_rtx (MEM, SImode, src));
-    emit_move_insn (fin_src = gen_reg_rtx (SImode), plus_constant (src, 4));
-    emit_move_insn (gen_rtx (MEM, SImode, dst), sreg);
-    emit_move_insn (fin_dst = gen_reg_rtx (SImode), plus_constant (dst, 4));
-    in_words_to_go--;
+  if (   GET_MODE (x) == mode
+      && GET_CODE (x) == REG
+      && REGNO    (x) == CC_REGNUM)
+    return TRUE;
 
-    if (in_words_to_go)        /* Sanity check */
-      abort ();
-  }
+  return FALSE;
+}
 
-  if (in_words_to_go)
+/* Return TRUE if this is the condition code register, if we aren't given
+   a mode, accept any class CCmode register which indicates a dominance
+   expression.  */
+int
+dominant_cc_register (x, mode)
+     rtx x;
+     enum machine_mode mode;
+{
+  if (mode == VOIDmode)
     {
-      if (in_words_to_go < 0)
-       abort ();
-
-      part_bytes_reg = copy_to_mode_reg (SImode, gen_rtx (MEM, SImode, src));
-      emit_insn (gen_addsi3 (src, src, GEN_INT (4)));
+      mode = GET_MODE (x);
+      
+      if (GET_MODE_CLASS (mode) != MODE_CC)
+       return FALSE;
     }
 
-  if (BYTES_BIG_ENDIAN && last_bytes)
-    {
-      rtx tmp = gen_reg_rtx (SImode);
+  if (   mode != CC_DNEmode && mode != CC_DEQmode
+      && mode != CC_DLEmode && mode != CC_DLTmode
+      && mode != CC_DGEmode && mode != CC_DGTmode
+      && mode != CC_DLEUmode && mode != CC_DLTUmode
+      && mode != CC_DGEUmode && mode != CC_DGTUmode)
+    return FALSE;
 
-      if (part_bytes_reg == NULL)
-       abort ();
+  return cc_register (x, mode);
+}
 
-      /* The bytes we want are in the top end of the word */
-      emit_insn (gen_lshrsi3 (tmp, part_bytes_reg,
-                             GEN_INT (8 * (4 - last_bytes))));
-      part_bytes_reg = tmp;
-      
-      while (last_bytes)
-       {
-         emit_move_insn (gen_rtx (MEM, QImode, 
-                                  plus_constant (dst, last_bytes - 1)),
-                         gen_rtx (SUBREG, QImode, part_bytes_reg, 0));
-         if (--last_bytes)
-           {
-             tmp = gen_reg_rtx (SImode);
-             emit_insn (gen_lshrsi3 (tmp, part_bytes_reg, GEN_INT (8)));
-             part_bytes_reg = tmp;
-           }
-       }
-         
-    }
-  else
+/* Return TRUE if X references a SYMBOL_REF.  */
+int
+symbol_mentioned_p (x)
+     rtx x;
+{
+  register const char * fmt;
+  register int i;
+
+  if (GET_CODE (x) == SYMBOL_REF)
+    return 1;
+
+  fmt = GET_RTX_FORMAT (GET_CODE (x));
+  
+  for (i = GET_RTX_LENGTH (GET_CODE (x)) - 1; i >= 0; i--)
     {
-      while (last_bytes)
+      if (fmt[i] == 'E')
        {
-         if (part_bytes_reg == NULL)
-           abort ();
+         register int j;
 
-         emit_move_insn (gen_rtx (MEM, QImode, dst),
-                         gen_rtx (SUBREG, QImode, part_bytes_reg, 0));
-         emit_insn (gen_addsi3 (dst, dst, const1_rtx));
-         if (--last_bytes)
-           {
-             rtx tmp = gen_reg_rtx (SImode);
-             emit_insn (gen_lshrsi3 (tmp, part_bytes_reg, GEN_INT (8)));
-             part_bytes_reg = tmp;
-           }
+         for (j = XVECLEN (x, i) - 1; j >= 0; j--)
+           if (symbol_mentioned_p (XVECEXP (x, i, j)))
+             return 1;
        }
+      else if (fmt[i] == 'e' && symbol_mentioned_p (XEXP (x, i)))
+       return 1;
     }
 
-  return 1;
+  return 0;
 }
 
-/* Generate a memory reference for a half word, such that it will be loaded
-   into the top 16 bits of the word.  We can assume that the address is
-   known to be alignable and of the form reg, or plus (reg, const).  */
-rtx
-gen_rotated_half_load (memref)
-     rtx memref;
+/* Return TRUE if X references a LABEL_REF.  */
+int
+label_mentioned_p (x)
+     rtx x;
 {
-  HOST_WIDE_INT offset = 0;
-  rtx base = XEXP (memref, 0);
-
-  if (GET_CODE (base) == PLUS)
-    {
-      offset = INTVAL (XEXP (base, 1));
-      base = XEXP (base, 0);
-    }
+  register const char * fmt;
+  register int i;
 
-  /* If we aren't allowed to generate unalligned addresses, then fail.  */
-  if (TARGET_SHORT_BY_BYTES
-      && ((BYTES_BIG_ENDIAN ? 1 : 0) ^ ((offset & 2) == 0)))
-    return NULL;
+  if (GET_CODE (x) == LABEL_REF)
+    return 1;
 
-  base = gen_rtx (MEM, SImode, plus_constant (base, offset & ~2));
+  fmt = GET_RTX_FORMAT (GET_CODE (x));
+  for (i = GET_RTX_LENGTH (GET_CODE (x)) - 1; i >= 0; i--)
+    {
+      if (fmt[i] == 'E')
+       {
+         register int j;
 
-  if ((BYTES_BIG_ENDIAN ? 1 : 0) ^ ((offset & 2) == 2))
-    return base;
+         for (j = XVECLEN (x, i) - 1; j >= 0; j--)
+           if (label_mentioned_p (XVECEXP (x, i, j)))
+             return 1;
+       }
+      else if (fmt[i] == 'e' && label_mentioned_p (XEXP (x, i)))
+       return 1;
+    }
 
-  return gen_rtx (ROTATE, SImode, base, GEN_INT (16));
+  return 0;
 }
 
-static enum machine_mode
-select_dominance_cc_mode (op, x, y, cond_or)
-     enum rtx_code op;
+enum rtx_code
+minmax_code (x)
      rtx x;
-     rtx y;
-     HOST_WIDE_INT cond_or;
 {
-  enum rtx_code cond1, cond2;
-  int swapped = 0;
-
-  /* Currently we will probably get the wrong result if the individual
-     comparisons are not simple.  This also ensures that it is safe to
-     reverse a comparions if necessary.  */
-  if ((arm_select_cc_mode (cond1 = GET_CODE (x), XEXP (x, 0), XEXP (x, 1))
-       != CCmode)
-      || (arm_select_cc_mode (cond2 = GET_CODE (y), XEXP (y, 0), XEXP (y, 1))
-         != CCmode))
-    return CCmode;
+  enum rtx_code code = GET_CODE (x);
 
-  if (cond_or)
-    cond1 = reverse_condition (cond1);
+  if (code == SMAX)
+    return GE;
+  else if (code == SMIN)
+    return LE;
+  else if (code == UMIN)
+    return LEU;
+  else if (code == UMAX)
+    return GEU;
 
-  /* If the comparisons are not equal, and one doesn't dominate the other,
-     then we can't do this.  */
-  if (cond1 != cond2 
-      && ! comparison_dominates_p (cond1, cond2)
-      && (swapped = 1, ! comparison_dominates_p (cond2, cond1)))
-    return CCmode;
+  abort ();
+}
 
-  if (swapped)
+/* Return 1 if memory locations are adjacent.  */
+int
+adjacent_mem_locations (a, b)
+     rtx a, b;
+{
+  int val0 = 0, val1 = 0;
+  int reg0, reg1;
+  
+  if ((GET_CODE (XEXP (a, 0)) == REG
+       || (GET_CODE (XEXP (a, 0)) == PLUS
+          && GET_CODE (XEXP (XEXP (a, 0), 1)) == CONST_INT))
+      && (GET_CODE (XEXP (b, 0)) == REG
+         || (GET_CODE (XEXP (b, 0)) == PLUS
+             && GET_CODE (XEXP (XEXP (b, 0), 1)) == CONST_INT)))
     {
-      enum rtx_code temp = cond1;
-      cond1 = cond2;
-      cond2 = temp;
+      if (GET_CODE (XEXP (a, 0)) == PLUS)
+        {
+         reg0 = REGNO (XEXP (XEXP (a, 0), 0));
+         val0 = INTVAL (XEXP (XEXP (a, 0), 1));
+        }
+      else
+       reg0 = REGNO (XEXP (a, 0));
+      if (GET_CODE (XEXP (b, 0)) == PLUS)
+        {
+         reg1 = REGNO (XEXP (XEXP (b, 0), 0));
+         val1 = INTVAL (XEXP (XEXP (b, 0), 1));
+        }
+      else
+       reg1 = REGNO (XEXP (b, 0));
+      return (reg0 == reg1) && ((val1 - val0) == 4 || (val0 - val1) == 4);
     }
+  return 0;
+}
 
-  switch (cond1)
-    {
-    case EQ:
-      if (cond2 == EQ || ! cond_or)
-       return CC_DEQmode;
-
-      switch (cond2)
-       {
-       case LE: return CC_DLEmode;
-       case LEU: return CC_DLEUmode;
-       case GE: return CC_DGEmode;
-       case GEU: return CC_DGEUmode;
-       }
+/* Return 1 if OP is a load multiple operation.  It is known to be
+   parallel and the first section will be tested.  */
+int
+load_multiple_operation (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
+{
+  HOST_WIDE_INT count = XVECLEN (op, 0);
+  int dest_regno;
+  rtx src_addr;
+  HOST_WIDE_INT i = 1, base = 0;
+  rtx elt;
 
-      break;
+  if (count <= 1
+      || GET_CODE (XVECEXP (op, 0, 0)) != SET)
+    return 0;
 
-    case LT:
-      if (cond2 == LT || ! cond_or)
-       return CC_DLTmode;
-      if (cond2 == LE)
-       return CC_DLEmode;
-      if (cond2 == NE)
-       return CC_DNEmode;
-      break;
-
-    case GT:
-      if (cond2 == GT || ! cond_or)
-       return CC_DGTmode;
-      if (cond2 == GE)
-       return CC_DGEmode;
-      if (cond2 == NE)
-       return CC_DNEmode;
-      break;
-      
-    case LTU:
-      if (cond2 == LTU || ! cond_or)
-       return CC_DLTUmode;
-      if (cond2 == LEU)
-       return CC_DLEUmode;
-      if (cond2 == NE)
-       return CC_DNEmode;
-      break;
+  /* Check to see if this might be a write-back.  */
+  if (GET_CODE (SET_SRC (elt = XVECEXP (op, 0, 0))) == PLUS)
+    {
+      i++;
+      base = 1;
 
-    case GTU:
-      if (cond2 == GTU || ! cond_or)
-       return CC_DGTUmode;
-      if (cond2 == GEU)
-       return CC_DGEUmode;
-      if (cond2 == NE)
-       return CC_DNEmode;
-      break;
+      /* Now check it more carefully.  */
+      if (GET_CODE (SET_DEST (elt)) != REG
+          || GET_CODE (XEXP (SET_SRC (elt), 0)) != REG
+          || REGNO (XEXP (SET_SRC (elt), 0)) != REGNO (SET_DEST (elt))
+          || GET_CODE (XEXP (SET_SRC (elt), 1)) != CONST_INT
+          || INTVAL (XEXP (SET_SRC (elt), 1)) != (count - 2) * 4
+          || GET_CODE (XVECEXP (op, 0, count - 1)) != CLOBBER
+          || GET_CODE (XEXP (XVECEXP (op, 0, count - 1), 0)) != REG
+          || REGNO (XEXP (XVECEXP (op, 0, count - 1), 0))
+              != REGNO (SET_DEST (elt)))
+        return 0;
 
-    /* The remaining cases only occur when both comparisons are the
-       same.  */
-    case NE:
-      return CC_DNEmode;
+      count--;
+    }
 
-    case LE:
-      return CC_DLEmode;
+  /* Perform a quick check so we don't blow up below.  */
+  if (count <= i
+      || GET_CODE (XVECEXP (op, 0, i - 1)) != SET
+      || GET_CODE (SET_DEST (XVECEXP (op, 0, i - 1))) != REG
+      || GET_CODE (SET_SRC (XVECEXP (op, 0, i - 1))) != MEM)
+    return 0;
 
-    case GE:
-      return CC_DGEmode;
+  dest_regno = REGNO (SET_DEST (XVECEXP (op, 0, i - 1)));
+  src_addr = XEXP (SET_SRC (XVECEXP (op, 0, i - 1)), 0);
 
-    case LEU:
-      return CC_DLEUmode;
+  for (; i < count; i++)
+    {
+      elt = XVECEXP (op, 0, i);
 
-    case GEU:
-      return CC_DGEUmode;
+      if (GET_CODE (elt) != SET
+          || GET_CODE (SET_DEST (elt)) != REG
+          || GET_MODE (SET_DEST (elt)) != SImode
+          || REGNO (SET_DEST (elt)) != (unsigned int)(dest_regno + i - base)
+          || GET_CODE (SET_SRC (elt)) != MEM
+          || GET_MODE (SET_SRC (elt)) != SImode
+          || GET_CODE (XEXP (SET_SRC (elt), 0)) != PLUS
+          || ! rtx_equal_p (XEXP (XEXP (SET_SRC (elt), 0), 0), src_addr)
+          || GET_CODE (XEXP (XEXP (SET_SRC (elt), 0), 1)) != CONST_INT
+          || INTVAL (XEXP (XEXP (SET_SRC (elt), 0), 1)) != (i - base) * 4)
+        return 0;
     }
 
-  abort ();
+  return 1;
 }
 
-enum machine_mode
-arm_select_cc_mode (op, x, y)
-     enum rtx_code op;
-     rtx x;
-     rtx y;
+/* Return 1 if OP is a store multiple operation.  It is known to be
+   parallel and the first section will be tested.  */
+int
+store_multiple_operation (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
-  /* All floating point compares return CCFP if it is an equality
-     comparison, and CCFPE otherwise.  */
-  if (GET_MODE_CLASS (GET_MODE (x)) == MODE_FLOAT)
-    return (op == EQ || op == NE) ? CCFPmode : CCFPEmode;
-  
-  /* A compare with a shifted operand.  Because of canonicalization, the
-     comparison will have to be swapped when we emit the assembler.  */
-  if (GET_MODE (y) == SImode && GET_CODE (y) == REG
-      && (GET_CODE (x) == ASHIFT || GET_CODE (x) == ASHIFTRT
-         || GET_CODE (x) == LSHIFTRT || GET_CODE (x) == ROTATE
-         || GET_CODE (x) == ROTATERT))
-    return CC_SWPmode;
+  HOST_WIDE_INT count = XVECLEN (op, 0);
+  int src_regno;
+  rtx dest_addr;
+  HOST_WIDE_INT i = 1, base = 0;
+  rtx elt;
 
-  /* This is a special case, that is used by combine to alow a 
-     comarison of a shifted byte load to be split into a zero-extend
-     followed by a comparison of the shifted integer (only valid for
-     equalities and unsigned inequalites.  */
-  if (GET_MODE (x) == SImode
-      && GET_CODE (x) == ASHIFT
-      && GET_CODE (XEXP (x, 1)) == CONST_INT && INTVAL (XEXP (x, 1)) == 24
-      && GET_CODE (XEXP (x, 0)) == SUBREG
-      && GET_CODE (SUBREG_REG (XEXP (x, 0))) == MEM
-      && GET_MODE (SUBREG_REG (XEXP (x, 0))) == QImode
-      && (op == EQ || op == NE
-         || op == GEU || op == GTU || op == LTU || op == LEU)
-      && GET_CODE (y) == CONST_INT)
-    return CC_Zmode;
+  if (count <= 1
+      || GET_CODE (XVECEXP (op, 0, 0)) != SET)
+    return 0;
 
-  /* An operation that sets the condition codes as a side-effect, the
-     V flag is not set correctly, so we can only use comparisons where
-     this doesn't matter.  (For LT and GE we can use "mi" and "pl"
-     instead.  */
-  if (GET_MODE (x) == SImode
-      && y == const0_rtx
-      && (op == EQ || op == NE || op == LT || op == GE)
-      && (GET_CODE (x) == PLUS || GET_CODE (x) == MINUS
-         || GET_CODE (x) == AND || GET_CODE (x) == IOR
-         || GET_CODE (x) == XOR || GET_CODE (x) == MULT
-         || GET_CODE (x) == NOT || GET_CODE (x) == NEG
-         || GET_CODE (x) == LSHIFTRT
-         || GET_CODE (x) == ASHIFT || GET_CODE (x) == ASHIFTRT
-         || GET_CODE (x) == ROTATERT || GET_CODE (x) == ZERO_EXTRACT))
-    return CC_NOOVmode;
+  /* Check to see if this might be a write-back.  */
+  if (GET_CODE (SET_SRC (elt = XVECEXP (op, 0, 0))) == PLUS)
+    {
+      i++;
+      base = 1;
 
-  /* A construct for a conditional compare, if the false arm contains
-     0, then both conditions must be true, otherwise either condition
-     must be true.  Not all conditions are possible, so CCmode is
-     returned if it can't be done.  */
-  if (GET_CODE (x) == IF_THEN_ELSE
-      && (XEXP (x, 2) == const0_rtx
-         || XEXP (x, 2) == const1_rtx)
-      && GET_RTX_CLASS (GET_CODE (XEXP (x, 0))) == '<'
-      && GET_RTX_CLASS (GET_CODE (XEXP (x, 1))) == '<')
-    return select_dominance_cc_mode (op, XEXP (x, 0), XEXP (x, 1), 
-                                    INTVAL (XEXP (x, 2)));
+      /* Now check it more carefully.  */
+      if (GET_CODE (SET_DEST (elt)) != REG
+          || GET_CODE (XEXP (SET_SRC (elt), 0)) != REG
+          || REGNO (XEXP (SET_SRC (elt), 0)) != REGNO (SET_DEST (elt))
+          || GET_CODE (XEXP (SET_SRC (elt), 1)) != CONST_INT
+          || INTVAL (XEXP (SET_SRC (elt), 1)) != (count - 2) * 4
+          || GET_CODE (XVECEXP (op, 0, count - 1)) != CLOBBER
+          || GET_CODE (XEXP (XVECEXP (op, 0, count - 1), 0)) != REG
+          || REGNO (XEXP (XVECEXP (op, 0, count - 1), 0))
+              != REGNO (SET_DEST (elt)))
+        return 0;
 
-  if (GET_MODE (x) == QImode && (op == EQ || op == NE))
-    return CC_Zmode;
+      count--;
+    }
 
-  return CCmode;
-}
+  /* Perform a quick check so we don't blow up below.  */
+  if (count <= i
+      || GET_CODE (XVECEXP (op, 0, i - 1)) != SET
+      || GET_CODE (SET_DEST (XVECEXP (op, 0, i - 1))) != MEM
+      || GET_CODE (SET_SRC (XVECEXP (op, 0, i - 1))) != REG)
+    return 0;
 
-/* X and Y are two things to compare using CODE.  Emit the compare insn and
-   return the rtx for register 0 in the proper mode.  FP means this is a
-   floating point compare: I don't think that it is needed on the arm.  */
+  src_regno = REGNO (SET_SRC (XVECEXP (op, 0, i - 1)));
+  dest_addr = XEXP (SET_DEST (XVECEXP (op, 0, i - 1)), 0);
 
-rtx
-gen_compare_reg (code, x, y, fp)
-     enum rtx_code code;
-     rtx x, y;
-{
-  enum machine_mode mode = SELECT_CC_MODE (code, x, y);
-  rtx cc_reg = gen_rtx (REG, mode, 24);
+  for (; i < count; i++)
+    {
+      elt = XVECEXP (op, 0, i);
 
-  emit_insn (gen_rtx (SET, VOIDmode, cc_reg,
-                      gen_rtx (COMPARE, mode, x, y)));
+      if (GET_CODE (elt) != SET
+          || GET_CODE (SET_SRC (elt)) != REG
+          || GET_MODE (SET_SRC (elt)) != SImode
+          || REGNO (SET_SRC (elt)) != (unsigned int)(src_regno + i - base)
+          || GET_CODE (SET_DEST (elt)) != MEM
+          || GET_MODE (SET_DEST (elt)) != SImode
+          || GET_CODE (XEXP (SET_DEST (elt), 0)) != PLUS
+          || ! rtx_equal_p (XEXP (XEXP (SET_DEST (elt), 0), 0), dest_addr)
+          || GET_CODE (XEXP (XEXP (SET_DEST (elt), 0), 1)) != CONST_INT
+          || INTVAL (XEXP (XEXP (SET_DEST (elt), 0), 1)) != (i - base) * 4)
+        return 0;
+    }
 
-  return cc_reg;
+  return 1;
 }
 
-void
-arm_reload_in_hi (operands)
-     rtx *operands;
+int
+load_multiple_sequence (operands, nops, regs, base, load_offset)
+     rtx * operands;
+     int nops;
+     int * regs;
+     int * base;
+     HOST_WIDE_INT * load_offset;
 {
-  rtx base = find_replacement (&XEXP (operands[1], 0));
-
-  emit_insn (gen_zero_extendqisi2 (operands[2], gen_rtx (MEM, QImode, base)));
-  emit_insn (gen_zero_extendqisi2 (gen_rtx (SUBREG, SImode, operands[0], 0),
-                                  gen_rtx (MEM, QImode, 
-                                           plus_constant (base, 1))));
-  if (BYTES_BIG_ENDIAN)
-    emit_insn (gen_rtx (SET, VOIDmode, gen_rtx (SUBREG, SImode, 
-                                               operands[0], 0),
-                       gen_rtx (IOR, SImode, 
-                                gen_rtx (ASHIFT, SImode,
-                                         gen_rtx (SUBREG, SImode,
-                                                  operands[0], 0),
-                                         GEN_INT (8)),
-                                operands[2])));
-  else
-    emit_insn (gen_rtx (SET, VOIDmode, gen_rtx (SUBREG, SImode, 
-                                               operands[0], 0),
-                       gen_rtx (IOR, SImode, 
-                                gen_rtx (ASHIFT, SImode,
-                                         operands[2],
-                                         GEN_INT (8)),
-                                gen_rtx (SUBREG, SImode, operands[0], 0))));
-}
+  int unsorted_regs[4];
+  HOST_WIDE_INT unsorted_offsets[4];
+  int order[4];
+  int base_reg = -1;
+  int i;
 
-void
-arm_reload_out_hi (operands)
-     rtx *operands;
-{
-  rtx base = find_replacement (&XEXP (operands[0], 0));
+  /* Can only handle 2, 3, or 4 insns at present, though could be easily
+     extended if required.  */
+  if (nops < 2 || nops > 4)
+    abort ();
 
-  if (BYTES_BIG_ENDIAN)
-    {
-      emit_insn (gen_movqi (gen_rtx (MEM, QImode, plus_constant (base, 1)),
-                           gen_rtx (SUBREG, QImode, operands[1], 0)));
-      emit_insn (gen_lshrsi3 (operands[2],
-                             gen_rtx (SUBREG, SImode, operands[1], 0),
-                             GEN_INT (8)));
-      emit_insn (gen_movqi (gen_rtx (MEM, QImode, base),
-                           gen_rtx (SUBREG, QImode, operands[2], 0)));
-    }
-  else
+  /* Loop over the operands and check that the memory references are
+     suitable (ie immediate offsets from the same base register).  At
+     the same time, extract the target register, and the memory
+     offsets.  */
+  for (i = 0; i < nops; i++)
     {
-      emit_insn (gen_movqi (gen_rtx (MEM, QImode, base),
-                           gen_rtx (SUBREG, QImode, operands[1], 0)));
-      emit_insn (gen_lshrsi3 (operands[2],
-                             gen_rtx (SUBREG, SImode, operands[1], 0),
-                             GEN_INT (8)));
-      emit_insn (gen_movqi (gen_rtx (MEM, QImode, plus_constant (base, 1)),
-                           gen_rtx (SUBREG, QImode, operands[2], 0)));
-    }
-}
-\f
-/* Check to see if a branch is forwards or backwards.  Return TRUE if it
-   is backwards.  */
-
-int
-arm_backwards_branch (from, to)
-     int from, to;
-{
-  return insn_addresses[to] <= insn_addresses[from];
-}
+      rtx reg;
+      rtx offset;
 
-/* Check to see if a branch is within the distance that can be done using
-   an arithmetic expression. */
-int
-short_branch (from, to)
-     int from, to;
-{
-  int delta = insn_addresses[from] + 8 - insn_addresses[to];
+      /* Convert a subreg of a mem into the mem itself.  */
+      if (GET_CODE (operands[nops + i]) == SUBREG)
+       operands[nops + i] = alter_subreg (operands[nops + i]);
 
-  return abs (delta) < 980;    /* A small margin for safety */
-}
+      if (GET_CODE (operands[nops + i]) != MEM)
+       abort ();
 
-/* Check to see that the insn isn't the target of the conditionalizing
-   code */
-int
-arm_insn_not_targeted (insn)
-     rtx insn;
-{
-  return insn != arm_target_insn;
-}
+      /* Don't reorder volatile memory references; it doesn't seem worth
+        looking for the case where the order is ok anyway.  */
+      if (MEM_VOLATILE_P (operands[nops + i]))
+       return 0;
 
-\f
-/* Routines for manipulation of the constant pool.  */
-/* This is unashamedly hacked from the version in sh.c, since the problem is
-   extremely similar.  */
+      offset = const0_rtx;
 
-/* Arm instructions cannot load a large constant into a register,
-   constants have to come from a pc relative load.  The reference of a pc
-   relative load instruction must be less than 1k infront of the instruction.
-   This means that we often have to dump a constant inside a function, and
-   generate code to branch around it.
-
-   It is important to minimize this, since the branches will slow things
-   down and make things bigger.
-
-   Worst case code looks like:
-
-       ldr     rn, L1
-       b       L2
-       align
-       L1:     .long value
-       L2:
-       ..
-
-       ldr     rn, L3
-       b       L4
-       align
-       L3:     .long value
-       L4:
-       ..
-
-   We fix this by performing a scan before scheduling, which notices which
-   instructions need to have their operands fetched from the constant table
-   and builds the table.
-
-
-   The algorithm is:
-
-   scan, find an instruction which needs a pcrel move.  Look forward, find th
-   last barrier which is within MAX_COUNT bytes of the requirement.
-   If there isn't one, make one.  Process all the instructions between
-   the find and the barrier.
-
-   In the above example, we can tell that L3 is within 1k of L1, so
-   the first move can be shrunk from the 2 insn+constant sequence into
-   just 1 insn, and the constant moved to L3 to make:
-
-       ldr     rn, L1
-       ..
-       ldr     rn, L3
-       b       L4
-       align
-       L1:     .long value
-       L3:     .long value
-       L4:
+      if ((GET_CODE (reg = XEXP (operands[nops + i], 0)) == REG
+          || (GET_CODE (reg) == SUBREG
+              && GET_CODE (reg = SUBREG_REG (reg)) == REG))
+         || (GET_CODE (XEXP (operands[nops + i], 0)) == PLUS
+             && ((GET_CODE (reg = XEXP (XEXP (operands[nops + i], 0), 0))
+                  == REG)
+                 || (GET_CODE (reg) == SUBREG
+                     && GET_CODE (reg = SUBREG_REG (reg)) == REG))
+             && (GET_CODE (offset = XEXP (XEXP (operands[nops + i], 0), 1))
+                 == CONST_INT)))
+       {
+         if (i == 0)
+           {
+             base_reg = REGNO (reg);
+             unsorted_regs[0] = (GET_CODE (operands[i]) == REG
+                                 ? REGNO (operands[i])
+                                 : REGNO (SUBREG_REG (operands[i])));
+             order[0] = 0;
+           }
+         else 
+           {
+             if (base_reg != (int) REGNO (reg))
+               /* Not addressed from the same base register.  */
+               return 0;
 
-   Then the second move becomes the target for the shortening process.
+             unsorted_regs[i] = (GET_CODE (operands[i]) == REG
+                                 ? REGNO (operands[i])
+                                 : REGNO (SUBREG_REG (operands[i])));
+             if (unsorted_regs[i] < unsorted_regs[order[0]])
+               order[0] = i;
+           }
 
- */
+         /* If it isn't an integer register, or if it overwrites the
+            base register but isn't the last insn in the list, then
+            we can't do this.  */
+         if (unsorted_regs[i] < 0 || unsorted_regs[i] > 14
+             || (i != nops - 1 && unsorted_regs[i] == base_reg))
+           return 0;
 
-typedef struct
-{
-  rtx value;                    /* Value in table */
-  HOST_WIDE_INT next_offset;
-  enum machine_mode mode;       /* Mode of value */
-} pool_node;
+         unsorted_offsets[i] = INTVAL (offset);
+       }
+      else
+       /* Not a suitable memory address.  */
+       return 0;
+    }
 
-/* The maximum number of constants that can fit into one pool, since
-   the pc relative range is 0...1020 bytes and constants are at least 4
-   bytes long */
+  /* All the useful information has now been extracted from the
+     operands into unsorted_regs and unsorted_offsets; additionally,
+     order[0] has been set to the lowest numbered register in the
+     list.  Sort the registers into order, and check that the memory
+     offsets are ascending and adjacent.  */
 
-#define MAX_POOL_SIZE (1020/4)
-static pool_node pool_vector[MAX_POOL_SIZE];
-static int pool_size;
-static rtx pool_vector_label;
+  for (i = 1; i < nops; i++)
+    {
+      int j;
 
-/* Add a constant to the pool and return its label.  */
-static HOST_WIDE_INT
-add_constant (x, mode)
-     rtx x;
-     enum machine_mode mode;
-{
-  int i;
-  rtx lab;
-  HOST_WIDE_INT offset;
+      order[i] = order[i - 1];
+      for (j = 0; j < nops; j++)
+       if (unsorted_regs[j] > unsorted_regs[order[i - 1]]
+           && (order[i] == order[i - 1]
+               || unsorted_regs[j] < unsorted_regs[order[i]]))
+         order[i] = j;
 
-  if (mode == SImode && GET_CODE (x) == MEM && CONSTANT_P (XEXP (x, 0))
-      && CONSTANT_POOL_ADDRESS_P (XEXP (x, 0)))
-    x = get_pool_constant (XEXP (x, 0));
-#ifndef AOF_ASSEMBLER
-  else if (GET_CODE (x) == UNSPEC && XINT (x, 1) == 3)
-    x = XVECEXP (x, 0, 0);
-#endif
+      /* Have we found a suitable register? if not, one must be used more
+        than once.  */
+      if (order[i] == order[i - 1])
+       return 0;
 
-  /* First see if we've already got it */
-  for (i = 0; i < pool_size; i++)
-    {
-      if (GET_CODE (x) == pool_vector[i].value->code
-         && mode == pool_vector[i].mode)
-       {
-         if (GET_CODE (x) == CODE_LABEL)
-           {
-             if (XINT (x, 3) != XINT (pool_vector[i].value, 3))
-               continue;
-           }
-         if (rtx_equal_p (x, pool_vector[i].value))
-           return pool_vector[i].next_offset - GET_MODE_SIZE (mode);
-       }
+      /* Is the memory address adjacent and ascending? */
+      if (unsorted_offsets[order[i]] != unsorted_offsets[order[i - 1]] + 4)
+       return 0;
     }
 
-  /* Need a new one */
-  pool_vector[pool_size].next_offset = GET_MODE_SIZE (mode);
-  offset = 0;
-  if (pool_size == 0)
-    pool_vector_label = gen_label_rtx ();
-  else
-    pool_vector[pool_size].next_offset
-      += (offset = pool_vector[pool_size - 1].next_offset);
-
-  pool_vector[pool_size].value = x;
-  pool_vector[pool_size].mode = mode;
-  pool_size++;
-  return offset;
-}
+  if (base)
+    {
+      *base = base_reg;
 
-/* Output the literal table */
-static void
-dump_table (scan)
-     rtx scan;
-{
-  int i;
+      for (i = 0; i < nops; i++)
+       regs[i] = unsorted_regs[order[i]];
 
-  scan = emit_label_after (gen_label_rtx (), scan);
-  scan = emit_insn_after (gen_align_4 (), scan);
-  scan = emit_label_after (pool_vector_label, scan);
+      *load_offset = unsorted_offsets[order[0]];
+    }
 
-  for (i = 0; i < pool_size; i++)
-    {
-      pool_node *p = pool_vector + i;
+  if (unsorted_offsets[order[0]] == 0)
+    return 1; /* ldmia */
 
-      switch (GET_MODE_SIZE (p->mode))
-       {
-       case 4:
-         scan = emit_insn_after (gen_consttable_4 (p->value), scan);
-         break;
+  if (unsorted_offsets[order[0]] == 4)
+    return 2; /* ldmib */
 
-       case 8:
-         scan = emit_insn_after (gen_consttable_8 (p->value), scan);
-         break;
+  if (unsorted_offsets[order[nops - 1]] == 0)
+    return 3; /* ldmda */
 
-       default:
-         abort ();
-         break;
-       }
-    }
+  if (unsorted_offsets[order[nops - 1]] == -4)
+    return 4; /* ldmdb */
 
-  scan = emit_insn_after (gen_consttable_end (), scan);
-  scan = emit_barrier_after (scan);
-  pool_size = 0;
-}
+  /* For ARM8,9 & StrongARM, 2 ldr instructions are faster than an ldm
+     if the offset isn't small enough.  The reason 2 ldrs are faster
+     is because these ARMs are able to do more than one cache access
+     in a single cycle.  The ARM9 and StrongARM have Harvard caches,
+     whilst the ARM8 has a double bandwidth cache.  This means that
+     these cores can do both an instruction fetch and a data fetch in
+     a single cycle, so the trick of calculating the address into a
+     scratch register (one of the result regs) and then doing a load
+     multiple actually becomes slower (and no smaller in code size).
+     That is the transformation
+       ldr     rd1, [rbase + offset]
+       ldr     rd2, [rbase + offset + 4]
+     to
+       add     rd1, rbase, offset
+       ldmia   rd1, {rd1, rd2}
+     produces worse code -- '3 cycles + any stalls on rd2' instead of
+     '2 cycles + any stalls on rd2'.  On ARMs with only one cache
+     access per cycle, the first sequence could never complete in less
+     than 6 cycles, whereas the ldm sequence would only take 5 and
+     would make better use of sequential accesses if not hitting the
+     cache.
+
+     We cheat here and test 'arm_ld_sched' which we currently know to
+     only be true for the ARM8, ARM9 and StrongARM.  If this ever
+     changes, then the test below needs to be reworked.  */
+  if (nops == 2 && arm_ld_sched)
+    return 0;
 
-/* Non zero if the src operand needs to be fixed up */
-static int
-fixit (src, mode, destreg)
-     rtx src;
-     enum machine_mode mode;
-     int destreg;
-{
-  if (CONSTANT_P (src))
-    {
-      if (GET_CODE (src) == CONST_INT)
-       return (! const_ok_for_arm (INTVAL (src))
-               && ! const_ok_for_arm (~INTVAL (src)));
-      if (GET_CODE (src) == CONST_DOUBLE)
-       return (GET_MODE (src) == VOIDmode
-               || destreg < 16
-               || (! const_double_rtx_ok_for_fpu (src)
-                   && ! neg_const_double_rtx_ok_for_fpu (src)));
-      return symbol_mentioned_p (src);
-    }
-#ifndef AOF_ASSEMBLER
-  else if (GET_CODE (src) == UNSPEC && XINT (src, 1) == 3)
-    return 1;
-#endif
-  else
-    return (mode == SImode && GET_CODE (src) == MEM
-           && GET_CODE (XEXP (src, 0)) == SYMBOL_REF
-           && CONSTANT_POOL_ADDRESS_P (XEXP (src, 0)));
+  /* Can't do it without setting up the offset, only do this if it takes
+     no more than one insn.  */
+  return (const_ok_for_arm (unsorted_offsets[order[0]]) 
+         || const_ok_for_arm (-unsorted_offsets[order[0]])) ? 5 : 0;
 }
 
-/* Find the last barrier less than MAX_COUNT bytes from FROM, or create one. */
-static rtx
-find_barrier (from, max_count)
-     rtx from;
-     int max_count;
+char *
+emit_ldm_seq (operands, nops)
+     rtx * operands;
+     int nops;
 {
-  int count = 0;
-  rtx found_barrier = 0;
+  int regs[4];
+  int base_reg;
+  HOST_WIDE_INT offset;
+  char buf[100];
+  int i;
 
-  while (from && count < max_count)
+  switch (load_multiple_sequence (operands, nops, regs, &base_reg, &offset))
     {
-      if (GET_CODE (from) == BARRIER)
-       found_barrier = from;
+    case 1:
+      strcpy (buf, "ldm%?ia\t");
+      break;
 
-      /* Count the length of this insn */
-      if (GET_CODE (from) == INSN
-         && GET_CODE (PATTERN (from)) == SET
-         && CONSTANT_P (SET_SRC (PATTERN (from)))
-         && CONSTANT_POOL_ADDRESS_P (SET_SRC (PATTERN (from))))
-       {
-         rtx src = SET_SRC (PATTERN (from));
-         count += 2;
-       }
-      else
-       count += get_attr_length (from);
+    case 2:
+      strcpy (buf, "ldm%?ib\t");
+      break;
 
-      from = NEXT_INSN (from);
-    }
+    case 3:
+      strcpy (buf, "ldm%?da\t");
+      break;
 
-  if (!found_barrier)
-    {
-      /* We didn't find a barrier in time to
-        dump our stuff, so we'll make one */
-      rtx label = gen_label_rtx ();
+    case 4:
+      strcpy (buf, "ldm%?db\t");
+      break;
 
-      if (from)
-       from = PREV_INSN (from);
+    case 5:
+      if (offset >= 0)
+       sprintf (buf, "add%%?\t%s%s, %s%s, #%ld", REGISTER_PREFIX,
+                reg_names[regs[0]], REGISTER_PREFIX, reg_names[base_reg],
+                (long) offset);
       else
-       from = get_last_insn ();
-
-      /* Walk back to be just before any jump */
-      while (GET_CODE (from) == JUMP_INSN
-             || GET_CODE (from) == NOTE
-            || GET_CODE (from) == CODE_LABEL)
-       from = PREV_INSN (from);
+       sprintf (buf, "sub%%?\t%s%s, %s%s, #%ld", REGISTER_PREFIX,
+                reg_names[regs[0]], REGISTER_PREFIX, reg_names[base_reg],
+                (long) -offset);
+      output_asm_insn (buf, operands);
+      base_reg = regs[0];
+      strcpy (buf, "ldm%?ia\t");
+      break;
 
-      from = emit_jump_insn_after (gen_jump (label), from);
-      JUMP_LABEL (from) = label;
-      found_barrier = emit_barrier_after (from);
-      emit_label_after (label, found_barrier);
-      return found_barrier;
+    default:
+      abort ();
     }
 
-  return found_barrier;
-}
+  sprintf (buf + strlen (buf), "%s%s, {%s%s", REGISTER_PREFIX, 
+          reg_names[base_reg], REGISTER_PREFIX, reg_names[regs[0]]);
 
-/* Non zero if the insn is a move instruction which needs to be fixed. */
-static int
-broken_move (insn)
-     rtx insn;
-{
-  if (!INSN_DELETED_P (insn)
-      && GET_CODE (insn) == INSN
-      && GET_CODE (PATTERN (insn)) == SET)
-    {
-      rtx pat = PATTERN (insn);
-      rtx src = SET_SRC (pat);
-      rtx dst = SET_DEST (pat);
-      int destreg;
-      enum machine_mode mode = GET_MODE (dst);
-      if (dst == pc_rtx)
-       return 0;
+  for (i = 1; i < nops; i++)
+    sprintf (buf + strlen (buf), ", %s%s", REGISTER_PREFIX,
+            reg_names[regs[i]]);
 
-      if (GET_CODE (dst) == REG)
-       destreg = REGNO (dst);
-      else if (GET_CODE (dst) == SUBREG && GET_CODE (SUBREG_REG (dst)) == REG)
-       destreg = REGNO (SUBREG_REG (dst));
+  strcat (buf, "}\t%@ phole ldm");
 
-      return fixit (src, mode, destreg);
-    }
-  return 0;
+  output_asm_insn (buf, operands);
+  return "";
 }
 
-void
-arm_reorg (first)
-     rtx first;
+int
+store_multiple_sequence (operands, nops, regs, base, load_offset)
+     rtx * operands;
+     int nops;
+     int * regs;
+     int * base;
+     HOST_WIDE_INT * load_offset;
 {
-  rtx insn;
-  int count_size;
-  int regno;
+  int unsorted_regs[4];
+  HOST_WIDE_INT unsorted_offsets[4];
+  int order[4];
+  int base_reg = -1;
+  int i;
 
-#if 0
-  /* The ldr instruction can work with up to a 4k offset, and most constants
-     will be loaded with one of these instructions; however, the adr 
-     instruction and the ldf instructions only work with a 1k offset.  This
-     code needs to be rewritten to use the 4k offset when possible, and to
-     adjust when a 1k offset is needed.  For now we just use a 1k offset
-     from the start.  */
-  count_size = 4000;
-
-  /* Floating point operands can't work further than 1024 bytes from the
-     PC, so to make things simple we restrict all loads for such functions.
-     */
-  if (TARGET_HARD_FLOAT)
-    for (regno = 16; regno < 24; regno++)
-      if (regs_ever_live[regno])
-       {
-         count_size = 1000;
-         break;
-       }
-#else
-  count_size = 1000;
-#endif /* 0 */
+  /* Can only handle 2, 3, or 4 insns at present, though could be easily
+     extended if required.  */
+  if (nops < 2 || nops > 4)
+    abort ();
 
-  for (insn = first; insn; insn = NEXT_INSN (insn))
+  /* Loop over the operands and check that the memory references are
+     suitable (ie immediate offsets from the same base register).  At
+     the same time, extract the target register, and the memory
+     offsets.  */
+  for (i = 0; i < nops; i++)
     {
-      if (broken_move (insn))
-       {
-         /* This is a broken move instruction, scan ahead looking for
-            a barrier to stick the constant table behind */
-         rtx scan;
-         rtx barrier = find_barrier (insn, count_size);
+      rtx reg;
+      rtx offset;
 
-         /* Now find all the moves between the points and modify them */
-         for (scan = insn; scan != barrier; scan = NEXT_INSN (scan))
-           {
-             if (broken_move (scan))
-               {
-                 /* This is a broken move instruction, add it to the pool */
-                 rtx pat = PATTERN (scan);
-                 rtx src = SET_SRC (pat);
-                 rtx dst = SET_DEST (pat);
-                 enum machine_mode mode = GET_MODE (dst);
-                 HOST_WIDE_INT offset;
-                 rtx newinsn = scan;
-                 rtx newsrc;
-                 rtx addr;
-                 int scratch;
-
-                 /* If this is an HImode constant load, convert it into
-                    an SImode constant load.  Since the register is always
-                    32 bits this is safe.  We have to do this, since the
-                    load pc-relative instruction only does a 32-bit load. */
-                 if (mode == HImode)
-                   {
-                     mode = SImode;
-                     if (GET_CODE (dst) != REG)
-                       abort ();
-                     PUT_MODE (dst, SImode);
-                   }
+      /* Convert a subreg of a mem into the mem itself.  */
+      if (GET_CODE (operands[nops + i]) == SUBREG)
+       operands[nops + i] = alter_subreg (operands[nops + i]);
 
-                 offset = add_constant (src, mode);
-                 addr = plus_constant (gen_rtx (LABEL_REF, VOIDmode,
-                                                pool_vector_label),
-                                       offset);
-
-                 /* For wide moves to integer regs we need to split the
-                    address calculation off into a separate insn, so that
-                    the load can then be done with a load-multiple.  This is
-                    safe, since we have already noted the length of such
-                    insns to be 8, and we are immediately over-writing the
-                    scratch we have grabbed with the final result.  */
-                 if (GET_MODE_SIZE (mode) > 4
-                     && (scratch = REGNO (dst)) < 16)
-                   {
-                     rtx reg = gen_rtx (REG, SImode, scratch);
-                     newinsn = emit_insn_after (gen_movaddr (reg, addr),
-                                                newinsn);
-                     addr = reg;
-                   }
+      if (GET_CODE (operands[nops + i]) != MEM)
+       abort ();
 
-                 newsrc = gen_rtx (MEM, mode, addr);
+      /* Don't reorder volatile memory references; it doesn't seem worth
+        looking for the case where the order is ok anyway.  */
+      if (MEM_VOLATILE_P (operands[nops + i]))
+       return 0;
 
-                 /* Build a jump insn wrapper around the move instead
-                    of an ordinary insn, because we want to have room for
-                    the target label rtx in fld[7], which an ordinary
-                    insn doesn't have. */
-                 newinsn = emit_jump_insn_after (gen_rtx (SET, VOIDmode,
-                                                          dst, newsrc),
-                                                 newinsn);
-                 JUMP_LABEL (newinsn) = pool_vector_label;
+      offset = const0_rtx;
 
-                 /* But it's still an ordinary insn */
-                 PUT_CODE (newinsn, INSN);
+      if ((GET_CODE (reg = XEXP (operands[nops + i], 0)) == REG
+          || (GET_CODE (reg) == SUBREG
+              && GET_CODE (reg = SUBREG_REG (reg)) == REG))
+         || (GET_CODE (XEXP (operands[nops + i], 0)) == PLUS
+             && ((GET_CODE (reg = XEXP (XEXP (operands[nops + i], 0), 0))
+                  == REG)
+                 || (GET_CODE (reg) == SUBREG
+                     && GET_CODE (reg = SUBREG_REG (reg)) == REG))
+             && (GET_CODE (offset = XEXP (XEXP (operands[nops + i], 0), 1))
+                 == CONST_INT)))
+       {
+         if (i == 0)
+           {
+             base_reg = REGNO (reg);
+             unsorted_regs[0] = (GET_CODE (operands[i]) == REG
+                                 ? REGNO (operands[i])
+                                 : REGNO (SUBREG_REG (operands[i])));
+             order[0] = 0;
+           }
+         else 
+           {
+             if (base_reg != (int) REGNO (reg))
+               /* Not addressed from the same base register.  */
+               return 0;
 
-                 /* Kill old insn */
-                 delete_insn (scan);
-                 scan = newinsn;
-               }
+             unsorted_regs[i] = (GET_CODE (operands[i]) == REG
+                                 ? REGNO (operands[i])
+                                 : REGNO (SUBREG_REG (operands[i])));
+             if (unsorted_regs[i] < unsorted_regs[order[0]])
+               order[0] = i;
            }
-         dump_table (barrier);
-         insn = scan;
+
+         /* If it isn't an integer register, then we can't do this.  */
+         if (unsorted_regs[i] < 0 || unsorted_regs[i] > 14)
+           return 0;
+
+         unsorted_offsets[i] = INTVAL (offset);
        }
+      else
+       /* Not a suitable memory address.  */
+       return 0;
     }
-}
 
-\f
-/* Routines to output assembly language.  */
+  /* All the useful information has now been extracted from the
+     operands into unsorted_regs and unsorted_offsets; additionally,
+     order[0] has been set to the lowest numbered register in the
+     list.  Sort the registers into order, and check that the memory
+     offsets are ascending and adjacent.  */
 
-/* If the rtx is the correct value then return the string of the number.
-   In this way we can ensure that valid double constants are generated even
-   when cross compiling. */
-char *
-fp_immediate_constant (x)
-     rtx x;
-{
-  REAL_VALUE_TYPE r;
-  int i;
-  
-  if (!fpa_consts_inited)
-    init_fpa_table ();
-  
-  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
-  for (i = 0; i < 8; i++)
-    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
-      return strings_fpa[i];
+  for (i = 1; i < nops; i++)
+    {
+      int j;
 
-  abort ();
-}
+      order[i] = order[i - 1];
+      for (j = 0; j < nops; j++)
+       if (unsorted_regs[j] > unsorted_regs[order[i - 1]]
+           && (order[i] == order[i - 1]
+               || unsorted_regs[j] < unsorted_regs[order[i]]))
+         order[i] = j;
 
-/* As for fp_immediate_constant, but value is passed directly, not in rtx.  */
-static char *
-fp_const_from_val (r)
-     REAL_VALUE_TYPE *r;
-{
-  int i;
+      /* Have we found a suitable register? if not, one must be used more
+        than once.  */
+      if (order[i] == order[i - 1])
+       return 0;
 
-  if (! fpa_consts_inited)
-    init_fpa_table ();
+      /* Is the memory address adjacent and ascending? */
+      if (unsorted_offsets[order[i]] != unsorted_offsets[order[i - 1]] + 4)
+       return 0;
+    }
 
-  for (i = 0; i < 8; i++)
-    if (REAL_VALUES_EQUAL (*r, values_fpa[i]))
-      return strings_fpa[i];
+  if (base)
+    {
+      *base = base_reg;
 
-  abort ();
-}
+      for (i = 0; i < nops; i++)
+       regs[i] = unsorted_regs[order[i]];
 
-/* Output the operands of a LDM/STM instruction to STREAM.
-   MASK is the ARM register set mask of which only bits 0-15 are important.
-   INSTR is the possibly suffixed base register.  HAT unequals zero if a hat
-   must follow the register list.  */
+      *load_offset = unsorted_offsets[order[0]];
+    }
 
-void
-print_multi_reg (stream, instr, mask, hat)
-     FILE *stream;
-     char *instr;
-     int mask, hat;
-{
-  int i;
-  int not_first = FALSE;
+  if (unsorted_offsets[order[0]] == 0)
+    return 1; /* stmia */
 
-  fputc ('\t', stream);
-  fprintf (stream, instr, REGISTER_PREFIX);
-  fputs (", {", stream);
-  for (i = 0; i < 16; i++)
-    if (mask & (1 << i))
-      {
-       if (not_first)
-         fprintf (stream, ", ");
-       fprintf (stream, "%s%s", REGISTER_PREFIX, reg_names[i]);
-       not_first = TRUE;
-      }
+  if (unsorted_offsets[order[0]] == 4)
+    return 2; /* stmib */
 
-  fprintf (stream, "}%s\n", hat ? "^" : "");
-}
+  if (unsorted_offsets[order[nops - 1]] == 0)
+    return 3; /* stmda */
 
-/* Output a 'call' insn. */
+  if (unsorted_offsets[order[nops - 1]] == -4)
+    return 4; /* stmdb */
+
+  return 0;
+}
 
 char *
-output_call (operands)
-     rtx *operands;
+emit_stm_seq (operands, nops)
+     rtx * operands;
+     int nops;
 {
-  /* Handle calls to lr using ip (which may be clobbered in subr anyway). */
+  int regs[4];
+  int base_reg;
+  HOST_WIDE_INT offset;
+  char buf[100];
+  int i;
 
-  if (REGNO (operands[0]) == 14)
+  switch (store_multiple_sequence (operands, nops, regs, &base_reg, &offset))
     {
-      operands[0] = gen_rtx (REG, SImode, 12);
-      output_asm_insn ("mov%?\t%0, %|lr", operands);
-    }
-  output_asm_insn ("mov%?\t%|lr, %|pc", operands);
-  output_asm_insn ("mov%?\t%|pc, %0", operands);
-  return "";
-}
+    case 1:
+      strcpy (buf, "stm%?ia\t");
+      break;
 
-static int
-eliminate_lr2ip (x)
-     rtx *x;
-{
-  int something_changed = 0;
-  rtx x0 = *x;
-  int code = GET_CODE (x0);
-  register int i, j;
-  register char *fmt;
-  
-  switch (code)
-    {
-    case REG:
-      if (REGNO (x0) == 14)
-        {
-         *x = gen_rtx (REG, SImode, 12);
-         return 1;
-        }
-      return 0;
-    default:
-      /* Scan through the sub-elements and change any references there */
-      fmt = GET_RTX_FORMAT (code);
-      for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
-       if (fmt[i] == 'e')
-         something_changed |= eliminate_lr2ip (&XEXP (x0, i));
-       else if (fmt[i] == 'E')
-         for (j = 0; j < XVECLEN (x0, i); j++)
-           something_changed |= eliminate_lr2ip (&XVECEXP (x0, i, j));
-      return something_changed;
-    }
-}
-  
-/* Output a 'call' insn that is a reference in memory. */
+    case 2:
+      strcpy (buf, "stm%?ib\t");
+      break;
 
-char *
-output_call_mem (operands)
-     rtx *operands;
-{
-  operands[0] = copy_rtx (operands[0]); /* Be ultra careful */
-  /* Handle calls using lr by using ip (which may be clobbered in subr anyway).
-   */
-  if (eliminate_lr2ip (&operands[0]))
-    output_asm_insn ("mov%?\t%|ip, %|lr", operands);
+    case 3:
+      strcpy (buf, "stm%?da\t");
+      break;
 
-  output_asm_insn ("mov%?\t%|lr, %|pc", operands);
-  output_asm_insn ("ldr%?\t%|pc, %0", operands);
-  return "";
-}
+    case 4:
+      strcpy (buf, "stm%?db\t");
+      break;
 
+    default:
+      abort ();
+    }
 
-/* Output a move from arm registers to an fpu registers.
-   OPERANDS[0] is an fpu register.
-   OPERANDS[1] is the first registers of an arm register pair.  */
+  sprintf (buf + strlen (buf), "%s%s, {%s%s", REGISTER_PREFIX, 
+          reg_names[base_reg], REGISTER_PREFIX, reg_names[regs[0]]);
 
-char *
-output_mov_long_double_fpu_from_arm (operands)
-     rtx *operands;
-{
-  int arm_reg0 = REGNO (operands[1]);
-  rtx ops[3];
+  for (i = 1; i < nops; i++)
+    sprintf (buf + strlen (buf), ", %s%s", REGISTER_PREFIX,
+            reg_names[regs[i]]);
 
-  if (arm_reg0 == 12)
-    abort();
+  strcat (buf, "}\t%@ phole stm");
 
-  ops[0] = gen_rtx (REG, SImode, arm_reg0);
-  ops[1] = gen_rtx (REG, SImode, 1 + arm_reg0);
-  ops[2] = gen_rtx (REG, SImode, 2 + arm_reg0);
-  
-  output_asm_insn ("stm%?fd\t%|sp!, {%0, %1, %2}", ops);
-  output_asm_insn ("ldf%?e\t%0, [%|sp], #12", operands);
+  output_asm_insn (buf, operands);
   return "";
 }
 
-/* Output a move from an fpu register to arm registers.
-   OPERANDS[0] is the first registers of an arm register pair.
-   OPERANDS[1] is an fpu register.  */
-
-char *
-output_mov_long_double_arm_from_fpu (operands)
-     rtx *operands;
+int
+multi_register_push (op, mode)
+     rtx op;
+     enum machine_mode mode ATTRIBUTE_UNUSED;
 {
-  int arm_reg0 = REGNO (operands[0]);
-  rtx ops[3];
+  if (GET_CODE (op) != PARALLEL
+      || (GET_CODE (XVECEXP (op, 0, 0)) != SET)
+      || (GET_CODE (SET_SRC (XVECEXP (op, 0, 0))) != UNSPEC)
+      || (XINT (SET_SRC (XVECEXP (op, 0, 0)), 1) != 2))
+    return 0;
 
-  if (arm_reg0 == 12)
-    abort();
+  return 1;
+}
+\f
+/* Routines for use with attributes.  */
 
-  ops[0] = gen_rtx (REG, SImode, arm_reg0);
-  ops[1] = gen_rtx (REG, SImode, 1 + arm_reg0);
-  ops[2] = gen_rtx (REG, SImode, 2 + arm_reg0);
+/* Return nonzero if ATTR is a valid attribute for DECL.
+   ATTRIBUTES are any existing attributes and ARGS are
+   the arguments supplied with ATTR.
 
-  output_asm_insn ("stf%?e\t%1, [%|sp, #-12]!", operands);
-  output_asm_insn ("ldm%?fd\t%|sp!, {%0, %1, %2}", ops);
-  return "";
-}
+   Supported attributes:
 
-/* Output a move from arm registers to arm registers of a long double
-   OPERANDS[0] is the destination.
-   OPERANDS[1] is the source.  */
-char *
-output_mov_long_double_arm_from_arm (operands)
-     rtx *operands;
+   naked:
+     don't output any prologue or epilogue code, the user is assumed
+     to do the right thing.
+   
+   interfacearm:
+     Always assume that this function will be entered in ARM mode,
+     not Thumb mode, and that the caller wishes to be returned to in
+     ARM mode.  */
+int
+arm_valid_machine_decl_attribute (decl, attr, args)
+     tree decl;
+     tree attr;
+     tree args;
 {
-  /* We have to be careful here because the two might overlap */
-  int dest_start = REGNO (operands[0]);
-  int src_start = REGNO (operands[1]);
-  rtx ops[2];
-  int i;
+  if (args != NULL_TREE)
+    return 0;
 
-  if (dest_start < src_start)
+  if (is_attribute_p ("naked", attr))
+    return TREE_CODE (decl) == FUNCTION_DECL;
+  
+#ifdef ARM_PE
+  if (is_attribute_p ("interfacearm", attr))
+    return TREE_CODE (decl) == FUNCTION_DECL;
+#endif /* ARM_PE */
+  
+  return 0;
+}
+
+/* Return non-zero if FUNC is a naked function.  */
+static int
+arm_naked_function_p (func)
+     tree func;
+{
+  tree a;
+
+  if (TREE_CODE (func) != FUNCTION_DECL)
+    abort ();
+  
+  a = lookup_attribute ("naked", DECL_MACHINE_ATTRIBUTES (func));
+  return a != NULL_TREE;
+}
+\f
+/* Routines for use in generating RTL.  */
+rtx
+arm_gen_load_multiple (base_regno, count, from, up, write_back, unchanging_p,
+                      in_struct_p, scalar_p)
+     int base_regno;
+     int count;
+     rtx from;
+     int up;
+     int write_back;
+     int unchanging_p;
+     int in_struct_p;
+     int scalar_p;
+{
+  int i = 0, j;
+  rtx result;
+  int sign = up ? 1 : -1;
+  rtx mem;
+
+  result = gen_rtx_PARALLEL (VOIDmode,
+                            rtvec_alloc (count + (write_back ? 2 : 0)));
+  if (write_back)
     {
-      for (i = 0; i < 3; i++)
-       {
-         ops[0] = gen_rtx (REG, SImode, dest_start + i);
-         ops[1] = gen_rtx (REG, SImode, src_start + i);
-         output_asm_insn ("mov%?\t%0, %1", ops);
-       }
+      XVECEXP (result, 0, 0)
+       = gen_rtx_SET (GET_MODE (from), from,
+                      plus_constant (from, count * 4 * sign));
+      i = 1;
+      count++;
     }
-  else
+
+  for (j = 0; i < count; i++, j++)
     {
-      for (i = 2; i >= 0; i--)
-       {
-         ops[0] = gen_rtx (REG, SImode, dest_start + i);
-         ops[1] = gen_rtx (REG, SImode, src_start + i);
-         output_asm_insn ("mov%?\t%0, %1", ops);
-       }
+      mem = gen_rtx_MEM (SImode, plus_constant (from, j * 4 * sign));
+      RTX_UNCHANGING_P (mem) = unchanging_p;
+      MEM_IN_STRUCT_P (mem) = in_struct_p;
+      MEM_SCALAR_P (mem) = scalar_p;
+      XVECEXP (result, 0, i)
+       = gen_rtx_SET (VOIDmode, gen_rtx_REG (SImode, base_regno + j), mem);
     }
 
-  return "";
+  if (write_back)
+    XVECEXP (result, 0, i) = gen_rtx_CLOBBER (SImode, from);
+
+  return result;
 }
 
+rtx
+arm_gen_store_multiple (base_regno, count, to, up, write_back, unchanging_p,
+                       in_struct_p, scalar_p)
+     int base_regno;
+     int count;
+     rtx to;
+     int up;
+     int write_back;
+     int unchanging_p;
+     int in_struct_p;
+     int scalar_p;
+{
+  int i = 0, j;
+  rtx result;
+  int sign = up ? 1 : -1;
+  rtx mem;
 
-/* Output a move from arm registers to an fpu registers.
-   OPERANDS[0] is an fpu register.
-   OPERANDS[1] is the first registers of an arm register pair.  */
+  result = gen_rtx_PARALLEL (VOIDmode,
+                            rtvec_alloc (count + (write_back ? 2 : 0)));
+  if (write_back)
+    {
+      XVECEXP (result, 0, 0)
+       = gen_rtx_SET (GET_MODE (to), to,
+                      plus_constant (to, count * 4 * sign));
+      i = 1;
+      count++;
+    }
 
-char *
-output_mov_double_fpu_from_arm (operands)
-     rtx *operands;
-{
-  int arm_reg0 = REGNO (operands[1]);
-  rtx ops[2];
+  for (j = 0; i < count; i++, j++)
+    {
+      mem = gen_rtx_MEM (SImode, plus_constant (to, j * 4 * sign));
+      RTX_UNCHANGING_P (mem) = unchanging_p;
+      MEM_IN_STRUCT_P (mem) = in_struct_p;
+      MEM_SCALAR_P (mem) = scalar_p;
 
-  if (arm_reg0 == 12)
-    abort();
-  ops[0] = gen_rtx (REG, SImode, arm_reg0);
-  ops[1] = gen_rtx (REG, SImode, 1 + arm_reg0);
-  output_asm_insn ("stm%?fd\t%|sp!, {%0, %1}", ops);
-  output_asm_insn ("ldf%?d\t%0, [%|sp], #8", operands);
-  return "";
-}
+      XVECEXP (result, 0, i)
+       = gen_rtx_SET (VOIDmode, mem, gen_rtx_REG (SImode, base_regno + j));
+    }
 
-/* Output a move from an fpu register to arm registers.
-   OPERANDS[0] is the first registers of an arm register pair.
-   OPERANDS[1] is an fpu register.  */
+  if (write_back)
+    XVECEXP (result, 0, i) = gen_rtx_CLOBBER (SImode, to);
 
-char *
-output_mov_double_arm_from_fpu (operands)
-     rtx *operands;
+  return result;
+}
+
+int
+arm_gen_movstrqi (operands)
+     rtx * operands;
 {
-  int arm_reg0 = REGNO (operands[0]);
-  rtx ops[2];
+  HOST_WIDE_INT in_words_to_go, out_words_to_go, last_bytes;
+  int i;
+  rtx src, dst;
+  rtx st_src, st_dst, fin_src, fin_dst;
+  rtx part_bytes_reg = NULL;
+  rtx mem;
+  int dst_unchanging_p, dst_in_struct_p, src_unchanging_p, src_in_struct_p;
+  int dst_scalar_p, src_scalar_p;
 
-  if (arm_reg0 == 12)
-    abort();
+  if (GET_CODE (operands[2]) != CONST_INT
+      || GET_CODE (operands[3]) != CONST_INT
+      || INTVAL (operands[2]) > 64
+      || INTVAL (operands[3]) & 3)
+    return 0;
 
-  ops[0] = gen_rtx (REG, SImode, arm_reg0);
-  ops[1] = gen_rtx (REG, SImode, 1 + arm_reg0);
-  output_asm_insn ("stf%?d\t%1, [%|sp, #-8]!", operands);
-  output_asm_insn ("ldm%?fd\t%|sp!, {%0, %1}", ops);
-  return "";
-}
+  st_dst = XEXP (operands[0], 0);
+  st_src = XEXP (operands[1], 0);
 
-/* Output a move between double words.
-   It must be REG<-REG, REG<-CONST_DOUBLE, REG<-CONST_INT, REG<-MEM
-   or MEM<-REG and all MEMs must be offsettable addresses.  */
+  dst_unchanging_p = RTX_UNCHANGING_P (operands[0]);
+  dst_in_struct_p = MEM_IN_STRUCT_P (operands[0]);
+  dst_scalar_p = MEM_SCALAR_P (operands[0]);
+  src_unchanging_p = RTX_UNCHANGING_P (operands[1]);
+  src_in_struct_p = MEM_IN_STRUCT_P (operands[1]);
+  src_scalar_p = MEM_SCALAR_P (operands[1]);
 
-char *
-output_move_double (operands)
-     rtx *operands;
-{
-  enum rtx_code code0 = GET_CODE (operands[0]);
-  enum rtx_code code1 = GET_CODE (operands[1]);
-  rtx otherops[2];
+  fin_dst = dst = copy_to_mode_reg (SImode, st_dst);
+  fin_src = src = copy_to_mode_reg (SImode, st_src);
 
-  if (code0 == REG)
+  in_words_to_go = NUM_INTS (INTVAL (operands[2]));
+  out_words_to_go = INTVAL (operands[2]) / 4;
+  last_bytes = INTVAL (operands[2]) & 3;
+
+  if (out_words_to_go != in_words_to_go && ((in_words_to_go - 1) & 3) != 0)
+    part_bytes_reg = gen_rtx_REG (SImode, (in_words_to_go - 1) & 3);
+
+  for (i = 0; in_words_to_go >= 2; i+=4)
     {
-      int reg0 = REGNO (operands[0]);
+      if (in_words_to_go > 4)
+       emit_insn (arm_gen_load_multiple (0, 4, src, TRUE, TRUE,
+                                         src_unchanging_p,
+                                         src_in_struct_p,
+                                         src_scalar_p));
+      else
+       emit_insn (arm_gen_load_multiple (0, in_words_to_go, src, TRUE, 
+                                         FALSE, src_unchanging_p,
+                                         src_in_struct_p, src_scalar_p));
 
-      otherops[0] = gen_rtx (REG, SImode, 1 + reg0);
-      if (code1 == REG)
+      if (out_words_to_go)
        {
-         int reg1 = REGNO (operands[1]);
-         if (reg1 == 12)
-           abort();
-
-         /* Ensure the second source is not overwritten */
-         if (reg1 == reg0 + (WORDS_BIG_ENDIAN ? -1 : 1))
-           output_asm_insn("mov%?\t%Q0, %Q1\n\tmov%?\t%R0, %R1", operands);
+         if (out_words_to_go > 4)
+           emit_insn (arm_gen_store_multiple (0, 4, dst, TRUE, TRUE,
+                                              dst_unchanging_p,
+                                              dst_in_struct_p,
+                                              dst_scalar_p));
+         else if (out_words_to_go != 1)
+           emit_insn (arm_gen_store_multiple (0, out_words_to_go,
+                                              dst, TRUE, 
+                                              (last_bytes == 0
+                                               ? FALSE : TRUE),
+                                              dst_unchanging_p,
+                                              dst_in_struct_p,
+                                              dst_scalar_p));
          else
-           output_asm_insn("mov%?\t%R0, %R1\n\tmov%?\t%Q0, %Q1", operands);
-       }
-      else if (code1 == CONST_DOUBLE)
-       {
-         if (GET_MODE (operands[1]) == DFmode)
-           {
-             long l[2];
-             union real_extract u;
-
-             bcopy ((char *) &CONST_DOUBLE_LOW (operands[1]), (char *) &u,
-                    sizeof (u));
-             REAL_VALUE_TO_TARGET_DOUBLE (u.d, l);
-             otherops[1] = GEN_INT(l[1]);
-             operands[1] = GEN_INT(l[0]);
-           }
-         else if (GET_MODE (operands[1]) != VOIDmode)
-           abort ();
-         else if (WORDS_BIG_ENDIAN)
            {
-             
-             otherops[1] = GEN_INT (CONST_DOUBLE_LOW (operands[1]));
-             operands[1] = GEN_INT (CONST_DOUBLE_HIGH (operands[1]));
+             mem = gen_rtx_MEM (SImode, dst);
+             RTX_UNCHANGING_P (mem) = dst_unchanging_p;
+             MEM_IN_STRUCT_P (mem) = dst_in_struct_p;
+             MEM_SCALAR_P (mem) = dst_scalar_p;
+             emit_move_insn (mem, gen_rtx_REG (SImode, 0));
+             if (last_bytes != 0)
+               emit_insn (gen_addsi3 (dst, dst, GEN_INT (4)));
            }
-         else
+       }
+
+      in_words_to_go -= in_words_to_go < 4 ? in_words_to_go : 4;
+      out_words_to_go -= out_words_to_go < 4 ? out_words_to_go : 4;
+    }
+
+  /* OUT_WORDS_TO_GO will be zero here if there are byte stores to do.  */
+  if (out_words_to_go)
+    {
+      rtx sreg;
+      
+      mem = gen_rtx_MEM (SImode, src);
+      RTX_UNCHANGING_P (mem) = src_unchanging_p;
+      MEM_IN_STRUCT_P (mem) = src_in_struct_p;
+      MEM_SCALAR_P (mem) = src_scalar_p;
+      emit_move_insn (sreg = gen_reg_rtx (SImode), mem);
+      emit_move_insn (fin_src = gen_reg_rtx (SImode), plus_constant (src, 4));
+      
+      mem = gen_rtx_MEM (SImode, dst);
+      RTX_UNCHANGING_P (mem) = dst_unchanging_p;
+      MEM_IN_STRUCT_P (mem) = dst_in_struct_p;
+      MEM_SCALAR_P (mem) = dst_scalar_p;
+      emit_move_insn (mem, sreg);
+      emit_move_insn (fin_dst = gen_reg_rtx (SImode), plus_constant (dst, 4));
+      in_words_to_go--;
+      
+      if (in_words_to_go)      /* Sanity check */
+       abort ();
+    }
+
+  if (in_words_to_go)
+    {
+      if (in_words_to_go < 0)
+       abort ();
+
+      mem = gen_rtx_MEM (SImode, src);
+      RTX_UNCHANGING_P (mem) = src_unchanging_p;
+      MEM_IN_STRUCT_P (mem) = src_in_struct_p;
+      MEM_SCALAR_P (mem) = src_scalar_p;
+      part_bytes_reg = copy_to_mode_reg (SImode, mem);
+    }
+
+  if (last_bytes && part_bytes_reg == NULL)
+    abort ();
+
+  if (BYTES_BIG_ENDIAN && last_bytes)
+    {
+      rtx tmp = gen_reg_rtx (SImode);
+
+      /* The bytes we want are in the top end of the word.  */
+      emit_insn (gen_lshrsi3 (tmp, part_bytes_reg,
+                             GEN_INT (8 * (4 - last_bytes))));
+      part_bytes_reg = tmp;
+      
+      while (last_bytes)
+       {
+         mem = gen_rtx_MEM (QImode, plus_constant (dst, last_bytes - 1));
+         RTX_UNCHANGING_P (mem) = dst_unchanging_p;
+         MEM_IN_STRUCT_P (mem) = dst_in_struct_p;
+         MEM_SCALAR_P (mem) = dst_scalar_p;
+         emit_move_insn (mem, gen_rtx_SUBREG (QImode, part_bytes_reg, 0));
+         
+         if (--last_bytes)
            {
-             
-             otherops[1] = GEN_INT (CONST_DOUBLE_HIGH (operands[1]));
-             operands[1] = GEN_INT (CONST_DOUBLE_LOW (operands[1]));
+             tmp = gen_reg_rtx (SImode);
+             emit_insn (gen_lshrsi3 (tmp, part_bytes_reg, GEN_INT (8)));
+             part_bytes_reg = tmp;
            }
-         output_mov_immediate (operands);
-         output_mov_immediate (otherops);
        }
-      else if (code1 == CONST_INT)
+         
+    }
+  else
+    {
+      if (last_bytes > 1)
        {
-         /* sign extend the intval into the high-order word */
-         if (WORDS_BIG_ENDIAN)
+         mem = gen_rtx_MEM (HImode, dst);
+         RTX_UNCHANGING_P (mem) = dst_unchanging_p;
+         MEM_IN_STRUCT_P (mem) = dst_in_struct_p;
+         MEM_SCALAR_P (mem) = dst_scalar_p;
+         emit_move_insn (mem, gen_rtx_SUBREG (HImode, part_bytes_reg, 0));
+         last_bytes -= 2;
+         if (last_bytes)
            {
-             otherops[1] = operands[1];
-             operands[1] = (INTVAL (operands[1]) < 0
-                            ? constm1_rtx : const0_rtx);
+             rtx tmp = gen_reg_rtx (SImode);
+
+             emit_insn (gen_addsi3 (dst, dst, GEN_INT (2)));
+             emit_insn (gen_lshrsi3 (tmp, part_bytes_reg, GEN_INT (16)));
+             part_bytes_reg = tmp;
            }
-         else
-           otherops[1] = INTVAL (operands[1]) < 0 ? constm1_rtx : const0_rtx;
-         output_mov_immediate (otherops);
-         output_mov_immediate (operands);
        }
-      else if (code1 == MEM)
+      
+      if (last_bytes)
        {
-         switch (GET_CODE (XEXP (operands[1], 0)))
-           {
-           case REG:
-             output_asm_insn ("ldm%?ia\t%m1, %M0", operands);
-             break;
+         mem = gen_rtx_MEM (QImode, dst);
+         RTX_UNCHANGING_P (mem) = dst_unchanging_p;
+         MEM_IN_STRUCT_P (mem) = dst_in_struct_p;
+         MEM_SCALAR_P (mem) = dst_scalar_p;
+         emit_move_insn (mem, gen_rtx_SUBREG (QImode, part_bytes_reg, 0));       
+       }
+    }
 
-           case PRE_INC:
-             abort (); /* Should never happen now */
-             break;
+  return 1;
+}
 
-           case PRE_DEC:
-             output_asm_insn ("ldm%?db\t%m1!, %M0", operands);
-             break;
+/* Generate a memory reference for a half word, such that it will be loaded
+   into the top 16 bits of the word.  We can assume that the address is
+   known to be alignable and of the form reg, or plus (reg, const).  */
+rtx
+arm_gen_rotated_half_load (memref)
+     rtx memref;
+{
+  HOST_WIDE_INT offset = 0;
+  rtx base = XEXP (memref, 0);
 
-           case POST_INC:
-             output_asm_insn ("ldm%?ia\t%m1!, %M0", operands);
-             break;
+  if (GET_CODE (base) == PLUS)
+    {
+      offset = INTVAL (XEXP (base, 1));
+      base = XEXP (base, 0);
+    }
 
-           case POST_DEC:
-             abort (); /* Should never happen now */
-             break;
+  /* If we aren't allowed to generate unaligned addresses, then fail.  */
+  if (TARGET_MMU_TRAPS
+      && ((BYTES_BIG_ENDIAN ? 1 : 0) ^ ((offset & 2) == 0)))
+    return NULL;
 
-           case LABEL_REF:
-           case CONST:
-             output_asm_insn ("adr%?\t%0, %1", operands);
-             output_asm_insn ("ldm%?ia\t%0, %M0", operands);
-             break;
-
-           default:
-             if (arm_add_operand (XEXP (XEXP (operands[1], 0), 1)))
-               {
-                 otherops[0] = operands[0];
-                 otherops[1] = XEXP (XEXP (operands[1], 0), 0);
-                 otherops[2] = XEXP (XEXP (operands[1], 0), 1);
-                 if (GET_CODE (XEXP (operands[1], 0)) == PLUS)
-                   {
-                     if (GET_CODE (otherops[2]) == CONST_INT)
-                       {
-                         switch (INTVAL (otherops[2]))
-                           {
-                           case -8:
-                             output_asm_insn ("ldm%?db\t%1, %M0", otherops);
-                             return "";
-                           case -4:
-                             output_asm_insn ("ldm%?da\t%1, %M0", otherops);
-                             return "";
-                           case 4:
-                             output_asm_insn ("ldm%?ib\t%1, %M0", otherops);
-                             return "";
-                           }
-                         if (!(const_ok_for_arm (INTVAL (otherops[2]))))
-                           output_asm_insn ("sub%?\t%0, %1, #%n2", otherops);
-                         else
-                           output_asm_insn ("add%?\t%0, %1, %2", otherops);
-                       }
-                     else
-                       output_asm_insn ("add%?\t%0, %1, %2", otherops);
-                   }
-                 else
-                   output_asm_insn ("sub%?\t%0, %1, %2", otherops);
-                 return "ldm%?ia\t%0, %M0";
-                }
-              else
-                {
-                 otherops[1] = adj_offsettable_operand (operands[1], 4);
-                 /* Take care of overlapping base/data reg.  */
-                 if (reg_mentioned_p (operands[0], operands[1]))
-                   {
-                     output_asm_insn ("ldr%?\t%0, %1", otherops);
-                     output_asm_insn ("ldr%?\t%0, %1", operands);
-                   }
-                 else
-                   {
-                     output_asm_insn ("ldr%?\t%0, %1", operands);
-                     output_asm_insn ("ldr%?\t%0, %1", otherops);
-                   }
-               }
-           }
-       }
-      else
-       abort();  /* Constraints should prevent this */
-    }
-  else if (code0 == MEM && code1 == REG)
-    {
-      if (REGNO (operands[1]) == 12)
-       abort();
-
-      switch (GET_CODE (XEXP (operands[0], 0)))
-        {
-       case REG:
-         output_asm_insn ("stm%?ia\t%m0, %M1", operands);
-         break;
-
-        case PRE_INC:
-         abort (); /* Should never happen now */
-         break;
+  base = gen_rtx_MEM (SImode, plus_constant (base, offset & ~2));
 
-        case PRE_DEC:
-         output_asm_insn ("stm%?db\t%m0!, %M1", operands);
-         break;
+  if ((BYTES_BIG_ENDIAN ? 1 : 0) ^ ((offset & 2) == 2))
+    return base;
 
-        case POST_INC:
-         output_asm_insn ("stm%?ia\t%m0!, %M1", operands);
-         break;
+  return gen_rtx_ROTATE (SImode, base, GEN_INT (16));
+}
 
-        case POST_DEC:
-         abort (); /* Should never happen now */
-         break;
+static enum machine_mode
+select_dominance_cc_mode (x, y, cond_or)
+     rtx x;
+     rtx y;
+     HOST_WIDE_INT cond_or;
+{
+  enum rtx_code cond1, cond2;
+  int swapped = 0;
 
-       case PLUS:
-         if (GET_CODE (XEXP (XEXP (operands[0], 0), 1)) == CONST_INT)
-           {
-             switch (INTVAL (XEXP (XEXP (operands[0], 0), 1)))
-               {
-               case -8:
-                 output_asm_insn ("stm%?db\t%m0, %M1", operands);
-                 return "";
+  /* Currently we will probably get the wrong result if the individual
+     comparisons are not simple.  This also ensures that it is safe to
+     reverse a comparison if necessary.  */
+  if ((arm_select_cc_mode (cond1 = GET_CODE (x), XEXP (x, 0), XEXP (x, 1))
+       != CCmode)
+      || (arm_select_cc_mode (cond2 = GET_CODE (y), XEXP (y, 0), XEXP (y, 1))
+         != CCmode))
+    return CCmode;
 
-               case -4:
-                 output_asm_insn ("stm%?da\t%m0, %M1", operands);
-                 return "";
+  if (cond_or)
+    cond1 = reverse_condition (cond1);
 
-               case 4:
-                 output_asm_insn ("stm%?ib\t%m0, %M1", operands);
-                 return "";
-               }
-           }
-         /* Fall through */
+  /* If the comparisons are not equal, and one doesn't dominate the other,
+     then we can't do this.  */
+  if (cond1 != cond2 
+      && ! comparison_dominates_p (cond1, cond2)
+      && (swapped = 1, ! comparison_dominates_p (cond2, cond1)))
+    return CCmode;
 
-        default:
-         otherops[0] = adj_offsettable_operand (operands[0], 4);
-         otherops[1] = gen_rtx (REG, SImode, 1 + REGNO (operands[1]));
-         output_asm_insn ("str%?\t%1, %0", operands);
-         output_asm_insn ("str%?\t%1, %0", otherops);
-       }
+  if (swapped)
+    {
+      enum rtx_code temp = cond1;
+      cond1 = cond2;
+      cond2 = temp;
     }
-  else
-    abort();  /* Constraints should prevent this */
-
-  return "";
-}
-
 
-/* Output an arbitrary MOV reg, #n.
-   OPERANDS[0] is a register.  OPERANDS[1] is a const_int.  */
+  switch (cond1)
+    {
+    case EQ:
+      if (cond2 == EQ || ! cond_or)
+       return CC_DEQmode;
 
-char *
-output_mov_immediate (operands)
-     rtx *operands;
-{
-  HOST_WIDE_INT n = INTVAL (operands[1]);
-  int n_ones = 0;
-  int i;
+      switch (cond2)
+       {
+       case LE: return CC_DLEmode;
+       case LEU: return CC_DLEUmode;
+       case GE: return CC_DGEmode;
+       case GEU: return CC_DGEUmode;
+       default: break;
+       }
 
-  /* Try to use one MOV */
-  if (const_ok_for_arm (n))
-    {
-      output_asm_insn ("mov%?\t%0, %1", operands);
-      return "";
-    }
+      break;
 
-  /* Try to use one MVN */
-  if (const_ok_for_arm (~n))
-    {
-      operands[1] = GEN_INT (~n);
-      output_asm_insn ("mvn%?\t%0, %1", operands);
-      return "";
-    }
+    case LT:
+      if (cond2 == LT || ! cond_or)
+       return CC_DLTmode;
+      if (cond2 == LE)
+       return CC_DLEmode;
+      if (cond2 == NE)
+       return CC_DNEmode;
+      break;
 
-  /* If all else fails, make it out of ORRs or BICs as appropriate. */
+    case GT:
+      if (cond2 == GT || ! cond_or)
+       return CC_DGTmode;
+      if (cond2 == GE)
+       return CC_DGEmode;
+      if (cond2 == NE)
+       return CC_DNEmode;
+      break;
+      
+    case LTU:
+      if (cond2 == LTU || ! cond_or)
+       return CC_DLTUmode;
+      if (cond2 == LEU)
+       return CC_DLEUmode;
+      if (cond2 == NE)
+       return CC_DNEmode;
+      break;
 
-  for (i=0; i < 32; i++)
-    if (n & 1 << i)
-      n_ones++;
+    case GTU:
+      if (cond2 == GTU || ! cond_or)
+       return CC_DGTUmode;
+      if (cond2 == GEU)
+       return CC_DGEUmode;
+      if (cond2 == NE)
+       return CC_DNEmode;
+      break;
 
-  if (n_ones > 16)  /* Shorter to use MVN with BIC in this case. */
-    output_multi_immediate(operands, "mvn%?\t%0, %1", "bic%?\t%0, %0, %1", 1,
-                          ~n);
-  else
-    output_multi_immediate(operands, "mov%?\t%0, %1", "orr%?\t%0, %0, %1", 1,
-                          n);
+    /* The remaining cases only occur when both comparisons are the
+       same.  */
+    case NE:
+      return CC_DNEmode;
 
-  return "";
-}
+    case LE:
+      return CC_DLEmode;
 
+    case GE:
+      return CC_DGEmode;
 
-/* Output an ADD r, s, #n where n may be too big for one instruction.  If
-   adding zero to one register, output nothing.  */
+    case LEU:
+      return CC_DLEUmode;
 
-char *
-output_add_immediate (operands)
-     rtx *operands;
-{
-  HOST_WIDE_INT n = INTVAL (operands[2]);
+    case GEU:
+      return CC_DGEUmode;
 
-  if (n != 0 || REGNO (operands[0]) != REGNO (operands[1]))
-    {
-      if (n < 0)
-       output_multi_immediate (operands,
-                               "sub%?\t%0, %1, %2", "sub%?\t%0, %0, %2", 2,
-                               -n);
-      else
-       output_multi_immediate (operands,
-                               "add%?\t%0, %1, %2", "add%?\t%0, %0, %2", 2,
-                               n);
+    default:
+      break;
     }
 
-  return "";
+  abort ();
 }
 
-/* Output a multiple immediate operation.
-   OPERANDS is the vector of operands referred to in the output patterns.
-   INSTR1 is the output pattern to use for the first constant.
-   INSTR2 is the output pattern to use for subsequent constants.
-   IMMED_OP is the index of the constant slot in OPERANDS.
-   N is the constant value.  */
-
-char *
-output_multi_immediate (operands, instr1, instr2, immed_op, n)
-     rtx *operands;
-     char *instr1, *instr2;
-     int immed_op;
-     HOST_WIDE_INT n;
+enum machine_mode
+arm_select_cc_mode (op, x, y)
+     enum rtx_code op;
+     rtx x;
+     rtx y;
 {
-#if HOST_BITS_PER_WIDE_INT > 32
-  n &= 0xffffffff;
-#endif
-
-  if (n == 0)
-    {
-      operands[immed_op] = const0_rtx;
-      output_asm_insn (instr1, operands); /* Quick and easy output */
-    }
-  else
-    {
-      int i;
-      char *instr = instr1;
-
-      /* Note that n is never zero here (which would give no output) */
-      for (i = 0; i < 32; i += 2)
-       {
-         if (n & (3 << i))
-           {
-             operands[immed_op] = GEN_INT (n & (255 << i));
-             output_asm_insn (instr, operands);
-             instr = instr2;
-             i += 6;
-           }
-       }
-    }
-  return "";
-}
-
-
-/* Return the appropriate ARM instruction for the operation code.
-   The returned result should not be overwritten.  OP is the rtx of the
-   operation.  SHIFT_FIRST_ARG is TRUE if the first argument of the operator
-   was shifted.  */
+  /* All floating point compares return CCFP if it is an equality
+     comparison, and CCFPE otherwise.  */
+  if (GET_MODE_CLASS (GET_MODE (x)) == MODE_FLOAT)
+    return (op == EQ || op == NE) ? CCFPmode : CCFPEmode;
+  
+  /* A compare with a shifted operand.  Because of canonicalization, the
+     comparison will have to be swapped when we emit the assembler.  */
+  if (GET_MODE (y) == SImode && GET_CODE (y) == REG
+      && (GET_CODE (x) == ASHIFT || GET_CODE (x) == ASHIFTRT
+         || GET_CODE (x) == LSHIFTRT || GET_CODE (x) == ROTATE
+         || GET_CODE (x) == ROTATERT))
+    return CC_SWPmode;
 
-char *
-arithmetic_instr (op, shift_first_arg)
-     rtx op;
-     int shift_first_arg;
-{
-  switch (GET_CODE (op))
-    {
-    case PLUS:
-      return "add";
+  /* This is a special case that is used by combine to allow a 
+     comparison of a shifted byte load to be split into a zero-extend
+     followed by a comparison of the shifted integer (only valid for
+     equalities and unsigned inequalities).  */
+  if (GET_MODE (x) == SImode
+      && GET_CODE (x) == ASHIFT
+      && GET_CODE (XEXP (x, 1)) == CONST_INT && INTVAL (XEXP (x, 1)) == 24
+      && GET_CODE (XEXP (x, 0)) == SUBREG
+      && GET_CODE (SUBREG_REG (XEXP (x, 0))) == MEM
+      && GET_MODE (SUBREG_REG (XEXP (x, 0))) == QImode
+      && (op == EQ || op == NE
+         || op == GEU || op == GTU || op == LTU || op == LEU)
+      && GET_CODE (y) == CONST_INT)
+    return CC_Zmode;
 
-    case MINUS:
-      return shift_first_arg ? "rsb" : "sub";
+  /* An operation that sets the condition codes as a side-effect, the
+     V flag is not set correctly, so we can only use comparisons where
+     this doesn't matter.  (For LT and GE we can use "mi" and "pl"
+     instead.  */
+  if (GET_MODE (x) == SImode
+      && y == const0_rtx
+      && (op == EQ || op == NE || op == LT || op == GE)
+      && (GET_CODE (x) == PLUS || GET_CODE (x) == MINUS
+         || GET_CODE (x) == AND || GET_CODE (x) == IOR
+         || GET_CODE (x) == XOR || GET_CODE (x) == MULT
+         || GET_CODE (x) == NOT || GET_CODE (x) == NEG
+         || GET_CODE (x) == LSHIFTRT
+         || GET_CODE (x) == ASHIFT || GET_CODE (x) == ASHIFTRT
+         || GET_CODE (x) == ROTATERT || GET_CODE (x) == ZERO_EXTRACT))
+    return CC_NOOVmode;
 
-    case IOR:
-      return "orr";
+  /* A construct for a conditional compare, if the false arm contains
+     0, then both conditions must be true, otherwise either condition
+     must be true.  Not all conditions are possible, so CCmode is
+     returned if it can't be done.  */
+  if (GET_CODE (x) == IF_THEN_ELSE
+      && (XEXP (x, 2) == const0_rtx
+         || XEXP (x, 2) == const1_rtx)
+      && GET_RTX_CLASS (GET_CODE (XEXP (x, 0))) == '<'
+      && GET_RTX_CLASS (GET_CODE (XEXP (x, 1))) == '<')
+    return select_dominance_cc_mode (XEXP (x, 0), XEXP (x, 1), 
+                                    INTVAL (XEXP (x, 2)));
 
-    case XOR:
-      return "eor";
+  if (GET_MODE (x) == QImode && (op == EQ || op == NE))
+    return CC_Zmode;
 
-    case AND:
-      return "and";
+  if (GET_MODE (x) == SImode && (op == LTU || op == GEU)
+      && GET_CODE (x) == PLUS
+      && (rtx_equal_p (XEXP (x, 0), y) || rtx_equal_p (XEXP (x, 1), y)))
+    return CC_Cmode;
 
-    default:
-      abort ();
-    }
+  return CCmode;
 }
 
+/* X and Y are two things to compare using CODE.  Emit the compare insn and
+   return the rtx for register 0 in the proper mode.  FP means this is a
+   floating point compare: I don't think that it is needed on the arm.  */
 
-/* Ensure valid constant shifts and return the appropriate shift mnemonic
-   for the operation code.  The returned result should not be overwritten.
-   OP is the rtx code of the shift.
-   On exit, *AMOUNTP will be -1 if the shift is by a register, or a constant
-   shift. */
-
-static char *
-shift_op (op, amountp)
-     rtx op;
-     HOST_WIDE_INT *amountp;
+rtx
+arm_gen_compare_reg (code, x, y)
+     enum rtx_code code;
+     rtx x, y;
 {
-  char *mnem;
-  enum rtx_code code = GET_CODE (op);
-
-  if (GET_CODE (XEXP (op, 1)) == REG || GET_CODE (XEXP (op, 1)) == SUBREG)
-    *amountp = -1;
-  else if (GET_CODE (XEXP (op, 1)) == CONST_INT)
-    *amountp = INTVAL (XEXP (op, 1));
-  else
-    abort ();
-
-  switch (code)
-    {
-    case ASHIFT:
-      mnem = "asl";
-      break;
-
-    case ASHIFTRT:
-      mnem = "asr";
-      break;
+  enum machine_mode mode = SELECT_CC_MODE (code, x, y);
+  rtx cc_reg = gen_rtx_REG (mode, CC_REGNUM);
 
-    case LSHIFTRT:
-      mnem = "lsr";
-      break;
+  emit_insn (gen_rtx_SET (VOIDmode, cc_reg,
+                         gen_rtx_COMPARE (mode, x, y)));
 
-    case ROTATERT:
-      mnem = "ror";
-      break;
+  return cc_reg;
+}
 
-    case MULT:
-      /* We never have to worry about the amount being other than a
-        power of 2, since this case can never be reloaded from a reg.  */
-      if (*amountp != -1)
-       *amountp = int_log2 (*amountp);
-      else
-       abort ();
-      return "asl";
+void
+arm_reload_in_hi (operands)
+     rtx * operands;
+{
+  rtx ref = operands[1];
+  rtx base, scratch;
+  HOST_WIDE_INT offset = 0;
 
-    default:
-      abort ();
+  if (GET_CODE (ref) == SUBREG)
+    {
+      offset = SUBREG_WORD (ref) * UNITS_PER_WORD;
+      if (BYTES_BIG_ENDIAN)
+       offset -= (MIN (UNITS_PER_WORD, GET_MODE_SIZE (GET_MODE (ref)))
+                  - MIN (UNITS_PER_WORD,
+                         GET_MODE_SIZE (GET_MODE (SUBREG_REG (ref)))));
+      ref = SUBREG_REG (ref);
     }
 
-  if (*amountp != -1)
+  if (GET_CODE (ref) == REG)
     {
-      /* This is not 100% correct, but follows from the desire to merge
-        multiplication by a power of 2 with the recognizer for a
-        shift.  >=32 is not a valid shift for "asl", so we must try and
-        output a shift that produces the correct arithmetical result.
-        Using lsr #32 is identical except for the fact that the carry bit
-        is not set correctly if we set the flags; but we never use the 
-        carry bit from such an operation, so we can ignore that.  */
-      if (code == ROTATERT)
-       *amountp &= 31;         /* Rotate is just modulo 32 */
-      else if (*amountp != (*amountp & 31))
+      /* We have a pseudo which has been spilt onto the stack; there
+        are two cases here: the first where there is a simple
+        stack-slot replacement and a second where the stack-slot is
+        out of range, or is used as a subreg.  */
+      if (reg_equiv_mem[REGNO (ref)])
        {
-         if (code == ASHIFT)
-           mnem = "lsr";
-         *amountp = 32;
+         ref = reg_equiv_mem[REGNO (ref)];
+         base = find_replacement (&XEXP (ref, 0));
        }
+      else
+       /* The slot is out of range, or was dressed up in a SUBREG.  */
+       base = reg_equiv_address[REGNO (ref)];
+    }
+  else
+    base = find_replacement (&XEXP (ref, 0));
 
-      /* Shifts of 0 are no-ops.  */
-      if (*amountp == 0)
-       return NULL;
-    }    
+  /* Handle the case where the address is too complex to be offset by 1.  */
+  if (GET_CODE (base) == MINUS
+      || (GET_CODE (base) == PLUS && GET_CODE (XEXP (base, 1)) != CONST_INT))
+    {
+      rtx base_plus = gen_rtx_REG (SImode, REGNO (operands[2]) + 1);
 
-  return mnem;
-}
+      emit_insn (gen_rtx_SET (VOIDmode, base_plus, base));
+      base = base_plus;
+    }
+  else if (GET_CODE (base) == PLUS)
+    {
+      /* The addend must be CONST_INT, or we would have dealt with it above.  */
+      HOST_WIDE_INT hi, lo;
 
+      offset += INTVAL (XEXP (base, 1));
+      base = XEXP (base, 0);
 
-/* Obtain the shift from the POWER of two. */
+      /* Rework the address into a legal sequence of insns.  */
+      /* Valid range for lo is -4095 -> 4095 */
+      lo = (offset >= 0
+           ? (offset & 0xfff)
+           : -((-offset) & 0xfff));
 
-HOST_WIDE_INT
-int_log2 (power)
-     HOST_WIDE_INT power;
-{
-  HOST_WIDE_INT shift = 0;
+      /* Corner case, if lo is the max offset then we would be out of range
+        once we have added the additional 1 below, so bump the msb into the
+        pre-loading insn(s).  */
+      if (lo == 4095)
+       lo &= 0x7ff;
 
-  while (((((HOST_WIDE_INT) 1) << shift) & power) == 0)
-    {
-      if (shift > 31)
+      hi = ((((offset - lo) & HOST_INT (0xffffffff))
+            ^ HOST_INT (0x80000000))
+           -  HOST_INT (0x80000000));
+
+      if (hi + lo != offset)
        abort ();
-      shift++;
+
+      if (hi != 0)
+       {
+         rtx base_plus = gen_rtx_REG (SImode, REGNO (operands[2]) + 1);
+
+         /* Get the base address; addsi3 knows how to handle constants
+            that require more than one insn.  */
+         emit_insn (gen_addsi3 (base_plus, base, GEN_INT (hi)));
+         base = base_plus;
+         offset = lo;
+       }
     }
 
-  return shift;
+  scratch = gen_rtx_REG (SImode, REGNO (operands[2]));
+  emit_insn (gen_zero_extendqisi2 (scratch,
+                                  gen_rtx_MEM (QImode,
+                                               plus_constant (base,
+                                                              offset))));
+  emit_insn (gen_zero_extendqisi2 (gen_rtx_SUBREG (SImode, operands[0], 0),
+                                  gen_rtx_MEM (QImode, 
+                                               plus_constant (base,
+                                                              offset + 1))));
+  if (! BYTES_BIG_ENDIAN)
+    emit_insn (gen_rtx_SET (VOIDmode, gen_rtx_SUBREG (SImode, operands[0], 0),
+                       gen_rtx_IOR (SImode, 
+                                    gen_rtx_ASHIFT
+                                    (SImode,
+                                     gen_rtx_SUBREG (SImode, operands[0], 0),
+                                     GEN_INT (8)),
+                                    scratch)));
+  else
+    emit_insn (gen_rtx_SET (VOIDmode, gen_rtx_SUBREG (SImode, operands[0], 0),
+                           gen_rtx_IOR (SImode, 
+                                        gen_rtx_ASHIFT (SImode, scratch,
+                                                        GEN_INT (8)),
+                                        gen_rtx_SUBREG (SImode, operands[0],
+                                                        0))));
 }
 
-/* Output a .ascii pseudo-op, keeping track of lengths.  This is because
-   /bin/as is horribly restrictive.  */
-
+/* Handle storing a half-word to memory during reload by synthesising as two
+   byte stores.  Take care not to clobber the input values until after we
+   have moved them somewhere safe.  This code assumes that if the DImode
+   scratch in operands[2] overlaps either the input value or output address
+   in some way, then that value must die in this insn (we absolutely need
+   two scratch registers for some corner cases).  */
 void
-output_ascii_pseudo_op (stream, p, len)
-     FILE *stream;
-     unsigned char *p;
-     int len;
+arm_reload_out_hi (operands)
+     rtx * operands;
 {
-  int i;
-  int len_so_far = 1000;
-  int chars_so_far = 0;
+  rtx ref = operands[0];
+  rtx outval = operands[1];
+  rtx base, scratch;
+  HOST_WIDE_INT offset = 0;
 
-  for (i = 0; i < len; i++)
+  if (GET_CODE (ref) == SUBREG)
     {
-      register int c = p[i];
-
-      if (len_so_far > 50)
-       {
-         if (chars_so_far)
-           fputs ("\"\n", stream);
-         fputs ("\t.ascii\t\"", stream);
-         len_so_far = 0;
-         arm_increase_location (chars_so_far);
-         chars_so_far = 0;
-       }
+      offset = SUBREG_WORD (ref) * UNITS_PER_WORD;
+      if (BYTES_BIG_ENDIAN)
+       offset -= (MIN (UNITS_PER_WORD, GET_MODE_SIZE (GET_MODE (ref)))
+                  - MIN (UNITS_PER_WORD,
+                         GET_MODE_SIZE (GET_MODE (SUBREG_REG (ref)))));
+      ref = SUBREG_REG (ref);
+    }
 
-      if (c == '\"' || c == '\\')
-       {
-         putc('\\', stream);
-         len_so_far++;
-       }
 
-      if (c >= ' ' && c < 0177)
+  if (GET_CODE (ref) == REG)
+    {
+      /* We have a pseudo which has been spilt onto the stack; there
+        are two cases here: the first where there is a simple
+        stack-slot replacement and a second where the stack-slot is
+        out of range, or is used as a subreg.  */
+      if (reg_equiv_mem[REGNO (ref)])
        {
-         putc (c, stream);
-         len_so_far++;
+         ref = reg_equiv_mem[REGNO (ref)];
+         base = find_replacement (&XEXP (ref, 0));
        }
       else
+       /* The slot is out of range, or was dressed up in a SUBREG.  */
+       base = reg_equiv_address[REGNO (ref)];
+    }
+  else
+    base = find_replacement (&XEXP (ref, 0));
+
+  scratch = gen_rtx_REG (SImode, REGNO (operands[2]));
+
+  /* Handle the case where the address is too complex to be offset by 1.  */
+  if (GET_CODE (base) == MINUS
+      || (GET_CODE (base) == PLUS && GET_CODE (XEXP (base, 1)) != CONST_INT))
+    {
+      rtx base_plus = gen_rtx_REG (SImode, REGNO (operands[2]) + 1);
+
+      /* Be careful not to destroy OUTVAL.  */
+      if (reg_overlap_mentioned_p (base_plus, outval))
        {
-         fprintf (stream, "\\%03o", c);
-         len_so_far +=4;
+         /* Updating base_plus might destroy outval, see if we can
+            swap the scratch and base_plus.  */
+         if (! reg_overlap_mentioned_p (scratch, outval))
+           {
+             rtx tmp = scratch;
+             scratch = base_plus;
+             base_plus = tmp;
+           }
+         else
+           {
+             rtx scratch_hi = gen_rtx_REG (HImode, REGNO (operands[2]));
+
+             /* Be conservative and copy OUTVAL into the scratch now,
+                this should only be necessary if outval is a subreg
+                of something larger than a word.  */
+             /* XXX Might this clobber base?  I can't see how it can,
+                since scratch is known to overlap with OUTVAL, and
+                must be wider than a word.  */
+             emit_insn (gen_movhi (scratch_hi, outval));
+             outval = scratch_hi;
+           }
        }
 
-      chars_so_far++;
+      emit_insn (gen_rtx_SET (VOIDmode, base_plus, base));
+      base = base_plus;
     }
+  else if (GET_CODE (base) == PLUS)
+    {
+      /* The addend must be CONST_INT, or we would have dealt with it above.  */
+      HOST_WIDE_INT hi, lo;
 
-  fputs ("\"\n", stream);
-  arm_increase_location (chars_so_far);
-}
-\f
+      offset += INTVAL (XEXP (base, 1));
+      base = XEXP (base, 0);
 
-/* Try to determine whether a pattern really clobbers the link register.
-   This information is useful when peepholing, so that lr need not be pushed
-   if we combine a call followed by a return.
-   NOTE: This code does not check for side-effect expressions in a SET_SRC:
-   such a check should not be needed because these only update an existing
-   value within a register; the register must still be set elsewhere within
-   the function. */
+      /* Rework the address into a legal sequence of insns.  */
+      /* Valid range for lo is -4095 -> 4095 */
+      lo = (offset >= 0
+           ? (offset & 0xfff)
+           : -((-offset) & 0xfff));
 
-static int
-pattern_really_clobbers_lr (x)
-     rtx x;
-{
-  int i;
-  
-  switch (GET_CODE (x))
-    {
-    case SET:
-      switch (GET_CODE (SET_DEST (x)))
-       {
-       case REG:
-         return REGNO (SET_DEST (x)) == 14;
+      /* Corner case, if lo is the max offset then we would be out of range
+        once we have added the additional 1 below, so bump the msb into the
+        pre-loading insn(s).  */
+      if (lo == 4095)
+       lo &= 0x7ff;
 
-        case SUBREG:
-         if (GET_CODE (XEXP (SET_DEST (x), 0)) == REG)
-           return REGNO (XEXP (SET_DEST (x), 0)) == 14;
+      hi = ((((offset - lo) & HOST_INT (0xffffffff))
+            ^ HOST_INT (0x80000000))
+           -  HOST_INT (0x80000000));
 
-         if (GET_CODE (XEXP (SET_DEST (x), 0)) == MEM)
-           return 0;
-         abort ();
+      if (hi + lo != offset)
+       abort ();
 
-        default:
-         return 0;
-        }
+      if (hi != 0)
+       {
+         rtx base_plus = gen_rtx_REG (SImode, REGNO (operands[2]) + 1);
 
-    case PARALLEL:
-      for (i = 0; i < XVECLEN (x, 0); i++)
-       if (pattern_really_clobbers_lr (XVECEXP (x, 0, i)))
-         return 1;
-      return 0;
+         /* Be careful not to destroy OUTVAL.  */
+         if (reg_overlap_mentioned_p (base_plus, outval))
+           {
+             /* Updating base_plus might destroy outval, see if we
+                can swap the scratch and base_plus.  */
+             if (! reg_overlap_mentioned_p (scratch, outval))
+               {
+                 rtx tmp = scratch;
+                 scratch = base_plus;
+                 base_plus = tmp;
+               }
+             else
+               {
+                 rtx scratch_hi = gen_rtx_REG (HImode, REGNO (operands[2]));
+
+                 /* Be conservative and copy outval into scratch now,
+                    this should only be necessary if outval is a
+                    subreg of something larger than a word.  */
+                 /* XXX Might this clobber base?  I can't see how it
+                    can, since scratch is known to overlap with
+                    outval.  */
+                 emit_insn (gen_movhi (scratch_hi, outval));
+                 outval = scratch_hi;
+               }
+           }
 
-    case CLOBBER:
-      switch (GET_CODE (XEXP (x, 0)))
-        {
-       case REG:
-         return REGNO (XEXP (x, 0)) == 14;
+         /* Get the base address; addsi3 knows how to handle constants
+            that require more than one insn.  */
+         emit_insn (gen_addsi3 (base_plus, base, GEN_INT (hi)));
+         base = base_plus;
+         offset = lo;
+       }
+    }
 
-        case SUBREG:
-         if (GET_CODE (XEXP (XEXP (x, 0), 0)) == REG)
-           return REGNO (XEXP (XEXP (x, 0), 0)) == 14;
-         abort ();
+  if (BYTES_BIG_ENDIAN)
+    {
+      emit_insn (gen_movqi (gen_rtx_MEM (QImode, 
+                                        plus_constant (base, offset + 1)),
+                           gen_rtx_SUBREG (QImode, outval, 0)));
+      emit_insn (gen_lshrsi3 (scratch,
+                             gen_rtx_SUBREG (SImode, outval, 0),
+                             GEN_INT (8)));
+      emit_insn (gen_movqi (gen_rtx_MEM (QImode, plus_constant (base, offset)),
+                           gen_rtx_SUBREG (QImode, scratch, 0)));
+    }
+  else
+    {
+      emit_insn (gen_movqi (gen_rtx_MEM (QImode, plus_constant (base, offset)),
+                           gen_rtx_SUBREG (QImode, outval, 0)));
+      emit_insn (gen_lshrsi3 (scratch,
+                             gen_rtx_SUBREG (SImode, outval, 0),
+                             GEN_INT (8)));
+      emit_insn (gen_movqi (gen_rtx_MEM (QImode,
+                                        plus_constant (base, offset + 1)),
+                           gen_rtx_SUBREG (QImode, scratch, 0)));
+    }
+}
+\f
+/* Print a symbolic form of X to the debug file, F.  */
+static void
+arm_print_value (f, x)
+     FILE * f;
+     rtx x;
+{
+  switch (GET_CODE (x))
+    {
+    case CONST_INT:
+      fprintf (f, HOST_WIDE_INT_PRINT_HEX, INTVAL (x));
+      return;
 
-        default:
-         return 0;
-        }
+    case CONST_DOUBLE:
+      fprintf (f, "<0x%lx,0x%lx>", (long)XWINT (x, 2), (long)XWINT (x, 3));
+      return;
 
-    case UNSPEC:
-      return 1;
+    case CONST_STRING:
+      fprintf (f, "\"%s\"", XSTR (x, 0));
+      return;
+
+    case SYMBOL_REF:
+      fprintf (f, "`%s'", XSTR (x, 0));
+      return;
+
+    case LABEL_REF:
+      fprintf (f, "L%d", INSN_UID (XEXP (x, 0)));
+      return;
+
+    case CONST:
+      arm_print_value (f, XEXP (x, 0));
+      return;
+
+    case PLUS:
+      arm_print_value (f, XEXP (x, 0));
+      fprintf (f, "+");
+      arm_print_value (f, XEXP (x, 1));
+      return;
+
+    case PC:
+      fprintf (f, "pc");
+      return;
 
     default:
-      return 0;
+      fprintf (f, "????");
+      return;
     }
 }
+\f
+/* Routines for manipulation of the constant pool.  */
 
-static int
-function_really_clobbers_lr (first)
-     rtx first;
-{
-  rtx insn, next;
-  
-  for (insn = first; insn; insn = next_nonnote_insn (insn))
-    {
-      switch (GET_CODE (insn))
-        {
-       case BARRIER:
-       case NOTE:
-       case CODE_LABEL:
-       case JUMP_INSN:         /* Jump insns only change the PC (and conds) */
-       case INLINE_HEADER:
-         break;
-
-        case INSN:
-         if (pattern_really_clobbers_lr (PATTERN (insn)))
-           return 1;
-         break;
+/* Arm instructions cannot load a large constant directly into a
+   register; they have to come from a pc relative load.  The constant
+   must therefore be placed in the addressable range of the pc
+   relative load.  Depending on the precise pc relative load
+   instruction the range is somewhere between 256 bytes and 4k.  This
+   means that we often have to dump a constant inside a function, and
+   generate code to branch around it.
 
-        case CALL_INSN:
-         /* Don't yet know how to handle those calls that are not to a 
-            SYMBOL_REF */
-         if (GET_CODE (PATTERN (insn)) != PARALLEL)
-           abort ();
+   It is important to minimize this, since the branches will slow
+   things down and make the code larger.
 
-         switch (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)))
-           {
-           case CALL:
-             if (GET_CODE (XEXP (XEXP (XVECEXP (PATTERN (insn), 0, 0), 0), 0))
-                 != SYMBOL_REF)
-               return 1;
-             break;
+   Normally we can hide the table after an existing unconditional
+   branch so that there is no interruption of the flow, but in the
+   worst case the code looks like this:
 
-           case SET:
-             if (GET_CODE (XEXP (XEXP (SET_SRC (XVECEXP (PATTERN (insn),
-                                                         0, 0)), 0), 0))
-                 != SYMBOL_REF)
-               return 1;
-             break;
+       ldr     rn, L1
+       ...
+       b       L2
+       align
+       L1:     .long value
+       L2:
+       ...
 
-           default:    /* Don't recognize it, be safe */
-             return 1;
-           }
+       ldr     rn, L3
+       ...
+       b       L4
+       align
+       L3:     .long value
+       L4:
+       ...
+
+   We fix this by performing a scan after scheduling, which notices
+   which instructions need to have their operands fetched from the
+   constant table and builds the table.
+
+   The algorithm starts by building a table of all the constants that
+   need fixing up and all the natural barriers in the function (places
+   where a constant table can be dropped without breaking the flow).
+   For each fixup we note how far the pc-relative replacement will be
+   able to reach and the offset of the instruction into the function.
+
+   Having built the table we then group the fixes together to form
+   tables that are as large as possible (subject to addressing
+   constraints) and emit each table of constants after the last
+   barrier that is within range of all the instructions in the group.
+   If a group does not contain a barrier, then we forcibly create one
+   by inserting a jump instruction into the flow.  Once the table has
+   been inserted, the insns are then modified to reference the
+   relevant entry in the pool.
+
+   Possible enhancements to the algorithm (not implemented) are:
+
+   1) For some processors and object formats, there may be benefit in
+   aligning the pools to the start of cache lines; this alignment
+   would need to be taken into account when calculating addressability
+   of a pool.  */
+
+/* These typedefs are located at the start of this file, so that
+   they can be used in the prototypes there.  This comment is to
+   remind readers of that fact so that the following structures
+   can be understood more easily.
+
+     typedef struct minipool_node    Mnode;
+     typedef struct minipool_fixup   Mfix;  */
+
+struct minipool_node
+{
+  /* Doubly linked chain of entries.  */
+  Mnode * next;
+  Mnode * prev;
+  /* The maximum offset into the code that this entry can be placed.  While
+     pushing fixes for forward references, all entries are sorted in order
+     of increasing max_address.  */
+  HOST_WIDE_INT max_address;
+  /* Similarly for a entry inserted for a backwards ref.  */
+  HOST_WIDE_INT min_address;
+  /* The number of fixes referencing this entry.  This can become zero
+     if we "unpush" an entry.  In this case we ignore the entry when we
+     come to emit the code.  */
+  int refcount;
+  /* The offset from the start of the minipool.  */
+  HOST_WIDE_INT offset;
+  /* The value in table.  */
+  rtx value;
+  /* The mode of value.  */
+  enum machine_mode mode;
+  int fix_size;
+};
 
-         /* A call can be made (by peepholing) not to clobber lr iff it is
-            followed by a return.  There may, however, be a use insn iff
-            we are returning the result of the call. 
-            If we run off the end of the insn chain, then that means the
-            call was at the end of the function.  Unfortunately we don't
-            have a return insn for the peephole to recognize, so we
-            must reject this.  (Can this be fixed by adding our own insn?) */
-         if ((next = next_nonnote_insn (insn)) == NULL)
-           return 1;
+struct minipool_fixup
+{
+  Mfix *            next;
+  rtx               insn;
+  HOST_WIDE_INT     address;
+  rtx *             loc;
+  enum machine_mode mode;
+  int               fix_size;
+  rtx               value;
+  Mnode *           minipool;
+  HOST_WIDE_INT     forwards;
+  HOST_WIDE_INT     backwards;
+};
 
-         if (GET_CODE (next) == INSN && GET_CODE (PATTERN (next)) == USE
-             && (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)) == SET)
-             && (REGNO (SET_DEST (XVECEXP (PATTERN (insn), 0, 0)))
-                 == REGNO (XEXP (PATTERN (next), 0))))
-           if ((next = next_nonnote_insn (next)) == NULL)
-             return 1;
+/* Fixes less than a word need padding out to a word boundary.  */
+#define MINIPOOL_FIX_SIZE(mode) \
+  (GET_MODE_SIZE ((mode)) >= 4 ? GET_MODE_SIZE ((mode)) : 4)
 
-         if (GET_CODE (next) == JUMP_INSN
-             && GET_CODE (PATTERN (next)) == RETURN)
-           break;
-         return 1;
+static Mnode * minipool_vector_head;
+static Mnode * minipool_vector_tail;
+static rtx     minipool_vector_label;
 
-        default:
-         abort ();
-        }
-    }
+/* The linked list of all minipool fixes required for this function.  */
+Mfix *                 minipool_fix_head;
+Mfix *                 minipool_fix_tail;
+/* The fix entry for the current minipool, once it has been placed.  */
+Mfix *         minipool_barrier;
 
-  /* We have reached the end of the chain so lr was _not_ clobbered */
-  return 0;
+/* Determines if INSN is the start of a jump table.  Returns the end
+   of the TABLE or NULL_RTX.  */
+static rtx
+is_jump_table (insn)
+     rtx insn;
+{
+  rtx table;
+  
+  if (GET_CODE (insn) == JUMP_INSN
+      && JUMP_LABEL (insn) != NULL
+      && ((table = next_real_insn (JUMP_LABEL (insn)))
+         == next_real_insn (insn))
+      && table != NULL
+      && GET_CODE (table) == JUMP_INSN
+      && (GET_CODE (PATTERN (table)) == ADDR_VEC
+         || GET_CODE (PATTERN (table)) == ADDR_DIFF_VEC))
+    return table;
+
+  return NULL_RTX;
 }
 
-char *
-output_return_instruction (operand, really_return, reverse)
-     rtx operand;
-     int really_return;
-     int reverse;
+static HOST_WIDE_INT
+get_jump_table_size (insn)
+     rtx insn;
 {
-  char instr[100];
-  int reg, live_regs = 0;
-  int volatile_func = (optimize > 0 
-                      && TREE_THIS_VOLATILE (current_function_decl));
+  rtx body = PATTERN (insn);
+  int elt = GET_CODE (body) == ADDR_DIFF_VEC ? 1 : 0;
 
-  return_used_this_function = 1;
+  return GET_MODE_SIZE (GET_MODE (body)) * XVECLEN (body, elt);
+}
 
-  if (volatile_func)
+/* Move a minipool fix MP from its current location to before MAX_MP.
+   If MAX_MP is NULL, then MP doesn't need moving, but the addressing
+   contrains may need updating.  */
+static Mnode *
+move_minipool_fix_forward_ref (mp, max_mp, max_address)
+     Mnode *       mp;
+     Mnode *       max_mp;
+     HOST_WIDE_INT max_address;
+{
+  /* This should never be true and the code below assumes these are
+     different.  */
+  if (mp == max_mp)
+    abort ();
+
+  if (max_mp == NULL)
     {
-      rtx ops[2];
-      /* If this function was declared non-returning, and we have found a tail 
-        call, then we have to trust that the called function won't return. */
-      if (! really_return)
-       return "";
-
-      /* Otherwise, trap an attempted return by aborting. */
-      ops[0] = operand;
-      ops[1] = gen_rtx (SYMBOL_REF, Pmode, "abort");
-      assemble_external_libcall (ops[1]);
-      output_asm_insn (reverse ? "bl%D0\t%a1" : "bl%d0\t%a1", ops);
-      return "";
+      if (max_address < mp->max_address)
+       mp->max_address = max_address;
     }
+  else
+    {
+      if (max_address > max_mp->max_address - mp->fix_size)
+       mp->max_address = max_mp->max_address - mp->fix_size;
+      else
+       mp->max_address = max_address;
+
+      /* Unlink MP from its current position.  Since max_mp is non-null,
+       mp->prev must be non-null.  */
+      mp->prev->next = mp->next;
+      if (mp->next != NULL)
+       mp->next->prev = mp->prev;
+      else
+       minipool_vector_tail = mp->prev;
+
+      /* Re-insert it before MAX_MP.  */
+      mp->next = max_mp;
+      mp->prev = max_mp->prev;
+      max_mp->prev = mp;
       
-  if (current_function_calls_alloca && ! really_return)
-    abort();
-    
-  for (reg = 0; reg <= 10; reg++)
-    if (regs_ever_live[reg] && ! call_used_regs[reg])
-      live_regs++;
+      if (mp->prev != NULL)
+       mp->prev->next = mp;
+      else
+       minipool_vector_head = mp;
+    }
 
-  if (live_regs || (regs_ever_live[14] && ! lr_save_eliminated))
-    live_regs++;
+  /* Save the new entry.  */
+  max_mp = mp;
 
-  if (frame_pointer_needed)
-    live_regs += 4;
+  /* Scan over the preceeding entries and adjust their addresses as
+     required.  */
+  while (mp->prev != NULL
+        && mp->prev->max_address > mp->max_address - mp->prev->fix_size)
+    {
+      mp->prev->max_address = mp->max_address - mp->prev->fix_size;
+      mp = mp->prev;
+    }
+
+  return max_mp;
+}
+
+/* Add a constant to the minipool for a forward reference.  Returns the
+   node added or NULL if the constant will not fit in this pool.  */
+static Mnode *
+add_minipool_forward_ref (fix)
+     Mfix * fix;
+{
+  /* If set, max_mp is the first pool_entry that has a lower
+     constraint than the one we are trying to add.  */
+  Mnode *       max_mp = NULL;
+  HOST_WIDE_INT max_address = fix->address + fix->forwards;
+  Mnode *       mp;
+  
+  /* If this fix's address is greater than the address of the first
+     entry, then we can't put the fix in this pool.  We subtract the
+     size of the current fix to ensure that if the table is fully
+     packed we still have enough room to insert this value by suffling
+     the other fixes forwards.  */
+  if (minipool_vector_head &&
+      fix->address >= minipool_vector_head->max_address - fix->fix_size)
+    return NULL;
 
-  if (live_regs)
+  /* Scan the pool to see if a constant with the same value has
+     already been added.  While we are doing this, also note the
+     location where we must insert the constant if it doesn't already
+     exist.  */
+  for (mp = minipool_vector_head; mp != NULL; mp = mp->next)
     {
-      if (lr_save_eliminated || ! regs_ever_live[14])
-        live_regs++;
+      if (GET_CODE (fix->value) == GET_CODE (mp->value)
+         && fix->mode == mp->mode
+         && (GET_CODE (fix->value) != CODE_LABEL
+             || (CODE_LABEL_NUMBER (fix->value)
+                 == CODE_LABEL_NUMBER (mp->value)))
+         && rtx_equal_p (fix->value, mp->value))
+       {
+         /* More than one fix references this entry.  */
+         mp->refcount++;
+         return move_minipool_fix_forward_ref (mp, max_mp, max_address);
+       }
 
-      if (frame_pointer_needed)
-        strcpy (instr,
-               reverse ? "ldm%?%D0ea\t%|fp, {" : "ldm%?%d0ea\t%|fp, {");
-      else
-        strcpy (instr, 
-               reverse ? "ldm%?%D0fd\t%|sp!, {" : "ldm%?%d0fd\t%|sp!, {");
+      /* Note the insertion point if necessary.  */
+      if (max_mp == NULL
+         && mp->max_address > max_address)
+       max_mp = mp;
+    }
 
-      for (reg = 0; reg <= 10; reg++)
-        if (regs_ever_live[reg] && ! call_used_regs[reg])
-          {
-           strcat (instr, "%|");
-            strcat (instr, reg_names[reg]);
-           if (--live_regs)
-              strcat (instr, ", ");
-          }
+  /* The value is not currently in the minipool, so we need to create
+     a new entry for it.  If MAX_MP is NULL, the entry will be put on
+     the end of the list since the placement is less constrained than
+     any existing entry.  Otherwise, we insert the new fix before
+     MAX_MP and, if neceesary, adjust the constraints on the other
+     entries.  */
+  mp = xmalloc (sizeof (* mp));
+  mp->fix_size = fix->fix_size;
+  mp->mode = fix->mode;
+  mp->value = fix->value;
+  mp->refcount = 1;
+  /* Not yet required for a backwards ref.  */
+  mp->min_address = -65536;
+
+  if (max_mp == NULL)
+    {
+      mp->max_address = max_address;
+      mp->next = NULL;
+      mp->prev = minipool_vector_tail;
 
-      if (frame_pointer_needed)
-        {
-         strcat (instr, "%|");
-          strcat (instr, reg_names[11]);
-          strcat (instr, ", ");
-         strcat (instr, "%|");
-          strcat (instr, reg_names[13]);
-          strcat (instr, ", ");
-         strcat (instr, "%|");
-          strcat (instr, really_return ? reg_names[15] : reg_names[14]);
-        }
-      else
+      if (mp->prev == NULL)
        {
-         strcat (instr, "%|");
-         strcat (instr, really_return ? reg_names[15] : reg_names[14]);
+         minipool_vector_head = mp;
+         minipool_vector_label = gen_label_rtx ();
        }
-      strcat (instr, (TARGET_APCS_32 || !really_return) ? "}" : "}^");
-      output_asm_insn (instr, &operand);
+      else
+       mp->prev->next = mp;
+
+      minipool_vector_tail = mp;
     }
-  else if (really_return)
+  else
     {
-      sprintf (instr, "mov%%?%%%s0%s\t%%|pc, %%|lr",
-              reverse ? "D" : "d", TARGET_APCS_32 ? "" : "s");
-      output_asm_insn (instr, &operand);
+      if (max_address > max_mp->max_address - mp->fix_size)
+       mp->max_address = max_mp->max_address - mp->fix_size;
+      else
+       mp->max_address = max_address;
+
+      mp->next = max_mp;
+      mp->prev = max_mp->prev;
+      max_mp->prev = mp;
+      if (mp->prev != NULL)
+       mp->prev->next = mp;
+      else
+       minipool_vector_head = mp;
     }
 
-  return "";
-}
+  /* Save the new entry.  */
+  max_mp = mp;
 
-/* Return nonzero if optimizing and the current function is volatile.
-   Such functions never return, and many memory cycles can be saved
-   by not storing register values that will never be needed again.
-   This optimization was added to speed up context switching in a
-   kernel application. */
+  /* Scan over the preceeding entries and adjust their addresses as
+     required.  */
+  while (mp->prev != NULL
+        && mp->prev->max_address > mp->max_address - mp->prev->fix_size)
+    {
+      mp->prev->max_address = mp->max_address - mp->prev->fix_size;
+      mp = mp->prev;
+    }
 
-int
-arm_volatile_func ()
-{
-  return (optimize > 0 && TREE_THIS_VOLATILE (current_function_decl));
+  return max_mp;
 }
 
-/* Return the size of the prologue.  It's not too bad if we slightly 
-   over-estimate.  */
-
-static int
-get_prologue_size ()
+static Mnode *
+move_minipool_fix_backward_ref (mp, min_mp, min_address)
+     Mnode *        mp;
+     Mnode *        min_mp;
+     HOST_WIDE_INT  min_address;
 {
-  return profile_flag ? 12 : 0;
-}
+  HOST_WIDE_INT offset;
 
-/* The amount of stack adjustment that happens here, in output_return and in
-   output_epilogue must be exactly the same as was calculated during reload,
-   or things will point to the wrong place.  The only time we can safely
-   ignore this constraint is when a function has no arguments on the stack,
-   no stack frame requirement and no live registers execpt for `lr'.  If we
-   can guarantee that by making all function calls into tail calls and that
-   lr is not clobbered in any other way, then there is no need to push lr
-   onto the stack. */
-   
-void
-output_func_prologue (f, frame_size)
-     FILE *f;
-     int frame_size;
-{
-  int reg, live_regs_mask = 0;
-  rtx operands[3];
-  int volatile_func = (optimize > 0
-                      && TREE_THIS_VOLATILE (current_function_decl));
+  /* This should never be true, and the code below assumes these are
+     different.  */
+  if (mp == min_mp)
+    abort ();
 
-  /* Nonzero if we must stuff some register arguments onto the stack as if
-     they were passed there.  */
-  int store_arg_regs = 0;
+  if (min_mp == NULL)
+    {
+      if (min_address > mp->min_address)
+       mp->min_address = min_address;
+    }
+  else
+    {
+      /* We will adjust this below if it is too loose.  */
+      mp->min_address = min_address;
+
+      /* Unlink MP from its current position.  Since min_mp is non-null,
+        mp->next must be non-null.  */
+      mp->next->prev = mp->prev;
+      if (mp->prev != NULL)
+       mp->prev->next = mp->next;
+      else
+       minipool_vector_head = mp->next;
+
+      /* Reinsert it after MIN_MP.  */
+      mp->prev = min_mp;
+      mp->next = min_mp->next;
+      min_mp->next = mp;
+      if (mp->next != NULL)
+       mp->next->prev = mp;
+      else
+       minipool_vector_tail = mp;
+    }
 
-  if (arm_ccfsm_state || arm_target_insn)
-    abort ();                                  /* Sanity check */
+  min_mp = mp;
 
-  if (arm_naked_function_p (current_function_decl))
-    return;
+  offset = 0;
+  for (mp = minipool_vector_head; mp != NULL; mp = mp->next)
+    {
+      mp->offset = offset;
+      if (mp->refcount > 0)
+       offset += mp->fix_size;
 
-  return_used_this_function = 0;
-  lr_save_eliminated = 0;
-  
-  fprintf (f, "\t%s args = %d, pretend = %d, frame = %d\n",
-          ASM_COMMENT_START, current_function_args_size,
-          current_function_pretend_args_size, frame_size);
-  fprintf (f, "\t%s frame_needed = %d, current_function_anonymous_args = %d\n",
-          ASM_COMMENT_START, frame_pointer_needed,
-          current_function_anonymous_args);
+      if (mp->next && mp->next->min_address < mp->min_address + mp->fix_size)
+       mp->next->min_address = mp->min_address + mp->fix_size;
+    }
 
-  if (volatile_func)
-    fprintf (f, "\t%s Volatile function.\n", ASM_COMMENT_START);
+  return min_mp;
+}      
 
-  if (current_function_anonymous_args && current_function_pretend_args_size)
-    store_arg_regs = 1;
+/* Add a constant to the minipool for a backward reference.  Returns the
+   node added or NULL if the constant will not fit in this pool.  
 
-  for (reg = 0; reg <= 10; reg++)
-    if (regs_ever_live[reg] && ! call_used_regs[reg])
-      live_regs_mask |= (1 << reg);
+   Note that the code for insertion for a backwards reference can be
+   somewhat confusing because the calculated offsets for each fix do
+   not take into account the size of the pool (which is still under
+   construction.  */
+static Mnode *
+add_minipool_backward_ref (fix)
+     Mfix * fix;
+{
+  /* If set, min_mp is the last pool_entry that has a lower constraint
+     than the one we are trying to add.  */
+  Mnode *        min_mp = NULL;
+  /* This can be negative, since it is only a constraint.  */
+  HOST_WIDE_INT  min_address = fix->address - fix->backwards;
+  Mnode *        mp;
+
+  /* If we can't reach the current pool from this insn, or if we can't
+     insert this entry at the end of the pool without pushing other
+     fixes out of range, then we don't try.  This ensures that we
+     can't fail later on.  */
+  if (min_address >= minipool_barrier->address
+      || (minipool_vector_tail->min_address + fix->fix_size
+         >= minipool_barrier->address))
+    return NULL;
 
-  if (frame_pointer_needed)
-    live_regs_mask |= 0xD800;
-  else if (regs_ever_live[14])
+  /* Scan the pool to see if a constant with the same value has
+     already been added.  While we are doing this, also note the
+     location where we must insert the constant if it doesn't already
+     exist.  */
+  for (mp = minipool_vector_tail; mp != NULL; mp = mp->prev)
     {
-      if (! current_function_args_size
-         && ! function_really_clobbers_lr (get_insns ()))
-       lr_save_eliminated = 1;
+      if (GET_CODE (fix->value) == GET_CODE (mp->value)
+         && fix->mode == mp->mode
+         && (GET_CODE (fix->value) != CODE_LABEL
+             || (CODE_LABEL_NUMBER (fix->value)
+                 == CODE_LABEL_NUMBER (mp->value)))
+         && rtx_equal_p (fix->value, mp->value)
+         /* Check that there is enough slack to move this entry to the
+            end of the table (this is conservative).  */
+         && (mp->max_address 
+             > (minipool_barrier->address 
+                + minipool_vector_tail->offset
+                + minipool_vector_tail->fix_size)))
+       {
+         mp->refcount++;
+         return move_minipool_fix_backward_ref (mp, min_mp, min_address);
+       }
+
+      if (min_mp != NULL)
+       mp->min_address += fix->fix_size;
       else
-        live_regs_mask |= 0x4000;
+       {
+         /* Note the insertion point if necessary.  */
+         if (mp->min_address < min_address)
+           min_mp = mp;
+         else if (mp->max_address
+                  < minipool_barrier->address + mp->offset + fix->fix_size)
+           {
+             /* Inserting before this entry would push the fix beyond
+                its maximum address (which can happen if we have
+                re-located a forwards fix); force the new fix to come
+                after it.  */
+             min_mp = mp;
+             min_address = mp->min_address + fix->fix_size;
+           }
+       }
     }
 
-  if (live_regs_mask)
+  /* We need to create a new entry.  */
+  mp = xmalloc (sizeof (* mp));
+  mp->fix_size = fix->fix_size;
+  mp->mode = fix->mode;
+  mp->value = fix->value;
+  mp->refcount = 1;
+  mp->max_address = minipool_barrier->address + 65536;
+
+  mp->min_address = min_address;
+
+  if (min_mp == NULL)
     {
-      /* if a di mode load/store multiple is used, and the base register
-        is r3, then r4 can become an ever live register without lr
-        doing so,  in this case we need to push lr as well, or we
-        will fail to get a proper return. */
+      mp->prev = NULL;
+      mp->next = minipool_vector_head;
 
-      live_regs_mask |= 0x4000;
-      lr_save_eliminated = 0;
+      if (mp->next == NULL)
+       {
+         minipool_vector_tail = mp;
+         minipool_vector_label = gen_label_rtx ();
+       }
+      else
+       mp->next->prev = mp;
+
+      minipool_vector_head = mp;
+    }
+  else
+    {
+      mp->next = min_mp->next;
+      mp->prev = min_mp;
+      min_mp->next = mp;
+      
+      if (mp->next != NULL)
+       mp->next->prev = mp;
+      else
+       minipool_vector_tail = mp;
+    }
+
+  /* Save the new entry.  */
+  min_mp = mp;
+
+  if (mp->prev)
+    mp = mp->prev;
+  else
+    mp->offset = 0;
 
+  /* Scan over the following entries and adjust their offsets.  */
+  while (mp->next != NULL)
+    {
+      if (mp->next->min_address < mp->min_address + mp->fix_size)
+       mp->next->min_address = mp->min_address + mp->fix_size;
+
+      if (mp->refcount)
+       mp->next->offset = mp->offset + mp->fix_size;
+      else
+       mp->next->offset = mp->offset;
+
+      mp = mp->next;
     }
 
-  if (lr_save_eliminated)
-    fprintf (f,"\t%s I don't think this function clobbers lr\n",
-            ASM_COMMENT_START);
+  return min_mp;
 }
 
-
-void
-output_func_epilogue (f, frame_size)
-     FILE *f;
-     int frame_size;
+static void
+assign_minipool_offsets (barrier)
+     Mfix * barrier;
 {
-  int reg, live_regs_mask = 0, code_size = 0;
-  /* If we need this then it will always be at lesat this much */
-  int floats_offset = 24;
-  rtx operands[3];
-  int volatile_func = (optimize > 0
-                      && TREE_THIS_VOLATILE (current_function_decl));
+  HOST_WIDE_INT offset = 0;
+  Mnode * mp;
+
+  minipool_barrier = barrier;
 
-  if (use_return_insn() && return_used_this_function)
+  for (mp = minipool_vector_head; mp != NULL; mp = mp->next)
     {
-      if (frame_size && !(frame_pointer_needed || TARGET_APCS))
-        {
-          abort ();
-        }
-      goto epilogue_done;
+      mp->offset = offset;
+      
+      if (mp->refcount > 0)
+       offset += mp->fix_size;
     }
+}
 
-  /* Naked functions don't have epilogues.  */
-  if (arm_naked_function_p (current_function_decl))
-    goto epilogue_done;
+/* Output the literal table */
+static void
+dump_minipool (scan)
+     rtx scan;
+{
+  Mnode * mp;
+  Mnode * nmp;
 
-  /* A volatile function should never return.  Call abort.  */
-  if (volatile_func)
+  if (rtl_dump_file)
+    fprintf (rtl_dump_file,
+            ";; Emitting minipool after insn %u; address %ld\n",
+            INSN_UID (scan), (unsigned long) minipool_barrier->address);
+
+  scan = emit_label_after (gen_label_rtx (), scan);
+  scan = emit_insn_after (gen_align_4 (), scan);
+  scan = emit_label_after (minipool_vector_label, scan);
+
+  for (mp = minipool_vector_head; mp != NULL; mp = nmp)
     {
-      rtx op = gen_rtx (SYMBOL_REF, Pmode, "abort");
-      assemble_external_libcall (op);
-      output_asm_insn ("bl\t%a0", &op);
-      code_size = 4;
-      goto epilogue_done;
+      if (mp->refcount > 0)
+       {
+         if (rtl_dump_file)
+           {
+             fprintf (rtl_dump_file, 
+                      ";;  Offset %u, min %ld, max %ld ",
+                      (unsigned) mp->offset, (unsigned long) mp->min_address,
+                      (unsigned long) mp->max_address);
+             arm_print_value (rtl_dump_file, mp->value);
+             fputc ('\n', rtl_dump_file);
+           }
+
+         switch (mp->fix_size)
+           {
+#ifdef HAVE_consttable_1
+           case 1:
+             scan = emit_insn_after (gen_consttable_1 (mp->value), scan);
+             break;
+
+#endif
+#ifdef HAVE_consttable_2
+           case 2:
+             scan = emit_insn_after (gen_consttable_2 (mp->value), scan);
+             break;
+
+#endif
+#ifdef HAVE_consttable_4
+           case 4:
+             scan = emit_insn_after (gen_consttable_4 (mp->value), scan);
+             break;
+
+#endif
+#ifdef HAVE_consttable_8
+           case 8:
+             scan = emit_insn_after (gen_consttable_8 (mp->value), scan);
+             break;
+
+#endif
+           default:
+             abort ();
+             break;
+           }
+       }
+
+      nmp = mp->next;
+      free (mp);
     }
 
-  for (reg = 0; reg <= 10; reg++)
-    if (regs_ever_live[reg] && ! call_used_regs[reg])
-      {
-        live_regs_mask |= (1 << reg);
-       floats_offset += 4;
-      }
+  minipool_vector_head = minipool_vector_tail = NULL;
+  scan = emit_insn_after (gen_consttable_end (), scan);
+  scan = emit_barrier_after (scan);
+}
 
-  if (frame_pointer_needed)
+/* Return the cost of forcibly inserting a barrier after INSN.  */
+static int
+arm_barrier_cost (insn)
+     rtx insn;
+{
+  /* Basing the location of the pool on the loop depth is preferable,
+     but at the moment, the basic block information seems to be
+     corrupt by this stage of the compilation.  */
+  int base_cost = 50;
+  rtx next = next_nonnote_insn (insn);
+
+  if (next != NULL && GET_CODE (next) == CODE_LABEL)
+    base_cost -= 20;
+
+  switch (GET_CODE (insn))
     {
-      for (reg = 23; reg > 15; reg--)
-       if (regs_ever_live[reg] && ! call_used_regs[reg])
-         {
-           fprintf (f, "\tldfe\t%s%s, [%sfp, #-%d]\n", REGISTER_PREFIX,
-                    reg_names[reg], REGISTER_PREFIX, floats_offset);
-           floats_offset += 12;
-           code_size += 4;
-         }
+    case CODE_LABEL:
+      /* It will always be better to place the table before the label, rather
+        than after it.  */
+      return 50;  
+
+    case INSN:
+    case CALL_INSN:
+      return base_cost;
+
+    case JUMP_INSN:
+      return base_cost - 10;
 
-      live_regs_mask |= 0xA800;
-      print_multi_reg (f, "ldmea\t%sfp", live_regs_mask,
-                      TARGET_APCS_32 ? FALSE : TRUE);
-      code_size += 4;
+    default:
+      return base_cost + 10;
     }
-  else
+}
+
+/* Find the best place in the insn stream in the range
+   (FIX->address,MAX_ADDRESS) to forcibly insert a minipool barrier.
+   Create the barrier by inserting a jump and add a new fix entry for
+   it.  */
+static Mfix *
+create_fix_barrier (fix, max_address)
+     Mfix * fix;
+     HOST_WIDE_INT max_address;
+{
+  HOST_WIDE_INT count = 0;
+  rtx barrier;
+  rtx from = fix->insn;
+  rtx selected = from;
+  int selected_cost;
+  HOST_WIDE_INT selected_address;
+  Mfix * new_fix;
+  HOST_WIDE_INT max_count = max_address - fix->address;
+  rtx label = gen_label_rtx ();
+
+  selected_cost = arm_barrier_cost (from);
+  selected_address = fix->address;
+
+  while (from && count < max_count)
     {
-      /* Restore stack pointer if necessary.  */
-      if (frame_size)
-       {
-         operands[0] = operands[1] = stack_pointer_rtx;
-         operands[2] = gen_rtx (CONST_INT, VOIDmode, frame_size);
-         output_add_immediate (operands);
-       }
+      rtx tmp;
+      int new_cost;
 
-      for (reg = 16; reg < 24; reg++)
-       if (regs_ever_live[reg] && ! call_used_regs[reg])
-         {
-           fprintf (f, "\tldfe\t%s%s, [%ssp], #12\n", REGISTER_PREFIX,
-                    reg_names[reg], REGISTER_PREFIX);
-           code_size += 4;
-         }
-      if (current_function_pretend_args_size == 0 && regs_ever_live[14])
-       {
-         print_multi_reg (f, "ldmfd\t%ssp!", live_regs_mask | 0x8000,
-                          TARGET_APCS_32 ? FALSE : TRUE);
-         code_size += 4;
-       }
-      else
+      /* This code shouldn't have been called if there was a natural barrier
+        within range.  */
+      if (GET_CODE (from) == BARRIER)
+       abort ();
+
+      /* Count the length of this insn.  */
+      count += get_attr_length (from);
+
+      /* If there is a jump table, add its length.  */
+      tmp = is_jump_table (from);
+      if (tmp != NULL)
        {
-         if (live_regs_mask || regs_ever_live[14])
-           {
-             live_regs_mask |= 0x4000;
-             print_multi_reg (f, "ldmfd\t%ssp!", live_regs_mask, FALSE);
-             code_size += 4;
-           }
-         if (current_function_pretend_args_size)
+         count += get_jump_table_size (tmp);
+
+         /* Jump tables aren't in a basic block, so base the cost on
+            the dispatch insn.  If we select this location, we will
+            still put the pool after the table.  */
+         new_cost = arm_barrier_cost (from);
+
+         if (count < max_count && new_cost <= selected_cost)
            {
-             operands[0] = operands[1] = stack_pointer_rtx;
-             operands[2] = gen_rtx (CONST_INT, VOIDmode,
-                                    current_function_pretend_args_size);
-             output_add_immediate (operands);
+             selected = tmp;
+             selected_cost = new_cost;
+             selected_address = fix->address + count;
            }
-         fprintf (f, (TARGET_APCS_32 ? "\tmov\t%spc, %slr\n"
-                      : "\tmovs\t%spc, %slr\n"),
-                  REGISTER_PREFIX, REGISTER_PREFIX, f);
-         code_size += 4;
+
+         /* Continue after the dispatch table.  */
+         from = NEXT_INSN (tmp);
+         continue;
+       }
+
+      new_cost = arm_barrier_cost (from);
+      
+      if (count < max_count && new_cost <= selected_cost)
+       {
+         selected = from;
+         selected_cost = new_cost;
+         selected_address = fix->address + count;
        }
+
+      from = NEXT_INSN (from);
     }
 
- epilogue_done:
+  /* Create a new JUMP_INSN that branches around a barrier.  */
+  from = emit_jump_insn_after (gen_jump (label), selected);
+  JUMP_LABEL (from) = label;
+  barrier = emit_barrier_after (from);
+  emit_label_after (label, barrier);
+
+  /* Create a minipool barrier entry for the new barrier.  */
+  new_fix = (Mfix *) oballoc (sizeof (* new_fix));
+  new_fix->insn = barrier;
+  new_fix->address = selected_address;
+  new_fix->next = fix->next;
+  fix->next = new_fix;
+
+  return new_fix;
+}
+
+/* Record that there is a natural barrier in the insn stream at
+   ADDRESS.  */
+static void
+push_minipool_barrier (insn, address)
+     rtx insn;
+     HOST_WIDE_INT address;
+{
+  Mfix * fix = (Mfix *) oballoc (sizeof (* fix));
 
-  /* insn_addresses isn't allocated when not optimizing */
+  fix->insn = insn;
+  fix->address = address;
 
-  if (optimize > 0)
-    arm_increase_location (code_size
-                          + insn_addresses[INSN_UID (get_last_insn ())]
-                          + get_prologue_size ());
+  fix->next = NULL;
+  if (minipool_fix_head != NULL)
+    minipool_fix_tail->next = fix;
+  else
+    minipool_fix_head = fix;
 
-  current_function_anonymous_args = 0;
+  minipool_fix_tail = fix;
 }
 
+/* Record INSN, which will need fixing up to load a value from the
+   minipool.  ADDRESS is the offset of the insn since the start of the
+   function; LOC is a pointer to the part of the insn which requires
+   fixing; VALUE is the constant that must be loaded, which is of type
+   MODE.  */
 static void
-emit_multi_reg_push (mask)
-     int mask;
+push_minipool_fix (insn, address, loc, mode, value)
+     rtx insn;
+     HOST_WIDE_INT address;
+     rtx * loc;
+     enum machine_mode mode;
+     rtx value;
 {
-  int num_regs = 0;
-  int i, j;
-  rtx par;
+  Mfix * fix = (Mfix *) oballoc (sizeof (* fix));
 
-  for (i = 0; i < 16; i++)
-    if (mask & (1 << i))
-      num_regs++;
+#ifdef AOF_ASSEMBLER
+  /* PIC symbol refereneces need to be converted into offsets into the
+     based area.  */
+  /* XXX This shouldn't be done here.  */
+  if (flag_pic && GET_CODE (value) == SYMBOL_REF)
+    value = aof_pic_entry (value);
+#endif /* AOF_ASSEMBLER */
 
-  if (num_regs == 0 || num_regs > 16)
+  fix->insn = insn;
+  fix->address = address;
+  fix->loc = loc;
+  fix->mode = mode;
+  fix->fix_size = MINIPOOL_FIX_SIZE (mode);
+  fix->value = value;
+  fix->forwards = get_attr_pool_range (insn);
+  fix->backwards = get_attr_neg_pool_range (insn);
+  fix->minipool = NULL;
+
+  /* If an insn doesn't have a range defined for it, then it isn't
+     expecting to be reworked by this code.  Better to abort now than
+     to generate duff assembly code.  */
+  if (fix->forwards == 0 && fix->backwards == 0)
     abort ();
 
-  par = gen_rtx (PARALLEL, VOIDmode, rtvec_alloc (num_regs));
-
-  for (i = 0; i < 16; i++)
+  if (rtl_dump_file)
     {
-      if (mask & (1 << i))
-       {
-         XVECEXP (par, 0, 0)
-           = gen_rtx (SET, VOIDmode, gen_rtx (MEM, BLKmode,
-                                              gen_rtx (PRE_DEC, BLKmode,
-                                                       stack_pointer_rtx)),
-                      gen_rtx (UNSPEC, BLKmode,
-                               gen_rtvec (1, gen_rtx (REG, SImode, i)),
-                               2));
-         break;
-       }
+      fprintf (rtl_dump_file,
+              ";; %smode fixup for i%d; addr %lu, range (%ld,%ld): ",
+              GET_MODE_NAME (mode),
+              INSN_UID (insn), (unsigned long) address, 
+              -1 * (long)fix->backwards, (long)fix->forwards);
+      arm_print_value (rtl_dump_file, fix->value);
+      fprintf (rtl_dump_file, "\n");
     }
 
-  for (j = 1, i++; j < num_regs; i++)
+  /* Add it to the chain of fixes.  */
+  fix->next = NULL;
+  
+  if (minipool_fix_head != NULL)
+    minipool_fix_tail->next = fix;
+  else
+    minipool_fix_head = fix;
+
+  minipool_fix_tail = fix;
+}
+
+/* Scan INSN and note any of its operands that need fixing.  */
+static void
+note_invalid_constants (insn, address)
+     rtx insn;
+     HOST_WIDE_INT address;
+{
+  int opno;
+
+  extract_insn (insn);
+
+  if (! constrain_operands (1))
+    fatal_insn_not_found (insn);
+
+  /* Fill in recog_op_alt with information about the constraints of this
+     insn.  */
+  preprocess_constraints ();
+
+  for (opno = 0; opno < recog_data.n_operands; opno++)
     {
-      if (mask & (1 << i))
+      /* Things we need to fix can only occur in inputs.  */
+      if (recog_data.operand_type[opno] != OP_IN)
+       continue;
+
+      /* If this alternative is a memory reference, then any mention
+        of constants in this alternative is really to fool reload
+        into allowing us to accept one there.  We need to fix them up
+        now so that we output the right code.  */
+      if (recog_op_alt[opno][which_alternative].memory_ok)
        {
-         XVECEXP (par, 0, j)
-           = gen_rtx (USE, VOIDmode, gen_rtx (REG, SImode, i));
-         j++;
+         rtx op = recog_data.operand[opno];
+
+         if (CONSTANT_P (op))
+           push_minipool_fix (insn, address, recog_data.operand_loc[opno],
+                              recog_data.operand_mode[opno], op);
+#if 0
+         /* RWE: Now we look correctly at the operands for the insn,
+            this shouldn't be needed any more.  */
+#ifndef AOF_ASSEMBLER
+         /* XXX Is this still needed?  */
+         else if (GET_CODE (op) == UNSPEC && XINT (op, 1) == 3)
+           push_minipool_fix (insn, address, recog_data.operand_loc[opno],
+                              recog_data.operand_mode[opno],
+                              XVECEXP (op, 0, 0));
+#endif
+#endif
+         else if (GET_CODE (op) == MEM
+                  && GET_CODE (XEXP (op, 0)) == SYMBOL_REF
+                  && CONSTANT_POOL_ADDRESS_P (XEXP (op, 0)))
+           push_minipool_fix (insn, address, recog_data.operand_loc[opno],
+                              recog_data.operand_mode[opno],
+                              get_pool_constant (XEXP (op, 0)));
        }
     }
-  emit_insn (par);
 }
 
 void
-arm_expand_prologue ()
+arm_reorg (first)
+     rtx first;
 {
-  int reg;
-  rtx amount = GEN_INT (- get_frame_size ());
-  rtx push_insn;
-  int num_regs;
-  int live_regs_mask = 0;
-  int store_arg_regs = 0;
-  int volatile_func = (optimize > 0
-                      && TREE_THIS_VOLATILE (current_function_decl));
+  rtx insn;
+  HOST_WIDE_INT address = 0;
+  Mfix * fix;
 
-  /* Naked functions don't have prologues.  */
-  if (arm_naked_function_p (current_function_decl))
-    return;
+  minipool_fix_head = minipool_fix_tail = NULL;
 
-  if (current_function_anonymous_args && current_function_pretend_args_size)
-    store_arg_regs = 1;
+  /* The first insn must always be a note, or the code below won't
+     scan it properly.  */
+  if (GET_CODE (first) != NOTE)
+    abort ();
 
-  if (! volatile_func)
-    for (reg = 0; reg <= 10; reg++)
-      if (regs_ever_live[reg] && ! call_used_regs[reg])
-       live_regs_mask |= 1 << reg;
+  /* Scan all the insns and record the operands that will need fixing.  */
+  for (insn = next_nonnote_insn (first); insn; insn = next_nonnote_insn (insn))
+    {
 
-  if (! volatile_func && regs_ever_live[14])
-    live_regs_mask |= 0x4000;
+      if (GET_CODE (insn) == BARRIER)
+       push_minipool_barrier (insn, address);
+      else if (GET_CODE (insn) == INSN || GET_CODE (insn) == CALL_INSN
+              || GET_CODE (insn) == JUMP_INSN)
+       {
+         rtx table;
 
-  if (frame_pointer_needed)
-    {
-      live_regs_mask |= 0xD800;
-      emit_insn (gen_movsi (gen_rtx (REG, SImode, 12),
-                           stack_pointer_rtx));
-    }
+         note_invalid_constants (insn, address);
+         address += get_attr_length (insn);
 
-  if (current_function_pretend_args_size)
-    {
-      if (store_arg_regs)
-       emit_multi_reg_push ((0xf0 >> (current_function_pretend_args_size / 4))
-                            & 0xf);
-      else
-       emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx, 
-                              GEN_INT (-current_function_pretend_args_size)));
+         /* If the insn is a vector jump, add the size of the table
+            and skip the table.  */
+         if ((table = is_jump_table (insn)) != NULL)
+           {
+             address += get_jump_table_size (table);
+             insn = table;
+           }
+       }
     }
 
-  if (live_regs_mask)
+  fix = minipool_fix_head;
+  
+  /* Now scan the fixups and perform the required changes.  */
+  while (fix)
     {
-      /* If we have to push any regs, then we must push lr as well, or
-        we won't get a proper return.  */
-      live_regs_mask |= 0x4000;
-      emit_multi_reg_push (live_regs_mask);
-    }
-      
-  /* For now the integer regs are still pushed in output_func_epilogue ().  */
+      Mfix * ftmp;
+      Mfix * fdel;
+      Mfix *  last_added_fix;
+      Mfix * last_barrier = NULL;
+      Mfix * this_fix;
+
+      /* Skip any further barriers before the next fix.  */
+      while (fix && GET_CODE (fix->insn) == BARRIER)
+       fix = fix->next;
+
+      /* No more fixes.  */
+      if (fix == NULL)
+       break;
 
-  if (! volatile_func)
-    for (reg = 23; reg > 15; reg--)
-      if (regs_ever_live[reg] && ! call_used_regs[reg])
-       emit_insn (gen_rtx (SET, VOIDmode, 
-                           gen_rtx (MEM, XFmode, 
-                                    gen_rtx (PRE_DEC, XFmode,
-                                             stack_pointer_rtx)),
-                           gen_rtx (REG, XFmode, reg)));
+      last_added_fix = NULL;
 
-  if (frame_pointer_needed)
-    emit_insn (gen_addsi3 (hard_frame_pointer_rtx, gen_rtx (REG, SImode, 12),
-                          (GEN_INT
-                           (-(4 + current_function_pretend_args_size)))));
+      for (ftmp = fix; ftmp; ftmp = ftmp->next)
+       {
+         if (GET_CODE (ftmp->insn) == BARRIER)
+           {
+             if (ftmp->address >= minipool_vector_head->max_address)
+               break;
 
-  if (amount != const0_rtx)
-    {
-      emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx, amount));
-      emit_insn (gen_rtx (CLOBBER, VOIDmode, 
-                         gen_rtx (MEM, BLKmode, stack_pointer_rtx)));
-    }
+             last_barrier = ftmp;
+           }
+         else if ((ftmp->minipool = add_minipool_forward_ref (ftmp)) == NULL)
+           break;
 
-  /* If we are profiling, make sure no instructions are scheduled before
-     the call to mcount.  */
-  if (profile_flag || profile_block_flag)
-    emit_insn (gen_blockage ());
-}
-  
-\f
-/* If CODE is 'd', then the X is a condition operand and the instruction
-   should only be executed if the condition is true.
-   if CODE is 'D', then the X is a condition operand and the instruction
-   should only be executed if the condition is false: however, if the mode
-   of the comparison is CCFPEmode, then always execute the instruction -- we
-   do this because in these circumstances !GE does not necessarily imply LT;
-   in these cases the instruction pattern will take care to make sure that
-   an instruction containing %d will follow, thereby undoing the effects of
-   doing this instruction unconditionally.
-   If CODE is 'N' then X is a floating point operand that must be negated
-   before output.
-   If CODE is 'B' then output a bitwise inverted value of X (a const int).
-   If X is a REG and CODE is `M', output a ldm/stm style multi-reg.  */
-
-void
-arm_print_operand (stream, x, code)
-     FILE *stream;
-     rtx x;
-     int code;
-{
-  switch (code)
-    {
-    case '@':
-      fputs (ASM_COMMENT_START, stream);
-      return;
+         last_added_fix = ftmp;  /* Keep track of the last fix added.  */
+       }
 
-    case '|':
-      fputs (REGISTER_PREFIX, stream);
-      return;
+      /* If we found a barrier, drop back to that; any fixes that we
+        could have reached but come after the barrier will now go in
+        the next mini-pool.  */
+      if (last_barrier != NULL)
+       {
+         /* Reduce the refcount for those fixes that won't go into this 
+            pool after all.  */
+         for (fdel = last_barrier->next;
+              fdel && fdel != ftmp;
+              fdel = fdel->next)
+           {
+             fdel->minipool->refcount--;
+             fdel->minipool = NULL;
+           }
 
-    case '?':
-      if (arm_ccfsm_state == 3 || arm_ccfsm_state == 4)
-       fputs (arm_condition_codes[arm_current_cc], stream);
-      return;
+         ftmp = last_barrier;
+       }
+      else
+        {
+         /* ftmp is first fix that we can't fit into this pool and
+            there no natural barriers that we could use.  Insert a
+            new barrier in the code somewhere between the previous
+            fix and this one, and arrange to jump around it.  */
+         HOST_WIDE_INT max_address;
+
+         /* The last item on the list of fixes must be a barrier, so
+            we can never run off the end of the list of fixes without
+            last_barrier being set.  */
+         if (ftmp == NULL)
+           abort ();
 
-    case 'N':
-      {
-       REAL_VALUE_TYPE r;
-       REAL_VALUE_FROM_CONST_DOUBLE (r, x);
-       r = REAL_VALUE_NEGATE (r);
-       fprintf (stream, "%s", fp_const_from_val (&r));
-      }
-      return;
+         max_address = minipool_vector_head->max_address;
+         /* Check that there isn't another fix that is in range that
+            we couldn't fit into this pool because the pool was
+            already too large: we need to put the pool before such an
+            instruction.  */
+         if (ftmp->address < max_address)
+           max_address = ftmp->address;
 
-    case 'B':
-      if (GET_CODE (x) == CONST_INT)
-       fprintf (stream,
-#if HOST_BITS_PER_WIDE_INT == HOST_BITS_PER_INT
-                "%d",
-#else
-                "%ld",
-#endif
-                ARM_SIGN_EXTEND (~ INTVAL (x)));
-      else
-       {
-         putc ('~', stream);
-         output_addr_const (stream, x);
+         last_barrier = create_fix_barrier (last_added_fix, max_address);
        }
-      return;
 
-    case 'i':
-      fprintf (stream, "%s", arithmetic_instr (x, 1));
-      return;
+      assign_minipool_offsets (last_barrier);
 
-    case 'I':
-      fprintf (stream, "%s", arithmetic_instr (x, 0));
-      return;
+      while (ftmp)
+       {
+         if (GET_CODE (ftmp->insn) != BARRIER
+             && ((ftmp->minipool = add_minipool_backward_ref (ftmp))
+                 == NULL))
+           break;
 
-    case 'S':
-      {
-       HOST_WIDE_INT val;
-       char *shift = shift_op (x, &val);
+         ftmp = ftmp->next;
+       }
 
-       if (shift)
+      /* Scan over the fixes we have identified for this pool, fixing them
+        up and adding the constants to the pool itself.  */
+      for (this_fix = fix; this_fix && ftmp != this_fix;
+          this_fix = this_fix->next)
+       if (GET_CODE (this_fix->insn) != BARRIER)
          {
-           fprintf (stream, ", %s ", shift_op (x, &val));
-           if (val == -1)
-             arm_print_operand (stream, XEXP (x, 1), 0);
-           else
-             fprintf (stream,
-#if HOST_BITS_PER_WIDE_INT == HOST_BITS_PER_INT
-                      "#%d",
-#else
-                      "#%ld",
-#endif
-                      val);
+           rtx addr
+             = plus_constant (gen_rtx_LABEL_REF (VOIDmode, 
+                                                 minipool_vector_label),
+                              this_fix->minipool->offset);
+           *this_fix->loc = gen_rtx_MEM (this_fix->mode, addr);
          }
-      }
-      return;
 
-    case 'Q':
-      if (REGNO (x) > 15)
-       abort ();
-      fputs (REGISTER_PREFIX, stream);
-      fputs (reg_names[REGNO (x) + (WORDS_BIG_ENDIAN ? 1 : 0)], stream);
-      return;
+      dump_minipool (last_barrier->insn);
+      fix = ftmp;
+    }
 
-    case 'R':
-      if (REGNO (x) > 15)
-       abort ();
-      fputs (REGISTER_PREFIX, stream);
-      fputs (reg_names[REGNO (x) + (WORDS_BIG_ENDIAN ? 0 : 1)], stream);
-      return;
+  /* From now on we must synthesize any constants that we can't handle
+     directly.  This can happen if the RTL gets split during final
+     instruction generation.  */
+  after_arm_reorg = 1;
+}
+\f
+/* Routines to output assembly language.  */
 
-    case 'm':
-      fputs (REGISTER_PREFIX, stream);
-      if (GET_CODE (XEXP (x, 0)) == REG)
-       fputs (reg_names[REGNO (XEXP (x, 0))], stream);
-      else
-       fputs (reg_names[REGNO (XEXP (XEXP (x, 0), 0))], stream);
-      return;
+/* If the rtx is the correct value then return the string of the number.
+   In this way we can ensure that valid double constants are generated even
+   when cross compiling.  */
+char *
+fp_immediate_constant (x)
+     rtx x;
+{
+  REAL_VALUE_TYPE r;
+  int i;
+  
+  if (!fpa_consts_inited)
+    init_fpa_table ();
+  
+  REAL_VALUE_FROM_CONST_DOUBLE (r, x);
+  for (i = 0; i < 8; i++)
+    if (REAL_VALUES_EQUAL (r, values_fpa[i]))
+      return strings_fpa[i];
 
-    case 'M':
-      fprintf (stream, "{%s%s-%s%s}", REGISTER_PREFIX, reg_names[REGNO (x)],
-              REGISTER_PREFIX, reg_names[REGNO (x) - 1
-                                        + ((GET_MODE_SIZE (GET_MODE (x))
-                                            + GET_MODE_SIZE (SImode) - 1)
-                                           / GET_MODE_SIZE (SImode))]);
-      return;
+  abort ();
+}
 
-    case 'd':
-      if (x)
-        fputs (arm_condition_codes[get_arm_condition_code (x)],
-              stream);
-      return;
+/* As for fp_immediate_constant, but value is passed directly, not in rtx.  */
+static char *
+fp_const_from_val (r)
+     REAL_VALUE_TYPE * r;
+{
+  int i;
 
-    case 'D':
-      if (x)
-        fputs (arm_condition_codes[ARM_INVERSE_CONDITION_CODE
-                                  (get_arm_condition_code (x))],
-              stream);
-      return;
+  if (! fpa_consts_inited)
+    init_fpa_table ();
 
-    default:
-      if (x == 0)
-       abort ();
+  for (i = 0; i < 8; i++)
+    if (REAL_VALUES_EQUAL (*r, values_fpa[i]))
+      return strings_fpa[i];
 
-      if (GET_CODE (x) == REG)
-       {
-         fputs (REGISTER_PREFIX, stream);
-         fputs (reg_names[REGNO (x)], stream);
-       }
-      else if (GET_CODE (x) == MEM)
-       {
-         output_memory_reference_mode = GET_MODE (x);
-         output_address (XEXP (x, 0));
-       }
-      else if (GET_CODE (x) == CONST_DOUBLE)
-       fprintf (stream, "#%s", fp_immediate_constant (x));
-      else if (GET_CODE (x) == NEG)
-       abort (); /* This should never happen now. */
-      else
-       {
-         fputc ('#', stream);
-         output_addr_const (stream, x);
-       }
-    }
+  abort ();
 }
 
-/* Increase the `arm_text_location' by AMOUNT if we're in the text
-   segment.  */
+/* Output the operands of a LDM/STM instruction to STREAM.
+   MASK is the ARM register set mask of which only bits 0-15 are important.
+   INSTR is the possibly suffixed base register.  HAT unequals zero if a hat
+   must follow the register list.  */
 
-void
-arm_increase_location (amount)
-     int amount;
+static void
+print_multi_reg (stream, instr, reg, mask, hat)
+     FILE * stream;
+     char * instr;
+     int reg;
+     int mask;
+     int hat;
 {
-  if (in_text_section ())
-    arm_text_location += amount;
+  int i;
+  int not_first = FALSE;
+
+  fputc ('\t', stream);
+  asm_fprintf (stream, instr, reg);
+  fputs (", {", stream);
+  
+  for (i = 0; i <= LAST_ARM_REGNUM; i++)
+    if (mask & (1 << i))
+      {
+       if (not_first)
+         fprintf (stream, ", ");
+       
+       asm_fprintf (stream, "%r", i);
+       not_first = TRUE;
+      }
+
+  fprintf (stream, "}%s\n", hat ? "^" : "");
 }
 
+/* Output a 'call' insn.  */
+
+char *
+output_call (operands)
+     rtx * operands;
+{
+  /* Handle calls to lr using ip (which may be clobbered in subr anyway).  */
 
-/* Output a label definition.  If this label is within the .text segment, it
-   is stored in OFFSET_TABLE, to be used when building `llc' instructions.
-   Maybe GCC remembers names not starting with a `*' for a long time, but this
-   is a minority anyway, so we just make a copy.  Do not store the leading `*'
-   if the name starts with one.  */
+  if (REGNO (operands[0]) == LR_REGNUM)
+    {
+      operands[0] = gen_rtx_REG (SImode, IP_REGNUM);
+      output_asm_insn ("mov%?\t%0, %|lr", operands);
+    }
+  
+  output_asm_insn ("mov%?\t%|lr, %|pc", operands);
+  
+  if (TARGET_INTERWORK)
+    output_asm_insn ("bx%?\t%0", operands);
+  else
+    output_asm_insn ("mov%?\t%|pc, %0", operands);
+  
+  return "";
+}
 
-void
-arm_asm_output_label (stream, name)
-     FILE *stream;
-     char *name;
+static int
+eliminate_lr2ip (x)
+     rtx * x;
 {
-  char *real_name, *s;
-  struct label_offset *cur;
-  int hash = 0;
+  int something_changed = 0;
+  rtx x0 = * x;
+  int code = GET_CODE (x0);
+  register int i, j;
+  register const char * fmt;
+  
+  switch (code)
+    {
+    case REG:
+      if (REGNO (x0) == LR_REGNUM)
+        {
+         *x = gen_rtx_REG (SImode, IP_REGNUM);
+         return 1;
+        }
+      return 0;
+    default:
+      /* Scan through the sub-elements and change any references there.  */
+      fmt = GET_RTX_FORMAT (code);
+      
+      for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
+       if (fmt[i] == 'e')
+         something_changed |= eliminate_lr2ip (&XEXP (x0, i));
+       else if (fmt[i] == 'E')
+         for (j = 0; j < XVECLEN (x0, i); j++)
+           something_changed |= eliminate_lr2ip (&XVECEXP (x0, i, j));
+      
+      return something_changed;
+    }
+}
+  
+/* Output a 'call' insn that is a reference in memory.  */
 
-  ARM_OUTPUT_LABEL (stream, name);
-  if (! in_text_section ())
-    return;
+char *
+output_call_mem (operands)
+     rtx * operands;
+{
+  operands[0] = copy_rtx (operands[0]); /* Be ultra careful.  */
+  /* Handle calls using lr by using ip (which may be clobbered in subr anyway).  */
+  if (eliminate_lr2ip (&operands[0]))
+    output_asm_insn ("mov%?\t%|ip, %|lr", operands);
 
-  if (name[0] == '*')
+  if (TARGET_INTERWORK)
     {
-      real_name = xmalloc (1 + strlen (&name[1]));
-      strcpy (real_name, &name[1]);
+      output_asm_insn ("ldr%?\t%|ip, %0", operands);
+      output_asm_insn ("mov%?\t%|lr, %|pc", operands);
+      output_asm_insn ("bx%?\t%|ip", operands);
     }
   else
     {
-      real_name = xmalloc (2 + strlen (name));
-      strcpy (real_name, USER_LABEL_PREFIX);
-      strcat (real_name, name);
+      output_asm_insn ("mov%?\t%|lr, %|pc", operands);
+      output_asm_insn ("ldr%?\t%|pc, %0", operands);
     }
-  for (s = real_name; *s; s++)
-    hash += *s;
 
-  hash = hash % LABEL_HASH_SIZE;
-  cur = (struct label_offset *) xmalloc (sizeof (struct label_offset));
-  cur->name = real_name;
-  cur->offset = arm_text_location;
-  cur->cdr = offset_table[hash];
-  offset_table[hash] = cur;
+  return "";
 }
 
-/* Output code resembling an .lcomm directive.  /bin/as doesn't have this
-   directive hence this hack, which works by reserving some `.space' in the
-   bss segment directly.
 
-   XXX This is a severe hack, which is guaranteed NOT to work since it doesn't
-   define STATIC COMMON space but merely STATIC BSS space.  */
+/* Output a move from arm registers to an fpu registers.
+   OPERANDS[0] is an fpu register.
+   OPERANDS[1] is the first registers of an arm register pair.  */
+
+char *
+output_mov_long_double_fpu_from_arm (operands)
+     rtx * operands;
+{
+  int arm_reg0 = REGNO (operands[1]);
+  rtx ops[3];
+
+  if (arm_reg0 == IP_REGNUM)
+    abort ();
 
-void
-output_lcomm_directive (stream, name, size, rounded)
-     FILE *stream;
-     char *name;
-     int size, rounded;
-{
-  fprintf (stream, "\n\t.bss\t%s .lcomm\n", ASM_COMMENT_START);
-  assemble_name (stream, name);
-  fprintf (stream, ":\t.space\t%d\n", rounded);
-  if (in_text_section ())
-    fputs ("\n\t.text\n", stream);
-  else
-    fputs ("\n\t.data\n", stream);
+  ops[0] = gen_rtx_REG (SImode, arm_reg0);
+  ops[1] = gen_rtx_REG (SImode, 1 + arm_reg0);
+  ops[2] = gen_rtx_REG (SImode, 2 + arm_reg0);
+  
+  output_asm_insn ("stm%?fd\t%|sp!, {%0, %1, %2}", ops);
+  output_asm_insn ("ldf%?e\t%0, [%|sp], #12", operands);
+  
+  return "";
 }
-\f
-/* A finite state machine takes care of noticing whether or not instructions
-   can be conditionally executed, and thus decrease execution time and code
-   size by deleting branch instructions.  The fsm is controlled by
-   final_prescan_insn, and controls the actions of ASM_OUTPUT_OPCODE.  */
 
-/* The state of the fsm controlling condition codes are:
-   0: normal, do nothing special
-   1: make ASM_OUTPUT_OPCODE not output this instruction
-   2: make ASM_OUTPUT_OPCODE not output this instruction
-   3: make instructions conditional
-   4: make instructions conditional
+/* Output a move from an fpu register to arm registers.
+   OPERANDS[0] is the first registers of an arm register pair.
+   OPERANDS[1] is an fpu register.  */
 
-   State transitions (state->state by whom under condition):
-   0 -> 1 final_prescan_insn if the `target' is a label
-   0 -> 2 final_prescan_insn if the `target' is an unconditional branch
-   1 -> 3 ASM_OUTPUT_OPCODE after not having output the conditional branch
-   2 -> 4 ASM_OUTPUT_OPCODE after not having output the conditional branch
-   3 -> 0 ASM_OUTPUT_INTERNAL_LABEL if the `target' label is reached
-          (the target label has CODE_LABEL_NUMBER equal to arm_target_label).
-   4 -> 0 final_prescan_insn if the `target' unconditional branch is reached
-          (the target insn is arm_target_insn).
-
-   If the jump clobbers the conditions then we use states 2 and 4.
+char *
+output_mov_long_double_arm_from_fpu (operands)
+     rtx * operands;
+{
+  int arm_reg0 = REGNO (operands[0]);
+  rtx ops[3];
 
-   A similar thing can be done with conditional return insns.
+  if (arm_reg0 == IP_REGNUM)
+    abort ();
 
-   XXX In case the `target' is an unconditional branch, this conditionalising
-   of the instructions always reduces code size, but not always execution
-   time.  But then, I want to reduce the code size to somewhere near what
-   /bin/cc produces.  */
+  ops[0] = gen_rtx_REG (SImode, arm_reg0);
+  ops[1] = gen_rtx_REG (SImode, 1 + arm_reg0);
+  ops[2] = gen_rtx_REG (SImode, 2 + arm_reg0);
 
-/* Returns the index of the ARM condition code string in
-   `arm_condition_codes'.  COMPARISON should be an rtx like
-   `(eq (...) (...))'.  */
+  output_asm_insn ("stf%?e\t%1, [%|sp, #-12]!", operands);
+  output_asm_insn ("ldm%?fd\t%|sp!, {%0, %1, %2}", ops);
+  return "";
+}
 
-static enum arm_cond_code
-get_arm_condition_code (comparison)
-     rtx comparison;
+/* Output a move from arm registers to arm registers of a long double
+   OPERANDS[0] is the destination.
+   OPERANDS[1] is the source.  */
+char *
+output_mov_long_double_arm_from_arm (operands)
+     rtx * operands;
 {
-  enum machine_mode mode = GET_MODE (XEXP (comparison, 0));
-  register int code;
-  register enum rtx_code comp_code = GET_CODE (comparison);
-
-  if (GET_MODE_CLASS (mode) != MODE_CC)
-    mode = SELECT_CC_MODE (comp_code, XEXP (comparison, 0),
-                          XEXP (comparison, 1));
+  /* We have to be careful here because the two might overlap.  */
+  int dest_start = REGNO (operands[0]);
+  int src_start = REGNO (operands[1]);
+  rtx ops[2];
+  int i;
 
-  switch (mode)
+  if (dest_start < src_start)
     {
-    case CC_DNEmode: code = ARM_NE; goto dominance;
-    case CC_DEQmode: code = ARM_EQ; goto dominance;
-    case CC_DGEmode: code = ARM_GE; goto dominance;
-    case CC_DGTmode: code = ARM_GT; goto dominance;
-    case CC_DLEmode: code = ARM_LE; goto dominance;
-    case CC_DLTmode: code = ARM_LT; goto dominance;
-    case CC_DGEUmode: code = ARM_CS; goto dominance;
-    case CC_DGTUmode: code = ARM_HI; goto dominance;
-    case CC_DLEUmode: code = ARM_LS; goto dominance;
-    case CC_DLTUmode: code = ARM_CC;
-
-    dominance:
-      if (comp_code != EQ && comp_code != NE)
-       abort ();
-
-      if (comp_code == EQ)
-       return ARM_INVERSE_CONDITION_CODE (code);
-      return code;
-
-    case CC_NOOVmode:
-      switch (comp_code)
+      for (i = 0; i < 3; i++)
        {
-       case NE: return ARM_NE;
-       case EQ: return ARM_EQ;
-       case GE: return ARM_PL;
-       case LT: return ARM_MI;
-       default: abort ();
+         ops[0] = gen_rtx_REG (SImode, dest_start + i);
+         ops[1] = gen_rtx_REG (SImode, src_start + i);
+         output_asm_insn ("mov%?\t%0, %1", ops);
        }
-
-    case CC_Zmode:
-    case CCFPmode:
-      switch (comp_code)
+    }
+  else
+    {
+      for (i = 2; i >= 0; i--)
        {
-       case NE: return ARM_NE;
-       case EQ: return ARM_EQ;
-       default: abort ();
+         ops[0] = gen_rtx_REG (SImode, dest_start + i);
+         ops[1] = gen_rtx_REG (SImode, src_start + i);
+         output_asm_insn ("mov%?\t%0, %1", ops);
        }
+    }
 
-    case CCFPEmode:
-      switch (comp_code)
-       {
-       case GE: return ARM_GE;
-       case GT: return ARM_GT;
-       case LE: return ARM_LS;
-       case LT: return ARM_MI;
-       default: abort ();
-       }
+  return "";
+}
 
-    case CC_SWPmode:
-      switch (comp_code)
-       {
-       case NE: return ARM_NE;
-       case EQ: return ARM_EQ;
-       case GE: return ARM_LE;
-       case GT: return ARM_LT;
-       case LE: return ARM_GE;
-       case LT: return ARM_GT;
-       case GEU: return ARM_LS;
-       case GTU: return ARM_CC;
-       case LEU: return ARM_CS;
-       case LTU: return ARM_HI;
-       default: abort ();
-       }
 
-    case CCmode:
-      switch (comp_code)
-       {
-       case NE: return ARM_NE;
-       case EQ: return ARM_EQ;
-       case GE: return ARM_GE;
-       case GT: return ARM_GT;
-       case LE: return ARM_LE;
-       case LT: return ARM_LT;
-       case GEU: return ARM_CS;
-       case GTU: return ARM_HI;
-       case LEU: return ARM_LS;
-       case LTU: return ARM_CC;
-       default: abort ();
-       }
+/* Output a move from arm registers to an fpu registers.
+   OPERANDS[0] is an fpu register.
+   OPERANDS[1] is the first registers of an arm register pair.  */
 
-    default: abort ();
-    }
+char *
+output_mov_double_fpu_from_arm (operands)
+     rtx * operands;
+{
+  int arm_reg0 = REGNO (operands[1]);
+  rtx ops[2];
 
-  abort ();
+  if (arm_reg0 == IP_REGNUM)
+    abort ();
+  
+  ops[0] = gen_rtx_REG (SImode, arm_reg0);
+  ops[1] = gen_rtx_REG (SImode, 1 + arm_reg0);
+  output_asm_insn ("stm%?fd\t%|sp!, {%0, %1}", ops);
+  output_asm_insn ("ldf%?d\t%0, [%|sp], #8", operands);
+  return "";
 }
 
+/* Output a move from an fpu register to arm registers.
+   OPERANDS[0] is the first registers of an arm register pair.
+   OPERANDS[1] is an fpu register.  */
 
-void
-final_prescan_insn (insn, opvec, noperands)
-     rtx insn;
-     rtx *opvec;
-     int noperands;
+char *
+output_mov_double_arm_from_fpu (operands)
+     rtx * operands;
 {
-  /* BODY will hold the body of INSN.  */
-  register rtx body = PATTERN (insn);
+  int arm_reg0 = REGNO (operands[0]);
+  rtx ops[2];
 
-  /* This will be 1 if trying to repeat the trick, and things need to be
-     reversed if it appears to fail.  */
-  int reverse = 0;
+  if (arm_reg0 == IP_REGNUM)
+    abort ();
 
-  /* JUMP_CLOBBERS will be one implies that the conditions if a branch is
-     taken are clobbered, even if the rtl suggests otherwise.  It also
-     means that we have to grub around within the jump expression to find
-     out what the conditions are when the jump isn't taken.  */
-  int jump_clobbers = 0;
-  
-  /* If we start with a return insn, we only succeed if we find another one. */
-  int seeking_return = 0;
-  
-  /* START_INSN will hold the insn from where we start looking.  This is the
-     first insn after the following code_label if REVERSE is true.  */
-  rtx start_insn = insn;
+  ops[0] = gen_rtx_REG (SImode, arm_reg0);
+  ops[1] = gen_rtx_REG (SImode, 1 + arm_reg0);
+  output_asm_insn ("stf%?d\t%1, [%|sp, #-8]!", operands);
+  output_asm_insn ("ldm%?fd\t%|sp!, {%0, %1}", ops);
+  return "";
+}
 
-  /* If in state 4, check if the target branch is reached, in order to
-     change back to state 0.  */
-  if (arm_ccfsm_state == 4)
-    {
-      if (insn == arm_target_insn)
-      {
-       arm_target_insn = NULL;
-       arm_ccfsm_state = 0;
-      }
-      return;
-    }
+/* Output a move between double words.
+   It must be REG<-REG, REG<-CONST_DOUBLE, REG<-CONST_INT, REG<-MEM
+   or MEM<-REG and all MEMs must be offsettable addresses.  */
 
-  /* If in state 3, it is possible to repeat the trick, if this insn is an
-     unconditional branch to a label, and immediately following this branch
-     is the previous target label which is only used once, and the label this
-     branch jumps to is not too far off.  */
-  if (arm_ccfsm_state == 3)
+char *
+output_move_double (operands)
+     rtx * operands;
+{
+  enum rtx_code code0 = GET_CODE (operands[0]);
+  enum rtx_code code1 = GET_CODE (operands[1]);
+  rtx otherops[3];
+
+  if (code0 == REG)
     {
-      if (simplejump_p (insn))
+      int reg0 = REGNO (operands[0]);
+
+      otherops[0] = gen_rtx_REG (SImode, 1 + reg0);
+      
+      if (code1 == REG)
        {
-         start_insn = next_nonnote_insn (start_insn);
-         if (GET_CODE (start_insn) == BARRIER)
-           {
-             /* XXX Isn't this always a barrier?  */
-             start_insn = next_nonnote_insn (start_insn);
-           }
-         if (GET_CODE (start_insn) == CODE_LABEL
-             && CODE_LABEL_NUMBER (start_insn) == arm_target_label
-             && LABEL_NUSES (start_insn) == 1)
-           reverse = TRUE;
+         int reg1 = REGNO (operands[1]);
+         if (reg1 == IP_REGNUM)
+           abort ();
+
+         /* Ensure the second source is not overwritten.  */
+         if (reg1 == reg0 + (WORDS_BIG_ENDIAN ? -1 : 1))
+           output_asm_insn ("mov%?\t%Q0, %Q1\n\tmov%?\t%R0, %R1", operands);
          else
-           return;
+           output_asm_insn ("mov%?\t%R0, %R1\n\tmov%?\t%Q0, %Q1", operands);
        }
-      else if (GET_CODE (body) == RETURN)
-        {
-         start_insn = next_nonnote_insn (start_insn);
-         if (GET_CODE (start_insn) == BARRIER)
-           start_insn = next_nonnote_insn (start_insn);
-         if (GET_CODE (start_insn) == CODE_LABEL
-             && CODE_LABEL_NUMBER (start_insn) == arm_target_label
-             && LABEL_NUSES (start_insn) == 1)
+      else if (code1 == CONST_DOUBLE)
+       {
+         if (GET_MODE (operands[1]) == DFmode)
            {
-             reverse = TRUE;
-             seeking_return = 1;
+             long l[2];
+             union real_extract u;
+
+             bcopy ((char *) &CONST_DOUBLE_LOW (operands[1]), (char *) &u,
+                    sizeof (u));
+             REAL_VALUE_TO_TARGET_DOUBLE (u.d, l);
+             otherops[1] = GEN_INT (l[1]);
+             operands[1] = GEN_INT (l[0]);
+           }
+         else if (GET_MODE (operands[1]) != VOIDmode)
+           abort ();
+         else if (WORDS_BIG_ENDIAN)
+           {
+             
+             otherops[1] = GEN_INT (CONST_DOUBLE_LOW (operands[1]));
+             operands[1] = GEN_INT (CONST_DOUBLE_HIGH (operands[1]));
            }
          else
-           return;
-        }
-      else
-       return;
-    }
-
-  if (arm_ccfsm_state != 0 && !reverse)
-    abort ();
-  if (GET_CODE (insn) != JUMP_INSN)
+           {
+             
+             otherops[1] = GEN_INT (CONST_DOUBLE_HIGH (operands[1]));
+             operands[1] = GEN_INT (CONST_DOUBLE_LOW (operands[1]));
+           }
+         
+         output_mov_immediate (operands);
+         output_mov_immediate (otherops);
+       }
+      else if (code1 == CONST_INT)
+       {
+#if HOST_BITS_PER_WIDE_INT > 32
+         /* If HOST_WIDE_INT is more than 32 bits, the intval tells us
+            what the upper word is.  */
+         if (WORDS_BIG_ENDIAN)
+           {
+             otherops[1] = GEN_INT (ARM_SIGN_EXTEND (INTVAL (operands[1])));
+             operands[1] = GEN_INT (INTVAL (operands[1]) >> 32);
+           }
+         else
+           {
+             otherops[1] = GEN_INT (INTVAL (operands[1]) >> 32);
+             operands[1] = GEN_INT (ARM_SIGN_EXTEND (INTVAL (operands[1])));
+           }
+#else
+         /* Sign extend the intval into the high-order word.  */
+         if (WORDS_BIG_ENDIAN)
+           {
+             otherops[1] = operands[1];
+             operands[1] = (INTVAL (operands[1]) < 0
+                            ? constm1_rtx : const0_rtx);
+           }
+         else
+           otherops[1] = INTVAL (operands[1]) < 0 ? constm1_rtx : const0_rtx;
+#endif
+         output_mov_immediate (otherops);
+         output_mov_immediate (operands);
+       }
+      else if (code1 == MEM)
+       {
+         switch (GET_CODE (XEXP (operands[1], 0)))
+           {
+           case REG:
+             output_asm_insn ("ldm%?ia\t%m1, %M0", operands);
+             break;
+
+           case PRE_INC:
+             abort (); /* Should never happen now.  */
+             break;
+
+           case PRE_DEC:
+             output_asm_insn ("ldm%?db\t%m1!, %M0", operands);
+             break;
+
+           case POST_INC:
+             output_asm_insn ("ldm%?ia\t%m1!, %M0", operands);
+             break;
+
+           case POST_DEC:
+             abort (); /* Should never happen now.  */
+             break;
+
+           case LABEL_REF:
+           case CONST:
+             output_asm_insn ("adr%?\t%0, %1", operands);
+             output_asm_insn ("ldm%?ia\t%0, %M0", operands);
+             break;
+
+           default:
+             if (arm_add_operand (XEXP (XEXP (operands[1], 0), 1),
+                                  GET_MODE (XEXP (XEXP (operands[1], 0), 1))))
+               {
+                 otherops[0] = operands[0];
+                 otherops[1] = XEXP (XEXP (operands[1], 0), 0);
+                 otherops[2] = XEXP (XEXP (operands[1], 0), 1);
+                 if (GET_CODE (XEXP (operands[1], 0)) == PLUS)
+                   {
+                     if (GET_CODE (otherops[2]) == CONST_INT)
+                       {
+                         switch (INTVAL (otherops[2]))
+                           {
+                           case -8:
+                             output_asm_insn ("ldm%?db\t%1, %M0", otherops);
+                             return "";
+                           case -4:
+                             output_asm_insn ("ldm%?da\t%1, %M0", otherops);
+                             return "";
+                           case 4:
+                             output_asm_insn ("ldm%?ib\t%1, %M0", otherops);
+                             return "";
+                           }
+                         if (!(const_ok_for_arm (INTVAL (otherops[2]))))
+                           output_asm_insn ("sub%?\t%0, %1, #%n2", otherops);
+                         else
+                           output_asm_insn ("add%?\t%0, %1, %2", otherops);
+                       }
+                     else
+                       output_asm_insn ("add%?\t%0, %1, %2", otherops);
+                   }
+                 else
+                   output_asm_insn ("sub%?\t%0, %1, %2", otherops);
+                 
+                 return "ldm%?ia\t%0, %M0";
+                }
+              else
+                {
+                 otherops[1] = adj_offsettable_operand (operands[1], 4);
+                 /* Take care of overlapping base/data reg.  */
+                 if (reg_mentioned_p (operands[0], operands[1]))
+                   {
+                     output_asm_insn ("ldr%?\t%0, %1", otherops);
+                     output_asm_insn ("ldr%?\t%0, %1", operands);
+                   }
+                 else
+                   {
+                     output_asm_insn ("ldr%?\t%0, %1", operands);
+                     output_asm_insn ("ldr%?\t%0, %1", otherops);
+                   }
+               }
+           }
+       }
+      else
+       abort ();  /* Constraints should prevent this.  */
+    }
+  else if (code0 == MEM && code1 == REG)
+    {
+      if (REGNO (operands[1]) == IP_REGNUM)
+       abort ();
+
+      switch (GET_CODE (XEXP (operands[0], 0)))
+        {
+       case REG:
+         output_asm_insn ("stm%?ia\t%m0, %M1", operands);
+         break;
+
+        case PRE_INC:
+         abort (); /* Should never happen now.  */
+         break;
+
+        case PRE_DEC:
+         output_asm_insn ("stm%?db\t%m0!, %M1", operands);
+         break;
+
+        case POST_INC:
+         output_asm_insn ("stm%?ia\t%m0!, %M1", operands);
+         break;
+
+        case POST_DEC:
+         abort (); /* Should never happen now.  */
+         break;
+
+       case PLUS:
+         if (GET_CODE (XEXP (XEXP (operands[0], 0), 1)) == CONST_INT)
+           {
+             switch (INTVAL (XEXP (XEXP (operands[0], 0), 1)))
+               {
+               case -8:
+                 output_asm_insn ("stm%?db\t%m0, %M1", operands);
+                 return "";
+
+               case -4:
+                 output_asm_insn ("stm%?da\t%m0, %M1", operands);
+                 return "";
+
+               case 4:
+                 output_asm_insn ("stm%?ib\t%m0, %M1", operands);
+                 return "";
+               }
+           }
+         /* Fall through */
+
+        default:
+         otherops[0] = adj_offsettable_operand (operands[0], 4);
+         otherops[1] = gen_rtx_REG (SImode, 1 + REGNO (operands[1]));
+         output_asm_insn ("str%?\t%1, %0", operands);
+         output_asm_insn ("str%?\t%1, %0", otherops);
+       }
+    }
+  else
+    abort ();  /* Constraints should prevent this */
+
+  return "";
+}
+
+
+/* Output an arbitrary MOV reg, #n.
+   OPERANDS[0] is a register.  OPERANDS[1] is a const_int.  */
+
+char *
+output_mov_immediate (operands)
+     rtx * operands;
+{
+  HOST_WIDE_INT n = INTVAL (operands[1]);
+  int n_ones = 0;
+  int i;
+
+  /* Try to use one MOV */
+  if (const_ok_for_arm (n))
+    {
+      output_asm_insn ("mov%?\t%0, %1", operands);
+      return "";
+    }
+
+  /* Try to use one MVN */
+  if (const_ok_for_arm (~n))
+    {
+      operands[1] = GEN_INT (~n);
+      output_asm_insn ("mvn%?\t%0, %1", operands);
+      return "";
+    }
+
+  /* If all else fails, make it out of ORRs or BICs as appropriate.  */
+
+  for (i=0; i < 32; i++)
+    if (n & 1 << i)
+      n_ones++;
+
+  if (n_ones > 16)  /* Shorter to use MVN with BIC in this case.  */
+    output_multi_immediate (operands, "mvn%?\t%0, %1", "bic%?\t%0, %0, %1", 1, ~n);
+  else
+    output_multi_immediate (operands, "mov%?\t%0, %1", "orr%?\t%0, %0, %1", 1, n);
+
+  return "";
+}
+
+
+/* Output an ADD r, s, #n where n may be too big for one instruction.  If
+   adding zero to one register, output nothing.  */
+
+char *
+output_add_immediate (operands)
+     rtx * operands;
+{
+  HOST_WIDE_INT n = INTVAL (operands[2]);
+
+  if (n != 0 || REGNO (operands[0]) != REGNO (operands[1]))
+    {
+      if (n < 0)
+       output_multi_immediate (operands,
+                               "sub%?\t%0, %1, %2", "sub%?\t%0, %0, %2", 2,
+                               -n);
+      else
+       output_multi_immediate (operands,
+                               "add%?\t%0, %1, %2", "add%?\t%0, %0, %2", 2,
+                               n);
+    }
+
+  return "";
+}
+
+/* Output a multiple immediate operation.
+   OPERANDS is the vector of operands referred to in the output patterns.
+   INSTR1 is the output pattern to use for the first constant.
+   INSTR2 is the output pattern to use for subsequent constants.
+   IMMED_OP is the index of the constant slot in OPERANDS.
+   N is the constant value.  */
+
+static char *
+output_multi_immediate (operands, instr1, instr2, immed_op, n)
+     rtx * operands;
+     char * instr1, * instr2;
+     int immed_op;
+     HOST_WIDE_INT n;
+{
+#if HOST_BITS_PER_WIDE_INT > 32
+  n &= HOST_UINT (0xffffffff);
+#endif
+
+  if (n == 0)
+    {
+      operands[immed_op] = const0_rtx;
+      output_asm_insn (instr1, operands); /* Quick and easy output.  */
+    }
+  else
+    {
+      int i;
+      char *instr = instr1;
+
+      /* Note that n is never zero here (which would give no output).  */
+      for (i = 0; i < 32; i += 2)
+       {
+         if (n & (3 << i))
+           {
+             operands[immed_op] = GEN_INT (n & (255 << i));
+             output_asm_insn (instr, operands);
+             instr = instr2;
+             i += 6;
+           }
+       }
+    }
+  return "";
+}
+
+
+/* Return the appropriate ARM instruction for the operation code.
+   The returned result should not be overwritten.  OP is the rtx of the
+   operation.  SHIFT_FIRST_ARG is TRUE if the first argument of the operator
+   was shifted.  */
+
+char *
+arithmetic_instr (op, shift_first_arg)
+     rtx op;
+     int shift_first_arg;
+{
+  switch (GET_CODE (op))
+    {
+    case PLUS:
+      return "add";
+
+    case MINUS:
+      return shift_first_arg ? "rsb" : "sub";
+
+    case IOR:
+      return "orr";
+
+    case XOR:
+      return "eor";
+
+    case AND:
+      return "and";
+
+    default:
+      abort ();
+    }
+}
+
+
+/* Ensure valid constant shifts and return the appropriate shift mnemonic
+   for the operation code.  The returned result should not be overwritten.
+   OP is the rtx code of the shift.
+   On exit, *AMOUNTP will be -1 if the shift is by a register, or a constant
+   shift.  */
+
+static char *
+shift_op (op, amountp)
+     rtx op;
+     HOST_WIDE_INT *amountp;
+{
+  char * mnem;
+  enum rtx_code code = GET_CODE (op);
+
+  if (GET_CODE (XEXP (op, 1)) == REG || GET_CODE (XEXP (op, 1)) == SUBREG)
+    *amountp = -1;
+  else if (GET_CODE (XEXP (op, 1)) == CONST_INT)
+    *amountp = INTVAL (XEXP (op, 1));
+  else
+    abort ();
+
+  switch (code)
+    {
+    case ASHIFT:
+      mnem = "asl";
+      break;
+
+    case ASHIFTRT:
+      mnem = "asr";
+      break;
+
+    case LSHIFTRT:
+      mnem = "lsr";
+      break;
+
+    case ROTATERT:
+      mnem = "ror";
+      break;
+
+    case MULT:
+      /* We never have to worry about the amount being other than a
+        power of 2, since this case can never be reloaded from a reg.  */
+      if (*amountp != -1)
+       *amountp = int_log2 (*amountp);
+      else
+       abort ();
+      return "asl";
+
+    default:
+      abort ();
+    }
+
+  if (*amountp != -1)
+    {
+      /* This is not 100% correct, but follows from the desire to merge
+        multiplication by a power of 2 with the recognizer for a
+        shift.  >=32 is not a valid shift for "asl", so we must try and
+        output a shift that produces the correct arithmetical result.
+        Using lsr #32 is identical except for the fact that the carry bit
+        is not set correctly if we set the flags; but we never use the 
+        carry bit from such an operation, so we can ignore that.  */
+      if (code == ROTATERT)
+       *amountp &= 31;         /* Rotate is just modulo 32 */
+      else if (*amountp != (*amountp & 31))
+       {
+         if (code == ASHIFT)
+           mnem = "lsr";
+         *amountp = 32;
+       }
+
+      /* Shifts of 0 are no-ops.  */
+      if (*amountp == 0)
+       return NULL;
+    }    
+
+  return mnem;
+}
+
+
+/* Obtain the shift from the POWER of two.  */
+static HOST_WIDE_INT
+int_log2 (power)
+     HOST_WIDE_INT power;
+{
+  HOST_WIDE_INT shift = 0;
+
+  while ((((HOST_INT (1)) << shift) & power) == 0)
+    {
+      if (shift > 31)
+       abort ();
+      shift++;
+    }
+
+  return shift;
+}
+
+/* Output a .ascii pseudo-op, keeping track of lengths.  This is because
+   /bin/as is horribly restrictive.  */
+#define MAX_ASCII_LEN 51
+
+void
+output_ascii_pseudo_op (stream, p, len)
+     FILE * stream;
+     const unsigned char * p;
+     int len;
+{
+  int i;
+  int len_so_far = 0;
+
+  fputs ("\t.ascii\t\"", stream);
+  
+  for (i = 0; i < len; i++)
+    {
+      register int c = p[i];
+
+      if (len_so_far >= MAX_ASCII_LEN)
+       {
+         fputs ("\"\n\t.ascii\t\"", stream);
+         len_so_far = 0;
+       }
+
+      switch (c)
+       {
+       case TARGET_TAB:                
+         fputs ("\\t", stream);
+         len_so_far += 2;                      
+         break;
+         
+       case TARGET_FF:
+         fputs ("\\f", stream);
+         len_so_far += 2;
+         break;
+         
+       case TARGET_BS:
+         fputs ("\\b", stream);
+         len_so_far += 2;
+         break;
+         
+       case TARGET_CR:
+         fputs ("\\r", stream);
+         len_so_far += 2;
+         break;
+         
+       case TARGET_NEWLINE:
+         fputs ("\\n", stream);
+         c = p [i + 1];
+         if ((c >= ' ' && c <= '~')
+             || c == TARGET_TAB)
+           /* This is a good place for a line break.  */
+           len_so_far = MAX_ASCII_LEN;
+         else
+           len_so_far += 2;
+         break;
+         
+       case '\"':
+       case '\\':
+         putc ('\\', stream);
+         len_so_far ++;
+         /* drop through.  */
+
+       default:
+         if (c >= ' ' && c <= '~')
+           {
+             putc (c, stream);
+             len_so_far ++;
+           }
+         else
+           {
+             fprintf (stream, "\\%03o", c);
+             len_so_far += 4;
+           }
+         break;
+       }
+    }
+
+  fputs ("\"\n", stream);
+}
+\f
+
+/* Try to determine whether a pattern really clobbers the link register.
+   This information is useful when peepholing, so that lr need not be pushed
+   if we combine a call followed by a return.
+   NOTE: This code does not check for side-effect expressions in a SET_SRC:
+   such a check should not be needed because these only update an existing
+   value within a register; the register must still be set elsewhere within
+   the function.  */
+static int
+pattern_really_clobbers_lr (x)
+     rtx x;
+{
+  int i;
+  
+  switch (GET_CODE (x))
+    {
+    case SET:
+      switch (GET_CODE (SET_DEST (x)))
+       {
+       case REG:
+         return REGNO (SET_DEST (x)) == LR_REGNUM;
+
+        case SUBREG:
+         if (GET_CODE (XEXP (SET_DEST (x), 0)) == REG)
+           return REGNO (XEXP (SET_DEST (x), 0)) == LR_REGNUM;
+
+         if (GET_CODE (XEXP (SET_DEST (x), 0)) == MEM)
+           return 0;
+         abort ();
+
+        default:
+         return 0;
+        }
+
+    case PARALLEL:
+      for (i = 0; i < XVECLEN (x, 0); i++)
+       if (pattern_really_clobbers_lr (XVECEXP (x, 0, i)))
+         return 1;
+      return 0;
+
+    case CLOBBER:
+      switch (GET_CODE (XEXP (x, 0)))
+        {
+       case REG:
+         return REGNO (XEXP (x, 0)) == LR_REGNUM;
+
+        case SUBREG:
+         if (GET_CODE (XEXP (XEXP (x, 0), 0)) == REG)
+           return REGNO (XEXP (XEXP (x, 0), 0)) == LR_REGNUM;
+         abort ();
+
+        default:
+         return 0;
+        }
+
+    case UNSPEC:
+      return 1;
+
+    default:
+      return 0;
+    }
+}
+
+static int
+function_really_clobbers_lr (first)
+     rtx first;
+{
+  rtx insn, next;
+  
+  for (insn = first; insn; insn = next_nonnote_insn (insn))
+    {
+      switch (GET_CODE (insn))
+        {
+       case BARRIER:
+       case NOTE:
+       case CODE_LABEL:
+       case JUMP_INSN:         /* Jump insns only change the PC (and conds) */
+         break;
+
+        case INSN:
+         if (pattern_really_clobbers_lr (PATTERN (insn)))
+           return 1;
+         break;
+
+        case CALL_INSN:
+         /* Don't yet know how to handle those calls that are not to a 
+            SYMBOL_REF.  */
+         if (GET_CODE (PATTERN (insn)) != PARALLEL)
+           abort ();
+
+         switch (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)))
+           {
+           case CALL:
+             if (GET_CODE (XEXP (XEXP (XVECEXP (PATTERN (insn), 0, 0), 0), 0))
+                 != SYMBOL_REF)
+               return 1;
+             break;
+
+           case SET:
+             if (GET_CODE (XEXP (XEXP (SET_SRC (XVECEXP (PATTERN (insn),
+                                                         0, 0)), 0), 0))
+                 != SYMBOL_REF)
+               return 1;
+             break;
+
+           default:    /* Don't recognize it, be safe.  */
+             return 1;
+           }
+
+         /* A call can be made (by peepholing) not to clobber lr iff it is
+            followed by a return.  There may, however, be a use insn iff
+            we are returning the result of the call. 
+            If we run off the end of the insn chain, then that means the
+            call was at the end of the function.  Unfortunately we don't
+            have a return insn for the peephole to recognize, so we
+            must reject this.  (Can this be fixed by adding our own insn?) */
+         if ((next = next_nonnote_insn (insn)) == NULL)
+           return 1;
+
+         /* No need to worry about lr if the call never returns.  */
+         if (GET_CODE (next) == BARRIER)
+           break;
+
+         if (GET_CODE (next) == INSN
+             && GET_CODE (PATTERN (next)) == USE
+             && (GET_CODE (XVECEXP (PATTERN (insn), 0, 0)) == SET)
+             && (GET_CODE (XEXP (PATTERN (next), 0)) == REG)
+             && (REGNO (SET_DEST (XVECEXP (PATTERN (insn), 0, 0)))
+                 == REGNO (XEXP (PATTERN (next), 0))))
+           if ((next = next_nonnote_insn (next)) == NULL)
+             return 1;
+
+         if (GET_CODE (next) == JUMP_INSN
+             && GET_CODE (PATTERN (next)) == RETURN)
+           break;
+         return 1;
+
+        default:
+         abort ();
+        }
+    }
+
+  /* We have reached the end of the chain so lr was _not_ clobbered.  */
+  return 0;
+}
+
+char *
+output_return_instruction (operand, really_return, reverse)
+     rtx operand;
+     int really_return;
+     int reverse;
+{
+  char instr[100];
+  int reg, live_regs = 0;
+  int volatile_func = arm_volatile_func ();
+
+  /* If a function is naked, don't use the "return" insn.  */
+  if (arm_naked_function_p (current_function_decl))
+    return "";
+  
+  return_used_this_function = 1;
+  
+  if (TARGET_ABORT_NORETURN && volatile_func)
+    {
+      /* If this function was declared non-returning, and we have found a tail 
+        call, then we have to trust that the called function won't return.  */
+      if (really_return)
+       {
+         rtx ops[2];
+      
+         /* Otherwise, trap an attempted return by aborting.  */
+         ops[0] = operand;
+         ops[1] = gen_rtx_SYMBOL_REF (Pmode, NEED_PLT_RELOC ? "abort(PLT)" 
+                                      : "abort");
+         assemble_external_libcall (ops[1]);
+         output_asm_insn (reverse ? "bl%D0\t%a1" : "bl%d0\t%a1", ops);
+       }
+      
+      return "";
+    }
+      
+  if (current_function_calls_alloca && ! really_return)
+    abort ();
+  
+  for (reg = 0; reg <= 10; reg++)
+    if (regs_ever_live[reg] && ! call_used_regs[reg])
+      live_regs++;
+
+  if (! TARGET_APCS_FRAME
+      && ! frame_pointer_needed
+      && regs_ever_live[HARD_FRAME_POINTER_REGNUM]
+      && ! call_used_regs[HARD_FRAME_POINTER_REGNUM])
+    live_regs++;
+
+  if (flag_pic && ! TARGET_SINGLE_PIC_BASE
+      && regs_ever_live[PIC_OFFSET_TABLE_REGNUM])
+    live_regs++;
+
+  if (live_regs || (regs_ever_live[LR_REGNUM] && ! lr_save_eliminated))
+    live_regs++;
+
+  if (frame_pointer_needed)
+    live_regs += 4;
+
+  /* On some ARM architectures it is faster to use LDR rather than LDM to
+     load a single register.  On other architectures, the cost is the same.  */
+  if (live_regs == 1
+      && regs_ever_live[LR_REGNUM]
+      && ! lr_save_eliminated
+      /* FIXME: We ought to handle the case TARGET_APCS_32 is true,
+        really_return is true, and only the PC needs restoring.  */
+      && ! really_return)
+    output_asm_insn (reverse ? "ldr%?%D0\t%|lr, [%|sp], #4" 
+                    : "ldr%?%d0\t%|lr, [%|sp], #4", &operand);
+  else if (live_regs == 1
+          && regs_ever_live[LR_REGNUM]
+          && ! lr_save_eliminated
+          && TARGET_APCS_32)
+    output_asm_insn (reverse ? "ldr%?%D0\t%|pc, [%|sp], #4"
+                    : "ldr%?%d0\t%|pc, [%|sp], #4", &operand);
+  else if (live_regs)
+    {
+      if (lr_save_eliminated || ! regs_ever_live[LR_REGNUM])
+        live_regs++;
+
+      if (frame_pointer_needed)
+        strcpy (instr,
+               reverse ? "ldm%?%D0ea\t%|fp, {" : "ldm%?%d0ea\t%|fp, {");
+      else
+        strcpy (instr, 
+               reverse ? "ldm%?%D0fd\t%|sp!, {" : "ldm%?%d0fd\t%|sp!, {");
+
+      for (reg = 0; reg <= 10; reg++)
+        if (regs_ever_live[reg]
+           && (! call_used_regs[reg]
+               || (flag_pic && ! TARGET_SINGLE_PIC_BASE
+                   && reg == PIC_OFFSET_TABLE_REGNUM)))
+          {
+           strcat (instr, "%|");
+            strcat (instr, reg_names[reg]);
+           if (--live_regs)
+              strcat (instr, ", ");
+          }
+
+      if (frame_pointer_needed)
+        {
+         strcat (instr, "%|");
+          strcat (instr, reg_names[11]);
+          strcat (instr, ", ");
+         strcat (instr, "%|");
+          strcat (instr, reg_names[13]);
+          strcat (instr, ", ");
+         strcat (instr, "%|");
+         strcat (instr, TARGET_INTERWORK || (! really_return)
+                 ? reg_names[LR_REGNUM] : reg_names[PC_REGNUM] );
+        }
+      else
+       {
+         if (! TARGET_APCS_FRAME
+             && regs_ever_live[HARD_FRAME_POINTER_REGNUM]
+             && ! call_used_regs[HARD_FRAME_POINTER_REGNUM])
+           {
+             strcat (instr, "%|");
+             strcat (instr, reg_names[HARD_FRAME_POINTER_REGNUM]);
+             strcat (instr, ", ");
+           }
+         
+         strcat (instr, "%|");
+         
+         if (TARGET_INTERWORK && really_return)
+           strcat (instr, reg_names[IP_REGNUM]);
+         else
+           strcat (instr, really_return ? reg_names[PC_REGNUM] : reg_names[LR_REGNUM]);
+       }
+      
+      strcat (instr, (TARGET_APCS_32 || !really_return) ? "}" : "}^");
+      output_asm_insn (instr, &operand);
+
+      if (TARGET_INTERWORK && really_return)
+       {
+         strcpy (instr, "bx%?");
+         strcat (instr, reverse ? "%D0" : "%d0");
+         strcat (instr, "\t%|");
+         strcat (instr, frame_pointer_needed ? "lr" : "ip");
+
+         output_asm_insn (instr, & operand);
+       }
+    }
+  else if (really_return)
+    {
+      if (TARGET_INTERWORK)
+       sprintf (instr, "bx%%?%%%s0\t%%|lr", reverse ? "D" : "d");
+      else
+       sprintf (instr, "mov%%?%%%s0%s\t%%|pc, %%|lr",
+                reverse ? "D" : "d", TARGET_APCS_32 ? "" : "s");
+      
+      output_asm_insn (instr, & operand);
+    }
+
+  return "";
+}
+
+/* Return nonzero if optimizing and the current function is volatile.
+   Such functions never return, and many memory cycles can be saved
+   by not storing register values that will never be needed again.
+   This optimization was added to speed up context switching in a
+   kernel application.  */
+int
+arm_volatile_func ()
+{
+  return (optimize > 0
+         && current_function_nothrow
+         && TREE_THIS_VOLATILE (current_function_decl));
+}
+
+/* Write the function name into the code section, directly preceding
+   the function prologue.
+
+   Code will be output similar to this:
+     t0
+        .ascii "arm_poke_function_name", 0
+        .align
+     t1
+        .word 0xff000000 + (t1 - t0)
+     arm_poke_function_name
+        mov     ip, sp
+        stmfd   sp!, {fp, ip, lr, pc}
+        sub     fp, ip, #4
+
+   When performing a stack backtrace, code can inspect the value
+   of 'pc' stored at 'fp' + 0.  If the trace function then looks
+   at location pc - 12 and the top 8 bits are set, then we know
+   that there is a function name embedded immediately preceding this
+   location and has length ((pc[-3]) & 0xff000000).
+
+   We assume that pc is declared as a pointer to an unsigned long.
+
+   It is of no benefit to output the function name if we are assembling
+   a leaf function.  These function types will not contain a stack
+   backtrace structure, therefore it is not possible to determine the
+   function name.  */
+
+void
+arm_poke_function_name (stream, name)
+   FILE * stream;
+   char * name;
+{
+  unsigned long alignlength;
+  unsigned long length;
+  rtx           x;
+
+  length      = strlen (name) + 1;
+  alignlength = ROUND_UP (length);
+  
+  ASM_OUTPUT_ASCII (stream, name, length);
+  ASM_OUTPUT_ALIGN (stream, 2);
+  x = GEN_INT (HOST_UINT(0xff000000) + alignlength);
+  ASM_OUTPUT_INT (stream, x);
+}
+
+/* The amount of stack adjustment that happens here, in output_return and in
+   output_epilogue must be exactly the same as was calculated during reload,
+   or things will point to the wrong place.  The only time we can safely
+   ignore this constraint is when a function has no arguments on the stack,
+   no stack frame requirement and no live registers execpt for `lr'.  If we
+   can guarantee that by making all function calls into tail calls and that
+   lr is not clobbered in any other way, then there is no need to push lr
+   onto the stack.  */
+void
+output_arm_prologue (f, frame_size)
+     FILE * f;
+     int frame_size;
+{
+  int reg, live_regs_mask = 0;
+  int volatile_func = arm_volatile_func ();
+
+  /* Nonzero if we must stuff some register arguments onto the stack as if
+     they were passed there.  */
+  int store_arg_regs = 0;
+
+  if (arm_ccfsm_state || arm_target_insn)
+    abort ();                                  /* Sanity check.  */
+
+  if (arm_naked_function_p (current_function_decl))
+    return;
+
+  return_used_this_function = 0;
+  lr_save_eliminated = 0;
+  
+  asm_fprintf (f, "\t%@ args = %d, pretend = %d, frame = %d\n",
+              current_function_args_size,
+              current_function_pretend_args_size, frame_size);
+  asm_fprintf (f, "\t%@ frame_needed = %d, current_function_anonymous_args = %d\n",
+              frame_pointer_needed,
+              current_function_anonymous_args);
+
+  if (volatile_func)
+    asm_fprintf (f, "\t%@ Volatile function.\n");
+
+  if (current_function_anonymous_args && current_function_pretend_args_size)
+    store_arg_regs = 1;
+
+  for (reg = 0; reg <= 10; reg++)
+    if (regs_ever_live[reg] && ! call_used_regs[reg])
+      live_regs_mask |= (1 << reg);
+
+  if (! TARGET_APCS_FRAME
+      && ! frame_pointer_needed
+      && regs_ever_live[HARD_FRAME_POINTER_REGNUM]
+      && ! call_used_regs[HARD_FRAME_POINTER_REGNUM])
+    live_regs_mask |= (1 << HARD_FRAME_POINTER_REGNUM);
+
+  if (flag_pic && ! TARGET_SINGLE_PIC_BASE
+      && regs_ever_live[PIC_OFFSET_TABLE_REGNUM])
+    live_regs_mask |= (1 << PIC_OFFSET_TABLE_REGNUM);
+
+  if (frame_pointer_needed)
+    live_regs_mask |= 0xD800;
+  else if (regs_ever_live[LR_REGNUM])
+    {
+      if (! current_function_args_size
+         && ! function_really_clobbers_lr (get_insns ()))
+       lr_save_eliminated = 1;
+      else
+        live_regs_mask |= 1 << LR_REGNUM;
+    }
+
+  if (live_regs_mask)
+    {
+      /* If a di mode load/store multiple is used, and the base register
+        is r3, then r4 can become an ever live register without lr
+        doing so,  in this case we need to push lr as well, or we
+        will fail to get a proper return.  */
+      live_regs_mask |= 1 << LR_REGNUM;
+      lr_save_eliminated = 0;
+
+    }
+
+  if (lr_save_eliminated)
+    asm_fprintf (f,"\t%@ I don't think this function clobbers lr\n");
+
+#ifdef AOF_ASSEMBLER
+  if (flag_pic)
+    asm_fprintf (f, "\tmov\t%r, %r\n", IP_REGNUM, PIC_OFFSET_TABLE_REGNUM);
+#endif
+}
+
+char *
+arm_output_epilogue ()
+{
+  int reg;
+  int live_regs_mask = 0;
+  /* If we need this, then it will always be at least this much.  */
+  int floats_offset = 12;
+  rtx operands[3];
+  int frame_size = get_frame_size ();
+  rtx eh_ofs = cfun->machine->eh_epilogue_sp_ofs;
+  FILE * f = asm_out_file;
+  int volatile_func = arm_volatile_func ();
+  int return_regnum;
+
+  if (use_return_insn (FALSE) && return_used_this_function)
+    return "";
+
+  /* Naked functions don't have epilogues.  */
+  if (arm_naked_function_p (current_function_decl))
+    return "";
+
+  /* If we are throwing an exception, the address we want to jump to is in
+     R1; otherwise, it's in LR.  */
+  return_regnum = eh_ofs ? 2 : LR_REGNUM;
+
+  /* A volatile function should never return.  Call abort.  */
+  if (TARGET_ABORT_NORETURN && volatile_func)
+    {
+      rtx op;
+      op = gen_rtx_SYMBOL_REF (Pmode, NEED_PLT_RELOC ? "abort(PLT)" : "abort");
+      assemble_external_libcall (op);
+      output_asm_insn ("bl\t%a0", &op);
+      return "";
+    }
+
+  for (reg = 0; reg <= 10; reg++)
+    if (regs_ever_live[reg] && ! call_used_regs[reg])
+      {
+        live_regs_mask |= (1 << reg);
+       floats_offset += 4;
+      }
+
+  /* Handle the frame pointer as a special case.  */
+  if (! TARGET_APCS_FRAME
+      && ! frame_pointer_needed
+      && regs_ever_live[HARD_FRAME_POINTER_REGNUM]
+      && ! call_used_regs[HARD_FRAME_POINTER_REGNUM])
+    {
+      live_regs_mask |= (1 << HARD_FRAME_POINTER_REGNUM);
+      floats_offset += 4;
+    }
+
+  /* If we aren't loading the PIC register, don't stack it even though it may
+     be live.  */
+  if (flag_pic && ! TARGET_SINGLE_PIC_BASE 
+      && regs_ever_live[PIC_OFFSET_TABLE_REGNUM])
+    {
+      live_regs_mask |= (1 << PIC_OFFSET_TABLE_REGNUM);
+      floats_offset += 4;
+    }
+
+  if (frame_pointer_needed)
+    {
+      if (arm_fpu_arch == FP_SOFT2)
+       {
+         for (reg = LAST_ARM_FP_REGNUM; reg >= FIRST_ARM_FP_REGNUM; reg--)
+           if (regs_ever_live[reg] && ! call_used_regs[reg])
+             {
+               floats_offset += 12;
+               asm_fprintf (f, "\tldfe\t%r, [%r, #-%d]\n", 
+                            reg, FP_REGNUM, floats_offset);
+             }
+       }
+      else
+       {
+         int start_reg = LAST_ARM_FP_REGNUM;
+
+         for (reg = LAST_ARM_FP_REGNUM; reg >= FIRST_ARM_FP_REGNUM; reg--)
+           {
+             if (regs_ever_live[reg] && ! call_used_regs[reg])
+               {
+                 floats_offset += 12;
+                 
+                 /* We can't unstack more than four registers at once.  */
+                 if (start_reg - reg == 3)
+                   {
+                     asm_fprintf (f, "\tlfm\t%r, 4, [%r, #-%d]\n",
+                                  reg, FP_REGNUM, floats_offset);
+                     start_reg = reg - 1;
+                   }
+               }
+             else
+               {
+                 if (reg != start_reg)
+                   asm_fprintf (f, "\tlfm\t%r, %d, [%r, #-%d]\n",
+                                reg + 1, start_reg - reg,
+                                FP_REGNUM, floats_offset);
+                 start_reg = reg - 1;
+               }
+           }
+
+         /* Just in case the last register checked also needs unstacking.  */
+         if (reg != start_reg)
+           asm_fprintf (f, "\tlfm\t%r, %d, [%r, #-%d]\n",
+                        reg + 1, start_reg - reg,
+                        FP_REGNUM, floats_offset);
+       }
+      
+      if (TARGET_INTERWORK)
+       {
+         live_regs_mask |= 0x6800;
+         print_multi_reg (f, "ldmea\t%r", FP_REGNUM, live_regs_mask, FALSE);
+         if (eh_ofs)
+           asm_fprintf (f, "\tadd\t%r, %r, %r\n", SP_REGNUM, SP_REGNUM,
+                        REGNO (eh_ofs));
+         asm_fprintf (f, "\tbx\t%r\n", return_regnum);
+       }
+      else if (eh_ofs)
+       {
+         live_regs_mask |= 0x6800;
+         print_multi_reg (f, "ldmea\t%r", FP_REGNUM, live_regs_mask, FALSE);
+         asm_fprintf (f, "\tadd\t%r, %r, %r\n", SP_REGNUM, SP_REGNUM,
+                      REGNO (eh_ofs));
+         /* Even in 26-bit mode we do a mov (rather than a movs) because
+            we don't have the PSR bits set in the address.  */
+         asm_fprintf (f, "\tmov\t%r, %r\n", PC_REGNUM, return_regnum);
+       }
+      else
+       {
+         live_regs_mask |= 0xA800;
+         print_multi_reg (f, "ldmea\t%r", FP_REGNUM, live_regs_mask,
+                          TARGET_APCS_32 ? FALSE : TRUE);
+       }
+    }
+  else
+    {
+      /* Restore stack pointer if necessary.  */
+      if (frame_size + current_function_outgoing_args_size != 0)
+       {
+         operands[0] = operands[1] = stack_pointer_rtx;
+         operands[2] = GEN_INT (frame_size
+                                + current_function_outgoing_args_size);
+         output_add_immediate (operands);
+       }
+
+      if (arm_fpu_arch == FP_SOFT2)
+       {
+         for (reg = FIRST_ARM_FP_REGNUM; reg <= LAST_ARM_FP_REGNUM; reg++)
+           if (regs_ever_live[reg] && ! call_used_regs[reg])
+             asm_fprintf (f, "\tldfe\t%r, [%r], #12\n",
+                          reg, SP_REGNUM);
+       }
+      else
+       {
+         int start_reg = FIRST_ARM_FP_REGNUM;
+
+         for (reg = FIRST_ARM_FP_REGNUM; reg <= LAST_ARM_FP_REGNUM; reg++)
+           {
+             if (regs_ever_live[reg] && ! call_used_regs[reg])
+               {
+                 if (reg - start_reg == 3)
+                   {
+                     asm_fprintf (f, "\tlfmfd\t%r, 4, [%r]!\n",
+                                  start_reg, SP_REGNUM);
+                     start_reg = reg + 1;
+                   }
+               }
+             else
+               {
+                 if (reg != start_reg)
+                   asm_fprintf (f, "\tlfmfd\t%r, %d, [%r]!\n",
+                                start_reg, reg - start_reg,
+                                SP_REGNUM);
+                 
+                 start_reg = reg + 1;
+               }
+           }
+
+         /* Just in case the last register checked also needs unstacking.  */
+         if (reg != start_reg)
+           asm_fprintf (f, "\tlfmfd\t%r, %d, [%r]!\n",
+                        start_reg, reg - start_reg, SP_REGNUM);
+       }
+
+      if (current_function_pretend_args_size == 0 && regs_ever_live[LR_REGNUM])
+       {
+         if (TARGET_INTERWORK)
+           {
+             if (! lr_save_eliminated)
+               live_regs_mask |= 1 << LR_REGNUM;
+
+             /* Handle LR on its own.  */
+             if (live_regs_mask == (1 << LR_REGNUM))
+               {
+                 if (eh_ofs)
+                   asm_fprintf (f, "\tadd\t%r, %r, #4\n", SP_REGNUM,
+                                SP_REGNUM);
+                 else
+                   asm_fprintf (f, "\tldr\t%r, [%r], #4\n", LR_REGNUM,
+                                SP_REGNUM);
+               }
+             else if (live_regs_mask != 0)
+               print_multi_reg (f, "ldmfd\t%r!", SP_REGNUM, live_regs_mask,
+                                FALSE);
+
+             if (eh_ofs)
+               asm_fprintf (f, "\tadd\t%r, %r, %r\n", SP_REGNUM, SP_REGNUM,
+                            REGNO (eh_ofs));
+
+             asm_fprintf (f, "\tbx\t%r\n", return_regnum);
+           }
+         else if (lr_save_eliminated)
+           asm_fprintf (f,
+                        TARGET_APCS_32 ? "\tmov\t%r, %r\n" : "\tmovs\t%r, %r\n",
+                        PC_REGNUM, LR_REGNUM);
+         else if (eh_ofs)
+           {
+             if (live_regs_mask == 0)
+               asm_fprintf (f, "\tadd\t%r, %r, #4\n", SP_REGNUM, SP_REGNUM);
+             else
+               print_multi_reg (f, "\tldmfd\t%r!", SP_REGNUM,
+                                live_regs_mask | (1 << LR_REGNUM), FALSE);
+               
+             asm_fprintf (f, "\tadd\t%r, %r, %r\n", SP_REGNUM, SP_REGNUM,
+                          REGNO (eh_ofs));
+             /* Jump to the target; even in 26-bit mode.  */
+             asm_fprintf (f, "\tmov\t%r, %r\n", PC_REGNUM, return_regnum);
+           }
+         else if (TARGET_APCS_32 && live_regs_mask == 0)
+           asm_fprintf (f, "\tldr\t%r, [%r], #4\n", PC_REGNUM, SP_REGNUM);
+         else
+           print_multi_reg (f, "ldmfd\t%r!", SP_REGNUM,
+                            live_regs_mask | (1 << PC_REGNUM),
+                            TARGET_APCS_32 ? FALSE : TRUE);
+       }
+      else
+       {
+         if (live_regs_mask || regs_ever_live[LR_REGNUM])
+           {
+             /* Restore the integer regs, and the return address into lr.  */
+             if (! lr_save_eliminated)
+               live_regs_mask |= 1 << LR_REGNUM;
+
+             if (live_regs_mask == (1 << LR_REGNUM))
+               {
+                 if (eh_ofs)
+                   asm_fprintf (f, "\tadd\t%r, %r, #4\n", SP_REGNUM,
+                                SP_REGNUM);
+                 else
+                   asm_fprintf (f, "\tldr\t%r, [%r], #4\n", LR_REGNUM,
+                                SP_REGNUM);
+               }
+             else if (live_regs_mask != 0)
+               print_multi_reg (f, "ldmfd\t%r!", SP_REGNUM, live_regs_mask,
+                                FALSE);
+           }
+
+         if (current_function_pretend_args_size)
+           {
+             /* Unwind the pre-pushed regs.  */
+             operands[0] = operands[1] = stack_pointer_rtx;
+             operands[2] = GEN_INT (current_function_pretend_args_size);
+             output_add_immediate (operands);
+           }
+
+         if (eh_ofs)
+           asm_fprintf (f, "\tadd\t%r, %r, %r\n", SP_REGNUM, SP_REGNUM,
+                        REGNO (eh_ofs));
+         
+         /* And finally, go home.  */
+         if (TARGET_INTERWORK)
+           asm_fprintf (f, "\tbx\t%r\n", return_regnum);
+         else if (TARGET_APCS_32 || eh_ofs)
+           asm_fprintf (f, "\tmov\t%r, %r\n", PC_REGNUM, return_regnum);
+         else
+           asm_fprintf (f, "\tmovs\t%r, %r\n", PC_REGNUM, return_regnum);
+       }
+    }
+
+  return "";
+}
+
+void
+output_func_epilogue (frame_size)
+     int frame_size;
+{
+  if (TARGET_THUMB)
+    {
+      /* ??? Probably not safe to set this here, since it assumes that a
+        function will be emitted as assembly immediately after we generate
+        RTL for it.  This does not happen for inline functions.  */
+      return_used_this_function = 0;
+    }
+  else
+    {
+      if (use_return_insn (FALSE)
+         && return_used_this_function
+         && (frame_size + current_function_outgoing_args_size) != 0
+         && ! frame_pointer_needed)
+       abort ();
+
+      /* Reset the ARM-specific per-function variables.  */
+      current_function_anonymous_args = 0;
+      after_arm_reorg = 0;
+    }
+}
+
+/* Generate and emit an insn that we will recognize as a push_multi.
+   Unfortunately, since this insn does not reflect very well the actual
+   semantics of the operation, we need to annotate the insn for the benefit
+   of DWARF2 frame unwind information.  */
+static rtx
+emit_multi_reg_push (mask)
+     int mask;
+{
+  int num_regs = 0;
+  int i, j;
+  rtx par;
+  rtx dwarf;
+  rtx tmp, reg;
+
+  for (i = 0; i <= LAST_ARM_REGNUM; i++)
+    if (mask & (1 << i))
+      num_regs ++;
+
+  if (num_regs == 0 || num_regs > 16)
+    abort ();
+
+  par = gen_rtx_PARALLEL (VOIDmode, rtvec_alloc (num_regs));
+  dwarf = gen_rtx_PARALLEL (VOIDmode, rtvec_alloc (num_regs));
+  RTX_FRAME_RELATED_P (dwarf) = 1;
+
+  for (i = 0; i <= LAST_ARM_REGNUM; i++)
+    {
+      if (mask & (1 << i))
+       {
+         reg = gen_rtx_REG (SImode, i);
+
+         XVECEXP (par, 0, 0)
+           = gen_rtx_SET (VOIDmode,
+                          gen_rtx_MEM (BLKmode,
+                                       gen_rtx_PRE_DEC (BLKmode,
+                                                        stack_pointer_rtx)),
+                          gen_rtx_UNSPEC (BLKmode,
+                                          gen_rtvec (1, reg),
+                                          2));
+
+         tmp = gen_rtx_SET (VOIDmode,
+                            gen_rtx_MEM (SImode,
+                                         gen_rtx_PRE_DEC (BLKmode,
+                                                          stack_pointer_rtx)),
+                            reg);
+         RTX_FRAME_RELATED_P (tmp) = 1;
+         XVECEXP (dwarf, 0, num_regs - 1) = tmp;         
+
+         break;
+       }
+    }
+
+  for (j = 1, i++; j < num_regs; i++)
+    {
+      if (mask & (1 << i))
+       {
+         reg = gen_rtx_REG (SImode, i);
+
+         XVECEXP (par, 0, j) = gen_rtx_USE (VOIDmode, reg);
+
+         tmp = gen_rtx_SET (VOIDmode,
+                            gen_rtx_MEM (SImode,
+                                         gen_rtx_PRE_DEC (BLKmode,
+                                                          stack_pointer_rtx)),
+                            reg);
+         RTX_FRAME_RELATED_P (tmp) = 1;
+         XVECEXP (dwarf, 0, num_regs - j - 1) = tmp;
+                          
+         j++;
+       }
+    }
+
+  par = emit_insn (par);
+  REG_NOTES (par) = gen_rtx_EXPR_LIST (REG_FRAME_RELATED_EXPR, dwarf,
+                                      REG_NOTES (par));
+  return par;
+}
+
+static rtx
+emit_sfm (base_reg, count)
+     int base_reg;
+     int count;
+{
+  rtx par;
+  rtx dwarf;
+  rtx tmp, reg;
+  int i;
+
+  par = gen_rtx_PARALLEL (VOIDmode, rtvec_alloc (count));
+  dwarf = gen_rtx_PARALLEL (VOIDmode, rtvec_alloc (count));
+  RTX_FRAME_RELATED_P (dwarf) = 1;
+
+  reg = gen_rtx_REG (XFmode, base_reg++);
+
+  XVECEXP (par, 0, 0)
+    = gen_rtx_SET (VOIDmode, 
+                  gen_rtx_MEM (BLKmode,
+                               gen_rtx_PRE_DEC (BLKmode, stack_pointer_rtx)),
+                  gen_rtx_UNSPEC (BLKmode,
+                                  gen_rtvec (1, reg),
+                                  2));
+  tmp
+    = gen_rtx_SET (VOIDmode, 
+                  gen_rtx_MEM (XFmode,
+                               gen_rtx_PRE_DEC (BLKmode, stack_pointer_rtx)),
+                  reg);
+  RTX_FRAME_RELATED_P (tmp) = 1;
+  XVECEXP (dwarf, 0, count - 1) = tmp;   
+  
+  for (i = 1; i < count; i++)
+    {
+      reg = gen_rtx_REG (XFmode, base_reg++);
+      XVECEXP (par, 0, i) = gen_rtx_USE (VOIDmode, reg);
+
+      tmp = gen_rtx_SET (VOIDmode, 
+                        gen_rtx_MEM (XFmode,
+                                     gen_rtx_PRE_DEC (BLKmode,
+                                                      stack_pointer_rtx)),
+                        reg);
+      RTX_FRAME_RELATED_P (tmp) = 1;
+      XVECEXP (dwarf, 0, count - i - 1) = tmp;   
+    }
+
+  par = emit_insn (par);
+  REG_NOTES (par) = gen_rtx_EXPR_LIST (REG_FRAME_RELATED_EXPR, dwarf,
+                                      REG_NOTES (par));
+  return par;
+}
+
+void
+arm_expand_prologue ()
+{
+  int reg;
+  rtx amount = GEN_INT (-(get_frame_size ()
+                         + current_function_outgoing_args_size));
+  int live_regs_mask = 0;
+  int store_arg_regs = 0;
+  /* If this function doesn't return, then there is no need to push
+     the call-saved regs.  */
+  int volatile_func = arm_volatile_func ();
+  rtx insn;
+
+  /* Naked functions don't have prologues.  */
+  if (arm_naked_function_p (current_function_decl))
+    return;
+
+  if (current_function_anonymous_args && current_function_pretend_args_size)
+    store_arg_regs = 1;
+
+  if (! volatile_func)
+    {
+      for (reg = 0; reg <= 10; reg++)
+       if (regs_ever_live[reg] && ! call_used_regs[reg])
+         live_regs_mask |= 1 << reg;
+
+      if (! TARGET_APCS_FRAME
+         && ! frame_pointer_needed
+         && regs_ever_live[HARD_FRAME_POINTER_REGNUM]
+         && ! call_used_regs[HARD_FRAME_POINTER_REGNUM])
+       live_regs_mask |= 1 << HARD_FRAME_POINTER_REGNUM;
+      
+      if (flag_pic && regs_ever_live[PIC_OFFSET_TABLE_REGNUM])
+       live_regs_mask |= 1 << PIC_OFFSET_TABLE_REGNUM;
+
+      if (regs_ever_live[LR_REGNUM])
+       live_regs_mask |= 1 << LR_REGNUM;
+    }
+
+  if (frame_pointer_needed)
+    {
+      live_regs_mask |= 0xD800;
+      insn = emit_insn (gen_movsi (gen_rtx_REG (SImode, IP_REGNUM),
+                                  stack_pointer_rtx));
+      RTX_FRAME_RELATED_P (insn) = 1;
+    }
+
+  if (current_function_pretend_args_size)
+    {
+      if (store_arg_regs)
+       insn = emit_multi_reg_push
+         ((0xf0 >> (current_function_pretend_args_size / 4)) & 0xf);
+      else
+       insn = emit_insn
+         (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx, 
+                      GEN_INT (-current_function_pretend_args_size)));
+      RTX_FRAME_RELATED_P (insn) = 1;
+    }
+
+  if (live_regs_mask)
+    {
+      /* If we have to push any regs, then we must push lr as well, or
+        we won't get a proper return.  */
+      live_regs_mask |= 1 << LR_REGNUM;
+      insn = emit_multi_reg_push (live_regs_mask);
+      RTX_FRAME_RELATED_P (insn) = 1;
+    }
+      
+  /* For now the integer regs are still pushed in output_arm_epilogue ().  */
+
+  if (! volatile_func)
+    {
+      if (arm_fpu_arch == FP_SOFT2)
+       {
+         for (reg = LAST_ARM_FP_REGNUM; reg >= FIRST_ARM_FP_REGNUM; reg --)
+           if (regs_ever_live[reg] && ! call_used_regs[reg])
+             {
+               insn = gen_rtx_PRE_DEC (XFmode, stack_pointer_rtx);
+               insn = gen_rtx_MEM (XFmode, insn);
+               insn = emit_insn (gen_rtx_SET (VOIDmode, insn,
+                                              gen_rtx_REG (XFmode, reg)));
+               RTX_FRAME_RELATED_P (insn) = 1;
+             }
+       }
+      else
+       {
+         int start_reg = LAST_ARM_FP_REGNUM;
+
+         for (reg = LAST_ARM_FP_REGNUM; reg >= FIRST_ARM_FP_REGNUM; reg --)
+           {
+             if (regs_ever_live[reg] && ! call_used_regs[reg])
+               {
+                 if (start_reg - reg == 3)
+                   {
+                     insn = emit_sfm (reg, 4);
+                     RTX_FRAME_RELATED_P (insn) = 1;
+                     start_reg = reg - 1;
+                   }
+               }
+             else
+               {
+                 if (start_reg != reg)
+                   {
+                     insn = emit_sfm (reg + 1, start_reg - reg);
+                     RTX_FRAME_RELATED_P (insn) = 1;
+                   }
+                 start_reg = reg - 1;
+               }
+           }
+
+         if (start_reg != reg)
+           {
+             insn = emit_sfm (reg + 1, start_reg - reg);
+             RTX_FRAME_RELATED_P (insn) = 1;
+           }
+       }
+    }
+
+  if (frame_pointer_needed)
+    {
+      insn = GEN_INT (-(4 + current_function_pretend_args_size));
+      insn = emit_insn (gen_addsi3 (hard_frame_pointer_rtx,
+                                   gen_rtx_REG (SImode, IP_REGNUM),
+                                   insn));
+      RTX_FRAME_RELATED_P (insn) = 1;
+    }
+
+  if (amount != const0_rtx)
+    {
+      insn = emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx,
+                                   amount));
+      RTX_FRAME_RELATED_P (insn) = 1;
+      emit_insn (gen_rtx_CLOBBER (VOIDmode, 
+                                 gen_rtx_MEM (BLKmode, stack_pointer_rtx)));
+    }
+
+  /* If we are profiling, make sure no instructions are scheduled before
+     the call to mcount.  Similarly if the user has requested no
+     scheduling in the prolog.  */
+  if (profile_flag || profile_block_flag || TARGET_NO_SCHED_PRO)
+    emit_insn (gen_blockage ());
+}
+\f
+/* If CODE is 'd', then the X is a condition operand and the instruction
+   should only be executed if the condition is true.
+   if CODE is 'D', then the X is a condition operand and the instruction
+   should only be executed if the condition is false: however, if the mode
+   of the comparison is CCFPEmode, then always execute the instruction -- we
+   do this because in these circumstances !GE does not necessarily imply LT;
+   in these cases the instruction pattern will take care to make sure that
+   an instruction containing %d will follow, thereby undoing the effects of
+   doing this instruction unconditionally.
+   If CODE is 'N' then X is a floating point operand that must be negated
+   before output.
+   If CODE is 'B' then output a bitwise inverted value of X (a const int).
+   If X is a REG and CODE is `M', output a ldm/stm style multi-reg.  */
+
+void
+arm_print_operand (stream, x, code)
+     FILE * stream;
+     rtx x;
+     int code;
+{
+  switch (code)
+    {
+    case '@':
+      fputs (ASM_COMMENT_START, stream);
+      return;
+
+    case '_':
+      fputs (user_label_prefix, stream);
+      return;
+         
+    case '|':
+      fputs (REGISTER_PREFIX, stream);
+      return;
+
+    case '?':
+      if (arm_ccfsm_state == 3 || arm_ccfsm_state == 4)
+       fputs (arm_condition_codes[arm_current_cc], stream);
+      return;
+
+    case 'N':
+      {
+       REAL_VALUE_TYPE r;
+       REAL_VALUE_FROM_CONST_DOUBLE (r, x);
+       r = REAL_VALUE_NEGATE (r);
+       fprintf (stream, "%s", fp_const_from_val (&r));
+      }
+      return;
+
+    case 'B':
+      if (GET_CODE (x) == CONST_INT)
+       {
+         HOST_WIDE_INT val;
+         val = ARM_SIGN_EXTEND (~ INTVAL (x));
+         fprintf (stream, HOST_WIDE_INT_PRINT_DEC, val);
+       }
+      else
+       {
+         putc ('~', stream);
+         output_addr_const (stream, x);
+       }
+      return;
+
+    case 'i':
+      fprintf (stream, "%s", arithmetic_instr (x, 1));
+      return;
+
+    case 'I':
+      fprintf (stream, "%s", arithmetic_instr (x, 0));
+      return;
+
+    case 'S':
+      {
+       HOST_WIDE_INT val;
+       char * shift = shift_op (x, & val);
+
+       if (shift)
+         {
+           fprintf (stream, ", %s ", shift_op (x, & val));
+           if (val == -1)
+             arm_print_operand (stream, XEXP (x, 1), 0);
+           else
+             {
+               fputc ('#', stream);
+               fprintf (stream, HOST_WIDE_INT_PRINT_DEC, val);
+             }
+         }
+      }
+      return;
+
+      /* An explanation of the 'Q', 'R' and 'H' register operands:
+        
+        In a pair of registers containing a DI or DF value the 'Q'
+        operand returns the register number of the register containing
+        the least signficant part of the value.  The 'R' operand returns
+        the register number of the register containing the most
+        significant part of the value.
+        
+        The 'H' operand returns the higher of the two register numbers.
+        On a run where WORDS_BIG_ENDIAN is true the 'H' operand is the
+        same as the 'Q' operand, since the most signficant part of the
+        value is held in the lower number register.  The reverse is true
+        on systems where WORDS_BIG_ENDIAN is false.
+        
+        The purpose of these operands is to distinguish between cases
+        where the endian-ness of the values is important (for example
+        when they are added together), and cases where the endian-ness
+        is irrelevant, but the order of register operations is important.
+        For example when loading a value from memory into a register
+        pair, the endian-ness does not matter.  Provided that the value
+        from the lower memory address is put into the lower numbered
+        register, and the value from the higher address is put into the
+        higher numbered register, the load will work regardless of whether
+        the value being loaded is big-wordian or little-wordian.  The
+        order of the two register loads can matter however, if the address
+        of the memory location is actually held in one of the registers
+        being overwritten by the load.  */
+    case 'Q':
+      if (REGNO (x) > LAST_ARM_REGNUM)
+       abort ();
+      asm_fprintf (stream, "%r", REGNO (x) + (WORDS_BIG_ENDIAN ? 1 : 0));
+      return;
+
+    case 'R':
+      if (REGNO (x) > LAST_ARM_REGNUM)
+       abort ();
+      asm_fprintf (stream, "%r", REGNO (x) + (WORDS_BIG_ENDIAN ? 0 : 1));
+      return;
+
+    case 'H':
+      if (REGNO (x) > LAST_ARM_REGNUM)
+       abort ();
+      asm_fprintf (stream, "%r", REGNO (x) + 1);
+      return;
+
+    case 'm':
+      asm_fprintf (stream, "%r", 
+                  GET_CODE (XEXP (x, 0)) == REG
+                  ? REGNO (XEXP (x, 0)) : REGNO (XEXP (XEXP (x, 0), 0)));
+      return;
+
+    case 'M':
+      asm_fprintf (stream, "{%r-%r}",
+                  REGNO (x),
+                  REGNO (x) + NUM_REGS (GET_MODE (x)) - 1);
+      return;
+
+    case 'd':
+      if (! x)
+       return;
+      
+      if (TARGET_ARM)
+        fputs (arm_condition_codes[get_arm_condition_code (x)],
+              stream);
+      else
+       fputs (thumb_condition_code (x, 0), stream);
+      return;
+
+    case 'D':
+      if (! x)
+       return;
+
+      if (TARGET_ARM)
+       fputs (arm_condition_codes[ARM_INVERSE_CONDITION_CODE
+                                 (get_arm_condition_code (x))],
+              stream);
+      else
+       fputs (thumb_condition_code (x, 1), stream);
+      return;
+
+    default:
+      if (x == 0)
+       abort ();
+
+      if (GET_CODE (x) == REG)
+       asm_fprintf (stream, "%r", REGNO (x));
+      else if (GET_CODE (x) == MEM)
+       {
+         output_memory_reference_mode = GET_MODE (x);
+         output_address (XEXP (x, 0));
+       }
+      else if (GET_CODE (x) == CONST_DOUBLE)
+       fprintf (stream, "#%s", fp_immediate_constant (x));
+      else if (GET_CODE (x) == NEG)
+       abort (); /* This should never happen now.  */
+      else
+       {
+         fputc ('#', stream);
+         output_addr_const (stream, x);
+       }
+    }
+}
+\f
+/* A finite state machine takes care of noticing whether or not instructions
+   can be conditionally executed, and thus decrease execution time and code
+   size by deleting branch instructions.  The fsm is controlled by
+   final_prescan_insn, and controls the actions of ASM_OUTPUT_OPCODE.  */
+
+/* The state of the fsm controlling condition codes are:
+   0: normal, do nothing special
+   1: make ASM_OUTPUT_OPCODE not output this instruction
+   2: make ASM_OUTPUT_OPCODE not output this instruction
+   3: make instructions conditional
+   4: make instructions conditional
+
+   State transitions (state->state by whom under condition):
+   0 -> 1 final_prescan_insn if the `target' is a label
+   0 -> 2 final_prescan_insn if the `target' is an unconditional branch
+   1 -> 3 ASM_OUTPUT_OPCODE after not having output the conditional branch
+   2 -> 4 ASM_OUTPUT_OPCODE after not having output the conditional branch
+   3 -> 0 ASM_OUTPUT_INTERNAL_LABEL if the `target' label is reached
+          (the target label has CODE_LABEL_NUMBER equal to arm_target_label).
+   4 -> 0 final_prescan_insn if the `target' unconditional branch is reached
+          (the target insn is arm_target_insn).
+
+   If the jump clobbers the conditions then we use states 2 and 4.
+
+   A similar thing can be done with conditional return insns.
+
+   XXX In case the `target' is an unconditional branch, this conditionalising
+   of the instructions always reduces code size, but not always execution
+   time.  But then, I want to reduce the code size to somewhere near what
+   /bin/cc produces.  */
+
+/* Returns the index of the ARM condition code string in
+   `arm_condition_codes'.  COMPARISON should be an rtx like
+   `(eq (...) (...))'.  */
+
+static enum arm_cond_code
+get_arm_condition_code (comparison)
+     rtx comparison;
+{
+  enum machine_mode mode = GET_MODE (XEXP (comparison, 0));
+  register int code;
+  register enum rtx_code comp_code = GET_CODE (comparison);
+
+  if (GET_MODE_CLASS (mode) != MODE_CC)
+    mode = SELECT_CC_MODE (comp_code, XEXP (comparison, 0),
+                          XEXP (comparison, 1));
+
+  switch (mode)
+    {
+    case CC_DNEmode: code = ARM_NE; goto dominance;
+    case CC_DEQmode: code = ARM_EQ; goto dominance;
+    case CC_DGEmode: code = ARM_GE; goto dominance;
+    case CC_DGTmode: code = ARM_GT; goto dominance;
+    case CC_DLEmode: code = ARM_LE; goto dominance;
+    case CC_DLTmode: code = ARM_LT; goto dominance;
+    case CC_DGEUmode: code = ARM_CS; goto dominance;
+    case CC_DGTUmode: code = ARM_HI; goto dominance;
+    case CC_DLEUmode: code = ARM_LS; goto dominance;
+    case CC_DLTUmode: code = ARM_CC;
+
+    dominance:
+      if (comp_code != EQ && comp_code != NE)
+       abort ();
+
+      if (comp_code == EQ)
+       return ARM_INVERSE_CONDITION_CODE (code);
+      return code;
+
+    case CC_NOOVmode:
+      switch (comp_code)
+       {
+       case NE: return ARM_NE;
+       case EQ: return ARM_EQ;
+       case GE: return ARM_PL;
+       case LT: return ARM_MI;
+       default: abort ();
+       }
+
+    case CC_Zmode:
+    case CCFPmode:
+      switch (comp_code)
+       {
+       case NE: return ARM_NE;
+       case EQ: return ARM_EQ;
+       default: abort ();
+       }
+
+    case CCFPEmode:
+      switch (comp_code)
+       {
+       case GE: return ARM_GE;
+       case GT: return ARM_GT;
+       case LE: return ARM_LS;
+       case LT: return ARM_MI;
+       default: abort ();
+       }
+
+    case CC_SWPmode:
+      switch (comp_code)
+       {
+       case NE: return ARM_NE;
+       case EQ: return ARM_EQ;
+       case GE: return ARM_LE;
+       case GT: return ARM_LT;
+       case LE: return ARM_GE;
+       case LT: return ARM_GT;
+       case GEU: return ARM_LS;
+       case GTU: return ARM_CC;
+       case LEU: return ARM_CS;
+       case LTU: return ARM_HI;
+       default: abort ();
+       }
+
+    case CC_Cmode:
+      switch (comp_code)
+      {
+      case LTU: return ARM_CS;
+      case GEU: return ARM_CC;
+      default: abort ();
+      }
+      
+    case CCmode:
+      switch (comp_code)
+       {
+       case NE: return ARM_NE;
+       case EQ: return ARM_EQ;
+       case GE: return ARM_GE;
+       case GT: return ARM_GT;
+       case LE: return ARM_LE;
+       case LT: return ARM_LT;
+       case GEU: return ARM_CS;
+       case GTU: return ARM_HI;
+       case LEU: return ARM_LS;
+       case LTU: return ARM_CC;
+       default: abort ();
+       }
+
+    default: abort ();
+    }
+
+  abort ();
+}
+
+
+void
+arm_final_prescan_insn (insn)
+     rtx insn;
+{
+  /* BODY will hold the body of INSN.  */
+  register rtx body = PATTERN (insn);
+
+  /* This will be 1 if trying to repeat the trick, and things need to be
+     reversed if it appears to fail.  */
+  int reverse = 0;
+
+  /* JUMP_CLOBBERS will be one implies that the conditions if a branch is
+     taken are clobbered, even if the rtl suggests otherwise.  It also
+     means that we have to grub around within the jump expression to find
+     out what the conditions are when the jump isn't taken.  */
+  int jump_clobbers = 0;
+  
+  /* If we start with a return insn, we only succeed if we find another one.  */
+  int seeking_return = 0;
+  
+  /* START_INSN will hold the insn from where we start looking.  This is the
+     first insn after the following code_label if REVERSE is true.  */
+  rtx start_insn = insn;
+
+  /* If in state 4, check if the target branch is reached, in order to
+     change back to state 0.  */
+  if (arm_ccfsm_state == 4)
+    {
+      if (insn == arm_target_insn)
+       {
+         arm_target_insn = NULL;
+         arm_ccfsm_state = 0;
+       }
+      return;
+    }
+
+  /* If in state 3, it is possible to repeat the trick, if this insn is an
+     unconditional branch to a label, and immediately following this branch
+     is the previous target label which is only used once, and the label this
+     branch jumps to is not too far off.  */
+  if (arm_ccfsm_state == 3)
+    {
+      if (simplejump_p (insn))
+       {
+         start_insn = next_nonnote_insn (start_insn);
+         if (GET_CODE (start_insn) == BARRIER)
+           {
+             /* XXX Isn't this always a barrier?  */
+             start_insn = next_nonnote_insn (start_insn);
+           }
+         if (GET_CODE (start_insn) == CODE_LABEL
+             && CODE_LABEL_NUMBER (start_insn) == arm_target_label
+             && LABEL_NUSES (start_insn) == 1)
+           reverse = TRUE;
+         else
+           return;
+       }
+      else if (GET_CODE (body) == RETURN)
+        {
+         start_insn = next_nonnote_insn (start_insn);
+         if (GET_CODE (start_insn) == BARRIER)
+           start_insn = next_nonnote_insn (start_insn);
+         if (GET_CODE (start_insn) == CODE_LABEL
+             && CODE_LABEL_NUMBER (start_insn) == arm_target_label
+             && LABEL_NUSES (start_insn) == 1)
+           {
+             reverse = TRUE;
+             seeking_return = 1;
+           }
+         else
+           return;
+        }
+      else
+       return;
+    }
+
+  if (arm_ccfsm_state != 0 && !reverse)
+    abort ();
+  if (GET_CODE (insn) != JUMP_INSN)
+    return;
+
+  /* This jump might be paralleled with a clobber of the condition codes 
+     the jump should always come first */
+  if (GET_CODE (body) == PARALLEL && XVECLEN (body, 0) > 0)
+    body = XVECEXP (body, 0, 0);
+
+#if 0  
+  /* If this is a conditional return then we don't want to know */
+  if (GET_CODE (body) == SET && GET_CODE (SET_DEST (body)) == PC
+      && GET_CODE (SET_SRC (body)) == IF_THEN_ELSE
+      && (GET_CODE (XEXP (SET_SRC (body), 1)) == RETURN
+          || GET_CODE (XEXP (SET_SRC (body), 2)) == RETURN))
     return;
+#endif
+
+  if (reverse
+      || (GET_CODE (body) == SET && GET_CODE (SET_DEST (body)) == PC
+         && GET_CODE (SET_SRC (body)) == IF_THEN_ELSE))
+    {
+      int insns_skipped;
+      int fail = FALSE, succeed = FALSE;
+      /* Flag which part of the IF_THEN_ELSE is the LABEL_REF.  */
+      int then_not_else = TRUE;
+      rtx this_insn = start_insn, label = 0;
+
+      if (get_attr_conds (insn) == CONDS_JUMP_CLOB)
+       {
+         /* The code below is wrong for these, and I haven't time to
+            fix it now.  So we just do the safe thing and return.  This
+            whole function needs re-writing anyway.  */
+         jump_clobbers = 1;
+         return;
+       }
+      
+      /* Register the insn jumped to.  */
+      if (reverse)
+        {
+         if (!seeking_return)
+           label = XEXP (SET_SRC (body), 0);
+        }
+      else if (GET_CODE (XEXP (SET_SRC (body), 1)) == LABEL_REF)
+       label = XEXP (XEXP (SET_SRC (body), 1), 0);
+      else if (GET_CODE (XEXP (SET_SRC (body), 2)) == LABEL_REF)
+       {
+         label = XEXP (XEXP (SET_SRC (body), 2), 0);
+         then_not_else = FALSE;
+       }
+      else if (GET_CODE (XEXP (SET_SRC (body), 1)) == RETURN)
+       seeking_return = 1;
+      else if (GET_CODE (XEXP (SET_SRC (body), 2)) == RETURN)
+        {
+         seeking_return = 1;
+         then_not_else = FALSE;
+        }
+      else
+       abort ();
+
+      /* See how many insns this branch skips, and what kind of insns.  If all
+        insns are okay, and the label or unconditional branch to the same
+        label is not too far away, succeed.  */
+      for (insns_skipped = 0;
+          !fail && !succeed && insns_skipped++ < max_insns_skipped;)
+       {
+         rtx scanbody;
+
+         this_insn = next_nonnote_insn (this_insn);
+         if (!this_insn)
+           break;
+
+         switch (GET_CODE (this_insn))
+           {
+           case CODE_LABEL:
+             /* Succeed if it is the target label, otherwise fail since
+                control falls in from somewhere else.  */
+             if (this_insn == label)
+               {
+                 if (jump_clobbers)
+                   {
+                     arm_ccfsm_state = 2;
+                     this_insn = next_nonnote_insn (this_insn);
+                   }
+                 else
+                   arm_ccfsm_state = 1;
+                 succeed = TRUE;
+               }
+             else
+               fail = TRUE;
+             break;
+
+           case BARRIER:
+             /* Succeed if the following insn is the target label.
+                Otherwise fail.  
+                If return insns are used then the last insn in a function 
+                will be a barrier.  */
+             this_insn = next_nonnote_insn (this_insn);
+             if (this_insn && this_insn == label)
+               {
+                 if (jump_clobbers)
+                   {
+                     arm_ccfsm_state = 2;
+                     this_insn = next_nonnote_insn (this_insn);
+                   }
+                 else
+                   arm_ccfsm_state = 1;
+                 succeed = TRUE;
+               }
+             else
+               fail = TRUE;
+             break;
+
+           case CALL_INSN:
+             /* If using 32-bit addresses the cc is not preserved over
+                calls.  */
+             if (TARGET_APCS_32)
+               {
+                 /* Succeed if the following insn is the target label,
+                    or if the following two insns are a barrier and
+                    the target label.  */
+                 this_insn = next_nonnote_insn (this_insn);
+                 if (this_insn && GET_CODE (this_insn) == BARRIER)
+                   this_insn = next_nonnote_insn (this_insn);
+
+                 if (this_insn && this_insn == label
+                     && insns_skipped < max_insns_skipped)
+                   {
+                     if (jump_clobbers)
+                       {
+                         arm_ccfsm_state = 2;
+                         this_insn = next_nonnote_insn (this_insn);
+                       }
+                     else
+                       arm_ccfsm_state = 1;
+                     succeed = TRUE;
+                   }
+                 else
+                   fail = TRUE;
+               }
+             break;
+
+           case JUMP_INSN:
+             /* If this is an unconditional branch to the same label, succeed.
+                If it is to another label, do nothing.  If it is conditional,
+                fail.  */
+             /* XXX Probably, the tests for SET and the PC are unnecessary.  */
+
+             scanbody = PATTERN (this_insn);
+             if (GET_CODE (scanbody) == SET
+                 && GET_CODE (SET_DEST (scanbody)) == PC)
+               {
+                 if (GET_CODE (SET_SRC (scanbody)) == LABEL_REF
+                     && XEXP (SET_SRC (scanbody), 0) == label && !reverse)
+                   {
+                     arm_ccfsm_state = 2;
+                     succeed = TRUE;
+                   }
+                 else if (GET_CODE (SET_SRC (scanbody)) == IF_THEN_ELSE)
+                   fail = TRUE;
+               }
+             /* Fail if a conditional return is undesirable (eg on a
+                StrongARM), but still allow this if optimizing for size.  */
+             else if (GET_CODE (scanbody) == RETURN
+                      && ! use_return_insn (TRUE)
+                      && ! optimize_size)
+               fail = TRUE;
+             else if (GET_CODE (scanbody) == RETURN
+                      && seeking_return)
+               {
+                 arm_ccfsm_state = 2;
+                 succeed = TRUE;
+               }
+             else if (GET_CODE (scanbody) == PARALLEL)
+               {
+                 switch (get_attr_conds (this_insn))
+                   {
+                   case CONDS_NOCOND:
+                     break;
+                   default:
+                     fail = TRUE;
+                     break;
+                   }
+               }
+             break;
+
+           case INSN:
+             /* Instructions using or affecting the condition codes make it
+                fail.  */
+             scanbody = PATTERN (this_insn);
+             if (! (GET_CODE (scanbody) == SET
+                    || GET_CODE (scanbody) == PARALLEL)
+                 || get_attr_conds (this_insn) != CONDS_NOCOND)
+               fail = TRUE;
+             break;
+
+           default:
+             break;
+           }
+       }
+      if (succeed)
+       {
+         if ((!seeking_return) && (arm_ccfsm_state == 1 || reverse))
+           arm_target_label = CODE_LABEL_NUMBER (label);
+         else if (seeking_return || arm_ccfsm_state == 2)
+           {
+             while (this_insn && GET_CODE (PATTERN (this_insn)) == USE)
+               {
+                 this_insn = next_nonnote_insn (this_insn);
+                 if (this_insn && (GET_CODE (this_insn) == BARRIER
+                                   || GET_CODE (this_insn) == CODE_LABEL))
+                   abort ();
+               }
+             if (!this_insn)
+               {
+                 /* Oh, dear! we ran off the end.. give up */
+                 recog (PATTERN (insn), insn, NULL_PTR);
+                 arm_ccfsm_state = 0;
+                 arm_target_insn = NULL;
+                 return;
+               }
+             arm_target_insn = this_insn;
+           }
+         else
+           abort ();
+         if (jump_clobbers)
+           {
+             if (reverse)
+               abort ();
+             arm_current_cc = 
+                 get_arm_condition_code (XEXP (XEXP (XEXP (SET_SRC (body),
+                                                           0), 0), 1));
+             if (GET_CODE (XEXP (XEXP (SET_SRC (body), 0), 0)) == AND)
+               arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
+             if (GET_CODE (XEXP (SET_SRC (body), 0)) == NE)
+               arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
+           }
+         else
+           {
+             /* If REVERSE is true, ARM_CURRENT_CC needs to be inverted from
+                what it was.  */
+             if (!reverse)
+               arm_current_cc = get_arm_condition_code (XEXP (SET_SRC (body),
+                                                              0));
+           }
+
+         if (reverse || then_not_else)
+           arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
+       }
+      
+      /* Restore recog_data (getting the attributes of other insns can
+        destroy this array, but final.c assumes that it remains intact
+        across this call; since the insn has been recognized already we
+        call recog direct).  */
+      recog (PATTERN (insn), insn, NULL_PTR);
+    }
+}
+
+int
+arm_regno_class (regno)
+     int regno;
+{
+  if (TARGET_THUMB)
+    {
+      if (regno == STACK_POINTER_REGNUM)
+       return STACK_REG;
+      if (regno == CC_REGNUM)
+       return CC_REG;
+      if (regno < 8)
+       return LO_REGS;
+      return HI_REGS;
+    }
+
+  if (   regno <= LAST_ARM_REGNUM
+      || regno == FRAME_POINTER_REGNUM
+      || regno == ARG_POINTER_REGNUM)
+    return GENERAL_REGS;
+  
+  if (regno == CC_REGNUM)
+    return NO_REGS;
+
+  return FPU_REGS;
+}
+
+/* Handle a special case when computing the offset
+   of an argument from the frame pointer.  */
+int
+arm_debugger_arg_offset (value, addr)
+     int value;
+     rtx addr;
+{
+  rtx insn;
+
+  /* We are only interested if dbxout_parms() failed to compute the offset.  */
+  if (value != 0)
+    return 0;
+
+  /* We can only cope with the case where the address is held in a register.  */
+  if (GET_CODE (addr) != REG)
+    return 0;
+
+  /* If we are using the frame pointer to point at the argument, then
+     an offset of 0 is correct.  */
+  if (REGNO (addr) == HARD_FRAME_POINTER_REGNUM)
+    return 0;
+  
+  /* If we are using the stack pointer to point at the
+     argument, then an offset of 0 is correct.  */
+  if ((TARGET_THUMB || ! frame_pointer_needed)
+      && REGNO (addr) == SP_REGNUM)
+    return 0;
+  
+  /* Oh dear.  The argument is pointed to by a register rather
+     than being held in a register, or being stored at a known
+     offset from the frame pointer.  Since GDB only understands
+     those two kinds of argument we must translate the address
+     held in the register into an offset from the frame pointer.
+     We do this by searching through the insns for the function
+     looking to see where this register gets its value.  If the
+     register is initialised from the frame pointer plus an offset
+     then we are in luck and we can continue, otherwise we give up.
+     
+     This code is exercised by producing debugging information
+     for a function with arguments like this:
+     
+           double func (double a, double b, int c, double d) {return d;}
+     
+     Without this code the stab for parameter 'd' will be set to
+     an offset of 0 from the frame pointer, rather than 8.  */
+
+  /* The if() statement says:
+
+     If the insn is a normal instruction
+     and if the insn is setting the value in a register
+     and if the register being set is the register holding the address of the argument
+     and if the address is computing by an addition
+     that involves adding to a register
+     which is the frame pointer
+     a constant integer
+
+     then... */
+  
+  for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
+    {
+      if (   GET_CODE (insn) == INSN 
+         && GET_CODE (PATTERN (insn)) == SET
+         && REGNO    (XEXP (PATTERN (insn), 0)) == REGNO (addr)
+         && GET_CODE (XEXP (PATTERN (insn), 1)) == PLUS
+         && GET_CODE (XEXP (XEXP (PATTERN (insn), 1), 0)) == REG
+         && REGNO    (XEXP (XEXP (PATTERN (insn), 1), 0)) == HARD_FRAME_POINTER_REGNUM
+         && GET_CODE (XEXP (XEXP (PATTERN (insn), 1), 1)) == CONST_INT
+            )
+       {
+         value = INTVAL (XEXP (XEXP (PATTERN (insn), 1), 1));
+         
+         break;
+       }
+    }
+  
+  if (value == 0)
+    {
+      debug_rtx (addr);
+      warning ("Unable to compute real location of stacked parameter");
+      value = 8; /* XXX magic hack */
+    }
+
+  return value;
+}
+
+\f
+/* Recursively search through all of the blocks in a function
+   checking to see if any of the variables created in that
+   function match the RTX called 'orig'.  If they do then
+   replace them with the RTX called 'new'.  */
+
+static void
+replace_symbols_in_block (block, orig, new)
+     tree block;
+     rtx orig;
+     rtx new;
+{
+  for (; block; block = BLOCK_CHAIN (block))
+    {
+      tree sym;
+      
+      if (! TREE_USED (block))
+       continue;
+
+      for (sym = BLOCK_VARS (block); sym; sym = TREE_CHAIN (sym))
+       {
+         if (  (DECL_NAME (sym) == 0 && TREE_CODE (sym) != TYPE_DECL)
+             || DECL_IGNORED_P (sym)
+             || TREE_CODE (sym) != VAR_DECL
+             || DECL_EXTERNAL (sym)
+             || ! rtx_equal_p (DECL_RTL (sym), orig)
+             )
+           continue;
+
+         DECL_RTL (sym) = new;
+       }
+      
+      replace_symbols_in_block (BLOCK_SUBBLOCKS (block), orig, new);
+    }
+}
+
+/* Return the number (counting from 0) of the least significant set
+   bit in MASK.  */
+#ifdef __GNUC__
+inline
+#endif
+static int
+number_of_first_bit_set (mask)
+     int mask;
+{
+  int bit;
+
+  for (bit = 0;
+       (mask & (1 << bit)) == 0;
+       ++ bit)
+    continue;
+
+  return bit;
+}
+
+/* Generate code to return from a thumb function.
+   If 'reg_containing_return_addr' is -1, then the return address is
+   actually on the stack, at the stack pointer.  */
+static void
+thumb_exit (f, reg_containing_return_addr, eh_ofs)
+     FILE * f;
+     int    reg_containing_return_addr;
+     rtx    eh_ofs;
+{
+  unsigned regs_available_for_popping;
+  unsigned regs_to_pop;
+  int pops_needed;
+  unsigned available;
+  unsigned required;
+  int mode;
+  int size;
+  int restore_a4 = FALSE;
+
+  /* Compute the registers we need to pop.  */
+  regs_to_pop = 0;
+  pops_needed = 0;
+
+  /* There is an assumption here, that if eh_ofs is not NULL, the
+     normal return address will have been pushed.  */
+  if (reg_containing_return_addr == -1 || eh_ofs)
+    {
+      /* When we are generating a return for __builtin_eh_return, 
+        reg_containing_return_addr must specify the return regno.  */
+      if (eh_ofs && reg_containing_return_addr == -1)
+       abort ();
+
+      regs_to_pop |= 1 << LR_REGNUM;
+      ++ pops_needed;
+    }
+
+  if (TARGET_BACKTRACE)
+    {
+      /* Restore the (ARM) frame pointer and stack pointer.  */
+      regs_to_pop |= (1 << ARM_HARD_FRAME_POINTER_REGNUM) | (1 << SP_REGNUM);
+      pops_needed += 2;
+    }
+
+  /* If there is nothing to pop then just emit the BX instruction and
+     return.  */
+  if (pops_needed == 0)
+    {
+      if (eh_ofs)
+       asm_fprintf (f, "\tadd\t%r, %r\n", SP_REGNUM, REGNO (eh_ofs));
+
+      asm_fprintf (f, "\tbx\t%r\n", reg_containing_return_addr);
+      return;
+    }
+  /* Otherwise if we are not supporting interworking and we have not created
+     a backtrace structure and the function was not entered in ARM mode then
+     just pop the return address straight into the PC.  */
+  else if (   ! TARGET_INTERWORK
+          && ! TARGET_BACKTRACE
+          && ! is_called_in_ARM_mode (current_function_decl))
+    {
+      if (eh_ofs)
+       {
+         asm_fprintf (f, "\tadd\t%r, #4\n", SP_REGNUM);
+         asm_fprintf (f, "\tadd\t%r, %r\n", SP_REGNUM, REGNO (eh_ofs));
+         asm_fprintf (f, "\tbx\t%r\n", reg_containing_return_addr);
+       }
+      else
+       asm_fprintf (f, "\tpop\t{%r}\n", PC_REGNUM);
+
+      return;
+    }
+
+  /* Find out how many of the (return) argument registers we can corrupt.  */
+  regs_available_for_popping = 0;
+
+  /* If returning via __builtin_eh_return, the bottom three registers
+     all contain information needed for the return.  */
+  if (eh_ofs)
+    size = 12;
+  else
+    {
+#ifdef RTX_CODE
+      /* If we can deduce the registers used from the function's
+        return value.  This is more reliable that examining
+        regs_ever_live[] because that will be set if the register is
+        ever used in the function, not just if the register is used
+        to hold a return value.  */
+
+      if (current_function_return_rtx != 0)
+       mode = GET_MODE (current_function_return_rtx);
+      else
+#endif
+       mode = DECL_MODE (DECL_RESULT (current_function_decl));
+
+      size = GET_MODE_SIZE (mode);
+
+      if (size == 0)
+       {
+         /* In a void function we can use any argument register.
+            In a function that returns a structure on the stack
+            we can use the second and third argument registers.  */
+         if (mode == VOIDmode)
+           regs_available_for_popping =
+             (1 << ARG_REGISTER (1))
+             | (1 << ARG_REGISTER (2))
+             | (1 << ARG_REGISTER (3));
+         else
+           regs_available_for_popping =
+             (1 << ARG_REGISTER (2))
+             | (1 << ARG_REGISTER (3));
+       }
+      else if (size <= 4)
+       regs_available_for_popping =
+         (1 << ARG_REGISTER (2))
+         | (1 << ARG_REGISTER (3));
+      else if (size <= 8)
+       regs_available_for_popping =
+         (1 << ARG_REGISTER (3));
+    }
+
+  /* Match registers to be popped with registers into which we pop them.  */
+  for (available = regs_available_for_popping,
+       required  = regs_to_pop;
+       required != 0 && available != 0;
+       available &= ~(available & - available),
+       required  &= ~(required  & - required))
+    -- pops_needed;
+
+  /* If we have any popping registers left over, remove them.  */
+  if (available > 0)
+    regs_available_for_popping &= ~ available;
+  
+  /* Otherwise if we need another popping register we can use
+     the fourth argument register.  */
+  else if (pops_needed)
+    {
+      /* If we have not found any free argument registers and
+        reg a4 contains the return address, we must move it.  */
+      if (regs_available_for_popping == 0
+         && reg_containing_return_addr == LAST_ARG_REGNUM)
+       {
+         asm_fprintf (f, "\tmov\t%r, %r\n", LR_REGNUM, LAST_ARG_REGNUM);
+         reg_containing_return_addr = LR_REGNUM;
+       }
+      else if (size > 12)
+       {
+         /* Register a4 is being used to hold part of the return value,
+            but we have dire need of a free, low register.  */
+         restore_a4 = TRUE;
+         
+         asm_fprintf (f, "\tmov\t%r, %r\n",IP_REGNUM, LAST_ARG_REGNUM);
+       }
+      
+      if (reg_containing_return_addr != LAST_ARG_REGNUM)
+       {
+         /* The fourth argument register is available.  */
+         regs_available_for_popping |= 1 << LAST_ARG_REGNUM;
+         
+         -- pops_needed;
+       }
+    }
+
+  /* Pop as many registers as we can.  */
+  thumb_pushpop (f, regs_available_for_popping, FALSE);
+
+  /* Process the registers we popped.  */
+  if (reg_containing_return_addr == -1)
+    {
+      /* The return address was popped into the lowest numbered register.  */
+      regs_to_pop &= ~ (1 << LR_REGNUM);
+      
+      reg_containing_return_addr =
+       number_of_first_bit_set (regs_available_for_popping);
+
+      /* Remove this register for the mask of available registers, so that
+         the return address will not be corrupted by futher pops.  */
+      regs_available_for_popping &= ~ (1 << reg_containing_return_addr);
+    }
+
+  /* If we popped other registers then handle them here.  */
+  if (regs_available_for_popping)
+    {
+      int frame_pointer;
+      
+      /* Work out which register currently contains the frame pointer.  */
+      frame_pointer = number_of_first_bit_set (regs_available_for_popping);
+
+      /* Move it into the correct place.  */
+      asm_fprintf (f, "\tmov\t%r, %r\n",
+                  ARM_HARD_FRAME_POINTER_REGNUM, frame_pointer);
+
+      /* (Temporarily) remove it from the mask of popped registers.  */
+      regs_available_for_popping &= ~ (1 << frame_pointer);
+      regs_to_pop &= ~ (1 << ARM_HARD_FRAME_POINTER_REGNUM);
+      
+      if (regs_available_for_popping)
+       {
+         int stack_pointer;
+         
+         /* We popped the stack pointer as well,
+            find the register that contains it.  */
+         stack_pointer = number_of_first_bit_set (regs_available_for_popping);
+
+         /* Move it into the stack register.  */
+         asm_fprintf (f, "\tmov\t%r, %r\n", SP_REGNUM, stack_pointer);
+         
+         /* At this point we have popped all necessary registers, so
+            do not worry about restoring regs_available_for_popping
+            to its correct value:
+
+            assert (pops_needed == 0)
+            assert (regs_available_for_popping == (1 << frame_pointer))
+            assert (regs_to_pop == (1 << STACK_POINTER))  */
+       }
+      else
+       {
+         /* Since we have just move the popped value into the frame
+            pointer, the popping register is available for reuse, and
+            we know that we still have the stack pointer left to pop.  */
+         regs_available_for_popping |= (1 << frame_pointer);
+       }
+    }
+  
+  /* If we still have registers left on the stack, but we no longer have
+     any registers into which we can pop them, then we must move the return
+     address into the link register and make available the register that
+     contained it.  */
+  if (regs_available_for_popping == 0 && pops_needed > 0)
+    {
+      regs_available_for_popping |= 1 << reg_containing_return_addr;
+      
+      asm_fprintf (f, "\tmov\t%r, %r\n", LR_REGNUM,
+                  reg_containing_return_addr);
+      
+      reg_containing_return_addr = LR_REGNUM;
+    }
+
+  /* If we have registers left on the stack then pop some more.
+     We know that at most we will want to pop FP and SP.  */
+  if (pops_needed > 0)
+    {
+      int  popped_into;
+      int  move_to;
+      
+      thumb_pushpop (f, regs_available_for_popping, FALSE);
+
+      /* We have popped either FP or SP.
+        Move whichever one it is into the correct register.  */
+      popped_into = number_of_first_bit_set (regs_available_for_popping);
+      move_to     = number_of_first_bit_set (regs_to_pop);
+
+      asm_fprintf (f, "\tmov\t%r, %r\n", move_to, popped_into);
+
+      regs_to_pop &= ~ (1 << move_to);
+
+      -- pops_needed;
+    }
+  
+  /* If we still have not popped everything then we must have only
+     had one register available to us and we are now popping the SP.  */
+  if (pops_needed > 0)
+    {
+      int  popped_into;
+      
+      thumb_pushpop (f, regs_available_for_popping, FALSE);
+
+      popped_into = number_of_first_bit_set (regs_available_for_popping);
+
+      asm_fprintf (f, "\tmov\t%r, %r\n", SP_REGNUM, popped_into);
+      /*
+       assert (regs_to_pop == (1 << STACK_POINTER))
+       assert (pops_needed == 1)
+      */
+    }
+
+  /* If necessary restore the a4 register.  */
+  if (restore_a4)
+    {
+      if (reg_containing_return_addr != LR_REGNUM)
+       {
+         asm_fprintf (f, "\tmov\t%r, %r\n", LR_REGNUM, LAST_ARG_REGNUM);
+         reg_containing_return_addr = LR_REGNUM;
+       }
+    
+      asm_fprintf (f, "\tmov\t%r, %r\n", LAST_ARG_REGNUM, IP_REGNUM);
+    }
+
+  if (eh_ofs)
+    asm_fprintf (f, "\tadd\t%r, %r\n", SP_REGNUM, REGNO (eh_ofs));
+
+  /* Return to caller.  */
+  asm_fprintf (f, "\tbx\t%r\n", reg_containing_return_addr);
+}
+
+/* Emit code to push or pop registers to or from the stack.  */
+static void
+thumb_pushpop (f, mask, push)
+     FILE * f;
+     int mask;
+     int push;
+{
+  int regno;
+  int lo_mask = mask & 0xFF;
+
+  if (lo_mask == 0 && ! push && (mask & (1 << 15)))
+    {
+      /* Special case.  Do not generate a POP PC statement here, do it in
+        thumb_exit() */
+      thumb_exit (f, -1, NULL_RTX);
+      return;
+    }
+      
+  fprintf (f, "\t%s\t{", push ? "push" : "pop");
+
+  /* Look at the low registers first.  */
+  for (regno = 0; regno <= LAST_LO_REGNUM; regno ++, lo_mask >>= 1)
+    {
+      if (lo_mask & 1)
+       {
+         asm_fprintf (f, "%r", regno);
+         
+         if ((lo_mask & ~1) != 0)
+           fprintf (f, ", ");
+       }
+    }
+  
+  if (push && (mask & (1 << LR_REGNUM)))
+    {
+      /* Catch pushing the LR.  */
+      if (mask & 0xFF)
+       fprintf (f, ", ");
+      
+      asm_fprintf (f, "%r", LR_REGNUM);
+    }
+  else if (!push && (mask & (1 << PC_REGNUM)))
+    {
+      /* Catch popping the PC.  */
+      if (TARGET_INTERWORK || TARGET_BACKTRACE)
+       {
+         /* The PC is never poped directly, instead
+            it is popped into r3 and then BX is used.  */
+         fprintf (f, "}\n");
+
+         thumb_exit (f, -1, NULL_RTX);
+
+         return;
+       }
+      else
+       {
+         if (mask & 0xFF)
+           fprintf (f, ", ");
+         
+         asm_fprintf (f, "%r", PC_REGNUM);
+       }
+    }
+       
+  fprintf (f, "}\n");
+}
+\f
+void
+thumb_final_prescan_insn (insn)
+     rtx insn;
+{
+  extern int * insn_addresses;
+
+  if (flag_print_asm_name)
+    asm_fprintf (asm_out_file, "%@ 0x%04x\n", insn_addresses[INSN_UID (insn)]);
+}
+
+int
+thumb_shiftable_const (val)
+     unsigned HOST_WIDE_INT val;
+{
+  unsigned HOST_WIDE_INT mask = 0xff;
+  int i;
+
+  if (val == 0) /* XXX */
+    return 0;
+  
+  for (i = 0; i < 25; i++)
+    if ((val & (mask << i)) == val)
+      return 1;
+
+  return 0;
+}
+
+/* Returns non-zero if the current function contains,
+   or might contain a far jump.  */
+int
+thumb_far_jump_used_p (int in_prologue)
+{
+  rtx insn;
+
+  /* This test is only important for leaf functions.  */
+  /* assert (! leaf_function_p ()); */
+  
+  /* If we have already decided that far jumps may be used,
+     do not bother checking again, and always return true even if
+     it turns out that they are not being used.  Once we have made
+     the decision that far jumps are present (and that hence the link
+     register will be pushed onto the stack) we cannot go back on it.  */
+  if (cfun->machine->far_jump_used)
+    return 1;
+
+  /* If this function is not being called from the prologue/epilogue
+     generation code then it must be being called from the
+     INITIAL_ELIMINATION_OFFSET macro.  */
+  if (! in_prologue)
+    {
+      /* In this case we know that we are being asked about the elimination
+        of the arg pointer register.  If that register is not being used,
+        then there are no arguments on the stack, and we do not have to
+        worry that a far jump might force the prologue to push the link
+        register, changing the stack offsets.  In this case we can just
+        return false, since the presence of far jumps in the function will
+        not affect stack offsets.
+
+        If the arg pointer is live (or if it was live, but has now been
+        eliminated and so set to dead) then we do have to test to see if
+        the function might contain a far jump.  This test can lead to some
+        false negatives, since before reload is completed, then length of
+        branch instructions is not known, so gcc defaults to returning their
+        longest length, which in turn sets the far jump attribute to true.
+
+        A false negative will not result in bad code being generated, but it
+        will result in a needless push and pop of the link register.  We
+        hope that this does not occur too often.  */
+      if (regs_ever_live [ARG_POINTER_REGNUM])
+       cfun->machine->arg_pointer_live = 1;
+      else if (! cfun->machine->arg_pointer_live)
+       return 0;
+    }
+
+  /* Check to see if the function contains a branch
+     insn with the far jump attribute set.  */
+  for (insn = get_insns (); insn; insn = NEXT_INSN (insn))
+    {
+      if (GET_CODE (insn) == JUMP_INSN
+         /* Ignore tablejump patterns.  */
+         && GET_CODE (PATTERN (insn)) != ADDR_VEC
+         && GET_CODE (PATTERN (insn)) != ADDR_DIFF_VEC
+         && get_attr_far_jump (insn) == FAR_JUMP_YES
+         )
+       {
+         /* Record the fact that we have decied that
+            the function does use far jumps.  */
+         cfun->machine->far_jump_used = 1;
+         return 1;
+       }
+    }
+  
+  return 0;
+}
+
+/* Return non-zero if FUNC must be entered in ARM mode.  */
+int
+is_called_in_ARM_mode (func)
+     tree func;
+{
+  if (TREE_CODE (func) != FUNCTION_DECL)
+    abort ();
+
+  /* Ignore the problem about functions whoes address is taken.  */
+  if (TARGET_CALLEE_INTERWORKING && TREE_PUBLIC (func))
+    return TRUE;
+
+#ifdef ARM_PE 
+  return lookup_attribute ("interfacearm", DECL_MACHINE_ATTRIBUTES (func)) != NULL_TREE;
+#else
+  return FALSE;
+#endif
+}
+
+/* The bits which aren't usefully expanded as rtl. */
+char *
+thumb_unexpanded_epilogue ()
+{
+  int regno;
+  int live_regs_mask = 0;
+  int high_regs_pushed = 0;
+  int leaf_function = leaf_function_p ();
+  int had_to_push_lr;
+  rtx eh_ofs = cfun->machine->eh_epilogue_sp_ofs;
+
+  if (return_used_this_function)
+    return "";
+
+  for (regno = 0; regno <= LAST_LO_REGNUM; regno++)
+    if (regs_ever_live[regno] && ! call_used_regs[regno]
+       && ! (TARGET_SINGLE_PIC_BASE && (regno == arm_pic_register)))
+      live_regs_mask |= 1 << regno;
 
-  /* This jump might be paralleled with a clobber of the condition codes 
-     the jump should always come first */
-  if (GET_CODE (body) == PARALLEL && XVECLEN (body, 0) > 0)
-    body = XVECEXP (body, 0, 0);
+  for (regno = 8; regno < 13; regno++)
+    {
+      if (regs_ever_live[regno] && ! call_used_regs[regno]
+         && ! (TARGET_SINGLE_PIC_BASE && (regno == arm_pic_register)))
+       high_regs_pushed ++;
+    }
 
-#if 0  
-  /* If this is a conditional return then we don't want to know */
-  if (GET_CODE (body) == SET && GET_CODE (SET_DEST (body)) == PC
-      && GET_CODE (SET_SRC (body)) == IF_THEN_ELSE
-      && (GET_CODE (XEXP (SET_SRC (body), 1)) == RETURN
-          || GET_CODE (XEXP (SET_SRC (body), 2)) == RETURN))
-    return;
+  /* The prolog may have pushed some high registers to use as
+     work registers.  eg the testuite file:
+     gcc/testsuite/gcc/gcc.c-torture/execute/complex-2.c
+     compiles to produce:
+       push    {r4, r5, r6, r7, lr}
+       mov     r7, r9
+       mov     r6, r8
+       push    {r6, r7}
+     as part of the prolog.  We have to undo that pushing here.  */
+  
+  if (high_regs_pushed)
+    {
+      int mask = live_regs_mask;
+      int next_hi_reg;
+      int size;
+      int mode;
+       
+#ifdef RTX_CODE
+      /* If we can deduce the registers used from the function's return value.
+        This is more reliable that examining regs_ever_live[] because that
+        will be set if the register is ever used in the function, not just if
+        the register is used to hold a return value.  */
+
+      if (current_function_return_rtx != 0)
+       mode = GET_MODE (current_function_return_rtx);
+      else
 #endif
+       mode = DECL_MODE (DECL_RESULT (current_function_decl));
 
-  if (reverse
-      || (GET_CODE (body) == SET && GET_CODE (SET_DEST (body)) == PC
-         && GET_CODE (SET_SRC (body)) == IF_THEN_ELSE))
-    {
-      int insns_skipped = 0, fail = FALSE, succeed = FALSE;
-      /* Flag which part of the IF_THEN_ELSE is the LABEL_REF.  */
-      int then_not_else = TRUE;
-      rtx this_insn = start_insn, label = 0;
+      size = GET_MODE_SIZE (mode);
 
-      if (get_attr_conds (insn) == CONDS_JUMP_CLOB)
+      /* Unless we are returning a type of size > 12 register r3 is
+         available.  */
+      if (size < 13)
+       mask |=  1 << 3;
+
+      if (mask == 0)
+       /* Oh dear!  We have no low registers into which we can pop
+           high registers!  */
+       fatal ("No low registers available for popping high registers");
+      
+      for (next_hi_reg = 8; next_hi_reg < 13; next_hi_reg++)
+       if (regs_ever_live[next_hi_reg] && ! call_used_regs[next_hi_reg]
+           && ! (TARGET_SINGLE_PIC_BASE && (next_hi_reg == arm_pic_register)))
+         break;
+
+      while (high_regs_pushed)
        {
-         /* The code below is wrong for these, and I haven't time to
-            fix it now.  So we just do the safe thing and return.  This
-            whole function needs re-writing anyway.  */
-         jump_clobbers = 1;
-         return;
+         /* Find lo register(s) into which the high register(s) can
+             be popped.  */
+         for (regno = 0; regno <= LAST_LO_REGNUM; regno++)
+           {
+             if (mask & (1 << regno))
+               high_regs_pushed--;
+             if (high_regs_pushed == 0)
+               break;
+           }
+
+         mask &= (2 << regno) - 1;     /* A noop if regno == 8 */
+
+         /* Pop the values into the low register(s). */
+         thumb_pushpop (asm_out_file, mask, 0);
+
+         /* Move the value(s) into the high registers.  */
+         for (regno = 0; regno <= LAST_LO_REGNUM; regno++)
+           {
+             if (mask & (1 << regno))
+               {
+                 asm_fprintf (asm_out_file, "\tmov\t%r, %r\n", next_hi_reg,
+                              regno);
+                 
+                 for (next_hi_reg++; next_hi_reg < 13; next_hi_reg++)
+                   if (regs_ever_live[next_hi_reg] && 
+                       ! call_used_regs[next_hi_reg]
+                       && ! (TARGET_SINGLE_PIC_BASE 
+                             && (next_hi_reg == arm_pic_register)))
+                     break;
+               }
+           }
        }
+    }
+
+  had_to_push_lr = (live_regs_mask || ! leaf_function
+                   || thumb_far_jump_used_p (1));
+  
+  if (TARGET_BACKTRACE
+      && ((live_regs_mask & 0xFF) == 0)
+      && regs_ever_live [LAST_ARG_REGNUM] != 0)
+    {
+      /* The stack backtrace structure creation code had to
+        push R7 in order to get a work register, so we pop
+        it now.   */
+      live_regs_mask |= (1 << LAST_LO_REGNUM);
+    }
+  
+  if (current_function_pretend_args_size == 0 || TARGET_BACKTRACE)
+    {
+      if (had_to_push_lr
+         && ! is_called_in_ARM_mode (current_function_decl)
+         && ! eh_ofs)
+       live_regs_mask |= 1 << PC_REGNUM;
+
+      /* Either no argument registers were pushed or a backtrace
+        structure was created which includes an adjusted stack
+        pointer, so just pop everything.  */
+      if (live_regs_mask)
+       thumb_pushpop (asm_out_file, live_regs_mask, FALSE);
       
-      /* Register the insn jumped to.  */
-      if (reverse)
-        {
-         if (!seeking_return)
-           label = XEXP (SET_SRC (body), 0);
-        }
-      else if (GET_CODE (XEXP (SET_SRC (body), 1)) == LABEL_REF)
-       label = XEXP (XEXP (SET_SRC (body), 1), 0);
-      else if (GET_CODE (XEXP (SET_SRC (body), 2)) == LABEL_REF)
+      if (eh_ofs)
+       thumb_exit (asm_out_file, 2, eh_ofs);
+      /* We have either just popped the return address into the
+        PC or it is was kept in LR for the entire function or
+        it is still on the stack because we do not want to
+        return by doing a pop {pc}.  */
+      else if ((live_regs_mask & (1 << PC_REGNUM)) == 0)
+       thumb_exit (asm_out_file,
+                   (had_to_push_lr
+                    && is_called_in_ARM_mode (current_function_decl)) ?
+                   -1 : LR_REGNUM, NULL_RTX);
+    }
+  else
+    {
+      /* Pop everything but the return address.  */
+      live_regs_mask &= ~ (1 << PC_REGNUM);
+      
+      if (live_regs_mask)
+       thumb_pushpop (asm_out_file, live_regs_mask, FALSE);
+
+      if (had_to_push_lr)
+       /* Get the return address into a temporary register.  */
+       thumb_pushpop (asm_out_file, 1 << LAST_ARG_REGNUM, 0);
+      
+      /* Remove the argument registers that were pushed onto the stack.  */
+      asm_fprintf (asm_out_file, "\tadd\t%r, %r, #%d\n",
+                  SP_REGNUM, SP_REGNUM,
+                  current_function_pretend_args_size);
+      
+      if (eh_ofs)
+       thumb_exit (asm_out_file, 2, eh_ofs);
+      else
+       thumb_exit (asm_out_file,
+                   had_to_push_lr ? LAST_ARG_REGNUM : LR_REGNUM, NULL_RTX);
+    }
+
+  return "";
+}
+
+/* Functions to save and restore machine-specific function data.  */
+
+static void
+arm_mark_machine_status (p)
+     struct function * p;
+{
+  struct machine_function *machine = p->machine;
+
+  ggc_mark_rtx (machine->ra_rtx);
+  ggc_mark_rtx (machine->eh_epilogue_sp_ofs);
+}
+
+static void
+arm_init_machine_status (p)
+     struct function * p;
+{
+  p->machine =
+    (struct machine_function *) xcalloc (1, sizeof (struct machine_function));
+}
+
+/* Return an RTX indicating where the return address to the
+   calling function can be found.  */
+rtx
+arm_return_addr (count, frame)
+     int count;
+     rtx frame ATTRIBUTE_UNUSED;
+{
+  rtx reg;
+
+  if (count != 0)
+    return NULL_RTX;
+
+  reg = cfun->machine->ra_rtx;
+  
+  if (reg == NULL)
+    {
+      rtx init;
+      
+      /* No rtx yet.  Invent one, and initialize it for r14 (lr) in 
+        the prologue.  */
+      reg = gen_reg_rtx (Pmode);
+      cfun->machine->ra_rtx = reg;
+      
+      if (! TARGET_APCS_32)
+       init = gen_rtx_AND (Pmode, gen_rtx_REG (Pmode, LR_REGNUM),
+                           GEN_INT (RETURN_ADDR_MASK26));
+      else
+       init = gen_rtx_REG (Pmode, LR_REGNUM);
+
+      init = gen_rtx_SET (VOIDmode, reg, init);
+
+      /* Emit the insn to the prologue with the other argument copies.  */
+      push_topmost_sequence ();
+      emit_insn_after (init, get_insns ());
+      pop_topmost_sequence ();
+    }
+
+  return reg;
+}
+
+/* Do anything needed before RTL is emitted for each function.  */
+void
+arm_init_expanders ()
+{
+  /* Arrange to initialize and mark the machine per-function status.  */
+  init_machine_status = arm_init_machine_status;
+  mark_machine_status = arm_mark_machine_status;
+}
+
+/* Generate the rest of a function's prologue.  */
+void
+thumb_expand_prologue ()
+{
+  HOST_WIDE_INT amount = (get_frame_size ()
+                         + current_function_outgoing_args_size);
+  
+  /* Naked functions don't have prologues.  */
+  if (arm_naked_function_p (current_function_decl))
+    return;
+
+  if (frame_pointer_needed)
+    emit_insn (gen_movsi (hard_frame_pointer_rtx, stack_pointer_rtx));
+
+  if (amount)
+    {
+      amount = ROUND_UP (amount);
+      
+      if (amount < 512)
+       emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx,
+                              GEN_INT (- amount)));
+      else
        {
-         label = XEXP (XEXP (SET_SRC (body), 2), 0);
-         then_not_else = FALSE;
+         int regno;
+         rtx reg;
+
+         /* The stack decrement is too big for an immediate value in a single
+            insn.  In theory we could issue multiple subtracts, but after
+            three of them it becomes more space efficient to place the full
+            value in the constant pool and load into a register.  (Also the
+            ARM debugger really likes to see only one stack decrement per
+            function).  So instead we look for a scratch register into which
+            we can load the decrement, and then we subtract this from the
+            stack pointer.  Unfortunately on the thumb the only available
+            scratch registers are the argument registers, and we cannot use
+            these as they may hold arguments to the function.  Instead we
+            attempt to locate a call preserved register which is used by this
+            function.  If we can find one, then we know that it will have
+            been pushed at the start of the prologue and so we can corrupt
+            it now.  */
+         for (regno = LAST_ARG_REGNUM + 1; regno <= LAST_LO_REGNUM; regno++)
+           if (regs_ever_live[regno]
+               && ! call_used_regs[regno] /* Paranoia */
+               && ! (TARGET_SINGLE_PIC_BASE && (regno == arm_pic_register))
+               && ! (frame_pointer_needed
+                     && (regno == THUMB_HARD_FRAME_POINTER_REGNUM)))
+             break;
+
+         if (regno > LAST_LO_REGNUM) /* Very unlikely */
+           {
+             rtx spare = gen_rtx (REG, SImode, IP_REGNUM);
+
+             /* Choose an arbitary, non-argument low register.  */
+             reg = gen_rtx (REG, SImode, LAST_LO_REGNUM);
+
+             /* Save it by copying it into a high, scratch register.  */
+             emit_insn (gen_movsi (spare, reg));
+
+             /* Decrement the stack.  */
+             emit_insn (gen_movsi (reg, GEN_INT (- amount)));
+             emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx,
+                                    reg));
+
+             /* Restore the low register's original value.  */
+             emit_insn (gen_movsi (reg, spare));
+             
+             /* Emit a USE of the restored scratch register, so that flow
+                analysis will not consider the restore redundant.  The
+                register won't be used again in this function and isn't
+                restored by the epilogue.  */
+             emit_insn (gen_rtx_USE (VOIDmode, reg));
+           }
+         else
+           {
+             reg = gen_rtx (REG, SImode, regno);
+
+             emit_insn (gen_movsi (reg, GEN_INT (- amount)));
+             emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx,
+                                    reg));
+           }
        }
-      else if (GET_CODE (XEXP (SET_SRC (body), 1)) == RETURN)
-       seeking_return = 1;
-      else if (GET_CODE (XEXP (SET_SRC (body), 2)) == RETURN)
-        {
-         seeking_return = 1;
-         then_not_else = FALSE;
-        }
+    }
+  
+  if (profile_flag || profile_block_flag || TARGET_NO_SCHED_PRO)
+    emit_insn (gen_blockage ());
+}
+
+void
+thumb_expand_epilogue ()
+{
+  HOST_WIDE_INT amount = (get_frame_size ()
+                         + current_function_outgoing_args_size);
+
+  /* Naked functions don't have epilogues.  */
+  if (arm_naked_function_p (current_function_decl))
+    return;
+
+  if (frame_pointer_needed)
+    emit_insn (gen_movsi (stack_pointer_rtx, hard_frame_pointer_rtx));
+  else if (amount)
+    {
+      amount = ROUND_UP (amount);
+      
+      if (amount < 512)
+       emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx,
+                              GEN_INT (amount)));
       else
+       {
+         /* r3 is always free in the epilogue.  */
+         rtx reg = gen_rtx (REG, SImode, LAST_ARG_REGNUM);
+
+         emit_insn (gen_movsi (reg, GEN_INT (amount)));
+         emit_insn (gen_addsi3 (stack_pointer_rtx, stack_pointer_rtx, reg));
+       }
+    }
+      
+  /* Emit a USE (stack_pointer_rtx), so that
+     the stack adjustment will not be deleted.  */
+  emit_insn (gen_rtx_USE (VOIDmode, stack_pointer_rtx));
+
+  if (profile_flag || profile_block_flag || TARGET_NO_SCHED_PRO)
+    emit_insn (gen_blockage ());
+}
+
+void
+output_thumb_prologue (f)
+     FILE * f;
+{
+  int live_regs_mask = 0;
+  int high_regs_pushed = 0;
+  int store_arg_regs = 0;
+  int regno;
+
+  if (arm_naked_function_p (current_function_decl))
+    return;
+
+  if (is_called_in_ARM_mode (current_function_decl))
+    {
+      const char * name;
+
+      if (GET_CODE (DECL_RTL (current_function_decl)) != MEM)
        abort ();
+      if (GET_CODE (XEXP (DECL_RTL (current_function_decl), 0)) != SYMBOL_REF)
+       abort ();
+      name = XSTR  (XEXP (DECL_RTL (current_function_decl), 0), 0);
+      
+      /* Generate code sequence to switch us into Thumb mode.  */
+      /* The .code 32 directive has already been emitted by
+        ASM_DECLARE_FUNCITON_NAME */
+      asm_fprintf (f, "\torr\t%r, %r, #1\n", IP_REGNUM, PC_REGNUM);
+      asm_fprintf (f, "\tbx\t%r\n", IP_REGNUM);
+
+      /* Generate a label, so that the debugger will notice the
+        change in instruction sets.  This label is also used by
+        the assembler to bypass the ARM code when this function
+        is called from a Thumb encoded function elsewhere in the
+        same file.  Hence the definition of STUB_NAME here must
+        agree with the definition in gas/config/tc-arm.c  */
+      
+#define STUB_NAME ".real_start_of"
+      
+      asm_fprintf (f, "\t.code\t16\n");
+#ifdef ARM_PE
+      if (arm_dllexport_name_p (name))
+        name = arm_strip_name_encoding (name);
+#endif        
+      asm_fprintf (f, "\t.globl %s%U%s\n", STUB_NAME, name);
+      asm_fprintf (f, "\t.thumb_func\n");
+      asm_fprintf (f, "%s%U%s:\n", STUB_NAME, name);
+    }
+    
+  if (current_function_anonymous_args && current_function_pretend_args_size)
+    store_arg_regs = 1;
 
-      /* See how many insns this branch skips, and what kind of insns.  If all
-        insns are okay, and the label or unconditional branch to the same
-        label is not too far away, succeed.  */
-      for (insns_skipped = 0;
-          !fail && !succeed && insns_skipped < MAX_INSNS_SKIPPED;
-          insns_skipped++)
+  if (current_function_pretend_args_size)
+    {
+      if (store_arg_regs)
        {
-         rtx scanbody;
+         int num_pushes;
+         
+         asm_fprintf (f, "\tpush\t{");
 
-         this_insn = next_nonnote_insn (this_insn);
-         if (!this_insn)
-           break;
+         num_pushes = NUM_INTS (current_function_pretend_args_size);
+         
+         for (regno = LAST_ARG_REGNUM + 1 - num_pushes;
+              regno <= LAST_ARG_REGNUM;
+              regno ++)
+           asm_fprintf (f, "%r%s", regno,
+                        regno == LAST_ARG_REGNUM ? "" : ", ");
 
-         scanbody = PATTERN (this_insn);
+         asm_fprintf (f, "}\n");
+       }
+      else
+       asm_fprintf (f, "\tsub\t%r, %r, #%d\n", 
+                    SP_REGNUM, SP_REGNUM,
+                    current_function_pretend_args_size);
+    }
 
-         switch (GET_CODE (this_insn))
-           {
-           case CODE_LABEL:
-             /* Succeed if it is the target label, otherwise fail since
-                control falls in from somewhere else.  */
-             if (this_insn == label)
-               {
-                 if (jump_clobbers)
-                   {
-                     arm_ccfsm_state = 2;
-                     this_insn = next_nonnote_insn (this_insn);
-                   }
-                 else
-                   arm_ccfsm_state = 1;
-                 succeed = TRUE;
-               }
-             else
-               fail = TRUE;
-             break;
+  for (regno = 0; regno <= LAST_LO_REGNUM; regno ++)
+    if (regs_ever_live[regno] && ! call_used_regs[regno]
+       && ! (TARGET_SINGLE_PIC_BASE && (regno == arm_pic_register)))
+      live_regs_mask |= 1 << regno;
 
-           case BARRIER:
-             /* Succeed if the following insn is the target label.
-                Otherwise fail.  
-                If return insns are used then the last insn in a function 
-                will be a barrier. */
-             this_insn = next_nonnote_insn (this_insn);
-             if (this_insn && this_insn == label)
-               {
-                 if (jump_clobbers)
-                   {
-                     arm_ccfsm_state = 2;
-                     this_insn = next_nonnote_insn (this_insn);
-                   }
-                 else
-                   arm_ccfsm_state = 1;
-                 succeed = TRUE;
-               }
-             else
-               fail = TRUE;
+  if (live_regs_mask || ! leaf_function_p () || thumb_far_jump_used_p (1))
+    live_regs_mask |= 1 << LR_REGNUM;
+
+  if (TARGET_BACKTRACE)
+    {
+      int    offset;
+      int    work_register = 0;
+      int    wr;
+      
+      /* We have been asked to create a stack backtrace structure.
+         The code looks like this:
+        
+        0   .align 2
+        0   func:
+         0     sub   SP, #16         Reserve space for 4 registers.
+        2     push  {R7}            Get a work register.
+         4     add   R7, SP, #20     Get the stack pointer before the push.
+         6     str   R7, [SP, #8]    Store the stack pointer (before reserving the space).
+         8     mov   R7, PC          Get hold of the start of this code plus 12.
+        10     str   R7, [SP, #16]   Store it.
+        12     mov   R7, FP          Get hold of the current frame pointer.
+        14     str   R7, [SP, #4]    Store it.
+        16     mov   R7, LR          Get hold of the current return address.
+        18     str   R7, [SP, #12]   Store it.
+        20     add   R7, SP, #16     Point at the start of the backtrace structure.
+        22     mov   FP, R7          Put this value into the frame pointer.  */
+
+      if ((live_regs_mask & 0xFF) == 0)
+       {
+         /* See if the a4 register is free.  */
+
+         if (regs_ever_live [LAST_ARG_REGNUM] == 0)
+           work_register = LAST_ARG_REGNUM;
+         else    /* We must push a register of our own */
+           live_regs_mask |= (1 << LAST_LO_REGNUM);
+       }
+
+      if (work_register == 0)
+       {
+         /* Select a register from the list that will be pushed to
+             use as our work register.  */
+         for (work_register = (LAST_LO_REGNUM + 1); work_register--;)
+           if ((1 << work_register) & live_regs_mask)
              break;
+       }
+      
+      asm_fprintf
+       (f, "\tsub\t%r, %r, #16\t%@ Create stack backtrace structure\n",
+        SP_REGNUM, SP_REGNUM);
+      
+      if (live_regs_mask)
+       thumb_pushpop (f, live_regs_mask, 1);
+      
+      for (offset = 0, wr = 1 << 15; wr != 0; wr >>= 1)
+       if (wr & live_regs_mask)
+         offset += 4;
+      
+      asm_fprintf (f, "\tadd\t%r, %r, #%d\n", work_register, SP_REGNUM,
+                  offset + 16 + current_function_pretend_args_size);
+      
+      asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                  offset + 4);
+
+      /* Make sure that the instruction fetching the PC is in the right place
+        to calculate "start of backtrace creation code + 12".  */
+      if (live_regs_mask)
+       {
+         asm_fprintf (f, "\tmov\t%r, %r\n", work_register, PC_REGNUM);
+         asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                      offset + 12);
+         asm_fprintf (f, "\tmov\t%r, %r\n", work_register,
+                      ARM_HARD_FRAME_POINTER_REGNUM);
+         asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                      offset);
+       }
+      else
+       {
+         asm_fprintf (f, "\tmov\t%r, %r\n", work_register,
+                      ARM_HARD_FRAME_POINTER_REGNUM);
+         asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                      offset);
+         asm_fprintf (f, "\tmov\t%r, %r\n", work_register, PC_REGNUM);
+         asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                      offset + 12);
+       }
+      
+      asm_fprintf (f, "\tmov\t%r, %r\n", work_register, LR_REGNUM);
+      asm_fprintf (f, "\tstr\t%r, [%r, #%d]\n", work_register, SP_REGNUM,
+                  offset + 8);
+      asm_fprintf (f, "\tadd\t%r, %r, #%d\n", work_register, SP_REGNUM,
+                  offset + 12);
+      asm_fprintf (f, "\tmov\t%r, %r\t\t%@ Backtrace structure created\n",
+                  ARM_HARD_FRAME_POINTER_REGNUM, work_register);
+    }
+  else if (live_regs_mask)
+    thumb_pushpop (f, live_regs_mask, 1);
+
+  for (regno = 8; regno < 13; regno++)
+    {
+      if (regs_ever_live[regno] && ! call_used_regs[regno]
+         && ! (TARGET_SINGLE_PIC_BASE && (regno == arm_pic_register)))
+       high_regs_pushed ++;
+    }
 
-           case CALL_INSN:
-             /* If using 32-bit addresses the cc is not preserved over
-                calls */
-             if (TARGET_APCS_32)
-               fail = TRUE;
-             break;
+  if (high_regs_pushed)
+    {
+      int pushable_regs = 0;
+      int mask = live_regs_mask & 0xff;
+      int next_hi_reg;
 
-           case JUMP_INSN:
-             /* If this is an unconditional branch to the same label, succeed.
-                If it is to another label, do nothing.  If it is conditional,
-                fail.  */
-             /* XXX Probably, the test for the SET and the PC are unnecessary. */
+      for (next_hi_reg = 12; next_hi_reg > LAST_LO_REGNUM; next_hi_reg--)
+       {
+         if (regs_ever_live[next_hi_reg] && ! call_used_regs[next_hi_reg]
+             && ! (TARGET_SINGLE_PIC_BASE
+                   && (next_hi_reg == arm_pic_register)))
+           break;
+       }
 
-             if (GET_CODE (scanbody) == SET
-                 && GET_CODE (SET_DEST (scanbody)) == PC)
+      pushable_regs = mask;
+
+      if (pushable_regs == 0)
+       {
+         /* Desperation time -- this probably will never happen.  */
+         if (regs_ever_live[LAST_ARG_REGNUM]
+             || ! call_used_regs[LAST_ARG_REGNUM])
+           asm_fprintf (f, "\tmov\t%r, %r\n", IP_REGNUM, LAST_ARG_REGNUM);
+         mask = 1 << LAST_ARG_REGNUM;
+       }
+
+      while (high_regs_pushed > 0)
+       {
+         for (regno = LAST_LO_REGNUM; regno >= 0; regno--)
+           {
+             if (mask & (1 << regno))
                {
-                 if (GET_CODE (SET_SRC (scanbody)) == LABEL_REF
-                     && XEXP (SET_SRC (scanbody), 0) == label && !reverse)
-                   {
-                     arm_ccfsm_state = 2;
-                     succeed = TRUE;
-                   }
-                 else if (GET_CODE (SET_SRC (scanbody)) == IF_THEN_ELSE)
-                   fail = TRUE;
-               }
-             else if (GET_CODE (scanbody) == RETURN
-                      && seeking_return)
-               {
-                 arm_ccfsm_state = 2;
-                 succeed = TRUE;
-               }
-             else if (GET_CODE (scanbody) == PARALLEL)
-               {
-                 switch (get_attr_conds (this_insn))
+                 asm_fprintf (f, "\tmov\t%r, %r\n", regno, next_hi_reg);
+                 
+                 high_regs_pushed --;
+                 
+                 if (high_regs_pushed)
+                   for (next_hi_reg--; next_hi_reg > LAST_LO_REGNUM;
+                        next_hi_reg--)
+                     {
+                       if (regs_ever_live[next_hi_reg]
+                           && ! call_used_regs[next_hi_reg]
+                           && ! (TARGET_SINGLE_PIC_BASE 
+                                 && (next_hi_reg == arm_pic_register)))
+                         break;
+                     }
+                 else
                    {
-                   case CONDS_NOCOND:
-                     break;
-                   default:
-                     fail = TRUE;
+                     mask &= ~ ((1 << regno) - 1);
                      break;
                    }
                }
-             break;
+           }
+         
+         thumb_pushpop (f, mask, 1);
+       }
 
-           case INSN:
-             /* Instructions using or affecting the condition codes make it
-                fail.  */
-             if ((GET_CODE (scanbody) == SET
-                  || GET_CODE (scanbody) == PARALLEL)
-                 && get_attr_conds (this_insn) != CONDS_NOCOND)
-               fail = TRUE;
-             break;
+      if (pushable_regs == 0
+         && (regs_ever_live[LAST_ARG_REGNUM]
+             || ! call_used_regs[LAST_ARG_REGNUM]))
+       asm_fprintf (f, "\tmov\t%r, %r\n", LAST_ARG_REGNUM, IP_REGNUM);
+    }
+}
 
-           default:
-             break;
-           }
+/* Handle the case of a double word load into a low register from
+   a computed memory address.  The computed address may involve a
+   register which is overwritten by the load.  */
+
+char *
+thumb_load_double_from_address (operands)
+     rtx * operands;
+{
+  rtx addr;
+  rtx base;
+  rtx offset;
+  rtx arg1;
+  rtx arg2;
+  
+  if (GET_CODE (operands[0]) != REG)
+    fatal ("thumb_load_double_from_address: destination is not a register");
+  
+  if (GET_CODE (operands[1]) != MEM)
+    {
+      debug_rtx (operands[1]);
+      fatal ("thumb_load_double_from_address: source is not a computed memory address");
+    }
+
+  /* Get the memory address.  */
+  addr = XEXP (operands[1], 0);
+      
+  /* Work out how the memory address is computed.  */
+  switch (GET_CODE (addr))
+    {
+    case REG:
+      operands[2] = gen_rtx (MEM, SImode,
+                            plus_constant (XEXP (operands[1], 0), 4));
+
+      if (REGNO (operands[0]) == REGNO (addr))
+       {
+         output_asm_insn ("ldr\t%H0, %2", operands);
+         output_asm_insn ("ldr\t%0, %1", operands);
        }
-      if (succeed)
+      else
        {
-         if ((!seeking_return) && (arm_ccfsm_state == 1 || reverse))
-           arm_target_label = CODE_LABEL_NUMBER (label);
-         else if (seeking_return || arm_ccfsm_state == 2)
-           {
-             while (this_insn && GET_CODE (PATTERN (this_insn)) == USE)
-               {
-                 this_insn = next_nonnote_insn (this_insn);
-                 if (this_insn && (GET_CODE (this_insn) == BARRIER
-                                   || GET_CODE (this_insn) == CODE_LABEL))
-                   abort ();
-               }
-             if (!this_insn)
-               {
-                 /* Oh, dear! we ran off the end.. give up */
-                 recog (PATTERN (insn), insn, NULL_PTR);
-                 arm_ccfsm_state = 0;
-                 arm_target_insn = NULL;
-                 return;
-               }
-             arm_target_insn = this_insn;
-           }
-         else
-           abort ();
-         if (jump_clobbers)
+         output_asm_insn ("ldr\t%0, %1", operands);
+         output_asm_insn ("ldr\t%H0, %2", operands);
+       }
+      break;
+      
+    case CONST:
+      /* Compute <address> + 4 for the high order load.  */
+      operands[2] = gen_rtx (MEM, SImode,
+                            plus_constant (XEXP (operands[1], 0), 4));
+      
+      output_asm_insn ("ldr\t%0, %1", operands);
+      output_asm_insn ("ldr\t%H0, %2", operands);
+      break;
+         
+    case PLUS:
+      arg1   = XEXP (addr, 0);
+      arg2   = XEXP (addr, 1);
+           
+      if (CONSTANT_P (arg1))
+       base = arg2, offset = arg1;
+      else
+       base = arg1, offset = arg2;
+  
+      if (GET_CODE (base) != REG)
+       fatal ("thumb_load_double_from_address: base is not a register");
+
+      /* Catch the case of <address> = <reg> + <reg> */
+      if (GET_CODE (offset) == REG)
+       {
+         int reg_offset = REGNO (offset);
+         int reg_base   = REGNO (base);
+         int reg_dest   = REGNO (operands[0]);
+         
+         /* Add the base and offset registers together into the
+             higher destination register.  */
+         asm_fprintf (asm_out_file, "\tadd\t%r, %r, %r",
+                      reg_dest + 1, reg_base, reg_offset);
+         
+         /* Load the lower destination register from the address in
+             the higher destination register.  */
+         asm_fprintf (asm_out_file, "\tldr\t%r, [%r, #0]",
+                      reg_dest, reg_dest + 1);
+         
+         /* Load the higher destination register from its own address
+             plus 4.  */
+         asm_fprintf (asm_out_file, "\tldr\t%r, [%r, #4]",
+                      reg_dest + 1, reg_dest + 1);
+       }
+      else
+       {
+         /* Compute <address> + 4 for the high order load.  */
+         operands[2] = gen_rtx (MEM, SImode,
+                                plus_constant (XEXP (operands[1], 0), 4));
+         
+         /* If the computed address is held in the low order register
+            then load the high order register first, otherwise always
+            load the low order register first.  */
+         if (REGNO (operands[0]) == REGNO (base))
            {
-             if (reverse)
-               abort ();
-             arm_current_cc = 
-                 get_arm_condition_code (XEXP (XEXP (XEXP (SET_SRC (body),
-                                                           0), 0), 1));
-             if (GET_CODE (XEXP (XEXP (SET_SRC (body), 0), 0)) == AND)
-               arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
-             if (GET_CODE (XEXP (SET_SRC (body), 0)) == NE)
-               arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
+             output_asm_insn ("ldr\t%H0, %2", operands);
+             output_asm_insn ("ldr\t%0, %1", operands);
            }
          else
            {
-             /* If REVERSE is true, ARM_CURRENT_CC needs to be inverted from
-                what it was.  */
-             if (!reverse)
-               arm_current_cc = get_arm_condition_code (XEXP (SET_SRC (body),
-                                                              0));
+             output_asm_insn ("ldr\t%0, %1", operands);
+             output_asm_insn ("ldr\t%H0, %2", operands);
            }
+       }
+      break;
 
-         if (reverse || then_not_else)
-           arm_current_cc = ARM_INVERSE_CONDITION_CODE (arm_current_cc);
+    case LABEL_REF:
+      /* With no registers to worry about we can just load the value
+         directly.  */
+      operands[2] = gen_rtx (MEM, SImode,
+                            plus_constant (XEXP (operands[1], 0), 4));
+         
+      output_asm_insn ("ldr\t%H0, %2", operands);
+      output_asm_insn ("ldr\t%0, %1", operands);
+      break;
+      
+    default:
+      debug_rtx (operands[1]);
+      fatal ("thumb_load_double_from_address: Unhandled address calculation");
+      break;
+    }
+  
+  return "";
+}
+
+
+char *
+thumb_output_move_mem_multiple (n, operands)
+     int n;
+     rtx * operands;
+{
+  rtx tmp;
+
+  switch (n)
+    {
+    case 2:
+      if (REGNO (operands[2]) > REGNO (operands[3]))
+       {
+         tmp = operands[2];
+         operands[2] = operands[3];
+         operands[3] = tmp;
        }
-      /* restore recog_operand (getting the attributes of other insns can
-        destroy this array, but final.c assumes that it remains intact
-        across this call; since the insn has been recognized already we
-        call recog direct). */
-      recog (PATTERN (insn), insn, NULL_PTR);
+      output_asm_insn ("ldmia\t%1!, {%2, %3}", operands);
+      output_asm_insn ("stmia\t%0!, {%2, %3}", operands);
+      break;
+
+    case 3:
+      if (REGNO (operands[2]) > REGNO (operands[3]))
+       {
+         tmp = operands[2];
+         operands[2] = operands[3];
+         operands[3] = tmp;
+       }
+      if (REGNO (operands[3]) > REGNO (operands[4]))
+       {
+         tmp = operands[3];
+         operands[3] = operands[4];
+         operands[4] = tmp;
+       }
+      if (REGNO (operands[2]) > REGNO (operands[3]))
+       {
+         tmp = operands[2];
+         operands[2] = operands[3];
+         operands[3] = tmp;
+       }
+      
+      output_asm_insn ("ldmia\t%1!, {%2, %3, %4}", operands);
+      output_asm_insn ("stmia\t%0!, {%2, %3, %4}", operands);
+      break;
+
+    default:
+      abort ();
+    }
+
+  return "";
+}
+
+/* Routines for generating rtl */
+
+void
+thumb_expand_movstrqi (operands)
+     rtx * operands;
+{
+  rtx out = copy_to_mode_reg (SImode, XEXP (operands[0], 0));
+  rtx in  = copy_to_mode_reg (SImode, XEXP (operands[1], 0));
+  HOST_WIDE_INT len = INTVAL (operands[2]);
+  HOST_WIDE_INT offset = 0;
+
+  while (len >= 12)
+    {
+      emit_insn (gen_movmem12b (out, in));
+      len -= 12;
+    }
+  
+  if (len >= 8)
+    {
+      emit_insn (gen_movmem8b (out, in));
+      len -= 8;
+    }
+  
+  if (len >= 4)
+    {
+      rtx reg = gen_reg_rtx (SImode);
+      emit_insn (gen_movsi (reg, gen_rtx (MEM, SImode, in)));
+      emit_insn (gen_movsi (gen_rtx (MEM, SImode, out), reg));
+      len -= 4;
+      offset += 4;
+    }
+  
+  if (len >= 2)
+    {
+      rtx reg = gen_reg_rtx (HImode);
+      emit_insn (gen_movhi (reg, gen_rtx (MEM, HImode, 
+                                         plus_constant (in, offset))));
+      emit_insn (gen_movhi (gen_rtx (MEM, HImode, plus_constant (out, offset)),
+                           reg));
+      len -= 2;
+      offset += 2;
+    }
+  
+  if (len)
+    {
+      rtx reg = gen_reg_rtx (QImode);
+      emit_insn (gen_movqi (reg, gen_rtx (MEM, QImode,
+                                         plus_constant (in, offset))));
+      emit_insn (gen_movqi (gen_rtx (MEM, QImode, plus_constant (out, offset)),
+                           reg));
     }
 }
 
+int
+thumb_cmp_operand (op, mode)
+     rtx op;
+     enum machine_mode mode;
+{
+  return ((GET_CODE (op) == CONST_INT
+          && (unsigned HOST_WIDE_INT) (INTVAL (op)) < 256)
+         || register_operand (op, mode));
+}
+
+static char *
+thumb_condition_code (x, invert)
+     rtx x;
+     int invert;
+{
+  static char * conds[] =
+  {
+    "eq", "ne", "cs", "cc", "mi", "pl", "vs", "vc", 
+    "hi", "ls", "ge", "lt", "gt", "le"
+  };
+  int val;
+
+  switch (GET_CODE (x))
+    {
+    case EQ: val = 0; break;
+    case NE: val = 1; break;
+    case GEU: val = 2; break;
+    case LTU: val = 3; break;
+    case GTU: val = 8; break;
+    case LEU: val = 9; break;
+    case GE: val = 10; break;
+    case LT: val = 11; break;
+    case GT: val = 12; break;
+    case LE: val = 13; break;
+    default:
+      abort ();
+    }
+
+  return conds[val ^ invert];
+}
+
+/* Handle storing a half-word to memory during reload.  */ 
+void
+thumb_reload_out_hi (operands)
+     rtx * operands;
+{
+  emit_insn (gen_thumb_movhi_clobber (operands[0], operands[1], operands[2]));
+}
+
+/* Handle storing a half-word to memory during reload.  */ 
+void
+thumb_reload_in_hi (operands)
+     rtx * operands ATTRIBUTE_UNUSED;
+{
+  abort ();
+}
+
+/* Return the length of a function name prefix
+    that starts with the character 'c'.  */
+static int
+arm_get_strip_length (char c)
+{
+  switch (c)
+    {
+    ARM_NAME_ENCODING_LENGTHS
+      default: return 0; 
+    }
+}
+
+/* Return a pointer to a function's name with any
+   and all prefix encodings stripped from it.  */
+const char *
+arm_strip_name_encoding (const char * name)
+{
+  int skip;
+  
+  while ((skip = arm_get_strip_length (* name)))
+    name += skip;
+
+  return name;
+}
+
 #ifdef AOF_ASSEMBLER
-/* Special functions only needed when producing AOF syntax assembler. */
+/* Special functions only needed when producing AOF syntax assembler.  */
+
+rtx aof_pic_label = NULL_RTX;
+struct pic_chain
+{
+  struct pic_chain * next;
+  char * symname;
+};
+
+static struct pic_chain * aof_pic_chain = NULL;
+
+rtx
+aof_pic_entry (x)
+     rtx x;
+{
+  struct pic_chain ** chainp;
+  int offset;
+
+  if (aof_pic_label == NULL_RTX)
+    {
+      /* We mark this here and not in arm_add_gc_roots() to avoid
+        polluting even more code with ifdefs, and because it never
+        contains anything useful until we assign to it here.  */
+      ggc_add_rtx_root (& aof_pic_label, 1);
+      /* This needs to persist throughout the compilation.  */
+      end_temporary_allocation ();
+      aof_pic_label = gen_rtx_SYMBOL_REF (Pmode, "x$adcons");
+      resume_temporary_allocation ();
+    }
+
+  for (offset = 0, chainp = &aof_pic_chain; *chainp;
+       offset += 4, chainp = &(*chainp)->next)
+    if ((*chainp)->symname == XSTR (x, 0))
+      return plus_constant (aof_pic_label, offset);
+
+  *chainp = (struct pic_chain *) xmalloc (sizeof (struct pic_chain));
+  (*chainp)->next = NULL;
+  (*chainp)->symname = XSTR (x, 0);
+  return plus_constant (aof_pic_label, offset);
+}
+
+void
+aof_dump_pic_table (f)
+     FILE * f;
+{
+  struct pic_chain * chain;
+
+  if (aof_pic_chain == NULL)
+    return;
+
+  asm_fprintf (f, "\tAREA |%r$$adcons|, BASED %r\n",
+              PIC_OFFSET_TABLE_REGNUM,
+              PIC_OFFSET_TABLE_REGNUM);
+  fputs ("|x$adcons|\n", f);
+  
+  for (chain = aof_pic_chain; chain; chain = chain->next)
+    {
+      fputs ("\tDCD\t", f);
+      assemble_name (f, chain->symname);
+      fputs ("\n", f);
+    }
+}
 
 int arm_text_section_count = 1;
 
@@ -5331,7 +9818,7 @@ aof_data_section ()
 
 /* The AOF assembler is religiously strict about declarations of
    imported and exported symbols, so that it is impossible to declare
-   a function as imported near the begining of the file, and then to
+   a function as imported near the beginning of the file, and then to
    export it later on.  It is, however, possible to delay the decision
    until all the functions in the file have been compiled.  To get
    around this, we maintain a list of the imports and exports, and
@@ -5341,17 +9828,17 @@ aof_data_section ()
 
 struct import
 {
-  struct import *next;
-  char *name;
+  struct import * next;
+  char * name;
 };
 
-static struct import *imports_list = NULL;
+static struct import * imports_list = NULL;
 
 void
 aof_add_import (name)
-     char *name;
+     char * name;
 {
-  struct import *new;
+  struct import * new;
 
   for (new = imports_list; new; new = new->next)
     if (new->name == name)
@@ -5365,9 +9852,9 @@ aof_add_import (name)
 
 void
 aof_delete_import (name)
-     char *name;
+     char * name;
 {
-  struct import **old;
+  struct import ** old;
 
   for (old = &imports_list; *old; old = & (*old)->next)
     {
@@ -5383,7 +9870,7 @@ int arm_main_function = 0;
 
 void
 aof_dump_imports (f)
-     FILE *f;
+     FILE * f;
 {
   /* The AOF assembler needs this to cause the startup code to be extracted
      from the library.  Brining in __main causes the whole thing to work