OSDN Git Service

Backport from 2012-04-19 mainline r186588.
[pf3gnuchains/gcc-fork.git] / gcc / config / avr / avr.c
index f33c0c5..af00aee 100644 (file)
 /* Return true if STR starts with PREFIX and false, otherwise.  */
 #define STR_PREFIX_P(STR,PREFIX) (0 == strncmp (STR, PREFIX, strlen (PREFIX)))
 
-#define AVR_SECTION_PROGMEM (SECTION_MACH_DEP << 0)
+/* The 4 bits starting at SECTION_MACH_DEP are reserved to store the
+   address space where data is to be located.
+   As the only non-generic address spaces are all located in Flash,
+   this can be used to test if data shall go into some .progmem* section.
+   This must be the rightmost field of machine dependent section flags.  */
+#define AVR_SECTION_PROGMEM (0xf * SECTION_MACH_DEP)
+
+/* Similar 4-bit region for SYMBOL_REF_FLAGS.  */
+#define AVR_SYMBOL_FLAG_PROGMEM (0xf * SYMBOL_FLAG_MACH_DEP)
+
+/* Similar 4-bit region in SYMBOL_REF_FLAGS:
+   Set address-space AS in SYMBOL_REF_FLAGS of SYM  */
+#define AVR_SYMBOL_SET_ADDR_SPACE(SYM,AS)                       \
+  do {                                                          \
+    SYMBOL_REF_FLAGS (sym) &= ~AVR_SYMBOL_FLAG_PROGMEM;         \
+    SYMBOL_REF_FLAGS (sym) |= (AS) * SYMBOL_FLAG_MACH_DEP;      \
+  } while (0)
+
+/* Read address-space from SYMBOL_REF_FLAGS of SYM  */
+#define AVR_SYMBOL_GET_ADDR_SPACE(SYM)                          \
+  ((SYMBOL_REF_FLAGS (sym) & AVR_SYMBOL_FLAG_PROGMEM)           \
+   / SYMBOL_FLAG_MACH_DEP)
+
+/* Known address spaces.  The order must be the same as in the respective
+   enum from avr.h (or designated initialized must be used).  */
+const avr_addrspace_t avr_addrspace[] =
+{
+    { ADDR_SPACE_RAM,  0, 2, ""     ,   0 },
+    { ADDR_SPACE_FLASH,  1, 2, "__flash",   0 },
+    { ADDR_SPACE_FLASH1, 1, 2, "__flash1",  1 },
+    { ADDR_SPACE_FLASH2, 1, 2, "__flash2",  2 },
+    { ADDR_SPACE_FLASH3, 1, 2, "__flash3",  3 },
+    { ADDR_SPACE_FLASH4, 1, 2, "__flash4",  4 },
+    { ADDR_SPACE_FLASH5, 1, 2, "__flash5",  5 },
+    { ADDR_SPACE_MEMX, 1, 3, "__memx",  0 },
+    { 0              , 0, 0, NULL,      0 }
+};
+
+/* Map 64-k Flash segment to section prefix.  */
+static const char* const progmem_section_prefix[6] =
+  {
+    ".progmem.data",
+    ".progmem1.data",
+    ".progmem2.data",
+    ".progmem3.data",
+    ".progmem4.data",
+    ".progmem5.data"
+  };
+
+/* Holding RAM addresses of some SFRs used by the compiler and that
+   are unique over all devices in an architecture like 'avr4'.  */
+  
+typedef struct
+{
+  /* SREG: The pocessor status */
+  int sreg;
+
+  /* RAMPX, RAMPY, RAMPD and CCP of XMEGA */
+  int ccp;
+  int rampd;
+  int rampx;
+  int rampy;
+
+  /* RAMPZ: The high byte of 24-bit address used with ELPM */ 
+  int rampz;
+
+  /* SP: The stack pointer and its low and high byte */
+  int sp_l;
+  int sp_h;
+} avr_addr_t;
+
+static avr_addr_t avr_addr;
 
 
 /* Prototypes for local helper functions.  */
 
+static const char* out_movqi_r_mr (rtx, rtx[], int*);
+static const char* out_movhi_r_mr (rtx, rtx[], int*);
+static const char* out_movsi_r_mr (rtx, rtx[], int*);
+static const char* out_movqi_mr_r (rtx, rtx[], int*);
+static const char* out_movhi_mr_r (rtx, rtx[], int*);
+static const char* out_movsi_mr_r (rtx, rtx[], int*);
+
 static int avr_naked_function_p (tree);
 static int interrupt_function_p (tree);
 static int signal_function_p (tree);
@@ -86,22 +164,42 @@ static bool avr_rtx_costs (rtx, int, int, int, int *, bool);
 #define FIRST_CUM_REG 26
 
 /* Implicit target register of LPM instruction (R0) */
-static GTY(()) rtx lpm_reg_rtx;
+extern GTY(()) rtx lpm_reg_rtx;
+rtx lpm_reg_rtx;
 
 /* (Implicit) address register of LPM instruction (R31:R30 = Z) */
-static GTY(()) rtx lpm_addr_reg_rtx;
+extern GTY(()) rtx lpm_addr_reg_rtx;
+rtx lpm_addr_reg_rtx;
 
-/* Temporary register RTX (gen_rtx_REG (QImode, TMP_REGNO)) */
-static GTY(()) rtx tmp_reg_rtx;
+/* Temporary register RTX (reg:QI TMP_REGNO) */
+extern GTY(()) rtx tmp_reg_rtx;
+rtx tmp_reg_rtx;
 
-/* Zeroed register RTX (gen_rtx_REG (QImode, ZERO_REGNO)) */
-static GTY(()) rtx zero_reg_rtx;
+/* Zeroed register RTX (reg:QI ZERO_REGNO) */
+extern GTY(()) rtx zero_reg_rtx;
+rtx zero_reg_rtx;
 
 /* RTXs for all general purpose registers as QImode */
-static GTY(()) rtx all_regs_rtx[32];
-
-/* AVR register names {"r0", "r1", ..., "r31"} */
-static const char *const avr_regnames[] = REGISTER_NAMES;
+extern GTY(()) rtx all_regs_rtx[32];
+rtx all_regs_rtx[32];
+
+/* SREG, the processor status */
+extern GTY(()) rtx sreg_rtx;
+rtx sreg_rtx;
+
+/* RAMP* special function registers */
+extern GTY(()) rtx rampd_rtx;
+extern GTY(()) rtx rampx_rtx;
+extern GTY(()) rtx rampy_rtx;
+extern GTY(()) rtx rampz_rtx;
+rtx rampd_rtx;
+rtx rampx_rtx;
+rtx rampy_rtx;
+rtx rampz_rtx;
+
+/* RTX containing the strings "" and "e", respectively */
+static GTY(()) rtx xstring_empty;
+static GTY(()) rtx xstring_e;
 
 /* Preprocessor macros to define depending on MCU type.  */
 const char *avr_extra_arch_macro;
@@ -115,160 +213,18 @@ const struct mcu_type_s *avr_current_device;
 /* Section to put switch tables in.  */
 static GTY(()) section *progmem_swtable_section;
 
-/* Unnamed section associated to __attribute__((progmem)) aka. PROGMEM.  */
-static GTY(()) section *progmem_section;
+/* Unnamed sections associated to __attribute__((progmem)) aka. PROGMEM
+   or to address space __flash*.  */
+static GTY(()) section *progmem_section[6];
+
+/* Condition for insns/expanders from avr-dimode.md.  */
+bool avr_have_dimode = true;
 
 /* To track if code will use .bss and/or .data.  */
 bool avr_need_clear_bss_p = false;
 bool avr_need_copy_data_p = false;
 
 \f
-/* Initialize the GCC target structure.  */
-#undef TARGET_ASM_ALIGNED_HI_OP
-#define TARGET_ASM_ALIGNED_HI_OP "\t.word\t"
-#undef TARGET_ASM_ALIGNED_SI_OP
-#define TARGET_ASM_ALIGNED_SI_OP "\t.long\t"
-#undef TARGET_ASM_UNALIGNED_HI_OP
-#define TARGET_ASM_UNALIGNED_HI_OP "\t.word\t"
-#undef TARGET_ASM_UNALIGNED_SI_OP
-#define TARGET_ASM_UNALIGNED_SI_OP "\t.long\t"
-#undef TARGET_ASM_INTEGER
-#define TARGET_ASM_INTEGER avr_assemble_integer
-#undef TARGET_ASM_FILE_START
-#define TARGET_ASM_FILE_START avr_file_start
-#undef TARGET_ASM_FILE_END
-#define TARGET_ASM_FILE_END avr_file_end
-
-#undef TARGET_ASM_FUNCTION_END_PROLOGUE
-#define TARGET_ASM_FUNCTION_END_PROLOGUE avr_asm_function_end_prologue
-#undef TARGET_ASM_FUNCTION_BEGIN_EPILOGUE
-#define TARGET_ASM_FUNCTION_BEGIN_EPILOGUE avr_asm_function_begin_epilogue
-
-#undef TARGET_FUNCTION_VALUE
-#define TARGET_FUNCTION_VALUE avr_function_value
-#undef TARGET_LIBCALL_VALUE
-#define TARGET_LIBCALL_VALUE avr_libcall_value
-#undef TARGET_FUNCTION_VALUE_REGNO_P
-#define TARGET_FUNCTION_VALUE_REGNO_P avr_function_value_regno_p
-
-#undef TARGET_ATTRIBUTE_TABLE
-#define TARGET_ATTRIBUTE_TABLE avr_attribute_table
-#undef TARGET_INSERT_ATTRIBUTES
-#define TARGET_INSERT_ATTRIBUTES avr_insert_attributes
-#undef TARGET_SECTION_TYPE_FLAGS
-#define TARGET_SECTION_TYPE_FLAGS avr_section_type_flags
-
-#undef TARGET_ASM_NAMED_SECTION
-#define TARGET_ASM_NAMED_SECTION avr_asm_named_section
-#undef TARGET_ASM_INIT_SECTIONS
-#define TARGET_ASM_INIT_SECTIONS avr_asm_init_sections
-#undef TARGET_ENCODE_SECTION_INFO
-#define TARGET_ENCODE_SECTION_INFO avr_encode_section_info
-#undef TARGET_ASM_SELECT_SECTION
-#define TARGET_ASM_SELECT_SECTION avr_asm_select_section
-
-#undef TARGET_REGISTER_MOVE_COST
-#define TARGET_REGISTER_MOVE_COST avr_register_move_cost
-#undef TARGET_MEMORY_MOVE_COST
-#define TARGET_MEMORY_MOVE_COST avr_memory_move_cost
-#undef TARGET_RTX_COSTS
-#define TARGET_RTX_COSTS avr_rtx_costs
-#undef TARGET_ADDRESS_COST
-#define TARGET_ADDRESS_COST avr_address_cost
-#undef TARGET_MACHINE_DEPENDENT_REORG
-#define TARGET_MACHINE_DEPENDENT_REORG avr_reorg
-#undef TARGET_FUNCTION_ARG
-#define TARGET_FUNCTION_ARG avr_function_arg
-#undef TARGET_FUNCTION_ARG_ADVANCE
-#define TARGET_FUNCTION_ARG_ADVANCE avr_function_arg_advance
-
-#undef TARGET_RETURN_IN_MEMORY
-#define TARGET_RETURN_IN_MEMORY avr_return_in_memory
-
-#undef TARGET_STRICT_ARGUMENT_NAMING
-#define TARGET_STRICT_ARGUMENT_NAMING hook_bool_CUMULATIVE_ARGS_true
-
-#undef TARGET_BUILTIN_SETJMP_FRAME_VALUE
-#define TARGET_BUILTIN_SETJMP_FRAME_VALUE avr_builtin_setjmp_frame_value
-
-#undef TARGET_HARD_REGNO_SCRATCH_OK
-#define TARGET_HARD_REGNO_SCRATCH_OK avr_hard_regno_scratch_ok
-#undef TARGET_CASE_VALUES_THRESHOLD
-#define TARGET_CASE_VALUES_THRESHOLD avr_case_values_threshold
-
-#undef TARGET_FRAME_POINTER_REQUIRED
-#define TARGET_FRAME_POINTER_REQUIRED avr_frame_pointer_required_p
-#undef TARGET_CAN_ELIMINATE
-#define TARGET_CAN_ELIMINATE avr_can_eliminate
-
-#undef TARGET_CLASS_LIKELY_SPILLED_P
-#define TARGET_CLASS_LIKELY_SPILLED_P avr_class_likely_spilled_p
-
-#undef TARGET_OPTION_OVERRIDE
-#define TARGET_OPTION_OVERRIDE avr_option_override
-
-#undef TARGET_CANNOT_MODIFY_JUMPS_P
-#define TARGET_CANNOT_MODIFY_JUMPS_P avr_cannot_modify_jumps_p
-
-#undef TARGET_FUNCTION_OK_FOR_SIBCALL
-#define TARGET_FUNCTION_OK_FOR_SIBCALL avr_function_ok_for_sibcall
-
-#undef TARGET_INIT_BUILTINS
-#define TARGET_INIT_BUILTINS avr_init_builtins
-
-#undef TARGET_EXPAND_BUILTIN
-#define TARGET_EXPAND_BUILTIN avr_expand_builtin
-
-#undef TARGET_ASM_FUNCTION_RODATA_SECTION
-#define TARGET_ASM_FUNCTION_RODATA_SECTION avr_asm_function_rodata_section
-
-#undef  TARGET_SCALAR_MODE_SUPPORTED_P
-#define TARGET_SCALAR_MODE_SUPPORTED_P avr_scalar_mode_supported_p
-
-#undef  TARGET_ADDR_SPACE_SUBSET_P
-#define TARGET_ADDR_SPACE_SUBSET_P avr_addr_space_subset_p
-
-#undef  TARGET_ADDR_SPACE_CONVERT
-#define TARGET_ADDR_SPACE_CONVERT avr_addr_space_convert
-
-#undef  TARGET_ADDR_SPACE_ADDRESS_MODE
-#define TARGET_ADDR_SPACE_ADDRESS_MODE avr_addr_space_address_mode
-
-#undef  TARGET_ADDR_SPACE_POINTER_MODE
-#define TARGET_ADDR_SPACE_POINTER_MODE avr_addr_space_pointer_mode
-
-#undef  TARGET_ADDR_SPACE_LEGITIMATE_ADDRESS_P
-#define TARGET_ADDR_SPACE_LEGITIMATE_ADDRESS_P avr_addr_space_legitimate_address_p
-
-#undef TARGET_ADDR_SPACE_LEGITIMIZE_ADDRESS
-#define TARGET_ADDR_SPACE_LEGITIMIZE_ADDRESS avr_addr_space_legitimize_address
-
-\f
-
-/* Custom function to replace string prefix.
-
-   Return a ggc-allocated string with strlen (OLD_PREFIX) characters removed
-   from the start of OLD_STR and then prepended with NEW_PREFIX.  */
-
-static inline const char*
-avr_replace_prefix (const char *old_str,
-                    const char *old_prefix, const char *new_prefix)
-{
-  char *new_str;
-  size_t len = strlen (old_str) + strlen (new_prefix) - strlen (old_prefix);
-
-  gcc_assert (strlen (old_prefix) <= strlen (old_str));
-
-  /* Unfortunately, ggc_alloc_string returns a const char* and thus cannot be
-     used here.  */
-     
-  new_str = (char*) ggc_alloc_atomic (1 + len);
-
-  strcat (stpcpy (new_str, new_prefix), old_str + strlen (old_prefix));
-  
-  return (const char*) new_str;
-}
-
 
 /* Custom function to count number of set bits.  */
 
@@ -317,8 +273,6 @@ avr_popcount_each_byte (rtx xval, int n_bytes, int pop_mask)
 static void
 avr_option_override (void)
 {
-  int regno;
-  
   flag_delete_null_pointer_checks = 0;
 
   /* caller-save.c looks for call-clobbered hard registers that are assigned
@@ -346,15 +300,23 @@ avr_option_override (void)
   avr_current_device = &avr_mcu_types[avr_mcu_index];
   avr_current_arch = &avr_arch_types[avr_current_device->arch];
   avr_extra_arch_macro = avr_current_device->macro;
+  
+  /* RAM addresses of some SFRs common to all Devices in respective Arch. */
 
-  for (regno = 0; regno < 32; regno ++)
-    all_regs_rtx[regno] = gen_rtx_REG (QImode, regno);
+  /* SREG: Status Register containing flags like I (global IRQ) */
+  avr_addr.sreg = 0x3F + avr_current_arch->sfr_offset;
 
-  lpm_reg_rtx  = all_regs_rtx[LPM_REGNO];
-  tmp_reg_rtx  = all_regs_rtx[TMP_REGNO];
-  zero_reg_rtx = all_regs_rtx[ZERO_REGNO];
+  /* RAMPZ: Address' high part when loading via ELPM */
+  avr_addr.rampz = 0x3B + avr_current_arch->sfr_offset;
 
-  lpm_addr_reg_rtx = gen_rtx_REG (HImode, REG_Z);
+  avr_addr.rampy = 0x3A + avr_current_arch->sfr_offset;
+  avr_addr.rampx = 0x39 + avr_current_arch->sfr_offset;
+  avr_addr.rampd = 0x38 + avr_current_arch->sfr_offset;
+  avr_addr.ccp = 0x34 + avr_current_arch->sfr_offset;
+
+  /* SP: Stack Pointer (SP_H:SP_L) */
+  avr_addr.sp_l = 0x3D + avr_current_arch->sfr_offset;
+  avr_addr.sp_h = avr_addr.sp_l + 1;
 
   init_machine_status = avr_init_machine_status;
 
@@ -369,6 +331,35 @@ avr_init_machine_status (void)
   return ggc_alloc_cleared_machine_function ();
 }
 
+
+/* Implement `INIT_EXPANDERS'.  */
+/* The function works like a singleton.  */
+
+void
+avr_init_expanders (void)
+{
+  int regno;
+
+  for (regno = 0; regno < 32; regno ++)
+    all_regs_rtx[regno] = gen_rtx_REG (QImode, regno);
+
+  lpm_reg_rtx  = all_regs_rtx[LPM_REGNO];
+  tmp_reg_rtx  = all_regs_rtx[TMP_REGNO];
+  zero_reg_rtx = all_regs_rtx[ZERO_REGNO];
+
+  lpm_addr_reg_rtx = gen_rtx_REG (HImode, REG_Z);
+
+  sreg_rtx = gen_rtx_MEM (QImode, GEN_INT (avr_addr.sreg));
+  rampd_rtx = gen_rtx_MEM (QImode, GEN_INT (avr_addr.rampd));
+  rampx_rtx = gen_rtx_MEM (QImode, GEN_INT (avr_addr.rampx));
+  rampy_rtx = gen_rtx_MEM (QImode, GEN_INT (avr_addr.rampy));
+  rampz_rtx = gen_rtx_MEM (QImode, GEN_INT (avr_addr.rampz));
+
+  xstring_empty = gen_rtx_CONST_STRING (VOIDmode, "");
+  xstring_e = gen_rtx_CONST_STRING (VOIDmode, "e");
+}
+
+
 /* Return register class for register R.  */
 
 enum reg_class
@@ -417,25 +408,55 @@ avr_scalar_mode_supported_p (enum machine_mode mode)
 /* Return TRUE if DECL is a VAR_DECL located in Flash and FALSE, otherwise.  */
 
 static bool
-avr_decl_pgm_p (tree decl)
+avr_decl_flash_p (tree decl)
 {
-  if (TREE_CODE (decl) != VAR_DECL)
-    return false;
+  if (TREE_CODE (decl) != VAR_DECL
+      || TREE_TYPE (decl) == error_mark_node)
+    {
+      return false;
+    }
 
   return !ADDR_SPACE_GENERIC_P (TYPE_ADDR_SPACE (TREE_TYPE (decl)));
 }
 
 
+/* Return TRUE if DECL is a VAR_DECL located in the 24-bit Flash
+   address space and FALSE, otherwise.  */
+static bool
+avr_decl_memx_p (tree decl)
+{
+  if (TREE_CODE (decl) != VAR_DECL
+      || TREE_TYPE (decl) == error_mark_node)
+    {
+      return false;
+    }
+
+  return (ADDR_SPACE_MEMX == TYPE_ADDR_SPACE (TREE_TYPE (decl)));
+}
+
+
 /* Return TRUE if X is a MEM rtx located in Flash and FALSE, otherwise.  */
 
 bool
-avr_mem_pgm_p (rtx x)
+avr_mem_flash_p (rtx x)
 {
   return (MEM_P (x)
           && !ADDR_SPACE_GENERIC_P (MEM_ADDR_SPACE (x)));
 }
 
 
+/* Return TRUE if X is a MEM rtx located in the 24-bit Flash
+   address space and FALSE, otherwise.  */
+
+bool
+avr_mem_memx_p (rtx x)
+{
+  return (MEM_P (x)
+          && ADDR_SPACE_MEMX == MEM_ADDR_SPACE (x));
+}
+
+
 /* A helper for the subsequent function attribute used to dig for
    attribute 'name' in a FUNCTION_DECL or FUNCTION_TYPE */
 
@@ -502,7 +523,8 @@ avr_OS_main_function_p (tree func)
 
 
 /* Implement `ACCUMULATE_OUTGOING_ARGS'.  */
-bool
+
+int
 avr_accumulate_outgoing_args (void)
 {
   if (!cfun)
@@ -769,6 +791,35 @@ emit_push_byte (unsigned regno, bool frame_related_p)
   cfun->machine->stack_usage++;
 }
 
+
+/*  Helper for expand_prologue.  Emit a push of a SFR via tmp_reg.
+    SFR is a MEM representing the memory location of the SFR.
+    If CLR_P then clear the SFR after the push using zero_reg.  */
+
+static void
+emit_push_sfr (rtx sfr, bool frame_related_p, bool clr_p)
+{
+  rtx insn;
+  
+  gcc_assert (MEM_P (sfr));
+
+  /* IN __tmp_reg__, IO(SFR) */
+  insn = emit_move_insn (tmp_reg_rtx, sfr);
+  if (frame_related_p)
+    RTX_FRAME_RELATED_P (insn) = 1;
+  
+  /* PUSH __tmp_reg__ */
+  emit_push_byte (TMP_REGNO, frame_related_p);
+
+  if (clr_p)
+    {
+      /* OUT IO(SFR), __zero_reg__ */
+      insn = emit_move_insn (sfr, const0_rtx);
+      if (frame_related_p)
+        RTX_FRAME_RELATED_P (insn) = 1;
+    }
+}
+
 static void
 avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
 {
@@ -776,7 +827,11 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
   bool isr_p = cfun->machine->is_interrupt || cfun->machine->is_signal;
   int live_seq = sequent_regs_live ();
 
+  HOST_WIDE_INT size_max
+    = (HOST_WIDE_INT) GET_MODE_MASK (AVR_HAVE_8BIT_SP ? QImode : Pmode);
+
   bool minimize = (TARGET_CALL_PROLOGUES
+                   && size < size_max
                    && live_seq
                    && !isr_p
                    && !cfun->machine->is_OS_task
@@ -881,8 +936,9 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
               !frame_pointer_needed can only occur if the function is not a
               leaf function and thus X has already been saved.  */
               
+          int irq_state = -1;
+          HOST_WIDE_INT size_cfa = size;
           rtx fp_plus_insns, fp, my_fp;
-          rtx sp_minus_size = plus_constant (stack_pointer_rtx, -size);
 
           gcc_assert (frame_pointer_needed
                       || !isr_p
@@ -895,11 +951,32 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
           if (AVR_HAVE_8BIT_SP)
             {
               /* The high byte (r29) does not change:
-                 Prefer SUBI (1 cycle) over ABIW (2 cycles, same size).  */
+                 Prefer SUBI (1 cycle) over SBIW (2 cycles, same size).  */
+
+              my_fp = all_regs_rtx[FRAME_POINTER_REGNUM];
+            }
 
-              my_fp = simplify_gen_subreg (QImode, fp, Pmode, 0);
+          /* Cut down size and avoid size = 0 so that we don't run
+             into ICE like PR52488 in the remainder.  */
+
+          if (size > size_max)
+            {
+              /* Don't error so that insane code from newlib still compiles
+                 and does not break building newlib.  As PR51345 is implemented
+                 now, there are multilib variants with -msp8.
+                 
+                 If user wants sanity checks he can use -Wstack-usage=
+                 or similar options.
+
+                 For CFA we emit the original, non-saturated size so that
+                 the generic machinery is aware of the real stack usage and
+                 will print the above diagnostic as expected.  */
+              
+              size = size_max;
             }
 
+          size = trunc_int_for_mode (size, GET_MODE (my_fp));
+          
           /************  Method 1: Adjust frame pointer  ************/
           
           start_sequence ();
@@ -911,43 +988,50 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
              the frame pointer subtraction is done.  */
           
           insn = emit_move_insn (fp, stack_pointer_rtx);
-          if (!frame_pointer_needed)
-            RTX_FRAME_RELATED_P (insn) = 1;
+          if (frame_pointer_needed)
+            {
+              RTX_FRAME_RELATED_P (insn) = 1;
+              add_reg_note (insn, REG_CFA_ADJUST_CFA,
+                            gen_rtx_SET (VOIDmode, fp, stack_pointer_rtx));
+            }
 
           insn = emit_move_insn (my_fp, plus_constant (my_fp, -size));
-          RTX_FRAME_RELATED_P (insn) = 1;
-          
           if (frame_pointer_needed)
             {
+              RTX_FRAME_RELATED_P (insn) = 1;
               add_reg_note (insn, REG_CFA_ADJUST_CFA,
-                            gen_rtx_SET (VOIDmode, fp, sp_minus_size));
+                            gen_rtx_SET (VOIDmode, fp,
+                                         plus_constant (fp, -size_cfa)));
             }
           
           /* Copy to stack pointer.  Note that since we've already
              changed the CFA to the frame pointer this operation
-             need not be annotated if frame pointer is needed.  */
-              
+             need not be annotated if frame pointer is needed.
+             Always move through unspec, see PR50063.
+             For meaning of irq_state see movhi_sp_r insn.  */
+
+          if (cfun->machine->is_interrupt)
+            irq_state = 1;
+
+          if (TARGET_NO_INTERRUPTS
+              || cfun->machine->is_signal
+              || cfun->machine->is_OS_main)
+            irq_state = 0;
+
           if (AVR_HAVE_8BIT_SP)
-            {
-              insn = emit_move_insn (stack_pointer_rtx, fp);
-            }
-          else if (TARGET_NO_INTERRUPTS 
-                   || isr_p
-                   || cfun->machine->is_OS_main)
-            {
-              rtx irqs_are_on = GEN_INT (!!cfun->machine->is_interrupt);
-              
-              insn = emit_insn (gen_movhi_sp_r (stack_pointer_rtx,
-                                                fp, irqs_are_on));
-            }
-          else
-            {
-              insn = emit_move_insn (stack_pointer_rtx, fp);
-            }
+            irq_state = 2;
 
+          insn = emit_insn (gen_movhi_sp_r (stack_pointer_rtx,
+                                            fp, GEN_INT (irq_state)));
           if (!frame_pointer_needed)
-            RTX_FRAME_RELATED_P (insn) = 1;
-
+            {
+              RTX_FRAME_RELATED_P (insn) = 1;
+              add_reg_note (insn, REG_CFA_ADJUST_CFA,
+                            gen_rtx_SET (VOIDmode, stack_pointer_rtx,
+                                         plus_constant (stack_pointer_rtx,
+                                                        -size_cfa)));
+            }
+          
           fp_plus_insns = get_insns ();
           end_sequence ();
           
@@ -962,9 +1046,13 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
               
               start_sequence ();
 
-              insn = emit_move_insn (stack_pointer_rtx, sp_minus_size);
+              insn = emit_move_insn (stack_pointer_rtx,
+                                     plus_constant (stack_pointer_rtx, -size));
               RTX_FRAME_RELATED_P (insn) = 1;
-
+              add_reg_note (insn, REG_CFA_ADJUST_CFA,
+                            gen_rtx_SET (VOIDmode, stack_pointer_rtx,
+                                         plus_constant (stack_pointer_rtx,
+                                                        -size_cfa)));
               if (frame_pointer_needed)
                 {
                   insn = emit_move_insn (fp, stack_pointer_rtx);
@@ -986,7 +1074,7 @@ avr_prologue_setup_frame (HOST_WIDE_INT size, HARD_REG_SET set)
               emit_insn (fp_plus_insns);
             }
 
-          cfun->machine->stack_usage += size;
+          cfun->machine->stack_usage += size_cfa;
         } /* !minimize && size != 0 */
     } /* !minimize */
 }
@@ -1032,26 +1120,42 @@ expand_prologue (void)
 
       /* Push SREG.  */
       /* ??? There's no dwarf2 column reserved for SREG.  */
-      emit_move_insn (tmp_reg_rtx, gen_rtx_MEM (QImode, GEN_INT (SREG_ADDR)));
-      emit_push_byte (TMP_REGNO, false);
+      emit_push_sfr (sreg_rtx, false, false /* clr */);
 
-      /* Push RAMPZ.  */
-      /* ??? There's no dwarf2 column reserved for RAMPZ.  */
-      if (AVR_HAVE_RAMPZ 
-          && TEST_HARD_REG_BIT (set, REG_Z)
-          && TEST_HARD_REG_BIT (set, REG_Z + 1))
-        {
-          emit_move_insn (tmp_reg_rtx,
-                          gen_rtx_MEM (QImode, GEN_INT (RAMPZ_ADDR)));
-          emit_push_byte (TMP_REGNO, false);
-        }
-        
       /* Clear zero reg.  */
       emit_move_insn (zero_reg_rtx, const0_rtx);
 
       /* Prevent any attempt to delete the setting of ZERO_REG!  */
       emit_use (zero_reg_rtx);
-    }
+
+      /* Push and clear RAMPD/X/Y/Z if present and low-part register is used.
+         ??? There are no dwarf2 columns reserved for RAMPD/X/Y/Z.  */
+      
+      if (AVR_HAVE_RAMPD)
+        emit_push_sfr (rampd_rtx, false /* frame-related */, true /* clr */);
+
+      if (AVR_HAVE_RAMPX
+          && TEST_HARD_REG_BIT (set, REG_X)
+          && TEST_HARD_REG_BIT (set, REG_X + 1))
+        {
+          emit_push_sfr (rampx_rtx, false /* frame-related */, true /* clr */);
+        }
+
+      if (AVR_HAVE_RAMPY
+          && (frame_pointer_needed
+              || (TEST_HARD_REG_BIT (set, REG_Y)
+                  && TEST_HARD_REG_BIT (set, REG_Y + 1))))
+        {
+          emit_push_sfr (rampy_rtx, false /* frame-related */, true /* clr */);
+        }
+
+      if (AVR_HAVE_RAMPZ
+          && TEST_HARD_REG_BIT (set, REG_Z)
+          && TEST_HARD_REG_BIT (set, REG_Z + 1))
+        {
+          emit_push_sfr (rampz_rtx, false /* frame-related */, AVR_HAVE_RAMPD);
+        }
+    }  /* is_interrupt is_signal */
 
   avr_prologue_setup_frame (size, set);
   
@@ -1179,9 +1283,11 @@ expand_epilogue (bool sibcall_p)
   if (size)
     {
       /* Try two methods to adjust stack and select shortest.  */
-          
+
+      int irq_state = -1;
       rtx fp, my_fp;
       rtx fp_plus_insns;
+      HOST_WIDE_INT size_max;
 
       gcc_assert (frame_pointer_needed
                   || !isr_p
@@ -1196,8 +1302,15 @@ expand_epilogue (bool sibcall_p)
           /* The high byte (r29) does not change:
              Prefer SUBI (1 cycle) over SBIW (2 cycles).  */
                   
-          my_fp = simplify_gen_subreg (QImode, fp, Pmode, 0);
+          my_fp = all_regs_rtx[FRAME_POINTER_REGNUM];
         }
+
+      /* For rationale see comment in prologue generation.  */
+
+      size_max = (HOST_WIDE_INT) GET_MODE_MASK (GET_MODE (my_fp));
+      if (size > size_max)
+        size = size_max;
+      size = trunc_int_for_mode (size, GET_MODE (my_fp));
               
       /********** Method 1: Adjust fp register  **********/
               
@@ -1209,23 +1322,15 @@ expand_epilogue (bool sibcall_p)
       emit_move_insn (my_fp, plus_constant (my_fp, size));
 
       /* Copy to stack pointer.  */
-              
+
+      if (TARGET_NO_INTERRUPTS)
+        irq_state = 0;
+
       if (AVR_HAVE_8BIT_SP)
-        {
-          emit_move_insn (stack_pointer_rtx, fp);
-        }
-      else if (TARGET_NO_INTERRUPTS 
-               || isr_p
-               || cfun->machine->is_OS_main)
-        {
-          rtx irqs_are_on = GEN_INT (!!cfun->machine->is_interrupt);
-          
-          emit_insn (gen_movhi_sp_r (stack_pointer_rtx, fp, irqs_are_on));
-        }
-      else
-        {
-          emit_move_insn (stack_pointer_rtx, fp);
-        }
+        irq_state = 2;
+
+      emit_insn (gen_movhi_sp_r (stack_pointer_rtx, fp,
+                                 GEN_INT (irq_state)));
 
       fp_plus_insns = get_insns ();
       end_sequence ();        
@@ -1273,22 +1378,44 @@ expand_epilogue (bool sibcall_p)
 
   if (isr_p)
     {
-      /* Restore RAMPZ using tmp reg as scratch.  */
+      /* Restore RAMPZ/Y/X/D using tmp_reg as scratch.
+         The conditions to restore them must be tha same as in prologue.  */
       
-      if (AVR_HAVE_RAMPZ 
+      if (AVR_HAVE_RAMPZ
           && TEST_HARD_REG_BIT (set, REG_Z)
           && TEST_HARD_REG_BIT (set, REG_Z + 1))
         {
           emit_pop_byte (TMP_REGNO);
-          emit_move_insn (gen_rtx_MEM (QImode, GEN_INT (RAMPZ_ADDR)), 
-                          tmp_reg_rtx);
+          emit_move_insn (rampz_rtx, tmp_reg_rtx);
+        }
+
+      if (AVR_HAVE_RAMPY
+          && (frame_pointer_needed
+              || (TEST_HARD_REG_BIT (set, REG_Y)
+                  && TEST_HARD_REG_BIT (set, REG_Y + 1))))
+        {
+          emit_pop_byte (TMP_REGNO);
+          emit_move_insn (rampy_rtx, tmp_reg_rtx);
+        }
+
+      if (AVR_HAVE_RAMPX
+          && TEST_HARD_REG_BIT (set, REG_X)
+          && TEST_HARD_REG_BIT (set, REG_X + 1))
+        {
+          emit_pop_byte (TMP_REGNO);
+          emit_move_insn (rampx_rtx, tmp_reg_rtx);
+        }
+
+      if (AVR_HAVE_RAMPD)
+        {
+          emit_pop_byte (TMP_REGNO);
+          emit_move_insn (rampd_rtx, tmp_reg_rtx);
         }
 
-      /* Restore SREG using tmp reg as scratch.  */
+      /* Restore SREG using tmp_reg as scratch.  */
       
       emit_pop_byte (TMP_REGNO);
-      emit_move_insn (gen_rtx_MEM (QImode, GEN_INT (SREG_ADDR)), 
-                      tmp_reg_rtx);
+      emit_move_insn (sreg_rtx, tmp_reg_rtx);
 
       /* Restore tmp REG.  */
       emit_pop_byte (TMP_REGNO);
@@ -1330,6 +1457,22 @@ avr_cannot_modify_jumps_p (void)
 }
 
 
+/* Implement `TARGET_MODE_DEPENDENT_ADDRESS_P'.  */
+
+/* FIXME:  PSImode addresses are not mode-dependent in themselves.
+      This hook just serves to hack around PR rtl-optimization/52543 by
+      claiming that PSImode addresses (which are used for the 24-bit
+      address space __memx) were mode-dependent so that lower-subreg.s
+      will skip these addresses.  See also the similar FIXME comment along
+      with mov<mode> expanders in avr.md.  */
+
+static bool
+avr_mode_dependent_address_p (const_rtx addr)
+{
+  return GET_MODE (addr) != Pmode;
+}
+
+
 /* Helper function for `avr_legitimate_address_p'.  */
 
 static inline bool
@@ -1638,10 +1781,12 @@ cond_string (enum rtx_code code)
   return "";
 }
 
+
+/* Implement `TARGET_PRINT_OPERAND_ADDRESS'.  */
 /* Output ADDR to FILE as address.  */
 
-void
-print_operand_address (FILE *file, rtx addr)
+static void
+avr_print_operand_address (FILE *file, rtx addr)
 {
   switch (GET_CODE (addr))
     {
@@ -1696,10 +1841,21 @@ print_operand_address (FILE *file, rtx addr)
 }
 
 
-/* Output X as assembler operand to file FILE.  */
-     
-void
-print_operand (FILE *file, rtx x, int code)
+/* Implement `TARGET_PRINT_OPERAND_PUNCT_VALID_P'.  */
+
+static bool
+avr_print_operand_punct_valid_p (unsigned char code)
+{
+  return code == '~' || code == '!';
+}
+
+
+/* Implement `TARGET_PRINT_OPERAND'.  */
+/* Output X as assembler operand to file FILE.
+   For a description of supported %-codes, see top of avr.md.  */
+
+static void
+avr_print_operand (FILE *file, rtx x, int code)
 {
   int abcd = 0;
 
@@ -1716,6 +1872,31 @@ print_operand (FILE *file, rtx x, int code)
       if (AVR_HAVE_EIJMP_EICALL)
        fputc ('e', file);
     }
+  else if (code == 't'
+           || code == 'T')
+    {
+      static int t_regno = -1;
+      static int t_nbits = -1;
+
+      if (REG_P (x) && t_regno < 0 && code == 'T')
+        {
+          t_regno = REGNO (x);
+          t_nbits = GET_MODE_BITSIZE (GET_MODE (x));
+        }
+      else if (CONST_INT_P (x) && t_regno >= 0
+               && IN_RANGE (INTVAL (x), 0, t_nbits - 1))
+        {
+          int bpos = INTVAL (x);
+
+          fprintf (file, "%s", reg_names[t_regno + bpos / 8]);
+          if (code == 'T')
+            fprintf (file, ",%d", bpos % 8);
+
+          t_regno = -1;
+        }
+      else
+        fatal_insn ("operands to %T/%t must be reg + const_int:", x);
+    }
   else if (REG_P (x))
     {
       if (x == zero_reg_rtx)
@@ -1723,16 +1904,45 @@ print_operand (FILE *file, rtx x, int code)
       else
        fprintf (file, reg_names[true_regnum (x) + abcd]);
     }
-  else if (GET_CODE (x) == CONST_INT)
-    fprintf (file, HOST_WIDE_INT_PRINT_DEC, INTVAL (x) + abcd);
-  else if (GET_CODE (x) == MEM)
+  else if (CONST_INT_P (x))
+    {
+      HOST_WIDE_INT ival = INTVAL (x);
+        
+      if ('i' != code)
+        fprintf (file, HOST_WIDE_INT_PRINT_DEC, ival + abcd);
+      else if (low_io_address_operand (x, VOIDmode)
+               || high_io_address_operand (x, VOIDmode))
+        {
+          if (AVR_HAVE_RAMPZ && ival == avr_addr.rampz)
+            fprintf (file, "__RAMPZ__");
+          else if (AVR_HAVE_RAMPY && ival == avr_addr.rampy)
+            fprintf (file, "__RAMPY__");
+          else if (AVR_HAVE_RAMPX && ival == avr_addr.rampx)
+            fprintf (file, "__RAMPX__");
+          else if (AVR_HAVE_RAMPD && ival == avr_addr.rampd)
+            fprintf (file, "__RAMPD__");
+          else if (AVR_XMEGA && ival == avr_addr.ccp)
+            fprintf (file, "__CCP__");
+          else if (ival == avr_addr.sreg)   fprintf (file, "__SREG__");
+          else if (ival == avr_addr.sp_l)   fprintf (file, "__SP_L__");
+          else if (ival == avr_addr.sp_h)   fprintf (file, "__SP_H__");
+          else
+            {
+              fprintf (file, HOST_WIDE_INT_PRINT_HEX,
+                       ival - avr_current_arch->sfr_offset);
+            }
+        }
+      else
+        fatal_insn ("bad address, not an I/O address:", x);
+    }
+  else if (MEM_P (x))
     {
       rtx addr = XEXP (x, 0);
       
       if (code == 'm')
        {
           if (!CONSTANT_P (addr))
-            fatal_insn ("bad address, not a constant):", addr);
+            fatal_insn ("bad address, not a constant:", addr);
           /* Assembler template with m-code is data - not progmem section */
           if (text_segment_operand (addr, VOIDmode))
             if (warning (0, "accessing data memory with"
@@ -1743,12 +1953,16 @@ print_operand (FILE *file, rtx x, int code)
               }
           output_addr_const (file, addr);
        }
+      else if (code == 'i')
+        {
+          avr_print_operand (file, addr, 'i');
+        }
       else if (code == 'o')
        {
          if (GET_CODE (addr) != PLUS)
            fatal_insn ("bad address, not (reg+disp):", addr);
 
-         print_operand (file, XEXP (addr, 1), 0);
+         avr_print_operand (file, XEXP (addr, 1), 0);
        }
       else if (code == 'p' || code == 'r')
         {
@@ -1756,21 +1970,25 @@ print_operand (FILE *file, rtx x, int code)
             fatal_insn ("bad address, not post_inc or pre_dec:", addr);
           
           if (code == 'p')
-            print_operand_address (file, XEXP (addr, 0));  /* X, Y, Z */
+            avr_print_operand_address (file, XEXP (addr, 0));  /* X, Y, Z */
           else
-            print_operand (file, XEXP (addr, 0), 0);  /* r26, r28, r30 */
+            avr_print_operand (file, XEXP (addr, 0), 0);  /* r26, r28, r30 */
         }
       else if (GET_CODE (addr) == PLUS)
        {
-         print_operand_address (file, XEXP (addr,0));
+         avr_print_operand_address (file, XEXP (addr,0));
          if (REGNO (XEXP (addr, 0)) == REG_X)
            fatal_insn ("internal compiler error.  Bad address:"
                        ,addr);
          fputc ('+', file);
-         print_operand (file, XEXP (addr,1), code);
+         avr_print_operand (file, XEXP (addr,1), code);
        }
       else
-       print_operand_address (file, addr);
+       avr_print_operand_address (file, addr);
+    }
+  else if (code == 'i')
+    {
+      fatal_insn ("bad address, not an I/O address:", x);
     }
   else if (code == 'x')
     {
@@ -1795,12 +2013,14 @@ print_operand (FILE *file, rtx x, int code)
       REAL_VALUE_TO_TARGET_SINGLE (rv, val);
       fprintf (file, "0x%lx", val);
     }
+  else if (GET_CODE (x) == CONST_STRING)
+    fputs (XSTR (x, 0), file);
   else if (code == 'j')
     fputs (cond_string (GET_CODE (x)), file);
   else if (code == 'k')
     fputs (cond_string (reverse_condition (GET_CODE (x))), file);
   else
-    print_operand_address (file, x);
+    avr_print_operand_address (file, x);
 }
 
 /* Update the condition code in the INSN.  */
@@ -1818,6 +2038,7 @@ notice_update_cc (rtx body ATTRIBUTE_UNUSED, rtx insn)
 
     case CC_OUT_PLUS:
     case CC_OUT_PLUS_NOCLOBBER:
+    case CC_LDI:
       {
         rtx *op = recog_data.operand;
         int len_dummy, icc;
@@ -1825,16 +2046,36 @@ notice_update_cc (rtx body ATTRIBUTE_UNUSED, rtx insn)
         /* Extract insn's operands.  */
         extract_constrain_insn_cached (insn);
 
-        if (CC_OUT_PLUS == cc)
-          avr_out_plus (op, &len_dummy, &icc);
-        else
-          avr_out_plus_noclobber (op, &len_dummy, &icc);
-        
-        cc = (enum attr_cc) icc;
-        
+        switch (cc)
+          {
+          default:
+            gcc_unreachable();
+            
+          case CC_OUT_PLUS:
+            avr_out_plus (op, &len_dummy, &icc);
+            cc = (enum attr_cc) icc;
+            break;
+            
+          case CC_OUT_PLUS_NOCLOBBER:
+            avr_out_plus_noclobber (op, &len_dummy, &icc);
+            cc = (enum attr_cc) icc;
+            break;
+
+          case CC_LDI:
+
+            cc = (op[1] == CONST0_RTX (GET_MODE (op[0]))
+                  && reg_overlap_mentioned_p (op[0], zero_reg_rtx))
+              /* Loading zero-reg with 0 uses CLI and thus clobbers cc0.  */
+              ? CC_CLOBBER
+              /* Any other "r,rL" combination does not alter cc0.  */
+              : CC_NONE;
+            
+            break;
+          } /* inner switch */
+
         break;
       }
-    }
+    } /* outer swicth */
 
   switch (cc)
     {
@@ -1927,90 +2168,90 @@ ret_cond_branch (rtx x, int len, int reverse)
     {
     case GT:
       if (cc_prev_status.flags & CC_OVERFLOW_UNUSABLE)
-       return (len == 1 ? (AS1 (breq,.+2) CR_TAB
-                           AS1 (brpl,%0)) :
-               len == 2 ? (AS1 (breq,.+4) CR_TAB
-                           AS1 (brmi,.+2) CR_TAB
-                           AS1 (rjmp,%0)) :
-               (AS1 (breq,.+6) CR_TAB
-                AS1 (brmi,.+4) CR_TAB
-                AS1 (jmp,%0)));
+       return (len == 1 ? ("breq .+2" CR_TAB
+                           "brpl %0") :
+               len == 2 ? ("breq .+4" CR_TAB
+                           "brmi .+2" CR_TAB
+                           "rjmp %0") :
+               ("breq .+6" CR_TAB
+                "brmi .+4" CR_TAB
+                "jmp %0"));
          
       else
-       return (len == 1 ? (AS1 (breq,.+2) CR_TAB
-                           AS1 (brge,%0)) :
-               len == 2 ? (AS1 (breq,.+4) CR_TAB
-                           AS1 (brlt,.+2) CR_TAB
-                           AS1 (rjmp,%0)) :
-               (AS1 (breq,.+6) CR_TAB
-                AS1 (brlt,.+4) CR_TAB
-                AS1 (jmp,%0)));
+       return (len == 1 ? ("breq .+2" CR_TAB
+                           "brge %0") :
+               len == 2 ? ("breq .+4" CR_TAB
+                           "brlt .+2" CR_TAB
+                           "rjmp %0") :
+               ("breq .+6" CR_TAB
+                "brlt .+4" CR_TAB
+                "jmp %0"));
     case GTU:
-      return (len == 1 ? (AS1 (breq,.+2) CR_TAB
-                          AS1 (brsh,%0)) :
-              len == 2 ? (AS1 (breq,.+4) CR_TAB
-                          AS1 (brlo,.+2) CR_TAB
-                          AS1 (rjmp,%0)) :
-              (AS1 (breq,.+6) CR_TAB
-               AS1 (brlo,.+4) CR_TAB
-               AS1 (jmp,%0)));
+      return (len == 1 ? ("breq .+2" CR_TAB
+                          "brsh %0") :
+              len == 2 ? ("breq .+4" CR_TAB
+                          "brlo .+2" CR_TAB
+                          "rjmp %0") :
+              ("breq .+6" CR_TAB
+               "brlo .+4" CR_TAB
+               "jmp %0"));
     case LE:
       if (cc_prev_status.flags & CC_OVERFLOW_UNUSABLE)
-       return (len == 1 ? (AS1 (breq,%0) CR_TAB
-                           AS1 (brmi,%0)) :
-               len == 2 ? (AS1 (breq,.+2) CR_TAB
-                           AS1 (brpl,.+2) CR_TAB
-                           AS1 (rjmp,%0)) :
-               (AS1 (breq,.+2) CR_TAB
-                AS1 (brpl,.+4) CR_TAB
-                AS1 (jmp,%0)));
+       return (len == 1 ? ("breq %0" CR_TAB
+                           "brmi %0") :
+               len == 2 ? ("breq .+2" CR_TAB
+                           "brpl .+2" CR_TAB
+                           "rjmp %0") :
+               ("breq .+2" CR_TAB
+                "brpl .+4" CR_TAB
+                "jmp %0"));
       else
-       return (len == 1 ? (AS1 (breq,%0) CR_TAB
-                           AS1 (brlt,%0)) :
-               len == 2 ? (AS1 (breq,.+2) CR_TAB
-                           AS1 (brge,.+2) CR_TAB
-                           AS1 (rjmp,%0)) :
-               (AS1 (breq,.+2) CR_TAB
-                AS1 (brge,.+4) CR_TAB
-                AS1 (jmp,%0)));
+       return (len == 1 ? ("breq %0" CR_TAB
+                           "brlt %0") :
+               len == 2 ? ("breq .+2" CR_TAB
+                           "brge .+2" CR_TAB
+                           "rjmp %0") :
+               ("breq .+2" CR_TAB
+                "brge .+4" CR_TAB
+                "jmp %0"));
     case LEU:
-      return (len == 1 ? (AS1 (breq,%0) CR_TAB
-                          AS1 (brlo,%0)) :
-              len == 2 ? (AS1 (breq,.+2) CR_TAB
-                          AS1 (brsh,.+2) CR_TAB
-                         AS1 (rjmp,%0)) :
-              (AS1 (breq,.+2) CR_TAB
-               AS1 (brsh,.+4) CR_TAB
-              AS1 (jmp,%0)));
+      return (len == 1 ? ("breq %0" CR_TAB
+                          "brlo %0") :
+              len == 2 ? ("breq .+2" CR_TAB
+                          "brsh .+2" CR_TAB
+                         "rjmp %0") :
+              ("breq .+2" CR_TAB
+               "brsh .+4" CR_TAB
+              "jmp %0"));
     default:
       if (reverse)
        {
          switch (len)
            {
            case 1:
-             return AS1 (br%k1,%0);
+             return "br%k1 %0";
            case 2:
-             return (AS1 (br%j1,.+2) CR_TAB
-                     AS1 (rjmp,%0));
+             return ("br%j1 .+2" CR_TAB
+                     "rjmp %0");
            default:
-             return (AS1 (br%j1,.+4) CR_TAB
-                     AS1 (jmp,%0));
+             return ("br%j1 .+4" CR_TAB
+                     "jmp %0");
            }
        }
-       else
-         {
-           switch (len)
-             {
-             case 1:
-               return AS1 (br%j1,%0);
-             case 2:
-               return (AS1 (br%k1,.+2) CR_TAB
-                       AS1 (rjmp,%0));
-             default:
-               return (AS1 (br%k1,.+4) CR_TAB
-                       AS1 (jmp,%0));
-             }
-         }
+      else
+        {
+          switch (len)
+            {
+            case 1:
+              return "br%j1 %0";
+            case 2:
+              return ("br%k1 .+2" CR_TAB
+                      "rjmp %0");
+            default:
+              return ("br%k1 .+4" CR_TAB
+                      "jmp %0");
+            }
+        }
     }
   return "";
 }
@@ -2244,88 +2485,19 @@ avr_load_libgcc_p (rtx op)
         
   return (n_bytes > 2
           && !AVR_HAVE_LPMX
-          && avr_mem_pgm_p (op));
+          && MEM_P (op)
+          && MEM_ADDR_SPACE (op) == ADDR_SPACE_FLASH);
 }
 
+/* Return true if a value of mode MODE is read by __xload_* function.  */
 
-/* Helper function for the next function in the case where only restricted
-   version of LPM instruction is available.  */
-
-static const char*
-avr_out_lpm_no_lpmx (rtx insn, rtx *xop, int *plen)
+bool
+avr_xload_libgcc_p (enum machine_mode mode)
 {
-  rtx dest = xop[0];
-  rtx addr = xop[1];
-  int n_bytes = GET_MODE_SIZE (GET_MODE (dest));
-  int regno_dest;
-
-  regno_dest = REGNO (dest);
-
-  /* The implicit target register of LPM.  */
-  xop[3] = lpm_reg_rtx;
-
-  switch (GET_CODE (addr))
-    {
-    default:
-      gcc_unreachable();
-
-    case REG:
-
-      gcc_assert (REG_Z == REGNO (addr));
-
-      switch (n_bytes)
-        {
-        default:
-          gcc_unreachable();
-
-        case 1:
-          return avr_asm_len ("lpm" CR_TAB
-                              "mov %0,%3", xop, plen, 2);
-
-        case 2:
-          if (REGNO (dest) == REG_Z)
-            return avr_asm_len ("lpm"        CR_TAB
-                                "push %3"    CR_TAB
-                                "adiw %2,1"  CR_TAB
-                                "lpm"        CR_TAB
-                                "mov %B0,%3" CR_TAB
-                                "pop %A0", xop, plen, 6);
-          else
-            {
-              avr_asm_len ("lpm"        CR_TAB
-                           "mov %A0,%3" CR_TAB
-                           "adiw %2,1"  CR_TAB
-                           "lpm"        CR_TAB
-                           "mov %B0,%3", xop, plen, 5);
-                
-              if (!reg_unused_after (insn, addr))
-                avr_asm_len ("sbiw %2,1", xop, plen, 1);
-            }
-          
-          break; /* 2 */
-        }
-      
-      break; /* REG */
-
-    case POST_INC:
-
-      gcc_assert (REG_Z == REGNO (XEXP (addr, 0))
-                  && n_bytes <= 2);
-
-      avr_asm_len ("lpm"        CR_TAB
-                   "mov %A0,%3" CR_TAB
-                   "adiw %2,1", xop, plen, 3);
-
-      if (n_bytes >= 2)
-        avr_asm_len ("lpm"        CR_TAB
-                     "mov %B0,%3" CR_TAB
-                     "adiw %2,1", xop, plen, 3);
-
-      break; /* POST_INC */
-      
-    } /* switch CODE (addr) */
-      
-  return "";
+  int n_bytes = GET_MODE_SIZE (mode);
+  
+  return (n_bytes > 1
+          || avr_current_device->n_flash > 1);
 }
 
 
@@ -2337,12 +2509,13 @@ avr_out_lpm_no_lpmx (rtx insn, rtx *xop, int *plen)
 static const char*
 avr_out_lpm (rtx insn, rtx *op, int *plen)
 {
-  rtx xop[5];
+  rtx xop[3];
   rtx dest = op[0];
   rtx src = SET_SRC (single_set (insn));
   rtx addr;
   int n_bytes = GET_MODE_SIZE (GET_MODE (dest));
-  int regno_dest;
+  RTX_CODE code;
+  addr_space_t as = MEM_ADDR_SPACE (src);
 
   if (plen)
     *plen = 0;
@@ -2350,29 +2523,29 @@ avr_out_lpm (rtx insn, rtx *op, int *plen)
   if (MEM_P (dest))
     {
       warning (0, "writing to address space %qs not supported",
-               c_addr_space_name (MEM_ADDR_SPACE (dest)));
+               avr_addrspace[MEM_ADDR_SPACE (dest)].name);
       
       return "";
     }
 
   addr = XEXP (src, 0);
+  code = GET_CODE (addr);
 
-  gcc_assert (!avr_load_libgcc_p (src)
-              && REG_P (dest)
-              && (REG_P (addr) || POST_INC == GET_CODE (addr)));
-
-  xop[0] = dest;
-  xop[1] = addr;
-  xop[2] = lpm_addr_reg_rtx;
+  gcc_assert (REG_P (dest));
+  gcc_assert (REG == code || POST_INC == code);
 
-  regno_dest = REGNO (dest);
+  /* Only 1-byte moves from __flash are representes as open coded
+     mov insns.  All other loads from flash are not handled here but
+     by some UNSPEC instead, see respective FIXME in machine description.  */
+  
+  gcc_assert (as == ADDR_SPACE_FLASH);
+  gcc_assert (n_bytes == 1);
 
-  if (!AVR_HAVE_LPMX)
-    {
-      return avr_out_lpm_no_lpmx (insn, xop, plen);
-    }
+  xop[0] = dest;
+  xop[1] = lpm_addr_reg_rtx;
+  xop[2] = lpm_reg_rtx;
 
-  switch (GET_CODE (addr))
+  switch (code)
     {
     default:
       gcc_unreachable();
@@ -2380,291 +2553,327 @@ avr_out_lpm (rtx insn, rtx *op, int *plen)
     case REG:
 
       gcc_assert (REG_Z == REGNO (addr));
+      
+      return AVR_HAVE_LPMX
+        ? avr_asm_len ("lpm %0,%a1", xop, plen, 1)
+        : avr_asm_len ("lpm" CR_TAB
+                       "mov %0,%2", xop, plen, 2);
+      
+    case POST_INC:
+      
+      gcc_assert (REG_Z == REGNO (XEXP (addr, 0)));
 
-      switch (n_bytes)
-        {
-        default:
-          gcc_unreachable();
+      return AVR_HAVE_LPMX
+        ? avr_asm_len ("lpm %0,%a1+", xop, plen, 1)
+        : avr_asm_len ("lpm"        CR_TAB
+                       "adiw %1, 1" CR_TAB
+                       "mov %0,%2", xop, plen, 3);
+    }
+
+  return "";
+}
 
-        case 1:
-          return avr_asm_len ("lpm %0,%a2", xop, plen, -1);
 
-        case 2:
-          if (REGNO (dest) == REG_Z)
-            return avr_asm_len ("lpm __tmp_reg__,%a2+" CR_TAB
-                                "lpm %B0,%a2"          CR_TAB
-                                "mov %A0,__tmp_reg__", xop, plen, -3);
-          else
+/* If PLEN == NULL: Ouput instructions to load $0 with a value from
+   flash address $1:Z.  If $1 = 0 we can use LPM to read, otherwise
+   use ELPM.
+   If PLEN != 0 set *PLEN to the length in words of the instruction sequence.
+   Return "".  */
+
+const char*
+avr_load_lpm (rtx insn, rtx *op, int *plen)
+{
+  rtx xop[4];
+  int n, n_bytes = GET_MODE_SIZE (GET_MODE (op[0]));
+  rtx xsegment = op[1];
+  bool clobber_z = PARALLEL == GET_CODE (PATTERN (insn));
+  bool r30_in_tmp = false;
+  
+  if (plen)
+    *plen = 0;
+  
+  xop[1] = lpm_addr_reg_rtx;
+  xop[2] = lpm_reg_rtx;
+  xop[3] = xstring_empty;
+  
+  /* Set RAMPZ as needed.  */
+  
+  if (REG_P (xsegment))
+    {
+      avr_asm_len ("out __RAMPZ__,%0", &xsegment, plen, 1);
+      xop[3] = xstring_e;
+    }
+  
+  /* Load the individual bytes from LSB to MSB.  */
+  
+  for (n = 0; n < n_bytes; n++)
+    {
+      xop[0] = all_regs_rtx[REGNO (op[0]) + n];
+      
+      if ((CONST_INT_P (xsegment) && AVR_HAVE_LPMX)
+          || (REG_P (xsegment) && AVR_HAVE_ELPMX))
+        {
+          if (n == n_bytes-1)
+            avr_asm_len ("%3lpm %0,%a1", xop, plen, 1);
+          else if (REGNO (xop[0]) == REG_Z)
             {
-              avr_asm_len ("lpm %A0,%a2+" CR_TAB
-                           "lpm %B0,%a2", xop, plen, -2);
-                
-              if (!reg_unused_after (insn, addr))
-                avr_asm_len ("sbiw %2,1", xop, plen, 1);
+              avr_asm_len ("%3lpm %2,%a1+", xop, plen, 1);
+              r30_in_tmp = true;
             }
+          else
+            avr_asm_len ("%3lpm %0,%a1+", xop, plen, 1);
+        }
+      else
+        {
+          gcc_assert (clobber_z);
           
-          break; /* 2 */
+          avr_asm_len ("%3lpm" CR_TAB
+                       "mov %0,%2", xop, plen, 2);
 
-        case 3:
+          if (n != n_bytes-1)
+            avr_asm_len ("adiw %1,1", xop, plen, 1);
+        }
+    }
+  
+  if (r30_in_tmp)
+    avr_asm_len ("mov %1,%2", xop, plen, 1);
+  
+  if (!clobber_z
+      && n_bytes > 1
+      && !reg_unused_after (insn, lpm_addr_reg_rtx)
+      && !reg_overlap_mentioned_p (op[0], lpm_addr_reg_rtx))
+    {
+      xop[2] = GEN_INT (n_bytes-1);
+      avr_asm_len ("sbiw %1,%2", xop, plen, 1);
+    }
+  
+  if (REG_P (xsegment) && AVR_HAVE_RAMPD)
+    {
+      /* Reset RAMPZ to 0 so that EBI devices don't read garbage from RAM */
+      
+      avr_asm_len ("out __RAMPZ__,__zero_reg__", xop, plen, 1);
+    }
 
-          avr_asm_len ("lpm %A0,%a2+" CR_TAB
-                       "lpm %B0,%a2+" CR_TAB
-                       "lpm %C0,%a2", xop, plen, -3);
-                
-          if (!reg_unused_after (insn, addr))
-            avr_asm_len ("sbiw %2,2", xop, plen, 1);
+  return "";
+}
 
-          break; /* 3 */
-      
-        case 4:
 
-          avr_asm_len ("lpm %A0,%a2+" CR_TAB
-                       "lpm %B0,%a2+", xop, plen, -2);
-          
-          if (REGNO (dest) == REG_Z - 2)
-            return avr_asm_len ("lpm __tmp_reg__,%a2+" CR_TAB
-                                "lpm %C0,%a2"          CR_TAB
-                                "mov %D0,__tmp_reg__", xop, plen, 3);
-          else
-            {
-              avr_asm_len ("lpm %C0,%a2+" CR_TAB
-                           "lpm %D0,%a2", xop, plen, 2);
-                
-              if (!reg_unused_after (insn, addr))
-                avr_asm_len ("sbiw %2,3", xop, plen, 1);
-            }
+/* Worker function for xload_8 insn.  */
 
-          break; /* 4 */
-        } /* n_bytes */
-      
-      break; /* REG */
+const char*
+avr_out_xload (rtx insn ATTRIBUTE_UNUSED, rtx *op, int *plen)
+{
+  rtx xop[4];
 
-    case POST_INC:
+  xop[0] = op[0];
+  xop[1] = op[1];
+  xop[2] = lpm_addr_reg_rtx;
+  xop[3] = AVR_HAVE_LPMX ? op[0] : lpm_reg_rtx;
 
-      gcc_assert (REG_Z == REGNO (XEXP (addr, 0))
-                  && n_bytes <= 4);
+  if (plen)
+    *plen = 0;
 
-      avr_asm_len                    ("lpm %A0,%a2+", xop, plen, -1);
-      if (n_bytes >= 2)  avr_asm_len ("lpm %B0,%a2+", xop, plen, 1);
-      if (n_bytes >= 3)  avr_asm_len ("lpm %C0,%a2+", xop, plen, 1);
-      if (n_bytes >= 4)  avr_asm_len ("lpm %D0,%a2+", xop, plen, 1);
+  avr_asm_len ("sbrc %1,7" CR_TAB
+               "ld %3,%a2" CR_TAB
+               "sbrs %1,7", xop, plen, 3);
 
-      break; /* POST_INC */
+  avr_asm_len (AVR_HAVE_LPMX ? "lpm %3,%a2" : "lpm", xop, plen, 1);
 
-    } /* switch CODE (addr) */
-      
+  if (REGNO (xop[0]) != REGNO (xop[3]))
+    avr_asm_len ("mov %0,%3", xop, plen, 1);
+  
   return "";
 }
 
 
-const char *
-output_movqi (rtx insn, rtx operands[], int *l)
+const char*
+output_movqi (rtx insn, rtx operands[], int *real_l)
 {
-  int dummy;
   rtx dest = operands[0];
   rtx src = operands[1];
-  int *real_l = l;
   
-  if (avr_mem_pgm_p (src)
-      || avr_mem_pgm_p (dest))
+  if (avr_mem_flash_p (src)
+      || avr_mem_flash_p (dest))
     {
       return avr_out_lpm (insn, operands, real_l);
     }
 
-  if (!l)
-    l = &dummy;
-
-  *l = 1;
+  if (real_l)
+    *real_l = 1;
   
   if (register_operand (dest, QImode))
     {
       if (register_operand (src, QImode)) /* mov r,r */
        {
          if (test_hard_reg_class (STACK_REG, dest))
-           return AS2 (out,%0,%1);
+           return "out %0,%1";
          else if (test_hard_reg_class (STACK_REG, src))
-           return AS2 (in,%0,%1);
+           return "in %0,%1";
          
-         return AS2 (mov,%0,%1);
+         return "mov %0,%1";
        }
       else if (CONSTANT_P (src))
         {
           output_reload_in_const (operands, NULL_RTX, real_l, false);
           return "";
         }
-      else if (GET_CODE (src) == MEM)
+      else if (MEM_P (src))
        return out_movqi_r_mr (insn, operands, real_l); /* mov r,m */
     }
-  else if (GET_CODE (dest) == MEM)
+  else if (MEM_P (dest))
     {
-      const char *templ;
-
-      if (src == const0_rtx)
-       operands[1] = zero_reg_rtx;
+      rtx xop[2];
 
-      templ = out_movqi_mr_r (insn, operands, real_l);
+      xop[0] = dest;
+      xop[1] = src == const0_rtx ? zero_reg_rtx : src;
 
-      if (!real_l)
-       output_asm_insn (templ, operands);
-
-      operands[1] = src;
+      return out_movqi_mr_r (insn, xop, real_l);
     }
   return "";
 }
 
 
 const char *
-output_movhi (rtx insn, rtx operands[], int *l)
+output_movhi (rtx insn, rtx xop[], int *plen)
 {
-  int dummy;
-  rtx dest = operands[0];
-  rtx src = operands[1];
-  int *real_l = l;
+  rtx dest = xop[0];
+  rtx src = xop[1];
+
+  gcc_assert (GET_MODE_SIZE (GET_MODE (dest)) == 2);
   
-  if (avr_mem_pgm_p (src)
-      || avr_mem_pgm_p (dest))
+  if (avr_mem_flash_p (src)
+      || avr_mem_flash_p (dest))
     {
-      return avr_out_lpm (insn, operands, real_l);
+      return avr_out_lpm (insn, xop, plen);
     }
 
-  if (!l)
-    l = &dummy;
-  
-  if (register_operand (dest, HImode))
+  if (REG_P (dest))
     {
-      if (register_operand (src, HImode)) /* mov r,r */
-       {
-         if (test_hard_reg_class (STACK_REG, dest))
-           {
-             if (AVR_HAVE_8BIT_SP)
-               return *l = 1, AS2 (out,__SP_L__,%A1);
-              /* Use simple load of stack pointer if no interrupts are 
-                used.  */
-             else if (TARGET_NO_INTERRUPTS)
-               return *l = 2, (AS2 (out,__SP_H__,%B1) CR_TAB
-                               AS2 (out,__SP_L__,%A1));
-             *l = 5;
-             return (AS2 (in,__tmp_reg__,__SREG__)  CR_TAB
-                     "cli"                          CR_TAB
-                     AS2 (out,__SP_H__,%B1)         CR_TAB
-                     AS2 (out,__SREG__,__tmp_reg__) CR_TAB
-                     AS2 (out,__SP_L__,%A1));
-           }
-         else if (test_hard_reg_class (STACK_REG, src))
-           {
-             *l = 2;   
-             return (AS2 (in,%A0,__SP_L__) CR_TAB
-                     AS2 (in,%B0,__SP_H__));
-           }
+      if (REG_P (src)) /* mov r,r */
+        {
+          if (test_hard_reg_class (STACK_REG, dest))
+            {
+              if (AVR_HAVE_8BIT_SP)
+                return avr_asm_len ("out __SP_L__,%A1", xop, plen, -1);
 
-         if (AVR_HAVE_MOVW)
-           {
-             *l = 1;
-             return (AS2 (movw,%0,%1));
-           }
-         else
-           {
-             *l = 2;
-             return (AS2 (mov,%A0,%A1) CR_TAB
-                     AS2 (mov,%B0,%B1));
-           }
-       }
+              if (AVR_XMEGA)
+                return avr_asm_len ("out __SP_L__,%A1" CR_TAB
+                                    "out __SP_H__,%B1", xop, plen, -2);
+              
+              /* Use simple load of SP if no interrupts are  used.  */
+              
+              return TARGET_NO_INTERRUPTS
+                ? avr_asm_len ("out __SP_H__,%B1" CR_TAB
+                               "out __SP_L__,%A1", xop, plen, -2)
+
+                : avr_asm_len ("in __tmp_reg__,__SREG__"  CR_TAB
+                               "cli"                      CR_TAB
+                               "out __SP_H__,%B1"         CR_TAB
+                               "out __SREG__,__tmp_reg__" CR_TAB
+                               "out __SP_L__,%A1", xop, plen, -5);
+            }
+          else if (test_hard_reg_class (STACK_REG, src))
+            {
+              return !AVR_HAVE_SPH
+                ? avr_asm_len ("in %A0,__SP_L__" CR_TAB
+                               "clr %B0", xop, plen, -2)
+                
+                : avr_asm_len ("in %A0,__SP_L__" CR_TAB
+                               "in %B0,__SP_H__", xop, plen, -2);
+            }
+
+          return AVR_HAVE_MOVW
+            ? avr_asm_len ("movw %0,%1", xop, plen, -1)
+
+            : avr_asm_len ("mov %A0,%A1" CR_TAB
+                           "mov %B0,%B1", xop, plen, -2);
+        } /* REG_P (src) */
       else if (CONSTANT_P (src))
         {
-          return output_reload_inhi (operands, NULL, real_l);
+          return output_reload_inhi (xop, NULL, plen);
+        }
+      else if (MEM_P (src))
+        {
+          return out_movhi_r_mr (insn, xop, plen); /* mov r,m */
         }
-      else if (GET_CODE (src) == MEM)
-       return out_movhi_r_mr (insn, operands, real_l); /* mov r,m */
     }
-  else if (GET_CODE (dest) == MEM)
+  else if (MEM_P (dest))
     {
-      const char *templ;
-
-      if (src == const0_rtx)
-       operands[1] = zero_reg_rtx;
+      rtx xop[2];
 
-      templ = out_movhi_mr_r (insn, operands, real_l);
-
-      if (!real_l)
-       output_asm_insn (templ, operands);
+      xop[0] = dest;
+      xop[1] = src == const0_rtx ? zero_reg_rtx : src;
 
-      operands[1] = src;
-      return "";
+      return out_movhi_mr_r (insn, xop, plen);
     }
+  
   fatal_insn ("invalid insn:", insn);
+  
   return "";
 }
 
-const char *
-out_movqi_r_mr (rtx insn, rtx op[], int *l)
+static const char*
+out_movqi_r_mr (rtx insn, rtx op[], int *plen)
 {
   rtx dest = op[0];
   rtx src = op[1];
   rtx x = XEXP (src, 0);
-  int dummy;
-  
-  if (!l)
-    l = &dummy;
   
   if (CONSTANT_ADDRESS_P (x))
     {
-      if (CONST_INT_P (x) && INTVAL (x) == SREG_ADDR)
-       {
-         *l = 1;
-         return AS2 (in,%0,__SREG__);
-       }
-      if (optimize > 0 && io_address_operand (x, QImode))
-       {
-         *l = 1;
-         return AS2 (in,%0,%m1-0x20);
-       }
-      *l = 2;
-      return AS2 (lds,%0,%m1);
+      return optimize > 0 && io_address_operand (x, QImode)
+        ? avr_asm_len ("in %0,%i1", op, plen, -1)
+        : avr_asm_len ("lds %0,%m1", op, plen, -2);
     }
-  /* memory access by reg+disp */
   else if (GET_CODE (x) == PLUS
-      && REG_P (XEXP (x,0))
-      && GET_CODE (XEXP (x,1)) == CONST_INT)
+           && REG_P (XEXP (x, 0))
+           && CONST_INT_P (XEXP (x, 1)))
     {
-      if ((INTVAL (XEXP (x,1)) - GET_MODE_SIZE (GET_MODE (src))) >= 63)
-       {
-         int disp = INTVAL (XEXP (x,1));
-         if (REGNO (XEXP (x,0)) != REG_Y)
-           fatal_insn ("incorrect insn:",insn);
+      /* memory access by reg+disp */
 
-         if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (src)))
-           return *l = 3, (AS2 (adiw,r28,%o1-63) CR_TAB
-                           AS2 (ldd,%0,Y+63)     CR_TAB
-                           AS2 (sbiw,r28,%o1-63));
-
-         return *l = 5, (AS2 (subi,r28,lo8(-%o1)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o1)) CR_TAB
-                         AS2 (ld,%0,Y)            CR_TAB
-                         AS2 (subi,r28,lo8(%o1))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o1)));
-       }
-      else if (REGNO (XEXP (x,0)) == REG_X)
-       {
-         /* This is a paranoid case LEGITIMIZE_RELOAD_ADDRESS must exclude
-            it but I have this situation with extremal optimizing options.  */
-         if (reg_overlap_mentioned_p (dest, XEXP (x,0))
-             || reg_unused_after (insn, XEXP (x,0)))
-           return *l = 2, (AS2 (adiw,r26,%o1) CR_TAB
-                           AS2 (ld,%0,X));
-
-         return *l = 3, (AS2 (adiw,r26,%o1) CR_TAB
-                         AS2 (ld,%0,X)      CR_TAB
-                         AS2 (sbiw,r26,%o1));
-       }
-      *l = 1;
-      return AS2 (ldd,%0,%1);
+      int disp = INTVAL (XEXP (x, 1));
+      
+      if (disp - GET_MODE_SIZE (GET_MODE (src)) >= 63)
+        {
+          if (REGNO (XEXP (x, 0)) != REG_Y)
+            fatal_insn ("incorrect insn:",insn);
+
+          if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (src)))
+            return avr_asm_len ("adiw r28,%o1-63" CR_TAB
+                                "ldd %0,Y+63"     CR_TAB
+                                "sbiw r28,%o1-63", op, plen, -3);
+
+          return avr_asm_len ("subi r28,lo8(-%o1)" CR_TAB
+                              "sbci r29,hi8(-%o1)" CR_TAB
+                              "ld %0,Y"            CR_TAB
+                              "subi r28,lo8(%o1)"  CR_TAB
+                              "sbci r29,hi8(%o1)", op, plen, -5);
+        }
+      else if (REGNO (XEXP (x, 0)) == REG_X)
+        {
+          /* This is a paranoid case LEGITIMIZE_RELOAD_ADDRESS must exclude
+             it but I have this situation with extremal optimizing options.  */
+          
+          avr_asm_len ("adiw r26,%o1" CR_TAB
+                       "ld %0,X", op, plen, -2);
+          
+          if (!reg_overlap_mentioned_p (dest, XEXP (x,0))
+              && !reg_unused_after (insn, XEXP (x,0)))
+            {
+              avr_asm_len ("sbiw r26,%o1", op, plen, 1);
+            }
+
+          return "";
+        }
+
+      return avr_asm_len ("ldd %0,%1", op, plen, -1);
     }
-  *l = 1;
-  return AS2 (ld,%0,%1);
+  
+  return avr_asm_len ("ld %0,%1", op, plen, -1);
 }
 
-const char *
-out_movhi_r_mr (rtx insn, rtx op[], int *l)
+static const char*
+out_movhi_r_mr (rtx insn, rtx op[], int *plen)
 {
   rtx dest = op[0];
   rtx src = op[1];
@@ -2674,39 +2883,25 @@ out_movhi_r_mr (rtx insn, rtx op[], int *l)
   /* "volatile" forces reading low byte first, even if less efficient,
      for correct operation with 16-bit I/O registers.  */
   int mem_volatile_p = MEM_VOLATILE_P (src);
-  int tmp;
-
-  if (!l)
-    l = &tmp;
 
   if (reg_base > 0)
     {
       if (reg_dest == reg_base)         /* R = (R) */
-       {
-         *l = 3;
-         return (AS2 (ld,__tmp_reg__,%1+) CR_TAB
-                 AS2 (ld,%B0,%1) CR_TAB
-                 AS2 (mov,%A0,__tmp_reg__));
-       }
-      else if (reg_base == REG_X)        /* (R26) */
-        {
-          if (reg_unused_after (insn, base))
-           {
-             *l = 2;
-             return (AS2 (ld,%A0,X+) CR_TAB
-                     AS2 (ld,%B0,X));
-           }
-         *l  = 3;
-         return (AS2 (ld,%A0,X+) CR_TAB
-                 AS2 (ld,%B0,X) CR_TAB
-                 AS2 (sbiw,r26,1));
-        }
-      else                      /* (R)  */
-       {
-         *l = 2;
-         return (AS2 (ld,%A0,%1)    CR_TAB
-                 AS2 (ldd,%B0,%1+1));
-       }
+        return avr_asm_len ("ld __tmp_reg__,%1+" CR_TAB
+                            "ld %B0,%1"          CR_TAB
+                            "mov %A0,__tmp_reg__", op, plen, -3);
+
+      if (reg_base != REG_X)
+        return avr_asm_len ("ld %A0,%1" CR_TAB
+                            "ldd %B0,%1+1", op, plen, -2);
+      
+      avr_asm_len ("ld %A0,X+" CR_TAB
+                   "ld %B0,X", op, plen, -2);
+          
+      if (!reg_unused_after (insn, base))
+        avr_asm_len ("sbiw r26,1", op, plen, 1);
+
+      return "";
     }
   else if (GET_CODE (base) == PLUS) /* (R + i) */
     {
@@ -2714,109 +2909,90 @@ out_movhi_r_mr (rtx insn, rtx op[], int *l)
       int reg_base = true_regnum (XEXP (base, 0));
       
       if (disp > MAX_LD_OFFSET (GET_MODE (src)))
-       {
-         if (REGNO (XEXP (base, 0)) != REG_Y)
-           fatal_insn ("incorrect insn:",insn);
-         
-         if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (src)))
-           return *l = 4, (AS2 (adiw,r28,%o1-62) CR_TAB
-                           AS2 (ldd,%A0,Y+62)    CR_TAB
-                           AS2 (ldd,%B0,Y+63)    CR_TAB
-                           AS2 (sbiw,r28,%o1-62));
-
-         return *l = 6, (AS2 (subi,r28,lo8(-%o1)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o1)) CR_TAB
-                         AS2 (ld,%A0,Y)           CR_TAB
-                         AS2 (ldd,%B0,Y+1)        CR_TAB
-                         AS2 (subi,r28,lo8(%o1))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o1)));
-       }
+        {
+          if (REGNO (XEXP (base, 0)) != REG_Y)
+            fatal_insn ("incorrect insn:",insn);
+          
+          return disp <= 63 + MAX_LD_OFFSET (GET_MODE (src))
+            ? avr_asm_len ("adiw r28,%o1-62" CR_TAB
+                           "ldd %A0,Y+62"    CR_TAB
+                           "ldd %B0,Y+63"    CR_TAB
+                           "sbiw r28,%o1-62", op, plen, -4)
+
+            : avr_asm_len ("subi r28,lo8(-%o1)" CR_TAB
+                           "sbci r29,hi8(-%o1)" CR_TAB
+                           "ld %A0,Y"           CR_TAB
+                           "ldd %B0,Y+1"        CR_TAB
+                           "subi r28,lo8(%o1)"  CR_TAB
+                           "sbci r29,hi8(%o1)", op, plen, -6);
+        }
+
+      /* This is a paranoid case. LEGITIMIZE_RELOAD_ADDRESS must exclude
+         it but I have this situation with extremal
+         optimization options.  */
+
       if (reg_base == REG_X)
-       {
-         /* This is a paranoid case. LEGITIMIZE_RELOAD_ADDRESS must exclude
-            it but I have this situation with extremal
-            optimization options.  */
-         
-         *l = 4;
-         if (reg_base == reg_dest)
-           return (AS2 (adiw,r26,%o1)      CR_TAB
-                   AS2 (ld,__tmp_reg__,X+) CR_TAB
-                   AS2 (ld,%B0,X)          CR_TAB
-                   AS2 (mov,%A0,__tmp_reg__));
-
-         return (AS2 (adiw,r26,%o1) CR_TAB
-                 AS2 (ld,%A0,X+)    CR_TAB
-                 AS2 (ld,%B0,X)     CR_TAB
-                 AS2 (sbiw,r26,%o1+1));
-       }
+        return reg_base == reg_dest
+          ? avr_asm_len ("adiw r26,%o1"      CR_TAB
+                         "ld __tmp_reg__,X+" CR_TAB
+                         "ld %B0,X"          CR_TAB
+                         "mov %A0,__tmp_reg__", op, plen, -4)
 
-      if (reg_base == reg_dest)
-       {
-         *l = 3;
-         return (AS2 (ldd,__tmp_reg__,%A1) CR_TAB
-                 AS2 (ldd,%B0,%B1)         CR_TAB
-                 AS2 (mov,%A0,__tmp_reg__));
-       }
-      
-      *l = 2;
-      return (AS2 (ldd,%A0,%A1) CR_TAB
-             AS2 (ldd,%B0,%B1));
+          : avr_asm_len ("adiw r26,%o1" CR_TAB
+                         "ld %A0,X+"    CR_TAB
+                         "ld %B0,X"     CR_TAB
+                         "sbiw r26,%o1+1", op, plen, -4);
+
+      return reg_base == reg_dest
+        ? avr_asm_len ("ldd __tmp_reg__,%A1" CR_TAB
+                       "ldd %B0,%B1"         CR_TAB
+                       "mov %A0,__tmp_reg__", op, plen, -3)
+
+        : avr_asm_len ("ldd %A0,%A1" CR_TAB
+                       "ldd %B0,%B1", op, plen, -2);
     }
   else if (GET_CODE (base) == PRE_DEC) /* (--R) */
     {
       if (reg_overlap_mentioned_p (dest, XEXP (base, 0)))
-       fatal_insn ("incorrect insn:", insn);
-
-      if (mem_volatile_p)
-        {
-          if (REGNO (XEXP (base, 0)) == REG_X)
-            {
-              *l = 4;
-              return (AS2 (sbiw,r26,2)  CR_TAB
-                      AS2 (ld,%A0,X+)   CR_TAB
-                      AS2 (ld,%B0,X)    CR_TAB
-                      AS2 (sbiw,r26,1));
-            }
-          else
-            {
-              *l = 3;
-              return (AS2 (sbiw,%r1,2)   CR_TAB
-                      AS2 (ld,%A0,%p1)  CR_TAB
-                      AS2 (ldd,%B0,%p1+1));
-            }
-        }
+        fatal_insn ("incorrect insn:", insn);
 
-      *l = 2;
-      return (AS2 (ld,%B0,%1) CR_TAB
-             AS2 (ld,%A0,%1));
+      if (!mem_volatile_p)
+        return avr_asm_len ("ld %B0,%1" CR_TAB
+                            "ld %A0,%1", op, plen, -2);
+      
+      return REGNO (XEXP (base, 0)) == REG_X
+        ? avr_asm_len ("sbiw r26,2"  CR_TAB
+                       "ld %A0,X+"   CR_TAB
+                       "ld %B0,X"    CR_TAB
+                       "sbiw r26,1", op, plen, -4)
+        
+        : avr_asm_len ("sbiw %r1,2"  CR_TAB
+                       "ld %A0,%p1"  CR_TAB
+                       "ldd %B0,%p1+1", op, plen, -3);
     }
   else if (GET_CODE (base) == POST_INC) /* (R++) */
     {
       if (reg_overlap_mentioned_p (dest, XEXP (base, 0)))
-       fatal_insn ("incorrect insn:", insn);
+        fatal_insn ("incorrect insn:", insn);
 
-      *l = 2;
-      return (AS2 (ld,%A0,%1)  CR_TAB
-             AS2 (ld,%B0,%1));
+      return avr_asm_len ("ld %A0,%1"  CR_TAB
+                          "ld %B0,%1", op, plen, -2);
     }
   else if (CONSTANT_ADDRESS_P (base))
     {
-      if (optimize > 0 && io_address_operand (base, HImode))
-       {
-         *l = 2;
-         return (AS2 (in,%A0,%m1-0x20) CR_TAB
-                 AS2 (in,%B0,%m1+1-0x20));
-       }
-      *l = 4;
-      return (AS2 (lds,%A0,%m1) CR_TAB
-             AS2 (lds,%B0,%m1+1));
+      return optimize > 0 && io_address_operand (base, HImode)
+        ? avr_asm_len ("in %A0,%i1" CR_TAB
+                       "in %B0,%i1+1", op, plen, -2)
+
+        : avr_asm_len ("lds %A0,%m1" CR_TAB
+                       "lds %B0,%m1+1", op, plen, -4);
     }
   
   fatal_insn ("unknown move insn:",insn);
   return "";
 }
 
-const char *
+static const char*
 out_movsi_r_mr (rtx insn, rtx op[], int *l)
 {
   rtx dest = op[0];
@@ -2835,50 +3011,50 @@ out_movsi_r_mr (rtx insn, rtx op[], int *l)
         {
           if (reg_dest == REG_X)
            /* "ld r26,-X" is undefined */
-           return *l=7, (AS2 (adiw,r26,3)        CR_TAB
-                         AS2 (ld,r29,X)          CR_TAB
-                         AS2 (ld,r28,-X)         CR_TAB
-                         AS2 (ld,__tmp_reg__,-X) CR_TAB
-                         AS2 (sbiw,r26,1)        CR_TAB
-                         AS2 (ld,r26,X)          CR_TAB
-                         AS2 (mov,r27,__tmp_reg__));
+           return *l=7, ("adiw r26,3"        CR_TAB
+                         "ld r29,X"          CR_TAB
+                         "ld r28,-X"         CR_TAB
+                         "ld __tmp_reg__,-X" CR_TAB
+                         "sbiw r26,1"        CR_TAB
+                         "ld r26,X"          CR_TAB
+                         "mov r27,__tmp_reg__");
           else if (reg_dest == REG_X - 2)
-            return *l=5, (AS2 (ld,%A0,X+)  CR_TAB
-                          AS2 (ld,%B0,X+) CR_TAB
-                          AS2 (ld,__tmp_reg__,X+)  CR_TAB
-                          AS2 (ld,%D0,X)  CR_TAB
-                          AS2 (mov,%C0,__tmp_reg__));
+            return *l=5, ("ld %A0,X+"          CR_TAB
+                          "ld %B0,X+"          CR_TAB
+                          "ld __tmp_reg__,X+"  CR_TAB
+                          "ld %D0,X"           CR_TAB
+                          "mov %C0,__tmp_reg__");
           else if (reg_unused_after (insn, base))
-            return  *l=4, (AS2 (ld,%A0,X+)  CR_TAB
-                           AS2 (ld,%B0,X+) CR_TAB
-                           AS2 (ld,%C0,X+) CR_TAB
-                           AS2 (ld,%D0,X));
+            return  *l=4, ("ld %A0,X+"  CR_TAB
+                           "ld %B0,X+" CR_TAB
+                           "ld %C0,X+" CR_TAB
+                           "ld %D0,X");
           else
-            return  *l=5, (AS2 (ld,%A0,X+)  CR_TAB
-                           AS2 (ld,%B0,X+) CR_TAB
-                           AS2 (ld,%C0,X+) CR_TAB
-                           AS2 (ld,%D0,X)  CR_TAB
-                           AS2 (sbiw,r26,3));
+            return  *l=5, ("ld %A0,X+"  CR_TAB
+                           "ld %B0,X+" CR_TAB
+                           "ld %C0,X+" CR_TAB
+                           "ld %D0,X"  CR_TAB
+                           "sbiw r26,3");
         }
       else
         {
           if (reg_dest == reg_base)
-            return *l=5, (AS2 (ldd,%D0,%1+3) CR_TAB
-                          AS2 (ldd,%C0,%1+2) CR_TAB
-                          AS2 (ldd,__tmp_reg__,%1+1)  CR_TAB
-                          AS2 (ld,%A0,%1)  CR_TAB
-                          AS2 (mov,%B0,__tmp_reg__));
+            return *l=5, ("ldd %D0,%1+3" CR_TAB
+                          "ldd %C0,%1+2" CR_TAB
+                          "ldd __tmp_reg__,%1+1"  CR_TAB
+                          "ld %A0,%1"  CR_TAB
+                          "mov %B0,__tmp_reg__");
           else if (reg_base == reg_dest + 2)
-            return *l=5, (AS2 (ld ,%A0,%1)    CR_TAB
-                          AS2 (ldd,%B0,%1+1) CR_TAB
-                          AS2 (ldd,__tmp_reg__,%1+2)  CR_TAB
-                          AS2 (ldd,%D0,%1+3) CR_TAB
-                          AS2 (mov,%C0,__tmp_reg__));
+            return *l=5, ("ld %A0,%1"             CR_TAB
+                          "ldd %B0,%1+1"          CR_TAB
+                          "ldd __tmp_reg__,%1+2"  CR_TAB
+                          "ldd %D0,%1+3"          CR_TAB
+                          "mov %C0,__tmp_reg__");
           else
-            return *l=4, (AS2 (ld ,%A0,%1)   CR_TAB
-                          AS2 (ldd,%B0,%1+1) CR_TAB
-                          AS2 (ldd,%C0,%1+2) CR_TAB
-                          AS2 (ldd,%D0,%1+3));
+            return *l=4, ("ld %A0,%1"    CR_TAB
+                          "ldd %B0,%1+1" CR_TAB
+                          "ldd %C0,%1+2" CR_TAB
+                          "ldd %D0,%1+3");
         }
     }
   else if (GET_CODE (base) == PLUS) /* (R + i) */
@@ -2891,21 +3067,21 @@ out_movsi_r_mr (rtx insn, rtx op[], int *l)
            fatal_insn ("incorrect insn:",insn);
 
          if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (src)))
-           return *l = 6, (AS2 (adiw,r28,%o1-60) CR_TAB
-                           AS2 (ldd,%A0,Y+60)    CR_TAB
-                           AS2 (ldd,%B0,Y+61)    CR_TAB
-                           AS2 (ldd,%C0,Y+62)    CR_TAB
-                           AS2 (ldd,%D0,Y+63)    CR_TAB
-                           AS2 (sbiw,r28,%o1-60));
-
-         return *l = 8, (AS2 (subi,r28,lo8(-%o1)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o1)) CR_TAB
-                         AS2 (ld,%A0,Y)           CR_TAB
-                         AS2 (ldd,%B0,Y+1)        CR_TAB
-                         AS2 (ldd,%C0,Y+2)        CR_TAB
-                         AS2 (ldd,%D0,Y+3)        CR_TAB
-                         AS2 (subi,r28,lo8(%o1))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o1)));
+           return *l = 6, ("adiw r28,%o1-60" CR_TAB
+                           "ldd %A0,Y+60"    CR_TAB
+                           "ldd %B0,Y+61"    CR_TAB
+                           "ldd %C0,Y+62"    CR_TAB
+                           "ldd %D0,Y+63"    CR_TAB
+                           "sbiw r28,%o1-60");
+
+         return *l = 8, ("subi r28,lo8(-%o1)" CR_TAB
+                         "sbci r29,hi8(-%o1)" CR_TAB
+                         "ld %A0,Y"           CR_TAB
+                         "ldd %B0,Y+1"        CR_TAB
+                         "ldd %C0,Y+2"        CR_TAB
+                         "ldd %D0,Y+3"        CR_TAB
+                         "subi r28,lo8(%o1)"  CR_TAB
+                         "sbci r29,hi8(%o1)");
        }
 
       reg_base = true_regnum (XEXP (base, 0));
@@ -2916,68 +3092,68 @@ out_movsi_r_mr (rtx insn, rtx op[], int *l)
            {
              *l = 7;
              /* "ld r26,-X" is undefined */
-             return (AS2 (adiw,r26,%o1+3)    CR_TAB
-                     AS2 (ld,r29,X)          CR_TAB
-                     AS2 (ld,r28,-X)         CR_TAB
-                     AS2 (ld,__tmp_reg__,-X) CR_TAB
-                     AS2 (sbiw,r26,1)        CR_TAB
-                     AS2 (ld,r26,X)          CR_TAB
-                     AS2 (mov,r27,__tmp_reg__));
+             return ("adiw r26,%o1+3"    CR_TAB
+                     "ld r29,X"          CR_TAB
+                     "ld r28,-X"         CR_TAB
+                     "ld __tmp_reg__,-X" CR_TAB
+                     "sbiw r26,1"        CR_TAB
+                     "ld r26,X"          CR_TAB
+                     "mov r27,__tmp_reg__");
            }
          *l = 6;
          if (reg_dest == REG_X - 2)
-           return (AS2 (adiw,r26,%o1)      CR_TAB
-                   AS2 (ld,r24,X+)         CR_TAB
-                   AS2 (ld,r25,X+)         CR_TAB
-                   AS2 (ld,__tmp_reg__,X+) CR_TAB
-                   AS2 (ld,r27,X)          CR_TAB
-                   AS2 (mov,r26,__tmp_reg__));
-
-         return (AS2 (adiw,r26,%o1) CR_TAB
-                 AS2 (ld,%A0,X+)    CR_TAB
-                 AS2 (ld,%B0,X+)    CR_TAB
-                 AS2 (ld,%C0,X+)    CR_TAB
-                 AS2 (ld,%D0,X)     CR_TAB
-                 AS2 (sbiw,r26,%o1+3));
+           return ("adiw r26,%o1"      CR_TAB
+                   "ld r24,X+"         CR_TAB
+                   "ld r25,X+"         CR_TAB
+                   "ld __tmp_reg__,X+" CR_TAB
+                   "ld r27,X"          CR_TAB
+                   "mov r26,__tmp_reg__");
+
+         return ("adiw r26,%o1" CR_TAB
+                 "ld %A0,X+"    CR_TAB
+                 "ld %B0,X+"    CR_TAB
+                 "ld %C0,X+"    CR_TAB
+                 "ld %D0,X"     CR_TAB
+                 "sbiw r26,%o1+3");
        }
       if (reg_dest == reg_base)
-        return *l=5, (AS2 (ldd,%D0,%D1) CR_TAB
-                      AS2 (ldd,%C0,%C1) CR_TAB
-                      AS2 (ldd,__tmp_reg__,%B1)  CR_TAB
-                      AS2 (ldd,%A0,%A1) CR_TAB
-                      AS2 (mov,%B0,__tmp_reg__));
+        return *l=5, ("ldd %D0,%D1"          CR_TAB
+                      "ldd %C0,%C1"          CR_TAB
+                      "ldd __tmp_reg__,%B1"  CR_TAB
+                      "ldd %A0,%A1"          CR_TAB
+                      "mov %B0,__tmp_reg__");
       else if (reg_dest == reg_base - 2)
-        return *l=5, (AS2 (ldd,%A0,%A1) CR_TAB
-                      AS2 (ldd,%B0,%B1) CR_TAB
-                      AS2 (ldd,__tmp_reg__,%C1)  CR_TAB
-                      AS2 (ldd,%D0,%D1) CR_TAB
-                      AS2 (mov,%C0,__tmp_reg__));
-      return *l=4, (AS2 (ldd,%A0,%A1) CR_TAB
-                    AS2 (ldd,%B0,%B1) CR_TAB
-                    AS2 (ldd,%C0,%C1) CR_TAB
-                    AS2 (ldd,%D0,%D1));
+        return *l=5, ("ldd %A0,%A1"          CR_TAB
+                      "ldd %B0,%B1"          CR_TAB
+                      "ldd __tmp_reg__,%C1"  CR_TAB
+                      "ldd %D0,%D1"          CR_TAB
+                      "mov %C0,__tmp_reg__");
+      return *l=4, ("ldd %A0,%A1" CR_TAB
+                    "ldd %B0,%B1" CR_TAB
+                    "ldd %C0,%C1" CR_TAB
+                    "ldd %D0,%D1");
     }
   else if (GET_CODE (base) == PRE_DEC) /* (--R) */
-    return *l=4, (AS2 (ld,%D0,%1) CR_TAB
-                 AS2 (ld,%C0,%1) CR_TAB
-                 AS2 (ld,%B0,%1) CR_TAB
-                 AS2 (ld,%A0,%1));
+    return *l=4, ("ld %D0,%1" CR_TAB
+                 "ld %C0,%1" CR_TAB
+                 "ld %B0,%1" CR_TAB
+                 "ld %A0,%1");
   else if (GET_CODE (base) == POST_INC) /* (R++) */
-    return *l=4, (AS2 (ld,%A0,%1) CR_TAB
-                 AS2 (ld,%B0,%1) CR_TAB
-                 AS2 (ld,%C0,%1) CR_TAB
-                 AS2 (ld,%D0,%1));
+    return *l=4, ("ld %A0,%1" CR_TAB
+                 "ld %B0,%1" CR_TAB
+                 "ld %C0,%1" CR_TAB
+                 "ld %D0,%1");
   else if (CONSTANT_ADDRESS_P (base))
-      return *l=8, (AS2 (lds,%A0,%m1) CR_TAB
-                   AS2 (lds,%B0,%m1+1) CR_TAB
-                   AS2 (lds,%C0,%m1+2) CR_TAB
-                   AS2 (lds,%D0,%m1+3));
+    return *l=8, ("lds %A0,%m1"   CR_TAB
+                  "lds %B0,%m1+1" CR_TAB
+                  "lds %C0,%m1+2" CR_TAB
+                  "lds %D0,%m1+3");
     
   fatal_insn ("unknown move insn:",insn);
   return "";
 }
 
-const char *
+static const char*
 out_movsi_mr_r (rtx insn, rtx op[], int *l)
 {
   rtx dest = op[0];
@@ -2991,10 +3167,10 @@ out_movsi_mr_r (rtx insn, rtx op[], int *l)
     l = &tmp;
   
   if (CONSTANT_ADDRESS_P (base))
-    return *l=8,(AS2 (sts,%m0,%A1) CR_TAB
-                AS2 (sts,%m0+1,%B1) CR_TAB
-                AS2 (sts,%m0+2,%C1) CR_TAB
-                AS2 (sts,%m0+3,%D1));
+    return *l=8,("sts %m0,%A1" CR_TAB
+                 "sts %m0+1,%B1" CR_TAB
+                 "sts %m0+2,%C1" CR_TAB
+                 "sts %m0+3,%D1");
   if (reg_base > 0)                 /* (r) */
     {
       if (reg_base == REG_X)                /* (R26) */
@@ -3003,52 +3179,52 @@ out_movsi_mr_r (rtx insn, rtx op[], int *l)
             {
              /* "st X+,r26" is undefined */
               if (reg_unused_after (insn, base))
-               return *l=6, (AS2 (mov,__tmp_reg__,r27) CR_TAB
-                             AS2 (st,X,r26)            CR_TAB
-                             AS2 (adiw,r26,1)          CR_TAB
-                             AS2 (st,X+,__tmp_reg__)   CR_TAB
-                             AS2 (st,X+,r28)           CR_TAB
-                             AS2 (st,X,r29));
+               return *l=6, ("mov __tmp_reg__,r27" CR_TAB
+                             "st X,r26"            CR_TAB
+                             "adiw r26,1"          CR_TAB
+                             "st X+,__tmp_reg__"   CR_TAB
+                             "st X+,r28"           CR_TAB
+                             "st X,r29");
               else
-                return *l=7, (AS2 (mov,__tmp_reg__,r27) CR_TAB
-                             AS2 (st,X,r26)            CR_TAB
-                             AS2 (adiw,r26,1)          CR_TAB
-                             AS2 (st,X+,__tmp_reg__)   CR_TAB
-                             AS2 (st,X+,r28)           CR_TAB
-                             AS2 (st,X,r29)            CR_TAB
-                             AS2 (sbiw,r26,3));
+                return *l=7, ("mov __tmp_reg__,r27" CR_TAB
+                             "st X,r26"            CR_TAB
+                             "adiw r26,1"          CR_TAB
+                             "st X+,__tmp_reg__"   CR_TAB
+                             "st X+,r28"           CR_TAB
+                             "st X,r29"            CR_TAB
+                             "sbiw r26,3");
             }
           else if (reg_base == reg_src + 2)
             {
               if (reg_unused_after (insn, base))
-                return *l=7, (AS2 (mov,__zero_reg__,%C1) CR_TAB
-                              AS2 (mov,__tmp_reg__,%D1) CR_TAB
-                              AS2 (st,%0+,%A1) CR_TAB
-                              AS2 (st,%0+,%B1) CR_TAB
-                              AS2 (st,%0+,__zero_reg__)  CR_TAB
-                              AS2 (st,%0,__tmp_reg__)   CR_TAB
-                              AS1 (clr,__zero_reg__));
+                return *l=7, ("mov __zero_reg__,%C1" CR_TAB
+                              "mov __tmp_reg__,%D1"  CR_TAB
+                              "st %0+,%A1"           CR_TAB
+                              "st %0+,%B1"           CR_TAB
+                              "st %0+,__zero_reg__"  CR_TAB
+                              "st %0,__tmp_reg__"    CR_TAB
+                              "clr __zero_reg__");
               else
-                return *l=8, (AS2 (mov,__zero_reg__,%C1) CR_TAB
-                              AS2 (mov,__tmp_reg__,%D1) CR_TAB
-                              AS2 (st,%0+,%A1) CR_TAB
-                              AS2 (st,%0+,%B1) CR_TAB
-                              AS2 (st,%0+,__zero_reg__)  CR_TAB
-                              AS2 (st,%0,__tmp_reg__)   CR_TAB
-                              AS1 (clr,__zero_reg__)     CR_TAB
-                              AS2 (sbiw,r26,3));
+                return *l=8, ("mov __zero_reg__,%C1" CR_TAB
+                              "mov __tmp_reg__,%D1"  CR_TAB
+                              "st %0+,%A1"           CR_TAB
+                              "st %0+,%B1"           CR_TAB
+                              "st %0+,__zero_reg__"  CR_TAB
+                              "st %0,__tmp_reg__"    CR_TAB
+                              "clr __zero_reg__"     CR_TAB
+                              "sbiw r26,3");
             }
-          return *l=5, (AS2 (st,%0+,%A1)  CR_TAB
-                        AS2 (st,%0+,%B1) CR_TAB
-                        AS2 (st,%0+,%C1) CR_TAB
-                        AS2 (st,%0,%D1)  CR_TAB
-                        AS2 (sbiw,r26,3));
+          return *l=5, ("st %0+,%A1" CR_TAB
+                        "st %0+,%B1" CR_TAB
+                        "st %0+,%C1" CR_TAB
+                        "st %0,%D1"  CR_TAB
+                        "sbiw r26,3");
         }
       else
-        return *l=4, (AS2 (st,%0,%A1)    CR_TAB
-                     AS2 (std,%0+1,%B1) CR_TAB
-                     AS2 (std,%0+2,%C1) CR_TAB
-                     AS2 (std,%0+3,%D1));
+        return *l=4, ("st %0,%A1"    CR_TAB
+                     "std %0+1,%B1" CR_TAB
+                     "std %0+2,%C1" CR_TAB
+                     "std %0+3,%D1");
     }
   else if (GET_CODE (base) == PLUS) /* (R + i) */
     {
@@ -3060,21 +3236,21 @@ out_movsi_mr_r (rtx insn, rtx op[], int *l)
            fatal_insn ("incorrect insn:",insn);
 
          if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest)))
-           return *l = 6, (AS2 (adiw,r28,%o0-60) CR_TAB
-                           AS2 (std,Y+60,%A1)    CR_TAB
-                           AS2 (std,Y+61,%B1)    CR_TAB
-                           AS2 (std,Y+62,%C1)    CR_TAB
-                           AS2 (std,Y+63,%D1)    CR_TAB
-                           AS2 (sbiw,r28,%o0-60));
-
-         return *l = 8, (AS2 (subi,r28,lo8(-%o0)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o0)) CR_TAB
-                         AS2 (st,Y,%A1)           CR_TAB
-                         AS2 (std,Y+1,%B1)        CR_TAB
-                         AS2 (std,Y+2,%C1)        CR_TAB
-                         AS2 (std,Y+3,%D1)        CR_TAB
-                         AS2 (subi,r28,lo8(%o0))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o0)));
+           return *l = 6, ("adiw r28,%o0-60" CR_TAB
+                           "std Y+60,%A1"    CR_TAB
+                           "std Y+61,%B1"    CR_TAB
+                           "std Y+62,%C1"    CR_TAB
+                           "std Y+63,%D1"    CR_TAB
+                           "sbiw r28,%o0-60");
+
+         return *l = 8, ("subi r28,lo8(-%o0)" CR_TAB
+                         "sbci r29,hi8(-%o0)" CR_TAB
+                         "st Y,%A1"           CR_TAB
+                         "std Y+1,%B1"        CR_TAB
+                         "std Y+2,%C1"        CR_TAB
+                         "std Y+3,%D1"        CR_TAB
+                         "subi r28,lo8(%o0)"  CR_TAB
+                         "sbci r29,hi8(%o0)");
        }
       if (reg_base == REG_X)
        {
@@ -3082,52 +3258,52 @@ out_movsi_mr_r (rtx insn, rtx op[], int *l)
          if (reg_src == REG_X)
            {
              *l = 9;
-             return (AS2 (mov,__tmp_reg__,r26)  CR_TAB
-                     AS2 (mov,__zero_reg__,r27) CR_TAB
-                     AS2 (adiw,r26,%o0)         CR_TAB
-                     AS2 (st,X+,__tmp_reg__)    CR_TAB
-                     AS2 (st,X+,__zero_reg__)   CR_TAB
-                     AS2 (st,X+,r28)            CR_TAB
-                     AS2 (st,X,r29)             CR_TAB
-                     AS1 (clr,__zero_reg__)     CR_TAB
-                     AS2 (sbiw,r26,%o0+3));
+             return ("mov __tmp_reg__,r26"  CR_TAB
+                     "mov __zero_reg__,r27" CR_TAB
+                     "adiw r26,%o0"         CR_TAB
+                     "st X+,__tmp_reg__"    CR_TAB
+                     "st X+,__zero_reg__"   CR_TAB
+                     "st X+,r28"            CR_TAB
+                     "st X,r29"             CR_TAB
+                     "clr __zero_reg__"     CR_TAB
+                     "sbiw r26,%o0+3");
            }
          else if (reg_src == REG_X - 2)
            {
              *l = 9;
-             return (AS2 (mov,__tmp_reg__,r26)  CR_TAB
-                     AS2 (mov,__zero_reg__,r27) CR_TAB
-                     AS2 (adiw,r26,%o0)         CR_TAB
-                     AS2 (st,X+,r24)            CR_TAB
-                     AS2 (st,X+,r25)            CR_TAB
-                     AS2 (st,X+,__tmp_reg__)    CR_TAB
-                     AS2 (st,X,__zero_reg__)    CR_TAB
-                     AS1 (clr,__zero_reg__)     CR_TAB
-                     AS2 (sbiw,r26,%o0+3));
+             return ("mov __tmp_reg__,r26"  CR_TAB
+                     "mov __zero_reg__,r27" CR_TAB
+                     "adiw r26,%o0"         CR_TAB
+                     "st X+,r24"            CR_TAB
+                     "st X+,r25"            CR_TAB
+                     "st X+,__tmp_reg__"    CR_TAB
+                     "st X,__zero_reg__"    CR_TAB
+                     "clr __zero_reg__"     CR_TAB
+                     "sbiw r26,%o0+3");
            }
          *l = 6;
-         return (AS2 (adiw,r26,%o0) CR_TAB
-                 AS2 (st,X+,%A1)    CR_TAB
-                 AS2 (st,X+,%B1)    CR_TAB
-                 AS2 (st,X+,%C1)    CR_TAB
-                 AS2 (st,X,%D1)     CR_TAB
-                 AS2 (sbiw,r26,%o0+3));
+         return ("adiw r26,%o0" CR_TAB
+                 "st X+,%A1"    CR_TAB
+                 "st X+,%B1"    CR_TAB
+                 "st X+,%C1"    CR_TAB
+                 "st X,%D1"     CR_TAB
+                 "sbiw r26,%o0+3");
        }
-      return *l=4, (AS2 (std,%A0,%A1)    CR_TAB
-                   AS2 (std,%B0,%B1) CR_TAB
-                   AS2 (std,%C0,%C1) CR_TAB
-                   AS2 (std,%D0,%D1));
+      return *l=4, ("std %A0,%A1" CR_TAB
+                   "std %B0,%B1" CR_TAB
+                   "std %C0,%C1" CR_TAB
+                   "std %D0,%D1");
     }
   else if (GET_CODE (base) == PRE_DEC) /* (--R) */
-    return *l=4, (AS2 (st,%0,%D1) CR_TAB
-                 AS2 (st,%0,%C1) CR_TAB
-                 AS2 (st,%0,%B1) CR_TAB
-                 AS2 (st,%0,%A1));
+    return *l=4, ("st %0,%D1" CR_TAB
+                 "st %0,%C1" CR_TAB
+                 "st %0,%B1" CR_TAB
+                 "st %0,%A1");
   else if (GET_CODE (base) == POST_INC) /* (R++) */
-    return *l=4, (AS2 (st,%0,%A1)  CR_TAB
-                 AS2 (st,%0,%B1) CR_TAB
-                 AS2 (st,%0,%C1) CR_TAB
-                 AS2 (st,%0,%D1));
+    return *l=4, ("st %0,%A1" CR_TAB
+                 "st %0,%B1" CR_TAB
+                 "st %0,%C1" CR_TAB
+                 "st %0,%D1");
   fatal_insn ("unknown move insn:",insn);
   return "";
 }
@@ -3140,8 +3316,8 @@ output_movsisf (rtx insn, rtx operands[], int *l)
   rtx src = operands[1];
   int *real_l = l;
   
-  if (avr_mem_pgm_p (src)
-      || avr_mem_pgm_p (dest))
+  if (avr_mem_flash_p (src)
+      || avr_mem_flash_p (dest))
     {
       return avr_out_lpm (insn, operands, real_l);
     }
@@ -3158,58 +3334,34 @@ output_movsisf (rtx insn, rtx operands[], int *l)
              if (AVR_HAVE_MOVW)
                {
                  *l = 2;
-                 return (AS2 (movw,%C0,%C1) CR_TAB
-                         AS2 (movw,%A0,%A1));
+                 return ("movw %C0,%C1" CR_TAB
+                         "movw %A0,%A1");
                }
              *l = 4;
-             return (AS2 (mov,%D0,%D1) CR_TAB
-                     AS2 (mov,%C0,%C1) CR_TAB
-                     AS2 (mov,%B0,%B1) CR_TAB
-                     AS2 (mov,%A0,%A1));
+             return ("mov %D0,%D1" CR_TAB
+                     "mov %C0,%C1" CR_TAB
+                     "mov %B0,%B1" CR_TAB
+                     "mov %A0,%A1");
            }
          else
            {
              if (AVR_HAVE_MOVW)
                {
                  *l = 2;
-                 return (AS2 (movw,%A0,%A1) CR_TAB
-                         AS2 (movw,%C0,%C1));
+                 return ("movw %A0,%A1" CR_TAB
+                         "movw %C0,%C1");
                }
              *l = 4;
-             return (AS2 (mov,%A0,%A1) CR_TAB
-                     AS2 (mov,%B0,%B1) CR_TAB
-                     AS2 (mov,%C0,%C1) CR_TAB
-                     AS2 (mov,%D0,%D1));
+             return ("mov %A0,%A1" CR_TAB
+                     "mov %B0,%B1" CR_TAB
+                     "mov %C0,%C1" CR_TAB
+                     "mov %D0,%D1");
            }
        }
-      else if (CONST_INT_P (src)
-               || CONST_DOUBLE_P (src))
-        {
-          return output_reload_insisf (operands, NULL_RTX, real_l);
-        }
       else if (CONSTANT_P (src))
        {
-         if (test_hard_reg_class (LD_REGS, dest)) /* ldi d,i */
-           {
-             *l = 4;
-             return (AS2 (ldi,%A0,lo8(%1))  CR_TAB
-                     AS2 (ldi,%B0,hi8(%1))  CR_TAB
-                     AS2 (ldi,%C0,hlo8(%1)) CR_TAB
-                     AS2 (ldi,%D0,hhi8(%1)));
-           }
-         /* Last resort, better than loading from memory.  */
-         *l = 10;
-         return (AS2 (mov,__tmp_reg__,r31) CR_TAB
-                 AS2 (ldi,r31,lo8(%1))     CR_TAB
-                 AS2 (mov,%A0,r31)         CR_TAB
-                 AS2 (ldi,r31,hi8(%1))     CR_TAB
-                 AS2 (mov,%B0,r31)         CR_TAB
-                 AS2 (ldi,r31,hlo8(%1))    CR_TAB
-                 AS2 (mov,%C0,r31)         CR_TAB
-                 AS2 (ldi,r31,hhi8(%1))    CR_TAB
-                 AS2 (mov,%D0,r31)         CR_TAB
-                 AS2 (mov,r31,__tmp_reg__));
-       }
+          return output_reload_insisf (operands, NULL_RTX, real_l);
+        }
       else if (GET_CODE (src) == MEM)
        return out_movsi_r_mr (insn, operands, real_l); /* mov r,m */
     }
@@ -3324,15 +3476,16 @@ avr_out_load_psi (rtx insn, rtx *op, int *plen)
                                   "mov r27,__tmp_reg__", op, plen, -6);
             }
           
-            avr_asm_len ("adiw r26,%o1"      CR_TAB
-                         "ld r24,X+"         CR_TAB
-                         "ld r25,X+"         CR_TAB
-                         "ld r26,X", op, plen, -4);
+          avr_asm_len ("adiw r26,%o1" CR_TAB
+                       "ld %A0,X+"    CR_TAB
+                       "ld %B0,X+"    CR_TAB
+                       "ld %C0,X", op, plen, -4);
 
-            if (reg_dest != REG_X - 2)
-              avr_asm_len ("sbiw r26,%o1+2", op, plen, 1);
+          if (reg_dest != REG_W
+              && !reg_unused_after (insn, XEXP (base, 0)))
+            avr_asm_len ("sbiw r26,%o1+2", op, plen, 1);
 
-            return "";
+          return "";
         }
       
       if (reg_dest == reg_base)
@@ -3465,8 +3618,8 @@ avr_out_movpsi (rtx insn, rtx *op, int *plen)
   rtx dest = op[0];
   rtx src = op[1];
   
-  if (avr_mem_pgm_p (src)
-      || avr_mem_pgm_p (dest))
+  if (avr_mem_flash_p (src)
+      || avr_mem_flash_p (dest))
     {
       return avr_out_lpm (insn, op, plen);
     }
@@ -3496,41 +3649,21 @@ avr_out_movpsi (rtx insn, rtx *op, int *plen)
               return avr_asm_len ("mov %C0,%C1", op, plen, 1);
             }
         }
-      else if (CONST_INT_P (src))
-        {
-          return avr_out_reload_inpsi (op, NULL_RTX, plen);
-        }
       else if (CONSTANT_P (src))
         {
-          if (test_hard_reg_class (LD_REGS, dest)) /* ldi d,i */
-            {
-              return avr_asm_len ("ldi %A0,lo8(%1)" CR_TAB
-                                  "ldi %B0,hi8(%1)" CR_TAB
-                                  "ldi %C0,hh8(%1)", op, plen, -3);
-            }
-          
-          /* Last resort, better than loading from memory.  */
-          return avr_asm_len ("mov __tmp_reg__,r31" CR_TAB
-                              "ldi r31,lo8(%1)" CR_TAB
-                              "mov %A0,r31"     CR_TAB
-                              "ldi r31,hi8(%1)" CR_TAB
-                              "mov %B0,r31"     CR_TAB
-                              "ldi r31,hh8(%1)" CR_TAB
-                              "mov %C0,r31"     CR_TAB
-                              "mov r31,__tmp_reg__", op, plen, -8);
+          return avr_out_reload_inpsi (op, NULL_RTX, plen);
         }
       else if (MEM_P (src))
         return avr_out_load_psi (insn, op, plen); /* mov r,m */
     }
   else if (MEM_P (dest))
     {
-      if (src == CONST0_RTX (GET_MODE (dest)))
-        op[1] = zero_reg_rtx;
-      
-      avr_out_store_psi (insn, op, plen);
+      rtx xop[2];
+
+      xop[0] = dest;
+      xop[1] = src == CONST0_RTX (GET_MODE (dest)) ? zero_reg_rtx : src;
       
-      op[1] = src;
-      return "";
+      return avr_out_store_psi (insn, xop, plen);
     }
     
   fatal_insn ("invalid insn:", insn);
@@ -3538,218 +3671,297 @@ avr_out_movpsi (rtx insn, rtx *op, int *plen)
 }
 
 
-const char *
-out_movqi_mr_r (rtx insn, rtx op[], int *l)
+static const char*
+out_movqi_mr_r (rtx insn, rtx op[], int *plen)
 {
   rtx dest = op[0];
   rtx src = op[1];
   rtx x = XEXP (dest, 0);
-  int dummy;
-
-  if (!l)
-    l = &dummy;
   
   if (CONSTANT_ADDRESS_P (x))
     {
-      if (CONST_INT_P (x) && INTVAL (x) == SREG_ADDR)
-       {
-         *l = 1;
-         return AS2 (out,__SREG__,%1);
-       }
-      if (optimize > 0 && io_address_operand (x, QImode))
-       {
-         *l = 1;
-         return AS2 (out,%m0-0x20,%1);
-       }
-      *l = 2;
-      return AS2 (sts,%m0,%1);
+      return optimize > 0 && io_address_operand (x, QImode)
+        ? avr_asm_len ("out %i0,%1", op, plen, -1)
+        : avr_asm_len ("sts %m0,%1", op, plen, -2);
     }
-  /* memory access by reg+disp */
-  else if (GET_CODE (x) == PLUS        
-      && REG_P (XEXP (x,0))
-      && GET_CODE (XEXP (x,1)) == CONST_INT)
+  else if (GET_CODE (x) == PLUS
+           && REG_P (XEXP (x, 0))
+           && CONST_INT_P (XEXP (x, 1)))
     {
-      if ((INTVAL (XEXP (x,1)) - GET_MODE_SIZE (GET_MODE (dest))) >= 63)
-       {
-         int disp = INTVAL (XEXP (x,1));
-         if (REGNO (XEXP (x,0)) != REG_Y)
-           fatal_insn ("incorrect insn:",insn);
+      /* memory access by reg+disp */
 
-         if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest)))
-           return *l = 3, (AS2 (adiw,r28,%o0-63) CR_TAB
-                           AS2 (std,Y+63,%1)     CR_TAB
-                           AS2 (sbiw,r28,%o0-63));
-
-         return *l = 5, (AS2 (subi,r28,lo8(-%o0)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o0)) CR_TAB
-                         AS2 (st,Y,%1)            CR_TAB
-                         AS2 (subi,r28,lo8(%o0))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o0)));
-       }
+      int disp = INTVAL (XEXP (x, 1));
+
+      if (disp - GET_MODE_SIZE (GET_MODE (dest)) >= 63)
+        {
+          if (REGNO (XEXP (x, 0)) != REG_Y)
+            fatal_insn ("incorrect insn:",insn);
+
+          if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest)))
+            return avr_asm_len ("adiw r28,%o0-63" CR_TAB
+                                "std Y+63,%1"     CR_TAB
+                                "sbiw r28,%o0-63", op, plen, -3);
+
+          return avr_asm_len ("subi r28,lo8(-%o0)" CR_TAB
+                              "sbci r29,hi8(-%o0)" CR_TAB
+                              "st Y,%1"            CR_TAB
+                              "subi r28,lo8(%o0)"  CR_TAB
+                              "sbci r29,hi8(%o0)", op, plen, -5);
+        }
       else if (REGNO (XEXP (x,0)) == REG_X)
-       {
-         if (reg_overlap_mentioned_p (src, XEXP (x, 0)))
-           {
-             if (reg_unused_after (insn, XEXP (x,0)))
-               return *l = 3, (AS2 (mov,__tmp_reg__,%1) CR_TAB
-                               AS2 (adiw,r26,%o0)       CR_TAB
-                               AS2 (st,X,__tmp_reg__));
-
-             return *l = 4, (AS2 (mov,__tmp_reg__,%1) CR_TAB
-                             AS2 (adiw,r26,%o0)       CR_TAB
-                             AS2 (st,X,__tmp_reg__)   CR_TAB
-                             AS2 (sbiw,r26,%o0));
-           }
-         else
-           {
-             if (reg_unused_after (insn, XEXP (x,0)))
-               return *l = 2, (AS2 (adiw,r26,%o0) CR_TAB
-                               AS2 (st,X,%1));
+        {
+          if (reg_overlap_mentioned_p (src, XEXP (x, 0)))
+            {
+              avr_asm_len ("mov __tmp_reg__,%1" CR_TAB
+                           "adiw r26,%o0"       CR_TAB
+                           "st X,__tmp_reg__", op, plen, -3);
+            }
+          else
+            {
+              avr_asm_len ("adiw r26,%o0" CR_TAB
+                           "st X,%1", op, plen, -2);
+            }
+          
+          if (!reg_unused_after (insn, XEXP (x,0)))
+            avr_asm_len ("sbiw r26,%o0", op, plen, 1);
 
-             return *l = 3, (AS2 (adiw,r26,%o0) CR_TAB
-                             AS2 (st,X,%1)      CR_TAB
-                             AS2 (sbiw,r26,%o0));
-           }
-       }
-      *l = 1;
-      return AS2 (std,%0,%1);
+          return "";
+        }
+      
+      return avr_asm_len ("std %0,%1", op, plen, -1);
     }
-  *l = 1;
-  return AS2 (st,%0,%1);
+  
+  return avr_asm_len ("st %0,%1", op, plen, -1);
 }
 
-const char *
-out_movhi_mr_r (rtx insn, rtx op[], int *l)
+
+/* Helper for the next function for XMEGA.  It does the same
+   but with low byte first.  */
+
+static const char*
+avr_out_movhi_mr_r_xmega (rtx insn, rtx op[], int *plen)
 {
   rtx dest = op[0];
   rtx src = op[1];
   rtx base = XEXP (dest, 0);
   int reg_base = true_regnum (base);
   int reg_src = true_regnum (src);
-  /* "volatile" forces writing high byte first, even if less efficient,
-     for correct operation with 16-bit I/O registers.  */
+
+  /* "volatile" forces writing low byte first, even if less efficient,
+     for correct operation with 16-bit I/O registers like SP.  */
   int mem_volatile_p = MEM_VOLATILE_P (dest);
-  int tmp;
 
-  if (!l)
-    l = &tmp;
   if (CONSTANT_ADDRESS_P (base))
-    {
-      if (optimize > 0 && io_address_operand (base, HImode))
-       {
-         *l = 2;
-         return (AS2 (out,%m0+1-0x20,%B1) CR_TAB
-                 AS2 (out,%m0-0x20,%A1));
-       }
-      return *l = 4, (AS2 (sts,%m0+1,%B1) CR_TAB
-                     AS2 (sts,%m0,%A1));
-    }
+    return optimize > 0 && io_address_operand (base, HImode)
+      ? avr_asm_len ("out %i0,%A1" CR_TAB
+                     "out %i0+1,%B1", op, plen, -2)
+
+      : avr_asm_len ("sts %m0,%A1" CR_TAB
+                     "sts %m0+1,%B1", op, plen, -4);
+  
   if (reg_base > 0)
     {
-      if (reg_base == REG_X)
-        {
-          if (reg_src == REG_X)
-            {
-              /* "st X+,r26" and "st -X,r26" are undefined.  */
-              if (!mem_volatile_p && reg_unused_after (insn, src))
-               return *l=4, (AS2 (mov,__tmp_reg__,r27) CR_TAB
-                             AS2 (st,X,r26)            CR_TAB
-                             AS2 (adiw,r26,1)          CR_TAB
-                             AS2 (st,X,__tmp_reg__));
-              else
-               return *l=5, (AS2 (mov,__tmp_reg__,r27) CR_TAB
-                             AS2 (adiw,r26,1)          CR_TAB
-                             AS2 (st,X,__tmp_reg__)    CR_TAB
-                              AS2 (sbiw,r26,1)          CR_TAB
-                              AS2 (st,X,r26));
-            }
-          else
-            {
-              if (!mem_volatile_p && reg_unused_after (insn, base))
-                return *l=2, (AS2 (st,X+,%A1) CR_TAB
-                              AS2 (st,X,%B1));
-              else
-                return *l=3, (AS2 (adiw,r26,1) CR_TAB
-                              AS2 (st,X,%B1)   CR_TAB
-                              AS2 (st,-X,%A1));
-            }
-        }
+      if (reg_base != REG_X)
+        return avr_asm_len ("st %0,%A1" CR_TAB
+                            "std %0+1,%B1", op, plen, -2);
+      
+      if (reg_src == REG_X)
+        /* "st X+,r26" and "st -X,r26" are undefined.  */
+        avr_asm_len ("mov __tmp_reg__,r27" CR_TAB
+                     "st X,r26"            CR_TAB
+                     "adiw r26,1"          CR_TAB
+                     "st X,__tmp_reg__", op, plen, -4);
       else
-        return  *l=2, (AS2 (std,%0+1,%B1) CR_TAB
-                       AS2 (st,%0,%A1));
+        avr_asm_len ("st X+,%A1" CR_TAB
+                     "st X,%B1", op, plen, -2);
+
+      return reg_unused_after (insn, base)
+        ? ""
+        : avr_asm_len ("sbiw r26,1", op, plen, 1);
     }
   else if (GET_CODE (base) == PLUS)
     {
       int disp = INTVAL (XEXP (base, 1));
       reg_base = REGNO (XEXP (base, 0));
       if (disp > MAX_LD_OFFSET (GET_MODE (dest)))
-       {
-         if (reg_base != REG_Y)
-           fatal_insn ("incorrect insn:",insn);
-
-         if (disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest)))
-           return *l = 4, (AS2 (adiw,r28,%o0-62) CR_TAB
-                           AS2 (std,Y+63,%B1)    CR_TAB
-                           AS2 (std,Y+62,%A1)    CR_TAB
-                           AS2 (sbiw,r28,%o0-62));
-
-         return *l = 6, (AS2 (subi,r28,lo8(-%o0)) CR_TAB
-                         AS2 (sbci,r29,hi8(-%o0)) CR_TAB
-                         AS2 (std,Y+1,%B1)        CR_TAB
-                         AS2 (st,Y,%A1)           CR_TAB
-                         AS2 (subi,r28,lo8(%o0))  CR_TAB
-                         AS2 (sbci,r29,hi8(%o0)));
-       }
-      if (reg_base == REG_X)
-       {
-         /* (X + d) = R */
-         if (reg_src == REG_X)
-            {
-             *l = 7;
-             return (AS2 (mov,__tmp_reg__,r26)  CR_TAB
-                     AS2 (mov,__zero_reg__,r27) CR_TAB
-                      AS2 (adiw,r26,%o0+1)       CR_TAB
-                     AS2 (st,X,__zero_reg__)    CR_TAB
-                     AS2 (st,-X,__tmp_reg__)    CR_TAB
-                     AS1 (clr,__zero_reg__)     CR_TAB
-                      AS2 (sbiw,r26,%o0));
-           }
-         *l = 4;
-          return (AS2 (adiw,r26,%o0+1) CR_TAB
-                  AS2 (st,X,%B1)       CR_TAB
-                  AS2 (st,-X,%A1)      CR_TAB
-                  AS2 (sbiw,r26,%o0));
-       }
-      return *l=2, (AS2 (std,%B0,%B1)    CR_TAB
-                    AS2 (std,%A0,%A1));
+        {
+          if (reg_base != REG_Y)
+            fatal_insn ("incorrect insn:",insn);
+          
+          return disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest))
+            ? avr_asm_len ("adiw r28,%o0-62" CR_TAB
+                           "std Y+62,%A1"    CR_TAB
+                           "std Y+63,%B1"    CR_TAB
+                           "sbiw r28,%o0-62", op, plen, -4)
+
+            : avr_asm_len ("subi r28,lo8(-%o0)" CR_TAB
+                           "sbci r29,hi8(-%o0)" CR_TAB
+                           "st Y,%A1"           CR_TAB
+                           "std Y+1,%B1"        CR_TAB
+                           "subi r28,lo8(%o0)"  CR_TAB
+                           "sbci r29,hi8(%o0)", op, plen, -6);
+        }
+      
+      if (reg_base != REG_X)
+        return avr_asm_len ("std %A0,%A1" CR_TAB
+                            "std %B0,%B1", op, plen, -2);
+      /* (X + d) = R */
+      return reg_src == REG_X
+        ? avr_asm_len ("mov __tmp_reg__,r26"  CR_TAB
+                       "mov __zero_reg__,r27" CR_TAB
+                       "adiw r26,%o0"         CR_TAB
+                       "st X+,__tmp_reg__"    CR_TAB
+                       "st X,__zero_reg__"    CR_TAB
+                       "clr __zero_reg__"     CR_TAB
+                       "sbiw r26,%o0+1", op, plen, -7)
+
+        : avr_asm_len ("adiw r26,%o0" CR_TAB
+                       "st X+,%A1"    CR_TAB
+                       "st X,%B1"     CR_TAB
+                       "sbiw r26,%o0+1", op, plen, -4);
     }
   else if (GET_CODE (base) == PRE_DEC) /* (--R) */
-    return *l=2, (AS2 (st,%0,%B1) CR_TAB
-                 AS2 (st,%0,%A1));
+    {
+      if (!mem_volatile_p)
+        return avr_asm_len ("st %0,%B1" CR_TAB
+                            "st %0,%A1", op, plen, -2);
+
+      return REGNO (XEXP (base, 0)) == REG_X
+        ? avr_asm_len ("sbiw r26,2"  CR_TAB
+                       "st X+,%A1"   CR_TAB
+                       "st X,%B1"    CR_TAB
+                       "sbiw r26,1", op, plen, -4)
+
+        : avr_asm_len ("sbiw %r0,2"  CR_TAB
+                       "st %p0,%A1"  CR_TAB
+                       "std %p0+1,%B1", op, plen, -3);
+    }
   else if (GET_CODE (base) == POST_INC) /* (R++) */
     {
-      if (mem_volatile_p)
+      return avr_asm_len ("st %0,%A1"  CR_TAB
+                          "st %0,%B1", op, plen, -2);
+      
+    }
+  fatal_insn ("unknown move insn:",insn);
+  return "";
+}
+
+
+static const char*
+out_movhi_mr_r (rtx insn, rtx op[], int *plen)
+{
+  rtx dest = op[0];
+  rtx src = op[1];
+  rtx base = XEXP (dest, 0);
+  int reg_base = true_regnum (base);
+  int reg_src = true_regnum (src);
+  int mem_volatile_p;
+
+  /* "volatile" forces writing high-byte first (no-xmega) resp.
+     low-byte first (xmega) even if less efficient, for correct
+     operation with 16-bit I/O registers like.  */
+
+  if (AVR_XMEGA)
+    return avr_out_movhi_mr_r_xmega (insn, op, plen);
+
+  mem_volatile_p = MEM_VOLATILE_P (dest);
+
+  if (CONSTANT_ADDRESS_P (base))
+    return optimize > 0 && io_address_operand (base, HImode)
+      ? avr_asm_len ("out %i0+1,%B1" CR_TAB
+                     "out %i0,%A1", op, plen, -2)
+
+      : avr_asm_len ("sts %m0+1,%B1" CR_TAB
+                     "sts %m0,%A1", op, plen, -4);
+  
+  if (reg_base > 0)
+    {
+      if (reg_base != REG_X)
+        return avr_asm_len ("std %0+1,%B1" CR_TAB
+                            "st %0,%A1", op, plen, -2);
+      
+      if (reg_src == REG_X)
+        /* "st X+,r26" and "st -X,r26" are undefined.  */
+        return !mem_volatile_p && reg_unused_after (insn, src)
+          ? avr_asm_len ("mov __tmp_reg__,r27" CR_TAB
+                         "st X,r26"            CR_TAB
+                         "adiw r26,1"          CR_TAB
+                         "st X,__tmp_reg__", op, plen, -4)
+
+          : avr_asm_len ("mov __tmp_reg__,r27" CR_TAB
+                         "adiw r26,1"          CR_TAB
+                         "st X,__tmp_reg__"    CR_TAB
+                         "sbiw r26,1"          CR_TAB
+                         "st X,r26", op, plen, -5);
+      
+      return !mem_volatile_p && reg_unused_after (insn, base)
+        ? avr_asm_len ("st X+,%A1" CR_TAB
+                       "st X,%B1", op, plen, -2)
+        : avr_asm_len ("adiw r26,1" CR_TAB
+                       "st X,%B1"   CR_TAB
+                       "st -X,%A1", op, plen, -3);
+    }
+  else if (GET_CODE (base) == PLUS)
+    {
+      int disp = INTVAL (XEXP (base, 1));
+      reg_base = REGNO (XEXP (base, 0));
+      if (disp > MAX_LD_OFFSET (GET_MODE (dest)))
         {
-          if (REGNO (XEXP (base, 0)) == REG_X)
-            {
-              *l = 4;
-              return (AS2 (adiw,r26,1)  CR_TAB
-                      AS2 (st,X,%B1)    CR_TAB
-                      AS2 (st,-X,%A1)   CR_TAB
-                      AS2 (adiw,r26,2));
-            }
-          else
-            {
-              *l = 3;
-              return (AS2 (std,%p0+1,%B1) CR_TAB
-                      AS2 (st,%p0,%A1)    CR_TAB
-                      AS2 (adiw,%r0,2));
-            }
+          if (reg_base != REG_Y)
+            fatal_insn ("incorrect insn:",insn);
+          
+          return disp <= 63 + MAX_LD_OFFSET (GET_MODE (dest))
+            ? avr_asm_len ("adiw r28,%o0-62" CR_TAB
+                           "std Y+63,%B1"    CR_TAB
+                           "std Y+62,%A1"    CR_TAB
+                           "sbiw r28,%o0-62", op, plen, -4)
+
+            : avr_asm_len ("subi r28,lo8(-%o0)" CR_TAB
+                           "sbci r29,hi8(-%o0)" CR_TAB
+                           "std Y+1,%B1"        CR_TAB
+                           "st Y,%A1"           CR_TAB
+                           "subi r28,lo8(%o0)"  CR_TAB
+                           "sbci r29,hi8(%o0)", op, plen, -6);
         }
+      
+      if (reg_base != REG_X)
+        return avr_asm_len ("std %B0,%B1" CR_TAB
+                            "std %A0,%A1", op, plen, -2);
+      /* (X + d) = R */
+      return reg_src == REG_X
+        ? avr_asm_len ("mov __tmp_reg__,r26"  CR_TAB
+                       "mov __zero_reg__,r27" CR_TAB
+                       "adiw r26,%o0+1"       CR_TAB
+                       "st X,__zero_reg__"    CR_TAB
+                       "st -X,__tmp_reg__"    CR_TAB
+                       "clr __zero_reg__"     CR_TAB
+                       "sbiw r26,%o0", op, plen, -7)
+
+        : avr_asm_len ("adiw r26,%o0+1" CR_TAB
+                       "st X,%B1"       CR_TAB
+                       "st -X,%A1"      CR_TAB
+                       "sbiw r26,%o0", op, plen, -4);
+    }
+  else if (GET_CODE (base) == PRE_DEC) /* (--R) */
+    {
+      return avr_asm_len ("st %0,%B1" CR_TAB
+                          "st %0,%A1", op, plen, -2);
+    }
+  else if (GET_CODE (base) == POST_INC) /* (R++) */
+    {
+      if (!mem_volatile_p)
+        return avr_asm_len ("st %0,%A1"  CR_TAB
+                            "st %0,%B1", op, plen, -2);
+      
+      return REGNO (XEXP (base, 0)) == REG_X
+        ? avr_asm_len ("adiw r26,1"  CR_TAB
+                       "st X,%B1"    CR_TAB
+                       "st -X,%A1"   CR_TAB
+                       "adiw r26,2", op, plen, -4)
 
-      *l = 2;
-      return (AS2 (st,%0,%A1)  CR_TAB
-            AS2 (st,%0,%B1));
+        : avr_asm_len ("std %p0+1,%B1" CR_TAB
+                       "st %p0,%A1"    CR_TAB
+                       "adiw %r0,2", op, plen, -3);
     }
   fatal_insn ("unknown move insn:",insn);
   return "";
@@ -3844,14 +4056,17 @@ avr_out_compare (rtx insn, rtx *xop, int *plen)
   /* Value (0..0xff) held in clobber register xop[2] or -1 if unknown.  */
   int clobber_val = -1;
 
-  gcc_assert (REG_P (xreg)
-              && CONST_INT_P (xval));
+  gcc_assert (REG_P (xreg));
+  gcc_assert ((CONST_INT_P (xval) && n_bytes <= 4)
+              || (const_double_operand (xval, VOIDmode) && n_bytes == 8));
   
   if (plen)
     *plen = 0;
 
   /* Comparisons == +/-1 and != +/-1 can be done similar to camparing
-     against 0 by ORing the bytes.  This is one instruction shorter.  */
+     against 0 by ORing the bytes.  This is one instruction shorter.
+     Notice that DImode comparisons are always against reg:DI 18
+     and therefore don't use this.  */
 
   if (!test_hard_reg_class (LD_REGS, xreg)
       && compare_eq_p (insn)
@@ -3969,12 +4184,26 @@ avr_out_compare (rtx insn, rtx *xop, int *plen)
 }
 
 
-/* Output test instruction for HImode.  */
+/* Prepare operands of compare_const_di2 to be used with avr_out_compare.  */
 
 const char*
-avr_out_tsthi (rtx insn, rtx *op, int *plen)
+avr_out_compare64 (rtx insn, rtx *op, int *plen)
 {
-  if (compare_sign_p (insn))
+  rtx xop[3];
+
+  xop[0] = gen_rtx_REG (DImode, 18);
+  xop[1] = op[0];
+  xop[2] = op[1];
+
+  return avr_out_compare (insn, xop, plen);
+}
+
+/* Output test instruction for HImode.  */
+
+const char*
+avr_out_tsthi (rtx insn, rtx *op, int *plen)
+{
+  if (compare_sign_p (insn))
     {
       avr_asm_len ("tst %B0", op, plen, -1);
     }
@@ -4044,29 +4273,33 @@ avr_out_tstsi (rtx insn, rtx *op, int *plen)
 }
 
 
-/* Generate asm equivalent for various shifts.
-   Shift count is a CONST_INT, MEM or REG.
-   This only handles cases that are not already
-   carefully hand-optimized in ?sh??i3_out.  */
+/* Generate asm equivalent for various shifts.  This only handles cases
+   that are not already carefully hand-optimized in ?sh??i3_out.
+
+   OPERANDS[0] resp. %0 in TEMPL is the operand to be shifted.
+   OPERANDS[2] is the shift count as CONST_INT, MEM or REG.
+   OPERANDS[3] is a QImode scratch register from LD regs if
+               available and SCRATCH, otherwise (no scratch available)
+
+   TEMPL is an assembler template that shifts by one position.
+   T_LEN is the length of this template.  */
 
 void
 out_shift_with_cnt (const char *templ, rtx insn, rtx operands[],
-                   int *len, int t_len)
+                   int *plen, int t_len)
 {
-  rtx op[10];
-  char str[500];
-  int second_label = 1;
-  int saved_in_tmp = 0;
-  int use_zero_reg = 0;
+  bool second_label = true;
+  bool saved_in_tmp = false;
+  bool use_zero_reg = false;
+  rtx op[5];
 
   op[0] = operands[0];
   op[1] = operands[1];
   op[2] = operands[2];
   op[3] = operands[3];
-  str[0] = 0;
 
-  if (len)
-    *len = 1;
+  if (plen)
+    *plen = 0;
 
   if (CONST_INT_P (operands[2]))
     {
@@ -4076,118 +4309,90 @@ out_shift_with_cnt (const char *templ, rtx insn, rtx operands[],
       int max_len = 10;  /* If larger than this, always use a loop.  */
 
       if (count <= 0)
-       {
-         if (len)
-           *len = 0;
-         return;
-       }
+          return;
 
       if (count < 8 && !scratch)
-       use_zero_reg = 1;
+        use_zero_reg = true;
 
       if (optimize_size)
-       max_len = t_len + (scratch ? 3 : (use_zero_reg ? 4 : 5));
+        max_len = t_len + (scratch ? 3 : (use_zero_reg ? 4 : 5));
 
       if (t_len * count <= max_len)
-       {
-         /* Output shifts inline with no loop - faster.  */
-         if (len)
-           *len = t_len * count;
-         else
-           {
-             while (count-- > 0)
-               output_asm_insn (templ, op);
-           }
+        {
+          /* Output shifts inline with no loop - faster.  */
+          
+          while (count-- > 0)
+            avr_asm_len (templ, op, plen, t_len);
 
-         return;
-       }
+          return;
+        }
 
       if (scratch)
-       {
-         if (!len)
-           strcat (str, AS2 (ldi,%3,%2));
-       }
+        {
+          avr_asm_len ("ldi %3,%2", op, plen, 1);
+        }
       else if (use_zero_reg)
-       {
-         /* Hack to save one word: use __zero_reg__ as loop counter.
-            Set one bit, then shift in a loop until it is 0 again.  */
+        {
+          /* Hack to save one word: use __zero_reg__ as loop counter.
+             Set one bit, then shift in a loop until it is 0 again.  */
 
-         op[3] = zero_reg_rtx;
-         if (len)
-           *len = 2;
-         else
-           strcat (str, ("set" CR_TAB
-                         AS2 (bld,%3,%2-1)));
-       }
+          op[3] = zero_reg_rtx;
+
+          avr_asm_len ("set" CR_TAB
+                       "bld %3,%2-1", op, plen, 2);
+        }
       else
-       {
-         /* No scratch register available, use one from LD_REGS (saved in
-            __tmp_reg__) that doesn't overlap with registers to shift.  */
+        {
+          /* No scratch register available, use one from LD_REGS (saved in
+             __tmp_reg__) that doesn't overlap with registers to shift.  */
 
-         op[3] = all_regs_rtx[((REGNO (operands[0]) - 1) & 15) + 16];
-         op[4] = tmp_reg_rtx;
-         saved_in_tmp = 1;
+          op[3] = all_regs_rtx[((REGNO (op[0]) - 1) & 15) + 16];
+          op[4] = tmp_reg_rtx;
+          saved_in_tmp = true;
 
-         if (len)
-           *len = 3;  /* Includes "mov %3,%4" after the loop.  */
-         else
-           strcat (str, (AS2 (mov,%4,%3) CR_TAB
-                         AS2 (ldi,%3,%2)));
-       }
+          avr_asm_len ("mov %4,%3" CR_TAB
+                       "ldi %3,%2", op, plen, 2);
+        }
 
-      second_label = 0;
+      second_label = false;
     }
-  else if (GET_CODE (operands[2]) == MEM)
+  else if (MEM_P (op[2]))
     {
-      rtx op_mov[10];
+      rtx op_mov[2];
       
-      op[3] = op_mov[0] = tmp_reg_rtx;
+      op_mov[0] = op[3] = tmp_reg_rtx;
       op_mov[1] = op[2];
 
-      if (len)
-       out_movqi_r_mr (insn, op_mov, len);
-      else
-       output_asm_insn (out_movqi_r_mr (insn, op_mov, NULL), op_mov);
+      out_movqi_r_mr (insn, op_mov, plen);
     }
-  else if (register_operand (operands[2], QImode))
+  else if (register_operand (op[2], QImode))
     {
-      if (reg_unused_after (insn, operands[2])
-          && !reg_overlap_mentioned_p (operands[0], operands[2]))
+      op[3] = op[2];
+      
+      if (!reg_unused_after (insn, op[2])
+          || reg_overlap_mentioned_p (op[0], op[2]))
         {
-          op[3] = op[2];
+          op[3] = tmp_reg_rtx;
+          avr_asm_len ("mov %3,%2", op, plen, 1);
         }
-      else
-       {
-         op[3] = tmp_reg_rtx;
-         if (!len)
-           strcat (str, (AS2 (mov,%3,%2) CR_TAB));
-       }
     }
   else
     fatal_insn ("bad shift insn:", insn);
 
   if (second_label)
-    {
-      if (len)
-       ++*len;
-      else
-       strcat (str, AS1 (rjmp,2f));
-    }
+      avr_asm_len ("rjmp 2f", op, plen, 1);
 
-  if (len)
-    *len += t_len + 2;  /* template + dec + brXX */
-  else
-    {
-      strcat (str, "\n1:\t");
-      strcat (str, templ);
-      strcat (str, second_label ? "\n2:\t" : "\n\t");
-      strcat (str, use_zero_reg ? AS1 (lsr,%3) : AS1 (dec,%3));
-      strcat (str, CR_TAB);
-      strcat (str, second_label ? AS1 (brpl,1b) : AS1 (brne,1b));
-      if (saved_in_tmp)
-       strcat (str, (CR_TAB AS2 (mov,%3,%4)));
-      output_asm_insn (str, op);
-    }
+  avr_asm_len ("1:", op, plen, 0);
+  avr_asm_len (templ, op, plen, t_len);
+
+  if (second_label)
+    avr_asm_len ("2:", op, plen, 0);
+
+  avr_asm_len (use_zero_reg ? "lsr %3" : "dec %3", op, plen, 1);
+  avr_asm_len (second_label ? "brpl 1b" : "brne 1b", op, plen, 1);
+
+  if (saved_in_tmp)
+    avr_asm_len ("mov %3,%4", op, plen, 1);
 }
 
 
@@ -4210,80 +4415,80 @@ ashlqi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          *len = 1;
-         return AS1 (clr,%0);
+         return "clr %0";
          
        case 1:
          *len = 1;
-         return AS1 (lsl,%0);
+         return "lsl %0";
          
        case 2:
          *len = 2;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0));
+         return ("lsl %0" CR_TAB
+                 "lsl %0");
 
        case 3:
          *len = 3;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0));
+         return ("lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0");
 
        case 4:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len = 2;
-             return (AS1 (swap,%0) CR_TAB
-                     AS2 (andi,%0,0xf0));
+             return ("swap %0" CR_TAB
+                     "andi %0,0xf0");
            }
          *len = 4;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0));
+         return ("lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0");
 
        case 5:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len = 3;
-             return (AS1 (swap,%0) CR_TAB
-                     AS1 (lsl,%0)  CR_TAB
-                     AS2 (andi,%0,0xe0));
+             return ("swap %0" CR_TAB
+                     "lsl %0"  CR_TAB
+                     "andi %0,0xe0");
            }
          *len = 5;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0));
+         return ("lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0");
 
        case 6:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len = 4;
-             return (AS1 (swap,%0) CR_TAB
-                     AS1 (lsl,%0)  CR_TAB
-                     AS1 (lsl,%0)  CR_TAB
-                     AS2 (andi,%0,0xc0));
+             return ("swap %0" CR_TAB
+                     "lsl %0"  CR_TAB
+                     "lsl %0"  CR_TAB
+                     "andi %0,0xc0");
            }
          *len = 6;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0) CR_TAB
-                 AS1 (lsl,%0));
+         return ("lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0" CR_TAB
+                 "lsl %0");
 
        case 7:
          *len = 3;
-         return (AS1 (ror,%0) CR_TAB
-                 AS1 (clr,%0) CR_TAB
-                 AS1 (ror,%0));
+         return ("ror %0" CR_TAB
+                 "clr %0" CR_TAB
+                 "ror %0");
        }
     }
   else if (CONSTANT_P (operands[2]))
     fatal_insn ("internal compiler error.  Incorrect shift:", insn);
 
-  out_shift_with_cnt (AS1 (lsl,%0),
-                     insn, operands, len, 1);
+  out_shift_with_cnt ("lsl %0",
+                      insn, operands, len, 1);
   return "";
 }
 
@@ -4310,8 +4515,8 @@ ashlhi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          *len = 2;
-         return (AS1 (clr,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %B0" CR_TAB
+                 "clr %A0");
 
        case 4:
          if (optimize_size && scratch)
@@ -4319,23 +4524,23 @@ ashlhi3_out (rtx insn, rtx operands[], int *len)
          if (ldi_ok)
            {
              *len = 6;
-             return (AS1 (swap,%A0)      CR_TAB
-                     AS1 (swap,%B0)      CR_TAB
-                     AS2 (andi,%B0,0xf0) CR_TAB
-                     AS2 (eor,%B0,%A0)   CR_TAB
-                     AS2 (andi,%A0,0xf0) CR_TAB
-                     AS2 (eor,%B0,%A0));
+             return ("swap %A0"      CR_TAB
+                     "swap %B0"      CR_TAB
+                     "andi %B0,0xf0" CR_TAB
+                     "eor %B0,%A0"   CR_TAB
+                     "andi %A0,0xf0" CR_TAB
+                     "eor %B0,%A0");
            }
          if (scratch)
            {
              *len = 7;
-             return (AS1 (swap,%A0)    CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS2 (ldi,%3,0xf0) CR_TAB
+             return ("swap %A0"    CR_TAB
+                     "swap %B0"    CR_TAB
+                     "ldi %3,0xf0" CR_TAB
                      "and %B0,%3"      CR_TAB
-                     AS2 (eor,%B0,%A0) CR_TAB
+                     "eor %B0,%A0" CR_TAB
                      "and %A0,%3"      CR_TAB
-                     AS2 (eor,%B0,%A0));
+                     "eor %B0,%A0");
            }
          break;  /* optimize_size ? 6 : 8 */
 
@@ -4345,27 +4550,27 @@ ashlhi3_out (rtx insn, rtx operands[], int *len)
          if (ldi_ok)
            {
              *len = 8;
-             return (AS1 (lsl,%A0)       CR_TAB
-                     AS1 (rol,%B0)       CR_TAB
-                     AS1 (swap,%A0)      CR_TAB
-                     AS1 (swap,%B0)      CR_TAB
-                     AS2 (andi,%B0,0xf0) CR_TAB
-                     AS2 (eor,%B0,%A0)   CR_TAB
-                     AS2 (andi,%A0,0xf0) CR_TAB
-                     AS2 (eor,%B0,%A0));
+             return ("lsl %A0"       CR_TAB
+                     "rol %B0"       CR_TAB
+                     "swap %A0"      CR_TAB
+                     "swap %B0"      CR_TAB
+                     "andi %B0,0xf0" CR_TAB
+                     "eor %B0,%A0"   CR_TAB
+                     "andi %A0,0xf0" CR_TAB
+                     "eor %B0,%A0");
            }
          if (scratch)
            {
              *len = 9;
-             return (AS1 (lsl,%A0)     CR_TAB
-                     AS1 (rol,%B0)     CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS2 (ldi,%3,0xf0) CR_TAB
+             return ("lsl %A0"     CR_TAB
+                     "rol %B0"     CR_TAB
+                     "swap %A0"    CR_TAB
+                     "swap %B0"    CR_TAB
+                     "ldi %3,0xf0" CR_TAB
                      "and %B0,%3"      CR_TAB
-                     AS2 (eor,%B0,%A0) CR_TAB
+                     "eor %B0,%A0" CR_TAB
                      "and %A0,%3"      CR_TAB
-                     AS2 (eor,%B0,%A0));
+                     "eor %B0,%A0");
            }
          break;  /* 10 */
 
@@ -4373,175 +4578,174 @@ ashlhi3_out (rtx insn, rtx operands[], int *len)
          if (optimize_size)
            break;  /* scratch ? 5 : 6 */
          *len = 9;
-         return (AS1 (clr,__tmp_reg__) CR_TAB
-                 AS1 (lsr,%B0)         CR_TAB
-                 AS1 (ror,%A0)         CR_TAB
-                 AS1 (ror,__tmp_reg__) CR_TAB
-                 AS1 (lsr,%B0)         CR_TAB
-                 AS1 (ror,%A0)         CR_TAB
-                 AS1 (ror,__tmp_reg__) CR_TAB
-                 AS2 (mov,%B0,%A0)     CR_TAB
-                 AS2 (mov,%A0,__tmp_reg__));
+         return ("clr __tmp_reg__" CR_TAB
+                 "lsr %B0"         CR_TAB
+                 "ror %A0"         CR_TAB
+                 "ror __tmp_reg__" CR_TAB
+                 "lsr %B0"         CR_TAB
+                 "ror %A0"         CR_TAB
+                 "ror __tmp_reg__" CR_TAB
+                 "mov %B0,%A0"     CR_TAB
+                 "mov %A0,__tmp_reg__");
 
        case 7:
          *len = 5;
-         return (AS1 (lsr,%B0)     CR_TAB
-                 AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (ror,%B0)     CR_TAB
-                 AS1 (ror,%A0));
+         return ("lsr %B0"     CR_TAB
+                 "mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "ror %B0"     CR_TAB
+                 "ror %A0");
 
        case 8:
-         return *len = 2, (AS2 (mov,%B0,%A1) CR_TAB
-                           AS1 (clr,%A0));
+         return *len = 2, ("mov %B0,%A1" CR_TAB
+                           "clr %A0");
 
        case 9:
          *len = 3;
-         return (AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (lsl,%B0));
+         return ("mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "lsl %B0");
 
        case 10:
          *len = 4;
-         return (AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0));
+         return ("mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0");
 
        case 11:
          *len = 5;
-         return (AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0));
+         return ("mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0");
 
        case 12:
          if (ldi_ok)
            {
              *len = 4;
-             return (AS2 (mov,%B0,%A0) CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS2 (andi,%B0,0xf0));
+             return ("mov %B0,%A0" CR_TAB
+                     "clr %A0"     CR_TAB
+                     "swap %B0"    CR_TAB
+                     "andi %B0,0xf0");
            }
          if (scratch)
            {
              *len = 5;
-             return (AS2 (mov,%B0,%A0) CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS2 (ldi,%3,0xf0) CR_TAB
+             return ("mov %B0,%A0" CR_TAB
+                     "clr %A0"     CR_TAB
+                     "swap %B0"    CR_TAB
+                     "ldi %3,0xf0" CR_TAB
                      "and %B0,%3");
            }
          *len = 6;
-         return (AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0));
+         return ("mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0");
 
        case 13:
          if (ldi_ok)
            {
              *len = 5;
-             return (AS2 (mov,%B0,%A0) CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS1 (lsl,%B0)     CR_TAB
-                     AS2 (andi,%B0,0xe0));
+             return ("mov %B0,%A0" CR_TAB
+                     "clr %A0"     CR_TAB
+                     "swap %B0"    CR_TAB
+                     "lsl %B0"     CR_TAB
+                     "andi %B0,0xe0");
            }
          if (AVR_HAVE_MUL && scratch)
            {
              *len = 5;
-             return (AS2 (ldi,%3,0x20) CR_TAB
-                     AS2 (mul,%A0,%3)  CR_TAB
-                     AS2 (mov,%B0,r0)  CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %3,0x20" CR_TAB
+                     "mul %A0,%3"  CR_TAB
+                     "mov %B0,r0"  CR_TAB
+                     "clr %A0"     CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          if (scratch)
            {
              *len = 6;
-             return (AS2 (mov,%B0,%A0) CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS1 (lsl,%B0)     CR_TAB
-                     AS2 (ldi,%3,0xe0) CR_TAB
+             return ("mov %B0,%A0" CR_TAB
+                     "clr %A0"     CR_TAB
+                     "swap %B0"    CR_TAB
+                     "lsl %B0"     CR_TAB
+                     "ldi %3,0xe0" CR_TAB
                      "and %B0,%3");
            }
          if (AVR_HAVE_MUL)
            {
              *len = 6;
              return ("set"            CR_TAB
-                     AS2 (bld,r1,5)   CR_TAB
-                     AS2 (mul,%A0,r1) CR_TAB
-                     AS2 (mov,%B0,r0) CR_TAB
-                     AS1 (clr,%A0)    CR_TAB
-                     AS1 (clr,__zero_reg__));
+                     "bld r1,5"   CR_TAB
+                     "mul %A0,r1" CR_TAB
+                     "mov %B0,r0" CR_TAB
+                     "clr %A0"    CR_TAB
+                     "clr __zero_reg__");
            }
          *len = 7;
-         return (AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (clr,%A0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS1 (lsl,%B0));
+         return ("mov %B0,%A0" CR_TAB
+                 "clr %A0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "lsl %B0");
 
        case 14:
          if (AVR_HAVE_MUL && ldi_ok)
            {
              *len = 5;
-             return (AS2 (ldi,%B0,0x40) CR_TAB
-                     AS2 (mul,%A0,%B0)  CR_TAB
-                     AS2 (mov,%B0,r0)   CR_TAB
-                     AS1 (clr,%A0)      CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %B0,0x40" CR_TAB
+                     "mul %A0,%B0"  CR_TAB
+                     "mov %B0,r0"   CR_TAB
+                     "clr %A0"      CR_TAB
+                     "clr __zero_reg__");
            }
          if (AVR_HAVE_MUL && scratch)
            {
              *len = 5;
-             return (AS2 (ldi,%3,0x40) CR_TAB
-                     AS2 (mul,%A0,%3)  CR_TAB
-                     AS2 (mov,%B0,r0)  CR_TAB
-                     AS1 (clr,%A0)     CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %3,0x40" CR_TAB
+                     "mul %A0,%3"  CR_TAB
+                     "mov %B0,r0"  CR_TAB
+                     "clr %A0"     CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && ldi_ok)
            {
              *len = 5;
-             return (AS2 (mov,%B0,%A0) CR_TAB
-                     AS2 (ldi,%A0,6) "\n1:\t"
-                     AS1 (lsl,%B0)     CR_TAB
-                     AS1 (dec,%A0)     CR_TAB
-                     AS1 (brne,1b));
+             return ("mov %B0,%A0" CR_TAB
+                     "ldi %A0,6" "\n1:\t"
+                     "lsl %B0"     CR_TAB
+                     "dec %A0"     CR_TAB
+                     "brne 1b");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          *len = 6;
-         return (AS1 (clr,%B0) CR_TAB
-                 AS1 (lsr,%A0) CR_TAB
-                 AS1 (ror,%B0) CR_TAB
-                 AS1 (lsr,%A0) CR_TAB
-                 AS1 (ror,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %B0" CR_TAB
+                 "lsr %A0" CR_TAB
+                 "ror %B0" CR_TAB
+                 "lsr %A0" CR_TAB
+                 "ror %B0" CR_TAB
+                 "clr %A0");
 
        case 15:
          *len = 4;
-         return (AS1 (clr,%B0) CR_TAB
-                 AS1 (lsr,%A0) CR_TAB
-                 AS1 (ror,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %B0" CR_TAB
+                 "lsr %A0" CR_TAB
+                 "ror %B0" CR_TAB
+                 "clr %A0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (lsl,%A0) CR_TAB
-                      AS1 (rol,%B0)),
-                      insn, operands, len, 2);
+  out_shift_with_cnt ("lsl %A0" CR_TAB
+                      "rol %B0", insn, operands, len, 2);
   return "";
 }
 
@@ -4629,14 +4833,14 @@ ashlsi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          if (AVR_HAVE_MOVW)
-           return *len = 3, (AS1 (clr,%D0) CR_TAB
-                             AS1 (clr,%C0) CR_TAB
-                             AS2 (movw,%A0,%C0));
+           return *len = 3, ("clr %D0" CR_TAB
+                             "clr %C0" CR_TAB
+                             "movw %A0,%C0");
          *len = 4;
-         return (AS1 (clr,%D0) CR_TAB
-                 AS1 (clr,%C0) CR_TAB
-                 AS1 (clr,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %D0" CR_TAB
+                 "clr %C0" CR_TAB
+                 "clr %B0" CR_TAB
+                 "clr %A0");
 
        case 8:
          {
@@ -4644,15 +4848,15 @@ ashlsi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
            *len = 4;
            if (reg0 >= reg1)
-             return (AS2 (mov,%D0,%C1)  CR_TAB
-                     AS2 (mov,%C0,%B1)  CR_TAB
-                     AS2 (mov,%B0,%A1)  CR_TAB
-                     AS1 (clr,%A0));
+             return ("mov %D0,%C1"  CR_TAB
+                     "mov %C0,%B1"  CR_TAB
+                     "mov %B0,%A1"  CR_TAB
+                     "clr %A0");
            else
-             return (AS1 (clr,%A0)      CR_TAB
-                     AS2 (mov,%B0,%A1)  CR_TAB
-                     AS2 (mov,%C0,%B1)  CR_TAB
-                     AS2 (mov,%D0,%C1));
+             return ("clr %A0"      CR_TAB
+                     "mov %B0,%A1"  CR_TAB
+                     "mov %C0,%B1"  CR_TAB
+                     "mov %D0,%C1");
          }
 
        case 16:
@@ -4660,42 +4864,41 @@ ashlsi3_out (rtx insn, rtx operands[], int *len)
            int reg0 = true_regnum (operands[0]);
            int reg1 = true_regnum (operands[1]);
            if (reg0 + 2 == reg1)
-             return *len = 2, (AS1 (clr,%B0)      CR_TAB
-                               AS1 (clr,%A0));
+             return *len = 2, ("clr %B0"      CR_TAB
+                               "clr %A0");
            if (AVR_HAVE_MOVW)
-             return *len = 3, (AS2 (movw,%C0,%A1) CR_TAB
-                               AS1 (clr,%B0)      CR_TAB
-                               AS1 (clr,%A0));
+             return *len = 3, ("movw %C0,%A1" CR_TAB
+                               "clr %B0"      CR_TAB
+                               "clr %A0");
            else
-             return *len = 4, (AS2 (mov,%C0,%A1)  CR_TAB
-                               AS2 (mov,%D0,%B1)  CR_TAB
-                               AS1 (clr,%B0)      CR_TAB
-                               AS1 (clr,%A0));
+             return *len = 4, ("mov %C0,%A1"  CR_TAB
+                               "mov %D0,%B1"  CR_TAB
+                               "clr %B0"      CR_TAB
+                               "clr %A0");
          }
 
        case 24:
          *len = 4;
-         return (AS2 (mov,%D0,%A1)  CR_TAB
-                 AS1 (clr,%C0)      CR_TAB
-                 AS1 (clr,%B0)      CR_TAB
-                 AS1 (clr,%A0));
+         return ("mov %D0,%A1"  CR_TAB
+                 "clr %C0"      CR_TAB
+                 "clr %B0"      CR_TAB
+                 "clr %A0");
 
        case 31:
          *len = 6;
-         return (AS1 (clr,%D0) CR_TAB
-                 AS1 (lsr,%A0) CR_TAB
-                 AS1 (ror,%D0) CR_TAB
-                 AS1 (clr,%C0) CR_TAB
-                 AS1 (clr,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %D0" CR_TAB
+                 "lsr %A0" CR_TAB
+                 "ror %D0" CR_TAB
+                 "clr %C0" CR_TAB
+                 "clr %B0" CR_TAB
+                 "clr %A0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (lsl,%A0) CR_TAB
-                      AS1 (rol,%B0) CR_TAB
-                      AS1 (rol,%C0) CR_TAB
-                      AS1 (rol,%D0)),
-                      insn, operands, len, 4);
+  out_shift_with_cnt ("lsl %A0" CR_TAB
+                      "rol %B0" CR_TAB
+                      "rol %C0" CR_TAB
+                      "rol %D0", insn, operands, len, 4);
   return "";
 }
 
@@ -4715,40 +4918,40 @@ ashrqi3_out (rtx insn, rtx operands[], int *len)
        {
        case 1:
          *len = 1;
-         return AS1 (asr,%0);
+         return "asr %0";
 
        case 2:
          *len = 2;
-         return (AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0));
+         return ("asr %0" CR_TAB
+                 "asr %0");
 
        case 3:
          *len = 3;
-         return (AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0));
+         return ("asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0");
 
        case 4:
          *len = 4;
-         return (AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0));
+         return ("asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0");
 
        case 5:
          *len = 5;
-         return (AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0) CR_TAB
-                 AS1 (asr,%0));
+         return ("asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0" CR_TAB
+                 "asr %0");
 
        case 6:
          *len = 4;
-         return (AS2 (bst,%0,6)  CR_TAB
-                 AS1 (lsl,%0)    CR_TAB
-                 AS2 (sbc,%0,%0) CR_TAB
-                 AS2 (bld,%0,0));
+         return ("bst %0,6"  CR_TAB
+                 "lsl %0"    CR_TAB
+                 "sbc %0,%0" CR_TAB
+                 "bld %0,0");
 
        default:
          if (INTVAL (operands[2]) < 8)
@@ -4758,15 +4961,15 @@ ashrqi3_out (rtx insn, rtx operands[], int *len)
 
        case 7:
          *len = 2;
-         return (AS1 (lsl,%0) CR_TAB
-                 AS2 (sbc,%0,%0));
+         return ("lsl %0" CR_TAB
+                 "sbc %0,%0");
        }
     }
   else if (CONSTANT_P (operands[2]))
     fatal_insn ("internal compiler error.  Incorrect shift:", insn);
 
-  out_shift_with_cnt (AS1 (asr,%0),
-                     insn, operands, len, 1);
+  out_shift_with_cnt ("asr %0",
+                      insn, operands, len, 1);
   return "";
 }
 
@@ -4797,21 +5000,21 @@ ashrhi3_out (rtx insn, rtx operands[], int *len)
          if (optimize_size)
            break;  /* scratch ? 5 : 6 */
          *len = 8;
-         return (AS2 (mov,__tmp_reg__,%A0) CR_TAB
-                 AS2 (mov,%A0,%B0)         CR_TAB
-                 AS1 (lsl,__tmp_reg__)     CR_TAB
-                 AS1 (rol,%A0)             CR_TAB
-                 AS2 (sbc,%B0,%B0)         CR_TAB
-                 AS1 (lsl,__tmp_reg__)     CR_TAB
-                 AS1 (rol,%A0)             CR_TAB
-                 AS1 (rol,%B0));
+         return ("mov __tmp_reg__,%A0" CR_TAB
+                 "mov %A0,%B0"         CR_TAB
+                 "lsl __tmp_reg__"     CR_TAB
+                 "rol %A0"             CR_TAB
+                 "sbc %B0,%B0"         CR_TAB
+                 "lsl __tmp_reg__"     CR_TAB
+                 "rol %A0"             CR_TAB
+                 "rol %B0");
 
        case 7:
          *len = 4;
-         return (AS1 (lsl,%A0)     CR_TAB
-                 AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (rol,%A0)     CR_TAB
-                 AS2 (sbc,%B0,%B0));
+         return ("lsl %A0"     CR_TAB
+                 "mov %A0,%B0" CR_TAB
+                 "rol %A0"     CR_TAB
+                 "sbc %B0,%B0");
 
        case 8:
          {
@@ -4819,101 +5022,101 @@ ashrhi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
 
            if (reg0 == reg1)
-             return *len = 3, (AS2 (mov,%A0,%B0) CR_TAB
-                               AS1 (lsl,%B0)     CR_TAB
-                               AS2 (sbc,%B0,%B0));
+             return *len = 3, ("mov %A0,%B0" CR_TAB
+                               "lsl %B0"     CR_TAB
+                               "sbc %B0,%B0");
            else 
-             return *len = 4, (AS2 (mov,%A0,%B1) CR_TAB
-                               AS1 (clr,%B0)     CR_TAB
-                               AS2 (sbrc,%A0,7)  CR_TAB
-                               AS1 (dec,%B0));
+             return *len = 4, ("mov %A0,%B1" CR_TAB
+                               "clr %B0"     CR_TAB
+                               "sbrc %A0,7"  CR_TAB
+                               "dec %B0");
          }
 
        case 9:
          *len = 4;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (lsl,%B0)      CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (asr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "lsl %B0"      CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "asr %A0");
 
        case 10:
          *len = 5;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0");
 
        case 11:
          if (AVR_HAVE_MUL && ldi_ok)
            {
              *len = 5;
-             return (AS2 (ldi,%A0,0x20) CR_TAB
-                     AS2 (muls,%B0,%A0) CR_TAB
-                     AS2 (mov,%A0,r1)   CR_TAB
-                     AS2 (sbc,%B0,%B0)  CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %A0,0x20" CR_TAB
+                     "muls %B0,%A0" CR_TAB
+                     "mov %A0,r1"   CR_TAB
+                     "sbc %B0,%B0"  CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          *len = 6;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0");
 
        case 12:
          if (AVR_HAVE_MUL && ldi_ok)
            {
              *len = 5;
-             return (AS2 (ldi,%A0,0x10) CR_TAB
-                     AS2 (muls,%B0,%A0) CR_TAB
-                     AS2 (mov,%A0,r1)   CR_TAB
-                     AS2 (sbc,%B0,%B0)  CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %A0,0x10" CR_TAB
+                     "muls %B0,%A0" CR_TAB
+                     "mov %A0,r1"   CR_TAB
+                     "sbc %B0,%B0"  CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          *len = 7;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0");
 
        case 13:
          if (AVR_HAVE_MUL && ldi_ok)
            {
              *len = 5;
-             return (AS2 (ldi,%A0,0x08) CR_TAB
-                     AS2 (muls,%B0,%A0) CR_TAB
-                     AS2 (mov,%A0,r1)   CR_TAB
-                     AS2 (sbc,%B0,%B0)  CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %A0,0x08" CR_TAB
+                     "muls %B0,%A0" CR_TAB
+                     "mov %A0,r1"   CR_TAB
+                     "sbc %B0,%B0"  CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size)
            break;  /* scratch ? 5 : 7 */
          *len = 8;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0)     CR_TAB
-                 AS1 (asr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0"     CR_TAB
+                 "asr %A0");
 
        case 14:
          *len = 5;
-         return (AS1 (lsl,%B0)     CR_TAB
-                 AS2 (sbc,%A0,%A0) CR_TAB
-                 AS1 (lsl,%B0)     CR_TAB
-                 AS2 (mov,%B0,%A0) CR_TAB
-                 AS1 (rol,%A0));
+         return ("lsl %B0"     CR_TAB
+                 "sbc %A0,%A0" CR_TAB
+                 "lsl %B0"     CR_TAB
+                 "mov %B0,%A0" CR_TAB
+                 "rol %A0");
 
        default:
          if (INTVAL (operands[2]) < 16)
@@ -4922,15 +5125,14 @@ ashrhi3_out (rtx insn, rtx operands[], int *len)
          /* fall through */
 
        case 15:
-         return *len = 3, (AS1 (lsl,%B0)     CR_TAB
-                           AS2 (sbc,%A0,%A0) CR_TAB
-                           AS2 (mov,%B0,%A0));
+         return *len = 3, ("lsl %B0"     CR_TAB
+                           "sbc %A0,%A0" CR_TAB
+                           "mov %B0,%A0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (asr,%B0) CR_TAB
-                      AS1 (ror,%A0)),
-                      insn, operands, len, 2);
+  out_shift_with_cnt ("asr %B0" CR_TAB
+                      "ror %A0", insn, operands, len, 2);
   return "";
 }
 
@@ -4979,7 +5181,7 @@ avr_out_ashrpsi3 (rtx insn, rtx *op, int *plen)
 
           /* fall through */
 
-        case 31:
+        case 23:
           return avr_asm_len ("lsl %C0"     CR_TAB
                               "sbc %A0,%A0" CR_TAB
                               "mov %B0,%A0" CR_TAB
@@ -5015,19 +5217,19 @@ ashrsi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
            *len=6;
            if (reg0 <= reg1)
-             return (AS2 (mov,%A0,%B1) CR_TAB
-                     AS2 (mov,%B0,%C1) CR_TAB
-                     AS2 (mov,%C0,%D1) CR_TAB
-                     AS1 (clr,%D0)     CR_TAB
-                     AS2 (sbrc,%C0,7)  CR_TAB
-                     AS1 (dec,%D0));
+             return ("mov %A0,%B1" CR_TAB
+                     "mov %B0,%C1" CR_TAB
+                     "mov %C0,%D1" CR_TAB
+                     "clr %D0"     CR_TAB
+                     "sbrc %C0,7"  CR_TAB
+                     "dec %D0");
            else
-             return (AS1 (clr,%D0)     CR_TAB
-                     AS2 (sbrc,%D1,7)  CR_TAB
-                     AS1 (dec,%D0)     CR_TAB
-                     AS2 (mov,%C0,%D1) CR_TAB
-                     AS2 (mov,%B0,%C1) CR_TAB
-                     AS2 (mov,%A0,%B1));
+             return ("clr %D0"     CR_TAB
+                     "sbrc %D1,7"  CR_TAB
+                     "dec %D0"     CR_TAB
+                     "mov %C0,%D1" CR_TAB
+                     "mov %B0,%C1" CR_TAB
+                     "mov %A0,%B1");
          }
          
        case 16:
@@ -5036,32 +5238,32 @@ ashrsi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
            
            if (reg0 == reg1 + 2)
-             return *len = 4, (AS1 (clr,%D0)     CR_TAB
-                               AS2 (sbrc,%B0,7)  CR_TAB
-                               AS1 (com,%D0)     CR_TAB
-                               AS2 (mov,%C0,%D0));
+             return *len = 4, ("clr %D0"     CR_TAB
+                               "sbrc %B0,7"  CR_TAB
+                               "com %D0"     CR_TAB
+                               "mov %C0,%D0");
            if (AVR_HAVE_MOVW)
-             return *len = 5, (AS2 (movw,%A0,%C1) CR_TAB
-                               AS1 (clr,%D0)      CR_TAB
-                               AS2 (sbrc,%B0,7)   CR_TAB
-                               AS1 (com,%D0)      CR_TAB
-                               AS2 (mov,%C0,%D0));
+             return *len = 5, ("movw %A0,%C1" CR_TAB
+                               "clr %D0"      CR_TAB
+                               "sbrc %B0,7"   CR_TAB
+                               "com %D0"      CR_TAB
+                               "mov %C0,%D0");
            else 
-             return *len = 6, (AS2 (mov,%B0,%D1) CR_TAB
-                               AS2 (mov,%A0,%C1) CR_TAB
-                               AS1 (clr,%D0)     CR_TAB
-                               AS2 (sbrc,%B0,7)  CR_TAB
-                               AS1 (com,%D0)     CR_TAB
-                               AS2 (mov,%C0,%D0));
+             return *len = 6, ("mov %B0,%D1" CR_TAB
+                               "mov %A0,%C1" CR_TAB
+                               "clr %D0"     CR_TAB
+                               "sbrc %B0,7"  CR_TAB
+                               "com %D0"     CR_TAB
+                               "mov %C0,%D0");
          }
 
        case 24:
-         return *len = 6, (AS2 (mov,%A0,%D1) CR_TAB
-                           AS1 (clr,%D0)     CR_TAB
-                           AS2 (sbrc,%A0,7)  CR_TAB
-                           AS1 (com,%D0)     CR_TAB
-                           AS2 (mov,%B0,%D0) CR_TAB
-                           AS2 (mov,%C0,%D0));
+         return *len = 6, ("mov %A0,%D1" CR_TAB
+                           "clr %D0"     CR_TAB
+                           "sbrc %A0,7"  CR_TAB
+                           "com %D0"     CR_TAB
+                           "mov %B0,%D0" CR_TAB
+                           "mov %C0,%D0");
 
        default:
          if (INTVAL (operands[2]) < 32)
@@ -5071,24 +5273,23 @@ ashrsi3_out (rtx insn, rtx operands[], int *len)
 
        case 31:
          if (AVR_HAVE_MOVW)
-           return *len = 4, (AS1 (lsl,%D0)     CR_TAB
-                             AS2 (sbc,%A0,%A0) CR_TAB
-                             AS2 (mov,%B0,%A0) CR_TAB
-                             AS2 (movw,%C0,%A0));
+           return *len = 4, ("lsl %D0"     CR_TAB
+                             "sbc %A0,%A0" CR_TAB
+                             "mov %B0,%A0" CR_TAB
+                             "movw %C0,%A0");
          else
-           return *len = 5, (AS1 (lsl,%D0)     CR_TAB
-                             AS2 (sbc,%A0,%A0) CR_TAB
-                             AS2 (mov,%B0,%A0) CR_TAB
-                             AS2 (mov,%C0,%A0) CR_TAB
-                             AS2 (mov,%D0,%A0));
+           return *len = 5, ("lsl %D0"     CR_TAB
+                             "sbc %A0,%A0" CR_TAB
+                             "mov %B0,%A0" CR_TAB
+                             "mov %C0,%A0" CR_TAB
+                             "mov %D0,%A0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (asr,%D0) CR_TAB
-                      AS1 (ror,%C0) CR_TAB
-                      AS1 (ror,%B0) CR_TAB
-                      AS1 (ror,%A0)),
-                      insn, operands, len, 4);
+  out_shift_with_cnt ("asr %D0" CR_TAB
+                      "ror %C0" CR_TAB
+                      "ror %B0" CR_TAB
+                      "ror %A0", insn, operands, len, 4);
   return "";
 }
 
@@ -5111,79 +5312,79 @@ lshrqi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          *len = 1;
-         return AS1 (clr,%0);
+         return "clr %0";
 
        case 1:
          *len = 1;
-         return AS1 (lsr,%0);
+         return "lsr %0";
 
        case 2:
          *len = 2;
-         return (AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0));
+         return ("lsr %0" CR_TAB
+                 "lsr %0");
        case 3:
          *len = 3;
-         return (AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0));
+         return ("lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0");
          
        case 4:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len=2;
-             return (AS1 (swap,%0) CR_TAB
-                     AS2 (andi,%0,0x0f));
+             return ("swap %0" CR_TAB
+                     "andi %0,0x0f");
            }
          *len = 4;
-         return (AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0));
+         return ("lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0");
          
        case 5:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len = 3;
-             return (AS1 (swap,%0) CR_TAB
-                     AS1 (lsr,%0)  CR_TAB
-                     AS2 (andi,%0,0x7));
+             return ("swap %0" CR_TAB
+                     "lsr %0"  CR_TAB
+                     "andi %0,0x7");
            }
          *len = 5;
-         return (AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0));
+         return ("lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0");
          
        case 6:
          if (test_hard_reg_class (LD_REGS, operands[0]))
            {
              *len = 4;
-             return (AS1 (swap,%0) CR_TAB
-                     AS1 (lsr,%0)  CR_TAB
-                     AS1 (lsr,%0)  CR_TAB
-                     AS2 (andi,%0,0x3));
+             return ("swap %0" CR_TAB
+                     "lsr %0"  CR_TAB
+                     "lsr %0"  CR_TAB
+                     "andi %0,0x3");
            }
          *len = 6;
-         return (AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0) CR_TAB
-                 AS1 (lsr,%0));
+         return ("lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0" CR_TAB
+                 "lsr %0");
          
        case 7:
          *len = 3;
-         return (AS1 (rol,%0) CR_TAB
-                 AS1 (clr,%0) CR_TAB
-                 AS1 (rol,%0));
+         return ("rol %0" CR_TAB
+                 "clr %0" CR_TAB
+                 "rol %0");
        }
     }
   else if (CONSTANT_P (operands[2]))
     fatal_insn ("internal compiler error.  Incorrect shift:", insn);
   
-  out_shift_with_cnt (AS1 (lsr,%0),
-                     insn, operands, len, 1);
+  out_shift_with_cnt ("lsr %0",
+                      insn, operands, len, 1);
   return "";
 }
 
@@ -5209,8 +5410,8 @@ lshrhi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          *len = 2;
-         return (AS1 (clr,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %B0" CR_TAB
+                 "clr %A0");
 
        case 4:
          if (optimize_size && scratch)
@@ -5218,23 +5419,23 @@ lshrhi3_out (rtx insn, rtx operands[], int *len)
          if (ldi_ok)
            {
              *len = 6;
-             return (AS1 (swap,%B0)      CR_TAB
-                     AS1 (swap,%A0)      CR_TAB
-                     AS2 (andi,%A0,0x0f) CR_TAB
-                     AS2 (eor,%A0,%B0)   CR_TAB
-                     AS2 (andi,%B0,0x0f) CR_TAB
-                     AS2 (eor,%A0,%B0));
+             return ("swap %B0"      CR_TAB
+                     "swap %A0"      CR_TAB
+                     "andi %A0,0x0f" CR_TAB
+                     "eor %A0,%B0"   CR_TAB
+                     "andi %B0,0x0f" CR_TAB
+                     "eor %A0,%B0");
            }
          if (scratch)
            {
              *len = 7;
-             return (AS1 (swap,%B0)    CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS2 (ldi,%3,0x0f) CR_TAB
+             return ("swap %B0"    CR_TAB
+                     "swap %A0"    CR_TAB
+                     "ldi %3,0x0f" CR_TAB
                      "and %A0,%3"      CR_TAB
-                     AS2 (eor,%A0,%B0) CR_TAB
+                     "eor %A0,%B0" CR_TAB
                      "and %B0,%3"      CR_TAB
-                     AS2 (eor,%A0,%B0));
+                     "eor %A0,%B0");
            }
          break;  /* optimize_size ? 6 : 8 */
 
@@ -5244,27 +5445,27 @@ lshrhi3_out (rtx insn, rtx operands[], int *len)
          if (ldi_ok)
            {
              *len = 8;
-             return (AS1 (lsr,%B0)       CR_TAB
-                     AS1 (ror,%A0)       CR_TAB
-                     AS1 (swap,%B0)      CR_TAB
-                     AS1 (swap,%A0)      CR_TAB
-                     AS2 (andi,%A0,0x0f) CR_TAB
-                     AS2 (eor,%A0,%B0)   CR_TAB
-                     AS2 (andi,%B0,0x0f) CR_TAB
-                     AS2 (eor,%A0,%B0));
+             return ("lsr %B0"       CR_TAB
+                     "ror %A0"       CR_TAB
+                     "swap %B0"      CR_TAB
+                     "swap %A0"      CR_TAB
+                     "andi %A0,0x0f" CR_TAB
+                     "eor %A0,%B0"   CR_TAB
+                     "andi %B0,0x0f" CR_TAB
+                     "eor %A0,%B0");
            }
          if (scratch)
            {
              *len = 9;
-             return (AS1 (lsr,%B0)     CR_TAB
-                     AS1 (ror,%A0)     CR_TAB
-                     AS1 (swap,%B0)    CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS2 (ldi,%3,0x0f) CR_TAB
+             return ("lsr %B0"     CR_TAB
+                     "ror %A0"     CR_TAB
+                     "swap %B0"    CR_TAB
+                     "swap %A0"    CR_TAB
+                     "ldi %3,0x0f" CR_TAB
                      "and %A0,%3"      CR_TAB
-                     AS2 (eor,%A0,%B0) CR_TAB
+                     "eor %A0,%B0" CR_TAB
                      "and %B0,%3"      CR_TAB
-                     AS2 (eor,%A0,%B0));
+                     "eor %A0,%B0");
            }
          break;  /* 10 */
 
@@ -5272,175 +5473,174 @@ lshrhi3_out (rtx insn, rtx operands[], int *len)
          if (optimize_size)
            break;  /* scratch ? 5 : 6 */
          *len = 9;
-         return (AS1 (clr,__tmp_reg__) CR_TAB
-                 AS1 (lsl,%A0)         CR_TAB
-                 AS1 (rol,%B0)         CR_TAB
-                 AS1 (rol,__tmp_reg__) CR_TAB
-                 AS1 (lsl,%A0)         CR_TAB
-                 AS1 (rol,%B0)         CR_TAB
-                 AS1 (rol,__tmp_reg__) CR_TAB
-                 AS2 (mov,%A0,%B0)     CR_TAB
-                 AS2 (mov,%B0,__tmp_reg__));
+         return ("clr __tmp_reg__" CR_TAB
+                 "lsl %A0"         CR_TAB
+                 "rol %B0"         CR_TAB
+                 "rol __tmp_reg__" CR_TAB
+                 "lsl %A0"         CR_TAB
+                 "rol %B0"         CR_TAB
+                 "rol __tmp_reg__" CR_TAB
+                 "mov %A0,%B0"     CR_TAB
+                 "mov %B0,__tmp_reg__");
 
        case 7:
          *len = 5;
-         return (AS1 (lsl,%A0)     CR_TAB
-                 AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (rol,%A0)     CR_TAB
-                 AS2 (sbc,%B0,%B0) CR_TAB
-                 AS1 (neg,%B0));
+         return ("lsl %A0"     CR_TAB
+                 "mov %A0,%B0" CR_TAB
+                 "rol %A0"     CR_TAB
+                 "sbc %B0,%B0" CR_TAB
+                 "neg %B0");
 
        case 8:
-         return *len = 2, (AS2 (mov,%A0,%B1) CR_TAB
-                           AS1 (clr,%B0));
+         return *len = 2, ("mov %A0,%B1" CR_TAB
+                           "clr %B0");
 
        case 9:
          *len = 3;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (clr,%B0)     CR_TAB
-                 AS1 (lsr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "clr %B0"     CR_TAB
+                 "lsr %A0");
 
        case 10:
          *len = 4;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (clr,%B0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "clr %B0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0");
 
        case 11:
          *len = 5;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (clr,%B0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "clr %B0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0");
 
        case 12:
          if (ldi_ok)
            {
              *len = 4;
-             return (AS2 (mov,%A0,%B0) CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS2 (andi,%A0,0x0f));
+             return ("mov %A0,%B0" CR_TAB
+                     "clr %B0"     CR_TAB
+                     "swap %A0"    CR_TAB
+                     "andi %A0,0x0f");
            }
          if (scratch)
            {
              *len = 5;
-             return (AS2 (mov,%A0,%B0) CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS2 (ldi,%3,0x0f) CR_TAB
+             return ("mov %A0,%B0" CR_TAB
+                     "clr %B0"     CR_TAB
+                     "swap %A0"    CR_TAB
+                     "ldi %3,0x0f" CR_TAB
                      "and %A0,%3");
            }
          *len = 6;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (clr,%B0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "clr %B0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0");
 
        case 13:
          if (ldi_ok)
            {
              *len = 5;
-             return (AS2 (mov,%A0,%B0) CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS1 (lsr,%A0)     CR_TAB
-                     AS2 (andi,%A0,0x07));
+             return ("mov %A0,%B0" CR_TAB
+                     "clr %B0"     CR_TAB
+                     "swap %A0"    CR_TAB
+                     "lsr %A0"     CR_TAB
+                     "andi %A0,0x07");
            }
          if (AVR_HAVE_MUL && scratch)
            {
              *len = 5;
-             return (AS2 (ldi,%3,0x08) CR_TAB
-                     AS2 (mul,%B0,%3)  CR_TAB
-                     AS2 (mov,%A0,r1)  CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %3,0x08" CR_TAB
+                     "mul %B0,%3"  CR_TAB
+                     "mov %A0,r1"  CR_TAB
+                     "clr %B0"     CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          if (scratch)
            {
              *len = 6;
-             return (AS2 (mov,%A0,%B0) CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (swap,%A0)    CR_TAB
-                     AS1 (lsr,%A0)     CR_TAB
-                     AS2 (ldi,%3,0x07) CR_TAB
+             return ("mov %A0,%B0" CR_TAB
+                     "clr %B0"     CR_TAB
+                     "swap %A0"    CR_TAB
+                     "lsr %A0"     CR_TAB
+                     "ldi %3,0x07" CR_TAB
                      "and %A0,%3");
            }
          if (AVR_HAVE_MUL)
            {
              *len = 6;
              return ("set"            CR_TAB
-                     AS2 (bld,r1,3)   CR_TAB
-                     AS2 (mul,%B0,r1) CR_TAB
-                     AS2 (mov,%A0,r1) CR_TAB
-                     AS1 (clr,%B0)    CR_TAB
-                     AS1 (clr,__zero_reg__));
+                     "bld r1,3"   CR_TAB
+                     "mul %B0,r1" CR_TAB
+                     "mov %A0,r1" CR_TAB
+                     "clr %B0"    CR_TAB
+                     "clr __zero_reg__");
            }
          *len = 7;
-         return (AS2 (mov,%A0,%B0) CR_TAB
-                 AS1 (clr,%B0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0)     CR_TAB
-                 AS1 (lsr,%A0));
+         return ("mov %A0,%B0" CR_TAB
+                 "clr %B0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0"     CR_TAB
+                 "lsr %A0");
 
        case 14:
          if (AVR_HAVE_MUL && ldi_ok)
            {
              *len = 5;
-             return (AS2 (ldi,%A0,0x04) CR_TAB
-                     AS2 (mul,%B0,%A0)  CR_TAB
-                     AS2 (mov,%A0,r1)   CR_TAB
-                     AS1 (clr,%B0)      CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %A0,0x04" CR_TAB
+                     "mul %B0,%A0"  CR_TAB
+                     "mov %A0,r1"   CR_TAB
+                     "clr %B0"      CR_TAB
+                     "clr __zero_reg__");
            }
          if (AVR_HAVE_MUL && scratch)
            {
              *len = 5;
-             return (AS2 (ldi,%3,0x04) CR_TAB
-                     AS2 (mul,%B0,%3)  CR_TAB
-                     AS2 (mov,%A0,r1)  CR_TAB
-                     AS1 (clr,%B0)     CR_TAB
-                     AS1 (clr,__zero_reg__));
+             return ("ldi %3,0x04" CR_TAB
+                     "mul %B0,%3"  CR_TAB
+                     "mov %A0,r1"  CR_TAB
+                     "clr %B0"     CR_TAB
+                     "clr __zero_reg__");
            }
          if (optimize_size && ldi_ok)
            {
              *len = 5;
-             return (AS2 (mov,%A0,%B0) CR_TAB
-                     AS2 (ldi,%B0,6) "\n1:\t"
-                     AS1 (lsr,%A0)     CR_TAB
-                     AS1 (dec,%B0)     CR_TAB
-                     AS1 (brne,1b));
+             return ("mov %A0,%B0" CR_TAB
+                     "ldi %B0,6" "\n1:\t"
+                     "lsr %A0"     CR_TAB
+                     "dec %B0"     CR_TAB
+                     "brne 1b");
            }
          if (optimize_size && scratch)
            break;  /* 5 */
          *len = 6;
-         return (AS1 (clr,%A0) CR_TAB
-                 AS1 (lsl,%B0) CR_TAB
-                 AS1 (rol,%A0) CR_TAB
-                 AS1 (lsl,%B0) CR_TAB
-                 AS1 (rol,%A0) CR_TAB
-                 AS1 (clr,%B0));
+         return ("clr %A0" CR_TAB
+                 "lsl %B0" CR_TAB
+                 "rol %A0" CR_TAB
+                 "lsl %B0" CR_TAB
+                 "rol %A0" CR_TAB
+                 "clr %B0");
 
        case 15:
          *len = 4;
-         return (AS1 (clr,%A0) CR_TAB
-                 AS1 (lsl,%B0) CR_TAB
-                 AS1 (rol,%A0) CR_TAB
-                 AS1 (clr,%B0));
+         return ("clr %A0" CR_TAB
+                 "lsl %B0" CR_TAB
+                 "rol %A0" CR_TAB
+                 "clr %B0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (lsr,%B0) CR_TAB
-                      AS1 (ror,%A0)),
-                      insn, operands, len, 2);
+  out_shift_with_cnt ("lsr %B0" CR_TAB
+                      "ror %A0", insn, operands, len, 2);
   return "";
 }
 
@@ -5519,14 +5719,14 @@ lshrsi3_out (rtx insn, rtx operands[], int *len)
            break;
 
          if (AVR_HAVE_MOVW)
-           return *len = 3, (AS1 (clr,%D0) CR_TAB
-                             AS1 (clr,%C0) CR_TAB
-                             AS2 (movw,%A0,%C0));
+           return *len = 3, ("clr %D0" CR_TAB
+                             "clr %C0" CR_TAB
+                             "movw %A0,%C0");
          *len = 4;
-         return (AS1 (clr,%D0) CR_TAB
-                 AS1 (clr,%C0) CR_TAB
-                 AS1 (clr,%B0) CR_TAB
-                 AS1 (clr,%A0));
+         return ("clr %D0" CR_TAB
+                 "clr %C0" CR_TAB
+                 "clr %B0" CR_TAB
+                 "clr %A0");
 
        case 8:
          {
@@ -5534,15 +5734,15 @@ lshrsi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
            *len = 4;
            if (reg0 <= reg1)
-             return (AS2 (mov,%A0,%B1) CR_TAB
-                     AS2 (mov,%B0,%C1) CR_TAB
-                     AS2 (mov,%C0,%D1) CR_TAB
-                     AS1 (clr,%D0));
+             return ("mov %A0,%B1" CR_TAB
+                     "mov %B0,%C1" CR_TAB
+                     "mov %C0,%D1" CR_TAB
+                     "clr %D0");
            else
-             return (AS1 (clr,%D0)     CR_TAB
-                     AS2 (mov,%C0,%D1) CR_TAB
-                     AS2 (mov,%B0,%C1) CR_TAB
-                     AS2 (mov,%A0,%B1)); 
+             return ("clr %D0"     CR_TAB
+                     "mov %C0,%D1" CR_TAB
+                     "mov %B0,%C1" CR_TAB
+                     "mov %A0,%B1"); 
          }
          
        case 16:
@@ -5551,41 +5751,40 @@ lshrsi3_out (rtx insn, rtx operands[], int *len)
            int reg1 = true_regnum (operands[1]);
 
            if (reg0 == reg1 + 2)
-             return *len = 2, (AS1 (clr,%C0)     CR_TAB
-                               AS1 (clr,%D0));
+             return *len = 2, ("clr %C0"     CR_TAB
+                               "clr %D0");
            if (AVR_HAVE_MOVW)
-             return *len = 3, (AS2 (movw,%A0,%C1) CR_TAB
-                               AS1 (clr,%C0)      CR_TAB
-                               AS1 (clr,%D0));
+             return *len = 3, ("movw %A0,%C1" CR_TAB
+                               "clr %C0"      CR_TAB
+                               "clr %D0");
            else
-             return *len = 4, (AS2 (mov,%B0,%D1) CR_TAB
-                               AS2 (mov,%A0,%C1) CR_TAB
-                               AS1 (clr,%C0)     CR_TAB
-                               AS1 (clr,%D0));
+             return *len = 4, ("mov %B0,%D1" CR_TAB
+                               "mov %A0,%C1" CR_TAB
+                               "clr %C0"     CR_TAB
+                               "clr %D0");
          }
          
        case 24:
-         return *len = 4, (AS2 (mov,%A0,%D1) CR_TAB
-                           AS1 (clr,%B0)     CR_TAB
-                           AS1 (clr,%C0)     CR_TAB
-                           AS1 (clr,%D0));
+         return *len = 4, ("mov %A0,%D1" CR_TAB
+                           "clr %B0"     CR_TAB
+                           "clr %C0"     CR_TAB
+                           "clr %D0");
 
        case 31:
          *len = 6;
-         return (AS1 (clr,%A0)    CR_TAB
-                 AS2 (sbrc,%D0,7) CR_TAB
-                 AS1 (inc,%A0)    CR_TAB
-                 AS1 (clr,%B0)    CR_TAB
-                 AS1 (clr,%C0)    CR_TAB
-                 AS1 (clr,%D0));
+         return ("clr %A0"    CR_TAB
+                 "sbrc %D0,7" CR_TAB
+                 "inc %A0"    CR_TAB
+                 "clr %B0"    CR_TAB
+                 "clr %C0"    CR_TAB
+                 "clr %D0");
        }
       len = t;
     }
-  out_shift_with_cnt ((AS1 (lsr,%D0) CR_TAB
-                      AS1 (ror,%C0) CR_TAB
-                      AS1 (ror,%B0) CR_TAB
-                      AS1 (ror,%A0)),
-                     insn, operands, len, 4);
+  out_shift_with_cnt ("lsr %D0" CR_TAB
+                      "ror %C0" CR_TAB
+                      "ror %B0" CR_TAB
+                      "ror %A0", insn, operands, len, 4);
   return "";
 }
 
@@ -5632,7 +5831,7 @@ avr_out_plus_1 (rtx *xop, int *plen, enum rtx_code code, int *pcc)
   *pcc = (MINUS == code) ? CC_SET_CZN : CC_CLOBBER;
 
   if (MINUS == code)
-    xval = gen_int_mode (-UINTVAL (xval), mode);
+    xval = simplify_unary_operation (NEG, mode, xval, mode);
 
   op[2] = xop[3];
 
@@ -5652,7 +5851,7 @@ avr_out_plus_1 (rtx *xop, int *plen, enum rtx_code code, int *pcc)
       bool ld_reg_p = test_hard_reg_class (LD_REGS, reg8);
 
       op[0] = reg8;
-      op[1] = GEN_INT (val8);
+      op[1] = gen_int_mode (val8, QImode);
 
       /* To get usable cc0 no low-bytes must have been skipped.  */
       
@@ -5807,6 +6006,25 @@ avr_out_plus_noclobber (rtx *xop, int *plen, int *pcc)
   return avr_out_plus (op, plen, pcc);
 }
 
+
+/* Prepare operands of adddi3_const_insn to be used with avr_out_plus_1.  */
+
+const char*
+avr_out_plus64 (rtx addend, int *plen)
+{
+  int cc_dummy;
+  rtx op[4];
+
+  op[0] = gen_rtx_REG (DImode, 18);
+  op[1] = op[0];
+  op[2] = addend;
+  op[3] = NULL_RTX;
+
+  avr_out_plus_1 (op, plen, MINUS, &cc_dummy);
+
+  return "";
+}
+
 /* Output bit operation (IOR, AND, XOR) with register XOP[0] and compile
    time constant XOP[2]:
 
@@ -6192,6 +6410,7 @@ adjust_insn_length (rtx insn, int len)
     case ADJUST_LEN_OUT_BITOP: avr_out_bitop (insn, op, &len); break;
       
     case ADJUST_LEN_OUT_PLUS: avr_out_plus (op, &len, NULL); break;
+    case ADJUST_LEN_PLUS64: avr_out_plus64 (op[0], &len); break;
     case ADJUST_LEN_OUT_PLUS_NOCLOBBER:
       avr_out_plus_noclobber (op, &len, NULL); break;
 
@@ -6201,11 +6420,15 @@ adjust_insn_length (rtx insn, int len)
     case ADJUST_LEN_MOV16: output_movhi (insn, op, &len); break;
     case ADJUST_LEN_MOV24: avr_out_movpsi (insn, op, &len); break;
     case ADJUST_LEN_MOV32: output_movsisf (insn, op, &len); break;
-      
+    case ADJUST_LEN_MOVMEM: avr_out_movmem (insn, op, &len); break;
+    case ADJUST_LEN_XLOAD: avr_out_xload (insn, op, &len); break;
+    case ADJUST_LEN_LOAD_LPM: avr_load_lpm (insn, op, &len); break;
+
     case ADJUST_LEN_TSTHI: avr_out_tsthi (insn, op, &len); break;
     case ADJUST_LEN_TSTPSI: avr_out_tstpsi (insn, op, &len); break;
     case ADJUST_LEN_TSTSI: avr_out_tstsi (insn, op, &len); break;
     case ADJUST_LEN_COMPARE: avr_out_compare (insn, op, &len); break;
+    case ADJUST_LEN_COMPARE64: avr_out_compare64 (insn, op, &len); break;
 
     case ADJUST_LEN_LSHRQI: lshrqi3_out (insn, op, &len); break;
     case ADJUST_LEN_LSHRHI: lshrhi3_out (insn, op, &len); break;
@@ -6225,10 +6448,12 @@ adjust_insn_length (rtx insn, int len)
 
     case ADJUST_LEN_CALL: len = AVR_HAVE_JMP_CALL ? 2 : 1; break;
 
+    case ADJUST_LEN_INSERT_BITS: avr_out_insert_bits (op, &len); break;
+
     default:
       gcc_unreachable();
     }
-  
+
   return len;
 }
 
@@ -6346,6 +6571,49 @@ _reg_unused_after (rtx insn, rtx reg)
   return 1;
 }
 
+
+/* Return RTX that represents the lower 16 bits of a constant address.
+   Unfortunately, simplify_gen_subreg does not handle this case.  */
+
+static rtx
+avr_const_address_lo16 (rtx x)
+{
+  rtx lo16;
+  
+  switch (GET_CODE (x))
+    {
+    default:
+      break;
+      
+    case CONST:
+      if (PLUS == GET_CODE (XEXP (x, 0))
+          && SYMBOL_REF == GET_CODE (XEXP (XEXP (x, 0), 0))
+          && CONST_INT_P (XEXP (XEXP (x, 0), 1)))
+        {
+          HOST_WIDE_INT offset = INTVAL (XEXP (XEXP (x, 0), 1));
+          const char *name = XSTR (XEXP (XEXP (x, 0), 0), 0);
+          
+          lo16 = gen_rtx_SYMBOL_REF (Pmode, ggc_strdup (name));
+          lo16 = gen_rtx_CONST (Pmode, plus_constant (lo16, offset));
+          
+          return lo16;
+        }
+      
+      break;
+      
+    case SYMBOL_REF:
+      {
+        const char *name = XSTR (x, 0);
+        
+        return gen_rtx_SYMBOL_REF (Pmode, ggc_strdup (name));
+      }
+    }
+  
+  avr_edump ("\n%?: %r\n", x);
+  gcc_unreachable();
+}
+
+
 /* Target hook for assembling integer objects.  The AVR version needs
    special handling for references to certain labels.  */
 
@@ -6358,11 +6626,30 @@ avr_assemble_integer (rtx x, unsigned int size, int aligned_p)
       fputs ("\t.word\tgs(", asm_out_file);
       output_addr_const (asm_out_file, x);
       fputs (")\n", asm_out_file);
+      
+      return true;
+    }
+  else if (GET_MODE (x) == PSImode)
+    {
+      default_assemble_integer (avr_const_address_lo16 (x),
+                                GET_MODE_SIZE (HImode), aligned_p);
+      
+      fputs ("\t.warning\t\"assembling 24-bit address needs binutils"
+             " extension for hh8(", asm_out_file);
+      output_addr_const (asm_out_file, x);
+      fputs (")\"\n", asm_out_file);
+      
+      fputs ("\t.byte\t0\t" ASM_COMMENT_START " hh8(", asm_out_file);
+      output_addr_const (asm_out_file, x);
+      fputs (")\n", asm_out_file);
+      
       return true;
     }
+  
   return default_assemble_integer (x, size, aligned_p);
 }
 
+
 /* Worker function for ASM_DECLARE_FUNCTION_NAME.  */
 
 void
@@ -6518,6 +6805,7 @@ avr_attribute_table[] =
    Return non-zero if DECL is data that must end up in Flash and
    zero if the data lives in RAM (.bss, .data, .rodata, ...).
    
+   Return 2   if DECL is located in 24-bit flash address-space
    Return 1   if DECL is located in 16-bit flash address-space
    Return -1  if attribute `progmem' occurs in DECL or ATTRIBUTES
    Return 0   otherwise  */
@@ -6530,7 +6818,10 @@ avr_progmem_p (tree decl, tree attributes)
   if (TREE_CODE (decl) != VAR_DECL)
     return 0;
 
-  if (avr_decl_pgm_p (decl))
+  if (avr_decl_memx_p (decl))
+    return 2;
+
+  if (avr_decl_flash_p (decl))
     return 1;
 
   if (NULL_TREE
@@ -6566,6 +6857,7 @@ avr_nonconst_pointer_addrspace (tree typ)
 
   if (POINTER_TYPE_P (typ))
     {
+      addr_space_t as;
       tree target = TREE_TYPE (typ);
 
       /* Pointer to function: Test the function's return type.  */
@@ -6578,12 +6870,16 @@ avr_nonconst_pointer_addrspace (tree typ)
       while (TREE_CODE (target) == ARRAY_TYPE)
         target = TREE_TYPE (target);
 
-      if (!ADDR_SPACE_GENERIC_P (TYPE_ADDR_SPACE (target))
-          && !TYPE_READONLY (target))
-        {
-          /* Pointers to non-generic address space must be const.  */
+      /* Pointers to non-generic address space must be const.
+         Refuse address spaces outside the device's flash.  */
           
-          return TYPE_ADDR_SPACE (target);
+      as = TYPE_ADDR_SPACE (target);
+        
+      if (!ADDR_SPACE_GENERIC_P (as)
+          && (!TYPE_READONLY (target)
+              || avr_addrspace[as].segment >= avr_current_device->n_flash))
+        {
+          return as;
         }
 
       /* Scan pointer's target type.  */
@@ -6595,8 +6891,8 @@ avr_nonconst_pointer_addrspace (tree typ)
 }
 
 
-/* Sanity check NODE so that all pointers targeting address space AS1
-   go along with CONST qualifier.  Writing to this address space should
+/* Sanity check NODE so that all pointers targeting non-generic addres spaces
+   go along with CONST qualifier.  Writing to these address spaces should
    be detected and complained about as early as possible.  */
 
 static bool
@@ -6645,12 +6941,29 @@ avr_pgm_check_var_decl (tree node)
 
   if (reason)
     {
-      if (TYPE_P (node))
-        error ("pointer targeting address space %qs must be const in %qT",
-               c_addr_space_name (as), node);
+      avr_edump ("%?: %s, %d, %d\n",
+                 avr_addrspace[as].name,
+                 avr_addrspace[as].segment, avr_current_device->n_flash);
+      if (avr_addrspace[as].segment >= avr_current_device->n_flash)
+        {
+          if (TYPE_P (node))
+            error ("%qT uses address space %qs beyond flash of %qs",
+                   node, avr_addrspace[as].name, avr_current_device->name);
+          else
+            error ("%s %q+D uses address space %qs beyond flash of %qs",
+                   reason, node, avr_addrspace[as].name,
+                   avr_current_device->name);
+        }
       else
-        error ("pointer targeting address space %qs must be const in %s %q+D",
-               c_addr_space_name (as), reason, node);
+        {
+          if (TYPE_P (node))
+            error ("pointer targeting address space %qs must be const in %qT",
+                   avr_addrspace[as].name, node);
+          else
+            error ("pointer targeting address space %qs must be const"
+                   " in %s %q+D",
+                   avr_addrspace[as].name, reason, node);
+        }
     }
 
   return reason == NULL;
@@ -6668,6 +6981,7 @@ avr_insert_attributes (tree node, tree *attributes)
       && (TREE_STATIC (node) || DECL_EXTERNAL (node))
       && avr_progmem_p (node, *attributes))
     {
+      addr_space_t as;
       tree node0 = node;
 
       /* For C++, we have to peel arrays in order to get correct
@@ -6679,15 +6993,23 @@ avr_insert_attributes (tree node, tree *attributes)
 
       if (error_mark_node == node0)
         return;
+
+      as = TYPE_ADDR_SPACE (TREE_TYPE (node));
+
+      if (avr_addrspace[as].segment >= avr_current_device->n_flash)
+        {
+          error ("variable %q+D located in address space %qs"
+                 " beyond flash of %qs",
+                 node, avr_addrspace[as].name, avr_current_device->name);
+        }
       
       if (!TYPE_READONLY (node0)
           && !TREE_READONLY (node))
         {
-          addr_space_t as = TYPE_ADDR_SPACE (TREE_TYPE (node));
           const char *reason = "__attribute__((progmem))";
 
           if (!ADDR_SPACE_GENERIC_P (as))
-            reason = c_addr_space_name (as);
+            reason = avr_addrspace[as].name;
           
           if (avr_log.progmem)
             avr_edump ("\n%?: %t\n%t\n", node, node0);
@@ -6710,7 +7032,11 @@ avr_asm_output_aligned_decl_common (FILE * stream,
                                     unsigned HOST_WIDE_INT size,
                                     unsigned int align, bool local_p)
 {
-  avr_need_clear_bss_p = true;
+  /* __gnu_lto_v1 etc. are just markers for the linker injected by toplev.c.
+     There is no need to trigger __do_clear_bss code for them.  */
+
+  if (!STR_PREFIX_P (name, "__gnu_lto"))
+    avr_need_clear_bss_p = true;
 
   if (local_p)
     ASM_OUTPUT_ALIGNED_LOCAL (stream, name, size, align);
@@ -6745,11 +7071,23 @@ avr_output_bss_section_asm_op (const void *data)
 }
 
 
+/* Unnamed section callback for progmem*.data sections.  */
+
+static void
+avr_output_progmem_section_asm_op (const void *data)
+{
+  fprintf (asm_out_file, "\t.section\t%s,\"a\",@progbits\n",
+           (const char*) data);
+}
+
+
 /* Implement `TARGET_ASM_INIT_SECTIONS'.  */
 
 static void
 avr_asm_init_sections (void)
 {
+  unsigned int n;
+  
   /* Set up a section for jump tables.  Alignment is handled by
      ASM_OUTPUT_BEFORE_CASE_LABEL.  */
   
@@ -6768,9 +7106,12 @@ avr_asm_init_sections (void)
                                ",\"ax\",@progbits");
     }
 
-  progmem_section
-    = get_unnamed_section (0, output_section_asm_op,
-                           "\t.section\t.progmem.data,\"a\",@progbits");
+  for (n = 0; n < sizeof (progmem_section) / sizeof (*progmem_section); n++)
+    {
+      progmem_section[n]
+        = get_unnamed_section (0, avr_output_progmem_section_asm_op,
+                               progmem_section_prefix[n]);
+    }
   
   /* Override section callbacks to keep track of `avr_need_clear_bss_p'
      resp. `avr_need_copy_data_p'.  */
@@ -6826,9 +7167,8 @@ avr_asm_function_rodata_section (tree decl)
 
           if (STR_PREFIX_P (name, old_prefix))
             {
-              const char *rname = avr_replace_prefix (name,
-                                                      old_prefix, new_prefix);
-
+              const char *rname = ACONCAT ((new_prefix,
+                                            name + strlen (old_prefix), NULL));
               flags &= ~SECTION_CODE;
               flags |= AVR_HAVE_JMP_CALL ? 0 : SECTION_CODE;
               
@@ -6849,17 +7189,20 @@ avr_asm_named_section (const char *name, unsigned int flags, tree decl)
 {
   if (flags & AVR_SECTION_PROGMEM)
     {
+      addr_space_t as = (flags & AVR_SECTION_PROGMEM) / SECTION_MACH_DEP;
+      int segment = avr_addrspace[as].segment;
       const char *old_prefix = ".rodata";
-      const char *new_prefix = ".progmem.data";
-      const char *sname = new_prefix;
+      const char *new_prefix = progmem_section_prefix[segment];
       
       if (STR_PREFIX_P (name, old_prefix))
         {
-          sname = avr_replace_prefix (name, old_prefix, new_prefix);
+          const char *sname = ACONCAT ((new_prefix,
+                                        name + strlen (old_prefix), NULL));
+          default_elf_asm_named_section (sname, flags, decl);
+          return;
         }
 
-      default_elf_asm_named_section (sname, flags, decl);
-
+      default_elf_asm_named_section (new_prefix, flags, decl);
       return;
     }
   
@@ -6892,9 +7235,18 @@ avr_section_type_flags (tree decl, const char *name, int reloc)
   if (decl && DECL_P (decl)
       && avr_progmem_p (decl, DECL_ATTRIBUTES (decl)))
     {
+      addr_space_t as = TYPE_ADDR_SPACE (TREE_TYPE (decl));
+
+      /* Attribute progmem puts data in generic address space.
+         Set section flags as if it was in __flash to get the right
+         section prefix in the remainder.  */
+
+      if (ADDR_SPACE_GENERIC_P (as))
+        as = ADDR_SPACE_FLASH;
+
+      flags |= as * SECTION_MACH_DEP;
       flags &= ~SECTION_WRITE;
       flags &= ~SECTION_BSS;
-      flags |= AVR_SECTION_PROGMEM;
     }
   
   return flags;
@@ -6904,8 +7256,7 @@ avr_section_type_flags (tree decl, const char *name, int reloc)
 /* Implement `TARGET_ENCODE_SECTION_INFO'.  */
 
 static void
-avr_encode_section_info (tree decl, rtx rtl,
-                         int new_decl_p)
+avr_encode_section_info (tree decl, rtx rtl, int new_decl_p)
 {
   /* In avr_handle_progmem_attribute, DECL_INITIAL is not yet
      readily available, see PR34734.  So we postpone the warning
@@ -6914,6 +7265,7 @@ avr_encode_section_info (tree decl, rtx rtl,
   if (new_decl_p
       && decl && DECL_P (decl)
       && NULL_TREE == DECL_INITIAL (decl)
+      && !DECL_EXTERNAL (decl)
       && avr_progmem_p (decl, DECL_ATTRIBUTES (decl)))
     {
       warning (OPT_Wuninitialized,
@@ -6922,6 +7274,23 @@ avr_encode_section_info (tree decl, rtx rtl,
     }
 
   default_encode_section_info (decl, rtl, new_decl_p);
+
+  if (decl && DECL_P (decl)
+      && TREE_CODE (decl) != FUNCTION_DECL
+      && MEM_P (rtl)
+      && SYMBOL_REF == GET_CODE (XEXP (rtl, 0)))
+   {
+      rtx sym = XEXP (rtl, 0);
+      addr_space_t as = TYPE_ADDR_SPACE (TREE_TYPE (decl));
+
+      /* PSTR strings are in generic space but located in flash:
+         patch address space.  */
+      
+      if (-1 == avr_progmem_p (decl, DECL_ATTRIBUTES (decl)))
+        as = ADDR_SPACE_FLASH;
+
+      AVR_SYMBOL_SET_ADDR_SPACE (sym, as);
+    }
 }
 
 
@@ -6935,46 +7304,61 @@ avr_asm_select_section (tree decl, int reloc, unsigned HOST_WIDE_INT align)
   if (decl && DECL_P (decl)
       && avr_progmem_p (decl, DECL_ATTRIBUTES (decl)))
     {
+      addr_space_t as = TYPE_ADDR_SPACE (TREE_TYPE (decl));
+      int segment = avr_addrspace[as].segment;
+      
       if (sect->common.flags & SECTION_NAMED)
         {
           const char * name = sect->named.name;
           const char * old_prefix = ".rodata";
-          const char * new_prefix = ".progmem.data";
+          const char * new_prefix = progmem_section_prefix[segment];
 
           if (STR_PREFIX_P (name, old_prefix))
             {
-              const char *sname = avr_replace_prefix (name,
-                                                      old_prefix, new_prefix);
-
+              const char *sname = ACONCAT ((new_prefix,
+                                            name + strlen (old_prefix), NULL));
               return get_section (sname, sect->common.flags, sect->named.decl);
             }
         }
           
-      return progmem_section;
+      return progmem_section[segment];
     }
 
   return sect;
 }
 
 /* Implement `TARGET_ASM_FILE_START'.  */
-/* Outputs some appropriate text to go at the start of an assembler
-   file.  */
+/* Outputs some text at the start of each assembler file.  */
 
 static void
 avr_file_start (void)
 {
+  int sfr_offset = avr_current_arch->sfr_offset;
+
   if (avr_current_arch->asm_only)
     error ("MCU %qs supported for assembler only", avr_current_device->name);
 
   default_file_start ();
 
-/*  fprintf (asm_out_file, "\t.arch %s\n", avr_current_device->name);*/
-  fputs ("__SREG__ = 0x3f\n"
-        "__SP_H__ = 0x3e\n"
-        "__SP_L__ = 0x3d\n", asm_out_file);
-  
-  fputs ("__tmp_reg__ = 0\n" 
-         "__zero_reg__ = 1\n", asm_out_file);
+  /* Print I/O addresses of some SFRs used with IN and OUT.  */
+
+  if (AVR_HAVE_SPH)
+    fprintf (asm_out_file, "__SP_H__ = 0x%02x\n", avr_addr.sp_h - sfr_offset);
+
+  fprintf (asm_out_file, "__SP_L__ = 0x%02x\n", avr_addr.sp_l - sfr_offset);
+  fprintf (asm_out_file, "__SREG__ = 0x%02x\n", avr_addr.sreg - sfr_offset);
+  if (AVR_HAVE_RAMPZ)
+    fprintf (asm_out_file, "__RAMPZ__ = 0x%02x\n", avr_addr.rampz - sfr_offset);
+  if (AVR_HAVE_RAMPY)
+    fprintf (asm_out_file, "__RAMPY__ = 0x%02x\n", avr_addr.rampy - sfr_offset);
+  if (AVR_HAVE_RAMPX)
+    fprintf (asm_out_file, "__RAMPX__ = 0x%02x\n", avr_addr.rampx - sfr_offset);
+  if (AVR_HAVE_RAMPD)
+    fprintf (asm_out_file, "__RAMPD__ = 0x%02x\n", avr_addr.rampd - sfr_offset);
+  if (AVR_XMEGA)
+    fprintf (asm_out_file, "__CCP__ = 0x%02x\n", avr_addr.ccp - sfr_offset);
+  fprintf (asm_out_file, "__tmp_reg__ = %d\n", TMP_REGNO);
+  fprintf (asm_out_file, "__zero_reg__ = %d\n", ZERO_REGNO);
 }
 
 
@@ -8058,7 +8442,9 @@ avr_compare_pattern (rtx insn)
   if (pattern
       && NONJUMP_INSN_P (insn)
       && SET_DEST (pattern) == cc0_rtx
-      && GET_CODE (SET_SRC (pattern)) == COMPARE)
+      && GET_CODE (SET_SRC (pattern)) == COMPARE
+      && DImode != GET_MODE (XEXP (SET_SRC (pattern), 0))
+      && DImode != GET_MODE (XEXP (SET_SRC (pattern), 1)))
     {
       return pattern;
     }
@@ -8479,7 +8865,7 @@ avr_hard_regno_mode_ok (int regno, enum machine_mode mode)
 
 /* Implement `MODE_CODE_BASE_REG_CLASS'.  */
 
-reg_class_t
+enum reg_class
 avr_mode_code_base_reg_class (enum machine_mode mode ATTRIBUTE_UNUSED,
                               addr_space_t as, RTX_CODE outer_code,
                               RTX_CODE index_code ATTRIBUTE_UNUSED)
@@ -8567,7 +8953,13 @@ avr_regno_mode_code_ok_for_base_p (int regno,
    LEN != NULL: set *LEN to the length of the instruction sequence
                 (in words) printed with LEN = NULL.
    If CLEAR_P is true, OP[0] had been cleard to Zero already.
-   If CLEAR_P is false, nothing is known about OP[0].  */
+   If CLEAR_P is false, nothing is known about OP[0].
+
+   The effect on cc0 is as follows:
+
+   Load 0 to any register except ZERO_REG : NONE
+   Load ld register with any value        : NONE
+   Anything else:                         : CLOBBER  */
 
 static void
 output_reload_in_const (rtx *op, rtx clobber_reg, int *len, bool clear_p)
@@ -8644,10 +9036,8 @@ output_reload_in_const (rtx *op, rtx clobber_reg, int *len, bool clear_p)
           xop[1] = src;
           xop[2] = clobber_reg;
 
-          if (n >= 2)
-            avr_asm_len ("clr %0", xop, len, 1);
-          else
-            avr_asm_len (asm_code[n][ldreg_p], xop, len, ldreg_p ? 1 : 2);
+          avr_asm_len (asm_code[n][ldreg_p], xop, len, ldreg_p ? 1 : 2);
+          
           continue;
         }
 
@@ -8677,14 +9067,15 @@ output_reload_in_const (rtx *op, rtx clobber_reg, int *len, bool clear_p)
             }
         }
 
-      /* Use CLR to zero a value so that cc0 is set as expected
-         for zero.  */
+      /* Don't use CLR so that cc0 is set as expected.  */
       
       if (ival[n] == 0)
         {
           if (!clear_p)
-            avr_asm_len ("clr %0", &xdest[n], len, 1);
-          
+            avr_asm_len (ldreg_p ? "ldi %0,0"
+                         : ZERO_REGNO == REGNO (xdest[n]) ? "clr %0"
+                         : "mov %0,__zero_reg__",
+                         &xdest[n], len, 1);
           continue;
         }
 
@@ -8820,7 +9211,9 @@ const char *
 output_reload_insisf (rtx *op, rtx clobber_reg, int *len)
 {
   if (AVR_HAVE_MOVW
-      && !test_hard_reg_class (LD_REGS, op[0]))
+      && !test_hard_reg_class (LD_REGS, op[0])
+      && (CONST_INT_P (op[1])
+          || CONST_DOUBLE_P (op[1])))
     {
       int len_clr, len_noclr;
       
@@ -8843,8 +9236,8 @@ output_reload_insisf (rtx *op, rtx clobber_reg, int *len)
         {
           /* Default needs 4 CLR instructions: clear register beforehand.  */
           
-          avr_asm_len ("clr %A0" CR_TAB
-                       "clr %B0" CR_TAB
+          avr_asm_len ("mov %A0,__zero_reg__" CR_TAB
+                       "mov %B0,__zero_reg__" CR_TAB
                        "movw %C0,%A0", &op[0], len, 3);
           
           output_reload_in_const (op, clobber_reg, len, true);
@@ -8869,15 +9262,6 @@ avr_out_reload_inpsi (rtx *op, rtx clobber_reg, int *len)
   return "";
 }
 
-void
-avr_output_bld (rtx operands[], int bit_nr)
-{
-  static char s[] = "bld %A0,0";
-
-  s[5] = 'A' + (bit_nr >> 3);
-  s[8] = '0' + (bit_nr & 7);
-  output_asm_insn (s, operands);
-}
 
 void
 avr_output_addr_vec_elt (FILE *stream, int value)
@@ -8954,8 +9338,8 @@ const char *
 avr_out_sbxx_branch (rtx insn, rtx operands[])
 {
   enum rtx_code comp = GET_CODE (operands[0]);
-  int long_jump = (get_attr_length (insn) >= 4);
-  int reverse = long_jump || jump_over_one_insn_p (insn, operands[3]);
+  bool long_jump = get_attr_length (insn) >= 4;
+  bool reverse = long_jump || jump_over_one_insn_p (insn, operands[3]);
 
   if (comp == GE)
     comp = EQ;
@@ -8965,49 +9349,48 @@ avr_out_sbxx_branch (rtx insn, rtx operands[])
   if (reverse)
     comp = reverse_condition (comp);
 
-  if (GET_CODE (operands[1]) == CONST_INT)
+  switch (GET_CODE (operands[1]))
     {
-      if (INTVAL (operands[1]) < 0x40)
-       {
-         if (comp == EQ)
-           output_asm_insn (AS2 (sbis,%m1-0x20,%2), operands);
-         else
-           output_asm_insn (AS2 (sbic,%m1-0x20,%2), operands);
-       }
+    default:
+      gcc_unreachable();
+      
+    case CONST_INT:
+
+      if (low_io_address_operand (operands[1], QImode))
+        {
+          if (comp == EQ)
+            output_asm_insn ("sbis %i1,%2", operands);
+          else
+            output_asm_insn ("sbic %i1,%2", operands);
+        }
       else
-       {
-         output_asm_insn (AS2 (in,__tmp_reg__,%m1-0x20), operands);
-         if (comp == EQ)
-           output_asm_insn (AS2 (sbrs,__tmp_reg__,%2), operands);
-         else
-           output_asm_insn (AS2 (sbrc,__tmp_reg__,%2), operands);
-       }
-    }
-  else  /* GET_CODE (operands[1]) == REG */
-    {
-      if (GET_MODE (operands[1]) == QImode)
-       {
-         if (comp == EQ)
-           output_asm_insn (AS2 (sbrs,%1,%2), operands);
-         else
-           output_asm_insn (AS2 (sbrc,%1,%2), operands);
-       }
-      else  /* HImode or SImode */
-       {
-         static char buf[] = "sbrc %A1,0";
-         int bit_nr = INTVAL (operands[2]);
-         buf[3] = (comp == EQ) ? 's' : 'c';
-         buf[6] = 'A' + (bit_nr >> 3);
-         buf[9] = '0' + (bit_nr & 7);
-         output_asm_insn (buf, operands);
-       }
-    }
+        {
+          output_asm_insn ("in __tmp_reg__,%i1", operands);
+          if (comp == EQ)
+            output_asm_insn ("sbrs __tmp_reg__,%2", operands);
+          else
+            output_asm_insn ("sbrc __tmp_reg__,%2", operands);
+        }
+
+      break; /* CONST_INT */
+
+    case REG:
+
+      if (comp == EQ)
+        output_asm_insn ("sbrs %T1%T2", operands);
+      else
+        output_asm_insn ("sbrc %T1%T2", operands);
+
+      break; /* REG */
+    }        /* switch */
 
   if (long_jump)
-    return (AS1 (rjmp,.+4) CR_TAB
-           AS1 (jmp,%x3));
+    return ("rjmp .+4" CR_TAB
+            "jmp %x3");
+
   if (!reverse)
-    return AS1 (rjmp,%x3);
+    return "rjmp %x3";
+
   return "";
 }
 
@@ -9055,18 +9438,18 @@ avr_case_values_threshold (void)
 /* Implement `TARGET_ADDR_SPACE_ADDRESS_MODE'.  */
 
 static enum machine_mode
-avr_addr_space_address_mode (addr_space_t as ATTRIBUTE_UNUSED)
+avr_addr_space_address_mode (addr_space_t as)
 {
-  return HImode;
+  return avr_addrspace[as].pointer_size == 3 ? PSImode : HImode;
 }
 
 
 /* Implement `TARGET_ADDR_SPACE_POINTER_MODE'.  */
 
 static enum machine_mode
-avr_addr_space_pointer_mode (addr_space_t as ATTRIBUTE_UNUSED)
+avr_addr_space_pointer_mode (addr_space_t as)
 {
-  return HImode;
+  return avr_addr_space_address_mode (as);
 }
 
 
@@ -9075,7 +9458,8 @@ avr_addr_space_pointer_mode (addr_space_t as ATTRIBUTE_UNUSED)
 static bool
 avr_reg_ok_for_pgm_addr (rtx reg, bool strict)
 {
-  gcc_assert (REG_P (reg));
+  if (!REG_P (reg))
+    return false;
 
   if (strict)
     {
@@ -9110,7 +9494,12 @@ avr_addr_space_legitimate_address_p (enum machine_mode mode, rtx x,
     case ADDR_SPACE_GENERIC:
       return avr_legitimate_address_p (mode, x, strict);
 
-    case ADDR_SPACE_PGM:
+    case ADDR_SPACE_FLASH:
+    case ADDR_SPACE_FLASH1:
+    case ADDR_SPACE_FLASH2:
+    case ADDR_SPACE_FLASH3:
+    case ADDR_SPACE_FLASH4:
+    case ADDR_SPACE_FLASH5:
 
       switch (GET_CODE (x))
         {
@@ -9119,15 +9508,32 @@ avr_addr_space_legitimate_address_p (enum machine_mode mode, rtx x,
           break;
           
         case POST_INC:
-          ok = (!avr_load_libgcc_p (x)
-                && avr_reg_ok_for_pgm_addr (XEXP (x, 0), strict));
+          ok = avr_reg_ok_for_pgm_addr (XEXP (x, 0), strict);
           break;
           
         default:
           break;
         }
 
-      break; /* PGM */
+      break; /* FLASH */
+      
+    case ADDR_SPACE_MEMX:
+      if (REG_P (x))
+        ok = (!strict
+              && can_create_pseudo_p());
+
+      if (LO_SUM == GET_CODE (x))
+        {
+          rtx hi = XEXP (x, 0);
+          rtx lo = XEXP (x, 1);
+
+          ok = (REG_P (hi)
+                && (!strict || REGNO (hi) < FIRST_PSEUDO_REGISTER)
+                && REG_P (lo)
+                && REGNO (lo) == REG_Z);
+        }
+      
+      break; /* MEMX */
     }
 
   if (avr_log.legitimate_address_p)
@@ -9177,10 +9583,66 @@ avr_addr_space_legitimize_address (rtx x, rtx old_x,
 static rtx
 avr_addr_space_convert (rtx src, tree type_from, tree type_to)
 {
+  addr_space_t as_from = TYPE_ADDR_SPACE (TREE_TYPE (type_from));
+  addr_space_t as_to = TYPE_ADDR_SPACE (TREE_TYPE (type_to));
+
   if (avr_log.progmem)
     avr_edump ("\n%!: op = %r\nfrom = %t\nto = %t\n",
                src, type_from, type_to);
 
+  /* Up-casting from 16-bit to 24-bit pointer.  */
+  
+  if (as_from != ADDR_SPACE_MEMX
+      && as_to == ADDR_SPACE_MEMX)
+    {
+      int msb;
+      rtx sym = src;
+      rtx reg = gen_reg_rtx (PSImode);
+
+      while (CONST == GET_CODE (sym) || PLUS == GET_CODE (sym))
+        sym = XEXP (sym, 0);
+
+      /* Look at symbol flags:  avr_encode_section_info set the flags
+         also if attribute progmem was seen so that we get the right
+         promotion for, e.g. PSTR-like strings that reside in generic space
+         but are located in flash.  In that case we patch the incoming
+         address space.  */
+
+      if (SYMBOL_REF == GET_CODE (sym)
+          && ADDR_SPACE_FLASH == AVR_SYMBOL_GET_ADDR_SPACE (sym))
+        {
+          as_from = ADDR_SPACE_FLASH;
+        }
+
+      /* Linearize memory: RAM has bit 23 set.  */
+             
+      msb = ADDR_SPACE_GENERIC_P (as_from)
+        ? 0x80
+        : avr_addrspace[as_from].segment;
+
+      src = force_reg (Pmode, src);
+      
+      emit_insn (msb == 0
+                 ? gen_zero_extendhipsi2 (reg, src)
+                 : gen_n_extendhipsi2 (reg, gen_int_mode (msb, QImode), src));
+          
+      return reg;
+    }
+
+  /* Down-casting from 24-bit to 16-bit throws away the high byte.  */
+
+  if (as_from == ADDR_SPACE_MEMX
+      && as_to != ADDR_SPACE_MEMX)
+    {
+      rtx new_src = gen_reg_rtx (Pmode);
+
+      src = force_reg (PSImode, src);
+      
+      emit_move_insn (new_src,
+                      simplify_gen_subreg (Pmode, src, PSImode, 0));
+      return new_src;
+    }
+  
   return src;
 }
 
@@ -9191,24 +9653,230 @@ static bool
 avr_addr_space_subset_p (addr_space_t subset ATTRIBUTE_UNUSED,
                          addr_space_t superset ATTRIBUTE_UNUSED)
 {
+  /* Allow any kind of pointer mess.  */
+  
   return true;
 }
 
 
-/* Helper for __builtin_avr_delay_cycles */
+/* Worker function for movmemhi expander.
+   XOP[0]  Destination as MEM:BLK
+   XOP[1]  Source      "     "
+   XOP[2]  # Bytes to copy
 
-static void
-avr_expand_delay_cycles (rtx operands0)
+   Return TRUE  if the expansion is accomplished.
+   Return FALSE if the operand compination is not supported.  */
+
+bool
+avr_emit_movmemhi (rtx *xop)
 {
-  unsigned HOST_WIDE_INT cycles = UINTVAL (operands0);
-  unsigned HOST_WIDE_INT cycles_used;
-  unsigned HOST_WIDE_INT loop_count;
-  
-  if (IN_RANGE (cycles, 83886082, 0xFFFFFFFF))
+  HOST_WIDE_INT count;
+  enum machine_mode loop_mode;
+  addr_space_t as = MEM_ADDR_SPACE (xop[1]);
+  rtx loop_reg, addr1, a_src, a_dest, insn, xas;
+  rtx a_hi8 = NULL_RTX;
+
+  if (avr_mem_flash_p (xop[0]))
+    return false;
+
+  if (!CONST_INT_P (xop[2]))
+    return false;
+
+  count = INTVAL (xop[2]);
+  if (count <= 0)
+    return false;
+
+  a_src  = XEXP (xop[1], 0);
+  a_dest = XEXP (xop[0], 0);
+
+  if (PSImode == GET_MODE (a_src))
     {
-      loop_count = ((cycles - 9) / 6) + 1;
-      cycles_used = ((loop_count - 1) * 6) + 9;
-      emit_insn (gen_delay_cycles_4 (gen_int_mode (loop_count, SImode)));
+      gcc_assert (as == ADDR_SPACE_MEMX);
+
+      loop_mode = (count < 0x100) ? QImode : HImode;
+      loop_reg = gen_rtx_REG (loop_mode, 24);
+      emit_move_insn (loop_reg, gen_int_mode (count, loop_mode));
+
+      addr1 = simplify_gen_subreg (HImode, a_src, PSImode, 0);
+      a_hi8 = simplify_gen_subreg (QImode, a_src, PSImode, 2);
+    }
+  else
+    {
+      int segment = avr_addrspace[as].segment;
+      
+      if (segment
+          && avr_current_device->n_flash > 1)
+        {
+          a_hi8 = GEN_INT (segment);
+          emit_move_insn (rampz_rtx, a_hi8 = copy_to_mode_reg (QImode, a_hi8));
+        }
+      else if (!ADDR_SPACE_GENERIC_P (as))
+        {
+          as = ADDR_SPACE_FLASH;
+        }
+      
+      addr1 = a_src;
+
+      loop_mode = (count <= 0x100) ? QImode : HImode;
+      loop_reg = copy_to_mode_reg (loop_mode, gen_int_mode (count, loop_mode));
+    }
+
+  xas = GEN_INT (as);
+
+  /* FIXME: Register allocator might come up with spill fails if it is left
+        on its own.  Thus, we allocate the pointer registers by hand:
+        Z = source address
+        X = destination address  */
+
+  emit_move_insn (lpm_addr_reg_rtx, addr1);
+  emit_move_insn (gen_rtx_REG (HImode, REG_X), a_dest);
+
+  /* FIXME: Register allocator does a bad job and might spill address
+        register(s) inside the loop leading to additional move instruction
+        to/from stack which could clobber tmp_reg.  Thus, do *not* emit
+        load and store as seperate insns.  Instead, we perform the copy
+        by means of one monolithic insn.  */
+
+  gcc_assert (TMP_REGNO == LPM_REGNO);
+
+  if (as != ADDR_SPACE_MEMX)
+    {
+      /* Load instruction ([E]LPM or LD) is known at compile time:
+         Do the copy-loop inline.  */
+      
+      rtx (*fun) (rtx, rtx, rtx)
+        = QImode == loop_mode ? gen_movmem_qi : gen_movmem_hi;
+
+      insn = fun (xas, loop_reg, loop_reg);
+    }
+  else
+    {
+      rtx (*fun) (rtx, rtx)
+        = QImode == loop_mode ? gen_movmemx_qi : gen_movmemx_hi;
+
+      emit_move_insn (gen_rtx_REG (QImode, 23), a_hi8);
+      
+      insn = fun (xas, GEN_INT (avr_addr.rampz));
+    }
+
+  set_mem_addr_space (SET_SRC (XVECEXP (insn, 0, 0)), as);
+  emit_insn (insn);
+
+  return true;
+}
+
+
+/* Print assembler for movmem_qi, movmem_hi insns...
+       $0     : Address Space
+       $1, $2 : Loop register
+       Z      : Source address
+       X      : Destination address
+*/
+
+const char*
+avr_out_movmem (rtx insn ATTRIBUTE_UNUSED, rtx *op, int *plen)
+{
+  addr_space_t as = (addr_space_t) INTVAL (op[0]);
+  enum machine_mode loop_mode = GET_MODE (op[1]);
+  bool sbiw_p = test_hard_reg_class (ADDW_REGS, op[1]);
+  rtx xop[3];
+
+  if (plen)
+    *plen = 0;
+
+  xop[0] = op[0];
+  xop[1] = op[1];
+  xop[2] = tmp_reg_rtx;
+
+  /* Loop label */
+
+  avr_asm_len ("0:", xop, plen, 0);
+
+  /* Load with post-increment */
+
+  switch (as)
+    {
+    default:
+      gcc_unreachable();
+      
+    case ADDR_SPACE_GENERIC:
+
+      avr_asm_len ("ld %2,Z+", xop, plen, 1);
+      break;
+      
+    case ADDR_SPACE_FLASH:
+
+      if (AVR_HAVE_LPMX)
+        avr_asm_len ("lpm %2,Z+", xop, plen, 1);
+      else
+        avr_asm_len ("lpm" CR_TAB
+                     "adiw r30,1", xop, plen, 2);
+      break;
+      
+    case ADDR_SPACE_FLASH1:
+    case ADDR_SPACE_FLASH2:
+    case ADDR_SPACE_FLASH3:
+    case ADDR_SPACE_FLASH4:
+    case ADDR_SPACE_FLASH5:
+
+      if (AVR_HAVE_ELPMX)
+        avr_asm_len ("elpm %2,Z+", xop, plen, 1);
+      else
+        avr_asm_len ("elpm" CR_TAB
+                     "adiw r30,1", xop, plen, 2);
+      break;
+    }
+
+  /* Store with post-increment */
+
+  avr_asm_len ("st X+,%2", xop, plen, 1);
+
+  /* Decrement loop-counter and set Z-flag */
+
+  if (QImode == loop_mode)
+    {
+      avr_asm_len ("dec %1", xop, plen, 1);
+    }
+  else if (sbiw_p)
+    {
+      avr_asm_len ("sbiw %1,1", xop, plen, 1);
+    }
+  else
+    {
+      avr_asm_len ("subi %A1,1" CR_TAB
+                   "sbci %B1,0", xop, plen, 2);
+    }
+
+  /* Loop until zero */
+  
+  return avr_asm_len ("brne 0b", xop, plen, 1);
+}
+
+
+\f
+/* Helper for __builtin_avr_delay_cycles */
+
+static rtx
+avr_mem_clobber (void)
+{
+  rtx mem = gen_rtx_MEM (BLKmode, gen_rtx_SCRATCH (Pmode));
+  MEM_VOLATILE_P (mem) = 1;
+  return mem;
+}
+
+static void
+avr_expand_delay_cycles (rtx operands0)
+{
+  unsigned HOST_WIDE_INT cycles = UINTVAL (operands0);
+  unsigned HOST_WIDE_INT cycles_used;
+  unsigned HOST_WIDE_INT loop_count;
+  
+  if (IN_RANGE (cycles, 83886082, 0xFFFFFFFF))
+    {
+      loop_count = ((cycles - 9) / 6) + 1;
+      cycles_used = ((loop_count - 1) * 6) + 9;
+      emit_insn (gen_delay_cycles_4 (gen_int_mode (loop_count, SImode),
+                                     avr_mem_clobber()));
       cycles -= cycles_used;
     }
   
@@ -9218,7 +9886,8 @@ avr_expand_delay_cycles (rtx operands0)
       if (loop_count > 0xFFFFFF)
         loop_count = 0xFFFFFF;
       cycles_used = ((loop_count - 1) * 5) + 7;
-      emit_insn (gen_delay_cycles_3 (gen_int_mode (loop_count, SImode)));
+      emit_insn (gen_delay_cycles_3 (gen_int_mode (loop_count, SImode),
+                                     avr_mem_clobber()));
       cycles -= cycles_used;
     }
   
@@ -9228,7 +9897,8 @@ avr_expand_delay_cycles (rtx operands0)
       if (loop_count > 0xFFFF)
         loop_count = 0xFFFF;
       cycles_used = ((loop_count - 1) * 4) + 5;
-      emit_insn (gen_delay_cycles_2 (gen_int_mode (loop_count, HImode)));
+      emit_insn (gen_delay_cycles_2 (gen_int_mode (loop_count, HImode),
+                                     avr_mem_clobber()));
       cycles -= cycles_used;
     }
   
@@ -9238,7 +9908,8 @@ avr_expand_delay_cycles (rtx operands0)
       if (loop_count > 255) 
         loop_count = 255;
       cycles_used = loop_count * 3;
-      emit_insn (gen_delay_cycles_1 (gen_int_mode (loop_count, QImode)));
+      emit_insn (gen_delay_cycles_1 (gen_int_mode (loop_count, QImode),
+                                     avr_mem_clobber()));
       cycles -= cycles_used;
       }
   
@@ -9255,22 +9926,402 @@ avr_expand_delay_cycles (rtx operands0)
     }
 }
 
+
+/* Return VAL * BASE + DIGIT.  BASE = 0 is shortcut for BASE = 2^{32}   */
+
+static double_int
+avr_double_int_push_digit (double_int val, int base,
+                           unsigned HOST_WIDE_INT digit)
+{
+  val = 0 == base
+    ? double_int_lshift (val, 32, 64, false)
+    : double_int_mul (val, uhwi_to_double_int (base));
+  
+  return double_int_add (val, uhwi_to_double_int (digit));
+}
+
+
+/* Compute the image of x under f, i.e. perform   x --> f(x)    */
+
+static int
+avr_map (double_int f, int x)
+{
+  return 0xf & double_int_to_uhwi (double_int_rshift (f, 4*x, 64, false));
+}
+
+
+/* Return some metrics of map A.  */
+
+enum
+  {
+    /* Number of fixed points in { 0 ... 7 } */
+    MAP_FIXED_0_7,
+
+    /* Size of preimage of non-fixed points in { 0 ... 7 } */
+    MAP_NONFIXED_0_7,
+    
+    /* Mask representing the fixed points in { 0 ... 7 } */
+    MAP_MASK_FIXED_0_7,
+    
+    /* Size of the preimage of { 0 ... 7 } */
+    MAP_PREIMAGE_0_7,
+    
+    /* Mask that represents the preimage of { f } */
+    MAP_MASK_PREIMAGE_F
+  };
+
+static unsigned
+avr_map_metric (double_int a, int mode)
+{
+  unsigned i, metric = 0;
+
+  for (i = 0; i < 8; i++)
+    {
+      unsigned ai = avr_map (a, i);
+
+      if (mode == MAP_FIXED_0_7)
+        metric += ai == i;
+      else if (mode == MAP_NONFIXED_0_7)
+        metric += ai < 8 && ai != i;
+      else if (mode == MAP_MASK_FIXED_0_7)
+        metric |= ((unsigned) (ai == i)) << i;
+      else if (mode == MAP_PREIMAGE_0_7)
+        metric += ai < 8;
+      else if (mode == MAP_MASK_PREIMAGE_F)
+        metric |= ((unsigned) (ai == 0xf)) << i;
+      else
+        gcc_unreachable();
+    }
+  
+  return metric;
+}
+
+
+/* Return true if IVAL has a 0xf in its hexadecimal representation
+   and false, otherwise.  Only nibbles 0..7 are taken into account.
+   Used as constraint helper for C0f and Cxf.  */
+
+bool
+avr_has_nibble_0xf (rtx ival)
+{
+  return 0 != avr_map_metric (rtx_to_double_int (ival), MAP_MASK_PREIMAGE_F);
+}
+
+
+/* We have a set of bits that are mapped by a function F.
+   Try to decompose F by means of a second function G so that
+
+      F = F o G^-1 o G
+
+   and
+
+      cost (F o G^-1) + cost (G)  <  cost (F)
+
+   Example:  Suppose builtin insert_bits supplies us with the map
+   F = 0x3210ffff.  Instead of doing 4 bit insertions to get the high
+   nibble of the result, we can just as well rotate the bits before inserting
+   them and use the map 0x7654ffff which is cheaper than the original map.
+   For this example G = G^-1 = 0x32107654 and F o G^-1 = 0x7654ffff.  */
+   
+typedef struct
+{
+  /* tree code of binary function G */
+  enum tree_code code;
+
+  /* The constant second argument of G */
+  int arg;
+
+  /* G^-1, the inverse of G (*, arg) */
+  unsigned ginv;
+
+  /* The cost of appplying G (*, arg) */
+  int cost;
+
+  /* The composition F o G^-1 (*, arg) for some function F */
+  double_int map;
+
+  /* For debug purpose only */
+  const char *str;
+} avr_map_op_t;
+
+static const avr_map_op_t avr_map_op[] =
+  {
+    { LROTATE_EXPR, 0, 0x76543210, 0, { 0, 0 }, "id" },
+    { LROTATE_EXPR, 1, 0x07654321, 2, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 2, 0x10765432, 4, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 3, 0x21076543, 4, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 4, 0x32107654, 1, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 5, 0x43210765, 3, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 6, 0x54321076, 5, { 0, 0 }, "<<<" },
+    { LROTATE_EXPR, 7, 0x65432107, 3, { 0, 0 }, "<<<" },
+    { RSHIFT_EXPR, 1, 0x6543210c, 1, { 0, 0 }, ">>" },
+    { RSHIFT_EXPR, 1, 0x7543210c, 1, { 0, 0 }, ">>" },
+    { RSHIFT_EXPR, 2, 0x543210cc, 2, { 0, 0 }, ">>" },
+    { RSHIFT_EXPR, 2, 0x643210cc, 2, { 0, 0 }, ">>" },
+    { RSHIFT_EXPR, 2, 0x743210cc, 2, { 0, 0 }, ">>" },
+    { LSHIFT_EXPR, 1, 0xc7654321, 1, { 0, 0 }, "<<" },
+    { LSHIFT_EXPR, 2, 0xcc765432, 2, { 0, 0 }, "<<" }
+  };
+
+
+/* Try to decompose F as F = (F o G^-1) o G as described above.
+   The result is a struct representing F o G^-1 and G.
+   If result.cost < 0 then such a decomposition does not exist.  */
+   
+static avr_map_op_t
+avr_map_decompose (double_int f, const avr_map_op_t *g, bool val_const_p)
+{
+  int i;
+  bool val_used_p = 0 != avr_map_metric (f, MAP_MASK_PREIMAGE_F);
+  avr_map_op_t f_ginv = *g;
+  double_int ginv = uhwi_to_double_int (g->ginv);
+
+  f_ginv.cost = -1;
+  
+  /* Step 1:  Computing F o G^-1  */
+
+  for (i = 7; i >= 0; i--)
+    {
+      int x = avr_map (f, i);
+      
+      if (x <= 7)
+        {
+          x = avr_map (ginv, x);
+
+          /* The bit is no element of the image of G: no avail (cost = -1)  */
+          
+          if (x > 7)
+            return f_ginv;
+        }
+      
+      f_ginv.map = avr_double_int_push_digit (f_ginv.map, 16, x);
+    }
+
+  /* Step 2:  Compute the cost of the operations.
+     The overall cost of doing an operation prior to the insertion is
+      the cost of the insertion plus the cost of the operation.  */
+
+  /* Step 2a:  Compute cost of F o G^-1  */
+
+  if (0 == avr_map_metric (f_ginv.map, MAP_NONFIXED_0_7))
+    {
+      /* The mapping consists only of fixed points and can be folded
+         to AND/OR logic in the remainder.  Reasonable cost is 3. */
+
+      f_ginv.cost = 2 + (val_used_p && !val_const_p);
+    }
+  else
+    {
+      rtx xop[4];
+
+      /* Get the cost of the insn by calling the output worker with some
+         fake values.  Mimic effect of reloading xop[3]: Unused operands
+         are mapped to 0 and used operands are reloaded to xop[0].  */
+
+      xop[0] = all_regs_rtx[24];
+      xop[1] = gen_int_mode (double_int_to_uhwi (f_ginv.map), SImode);
+      xop[2] = all_regs_rtx[25];
+      xop[3] = val_used_p ? xop[0] : const0_rtx;
+  
+      avr_out_insert_bits (xop, &f_ginv.cost);
+      
+      f_ginv.cost += val_const_p && val_used_p ? 1 : 0;
+    }
+  
+  /* Step 2b:  Add cost of G  */
+
+  f_ginv.cost += g->cost;
+
+  if (avr_log.builtin)
+    avr_edump (" %s%d=%d", g->str, g->arg, f_ginv.cost);
+
+  return f_ginv;
+}
+
+
+/* Insert bits from XOP[1] into XOP[0] according to MAP.
+   XOP[0] and XOP[1] don't overlap.
+   If FIXP_P = true:  Move all bits according to MAP using BLD/BST sequences.
+   If FIXP_P = false: Just move the bit if its position in the destination
+   is different to its source position.  */
+
+static void
+avr_move_bits (rtx *xop, double_int map, bool fixp_p, int *plen)
+{
+  int bit_dest, b;
+
+  /* T-flag contains this bit of the source, i.e. of XOP[1]  */
+  int t_bit_src = -1;
+
+  /* We order the operations according to the requested source bit b.  */
+  
+  for (b = 0; b < 8; b++)
+    for (bit_dest = 0; bit_dest < 8; bit_dest++)
+      {
+        int bit_src = avr_map (map, bit_dest);
+        
+        if (b != bit_src
+            || bit_src >= 8
+            /* Same position: No need to copy as requested by FIXP_P.  */
+            || (bit_dest == bit_src && !fixp_p))
+          continue;
+
+        if (t_bit_src != bit_src)
+          {
+            /* Source bit is not yet in T: Store it to T.  */
+              
+            t_bit_src = bit_src;
+
+            xop[3] = GEN_INT (bit_src);
+            avr_asm_len ("bst %T1%T3", xop, plen, 1);
+          }
+
+        /* Load destination bit with T.  */
+        
+        xop[3] = GEN_INT (bit_dest);
+        avr_asm_len ("bld %T0%T3", xop, plen, 1);
+      }
+}
+
+
+/* PLEN == 0: Print assembler code for `insert_bits'.
+   PLEN != 0: Compute code length in bytes.
+   
+   OP[0]:  Result
+   OP[1]:  The mapping composed of nibbles. If nibble no. N is
+           0:   Bit N of result is copied from bit OP[2].0
+           ...  ...
+           7:   Bit N of result is copied from bit OP[2].7
+           0xf: Bit N of result is copied from bit OP[3].N
+   OP[2]:  Bits to be inserted
+   OP[3]:  Target value  */
+
+const char*
+avr_out_insert_bits (rtx *op, int *plen)
+{
+  double_int map = rtx_to_double_int (op[1]);
+  unsigned mask_fixed;
+  bool fixp_p = true;
+  rtx xop[4];
+
+  xop[0] = op[0];
+  xop[1] = op[2];
+  xop[2] = op[3];
+
+  gcc_assert (REG_P (xop[2]) || CONST_INT_P (xop[2]));
+          
+  if (plen)
+    *plen = 0;
+  else if (flag_print_asm_name)
+    fprintf (asm_out_file,
+             ASM_COMMENT_START "map = 0x%08" HOST_LONG_FORMAT "x\n",
+             double_int_to_uhwi (map) & GET_MODE_MASK (SImode));
+
+  /* If MAP has fixed points it might be better to initialize the result
+     with the bits to be inserted instead of moving all bits by hand.  */
+      
+  mask_fixed = avr_map_metric (map, MAP_MASK_FIXED_0_7);
+
+  if (REGNO (xop[0]) == REGNO (xop[1]))
+    {
+      /* Avoid early-clobber conflicts */
+      
+      avr_asm_len ("mov __tmp_reg__,%1", xop, plen, 1);
+      xop[1] = tmp_reg_rtx;
+      fixp_p = false;
+    }
+
+  if (avr_map_metric (map, MAP_MASK_PREIMAGE_F))
+    {
+      /* XOP[2] is used and reloaded to XOP[0] already */
+      
+      int n_fix = 0, n_nofix = 0;
+      
+      gcc_assert (REG_P (xop[2]));
+      
+      /* Get the code size of the bit insertions; once with all bits
+         moved and once with fixed points omitted.  */
+  
+      avr_move_bits (xop, map, true, &n_fix);
+      avr_move_bits (xop, map, false, &n_nofix);
+
+      if (fixp_p && n_fix - n_nofix > 3)
+        {
+          xop[3] = gen_int_mode (~mask_fixed, QImode);
+        
+          avr_asm_len ("eor %0,%1"   CR_TAB
+                       "andi %0,%3"  CR_TAB
+                       "eor %0,%1", xop, plen, 3);
+          fixp_p = false;
+        }
+    }
+  else
+    {
+      /* XOP[2] is unused */
+      
+      if (fixp_p && mask_fixed)
+        {
+          avr_asm_len ("mov %0,%1", xop, plen, 1);
+          fixp_p = false;
+        }
+    }
+  
+  /* Move/insert remaining bits.  */
+
+  avr_move_bits (xop, map, fixp_p, plen);
+  
+  return "";
+}
+
+
 /* IDs for all the AVR builtins.  */
 
 enum avr_builtin_id
   {
-    AVR_BUILTIN_NOP,
-    AVR_BUILTIN_SEI,
-    AVR_BUILTIN_CLI,
-    AVR_BUILTIN_WDR,
-    AVR_BUILTIN_SLEEP,
-    AVR_BUILTIN_SWAP,
-    AVR_BUILTIN_FMUL,
-    AVR_BUILTIN_FMULS,
-    AVR_BUILTIN_FMULSU,
-    AVR_BUILTIN_DELAY_CYCLES
+    
+#define DEF_BUILTIN(NAME, N_ARGS, ID, TYPE, CODE) ID,
+#include "builtins.def"  
+#undef DEF_BUILTIN
+
+    AVR_BUILTIN_COUNT
+  };
+
+struct GTY(()) avr_builtin_description
+{
+  enum insn_code icode;
+  const char *name;
+  int n_args;
+  tree fndecl;
+};
+
+
+/* Notice that avr_bdesc[] and avr_builtin_id are initialized in such a way
+   that a built-in's ID can be used to access the built-in by means of
+   avr_bdesc[ID]  */
+
+static GTY(()) struct avr_builtin_description
+avr_bdesc[AVR_BUILTIN_COUNT] =
+  {
+
+#define DEF_BUILTIN(NAME, N_ARGS, ID, TYPE, ICODE)      \
+    { ICODE, NAME, N_ARGS, NULL_TREE },
+#include "builtins.def"  
+#undef DEF_BUILTIN
   };
 
+
+/* Implement `TARGET_BUILTIN_DECL'.  */
+
+static tree
+avr_builtin_decl (unsigned id, bool initialize_p ATTRIBUTE_UNUSED)
+{
+  if (id < AVR_BUILTIN_COUNT)
+    return avr_bdesc[id].fndecl;
+
+  return error_mark_node;
+}
+
+
 static void
 avr_init_builtin_int24 (void)
 {
@@ -9281,13 +10332,6 @@ avr_init_builtin_int24 (void)
   (*lang_hooks.types.register_builtin_type) (uint24_type, "__uint24");
 }
 
-#define DEF_BUILTIN(NAME, TYPE, CODE)                                   \
-  do                                                                    \
-    {                                                                   \
-      add_builtin_function ((NAME), (TYPE), (CODE), BUILT_IN_MD,        \
-                            NULL, NULL_TREE);                           \
-    } while (0)
-
 
 /* Implement `TARGET_INIT_BUILTINS' */
 /* Set up all builtin functions for this target.  */
@@ -9321,47 +10365,36 @@ avr_init_builtins (void)
                                 long_unsigned_type_node,
                                 NULL_TREE);
 
-  DEF_BUILTIN ("__builtin_avr_nop", void_ftype_void, AVR_BUILTIN_NOP);
-  DEF_BUILTIN ("__builtin_avr_sei", void_ftype_void, AVR_BUILTIN_SEI);
-  DEF_BUILTIN ("__builtin_avr_cli", void_ftype_void, AVR_BUILTIN_CLI);
-  DEF_BUILTIN ("__builtin_avr_wdr", void_ftype_void, AVR_BUILTIN_WDR);
-  DEF_BUILTIN ("__builtin_avr_sleep", void_ftype_void, AVR_BUILTIN_SLEEP);
-  DEF_BUILTIN ("__builtin_avr_swap", uchar_ftype_uchar, AVR_BUILTIN_SWAP);
-  DEF_BUILTIN ("__builtin_avr_delay_cycles", void_ftype_ulong, 
-               AVR_BUILTIN_DELAY_CYCLES);
-
-  DEF_BUILTIN ("__builtin_avr_fmul", uint_ftype_uchar_uchar, 
-               AVR_BUILTIN_FMUL);
-  DEF_BUILTIN ("__builtin_avr_fmuls", int_ftype_char_char, 
-               AVR_BUILTIN_FMULS);
-  DEF_BUILTIN ("__builtin_avr_fmulsu", int_ftype_char_uchar, 
-               AVR_BUILTIN_FMULSU);
-
-  avr_init_builtin_int24 ();
-}
+  tree uchar_ftype_ulong_uchar_uchar
+    = build_function_type_list (unsigned_char_type_node,
+                                long_unsigned_type_node,
+                                unsigned_char_type_node,
+                                unsigned_char_type_node,
+                                NULL_TREE);
 
-#undef DEF_BUILTIN
+  tree const_memx_void_node
+      = build_qualified_type (void_type_node,
+                              TYPE_QUAL_CONST
+                              | ENCODE_QUAL_ADDR_SPACE (ADDR_SPACE_MEMX));
 
-struct avr_builtin_description
-{
-  const enum insn_code icode;
-  const char *const name;
-  const enum avr_builtin_id id;
-};
+  tree const_memx_ptr_type_node
+      = build_pointer_type_for_mode (const_memx_void_node, PSImode, false);
+  
+  tree char_ftype_const_memx_ptr
+      = build_function_type_list (char_type_node,
+                                  const_memx_ptr_type_node,
+                                  NULL);
 
-static const struct avr_builtin_description
-bdesc_1arg[] =
-  {
-    { CODE_FOR_rotlqi3_4, "__builtin_avr_swap", AVR_BUILTIN_SWAP }
-  };
+#define DEF_BUILTIN(NAME, N_ARGS, ID, TYPE, CODE)                       \
+  gcc_assert (ID < AVR_BUILTIN_COUNT);                                  \
+  avr_bdesc[ID].fndecl                                                  \
+    = add_builtin_function (NAME, TYPE, ID, BUILT_IN_MD, NULL, NULL_TREE);
+#include "builtins.def"  
+#undef DEF_BUILTIN
+  
+  avr_init_builtin_int24 ();
+}
 
-static const struct avr_builtin_description
-bdesc_2arg[] =
-  {
-    { CODE_FOR_fmul, "__builtin_avr_fmul", AVR_BUILTIN_FMUL },
-    { CODE_FOR_fmuls, "__builtin_avr_fmuls", AVR_BUILTIN_FMULS },
-    { CODE_FOR_fmulsu, "__builtin_avr_fmulsu", AVR_BUILTIN_FMULSU }
-  };
 
 /* Subroutine of avr_expand_builtin to take care of unop insns.  */
 
@@ -9460,7 +10493,78 @@ avr_expand_binop_builtin (enum insn_code icode, tree exp, rtx target)
   return target;
 }
 
+/* Subroutine of avr_expand_builtin to take care of 3-operand insns.  */
+
+static rtx
+avr_expand_triop_builtin (enum insn_code icode, tree exp, rtx target)
+{
+  rtx pat;
+  tree arg0 = CALL_EXPR_ARG (exp, 0);
+  tree arg1 = CALL_EXPR_ARG (exp, 1);
+  tree arg2 = CALL_EXPR_ARG (exp, 2);
+  rtx op0 = expand_expr (arg0, NULL_RTX, VOIDmode, EXPAND_NORMAL);
+  rtx op1 = expand_expr (arg1, NULL_RTX, VOIDmode, EXPAND_NORMAL);
+  rtx op2 = expand_expr (arg2, NULL_RTX, VOIDmode, EXPAND_NORMAL);
+  enum machine_mode op0mode = GET_MODE (op0);
+  enum machine_mode op1mode = GET_MODE (op1);
+  enum machine_mode op2mode = GET_MODE (op2);
+  enum machine_mode tmode = insn_data[icode].operand[0].mode;
+  enum machine_mode mode0 = insn_data[icode].operand[1].mode;
+  enum machine_mode mode1 = insn_data[icode].operand[2].mode;
+  enum machine_mode mode2 = insn_data[icode].operand[3].mode;
+
+  if (! target
+      || GET_MODE (target) != tmode
+      || ! (*insn_data[icode].operand[0].predicate) (target, tmode))
+    {
+      target = gen_reg_rtx (tmode);
+    }
+
+  if ((op0mode == SImode || op0mode == VOIDmode) && mode0 == HImode)
+    {
+      op0mode = HImode;
+      op0 = gen_lowpart (HImode, op0);
+    }
+  
+  if ((op1mode == SImode || op1mode == VOIDmode) && mode1 == HImode)
+    {
+      op1mode = HImode;
+      op1 = gen_lowpart (HImode, op1);
+    }
+  
+  if ((op2mode == SImode || op2mode == VOIDmode) && mode2 == HImode)
+    {
+      op2mode = HImode;
+      op2 = gen_lowpart (HImode, op2);
+    }
+  
+  /* In case the insn wants input operands in modes different from
+     the result, abort.  */
+  
+  gcc_assert ((op0mode == mode0 || op0mode == VOIDmode)
+              && (op1mode == mode1 || op1mode == VOIDmode)
+              && (op2mode == mode2 || op2mode == VOIDmode));
+
+  if (! (*insn_data[icode].operand[1].predicate) (op0, mode0))
+    op0 = copy_to_mode_reg (mode0, op0);
+  
+  if (! (*insn_data[icode].operand[2].predicate) (op1, mode1))
+    op1 = copy_to_mode_reg (mode1, op1);
+
+  if (! (*insn_data[icode].operand[3].predicate) (op2, mode2))
+    op2 = copy_to_mode_reg (mode2, op2);
+
+  pat = GEN_FCN (icode) (target, op0, op1, op2);
+  
+  if (! pat)
+    return 0;
+
+  emit_insn (pat);
+  return target;
+}
+
 
+/* Implement `TARGET_EXPAND_BUILTIN'.  */
 /* Expand an expression EXP that calls a built-in function,
    with result going to TARGET if that's convenient
    (and in mode MODE if that's convenient).
@@ -9473,60 +10577,367 @@ avr_expand_builtin (tree exp, rtx target,
                     enum machine_mode mode ATTRIBUTE_UNUSED,
                     int ignore ATTRIBUTE_UNUSED)
 {
-  size_t i;
-  const struct avr_builtin_description *d;
   tree fndecl = TREE_OPERAND (CALL_EXPR_FN (exp), 0);
+  const char* bname = IDENTIFIER_POINTER (DECL_NAME (fndecl));
   unsigned int id = DECL_FUNCTION_CODE (fndecl);
+  const struct avr_builtin_description *d = &avr_bdesc[id];
   tree arg0;
   rtx op0;
 
+  gcc_assert (id < AVR_BUILTIN_COUNT);
+
   switch (id)
     {
     case AVR_BUILTIN_NOP:
       emit_insn (gen_nopv (GEN_INT(1)));
       return 0;
       
-    case AVR_BUILTIN_SEI:
-      emit_insn (gen_enable_interrupt ());
-      return 0;
-      
-    case AVR_BUILTIN_CLI:
-      emit_insn (gen_disable_interrupt ());
-      return 0;
-      
-    case AVR_BUILTIN_WDR:
-      emit_insn (gen_wdr ());
-      return 0;
-      
-    case AVR_BUILTIN_SLEEP:
-      emit_insn (gen_sleep ());
-      return 0;
-      
     case AVR_BUILTIN_DELAY_CYCLES:
       {
         arg0 = CALL_EXPR_ARG (exp, 0);
         op0 = expand_expr (arg0, NULL_RTX, VOIDmode, EXPAND_NORMAL);
 
-        if (! CONST_INT_P (op0))
-          error ("__builtin_avr_delay_cycles expects a"
-                 " compile time integer constant.");
+        if (!CONST_INT_P (op0))
+          error ("%s expects a compile time integer constant", bname);
+        else
+          avr_expand_delay_cycles (op0);
 
-        avr_expand_delay_cycles (op0);
         return 0;
       }
+
+    case AVR_BUILTIN_INSERT_BITS:
+      {
+        arg0 = CALL_EXPR_ARG (exp, 0);
+        op0 = expand_expr (arg0, NULL_RTX, VOIDmode, EXPAND_NORMAL);
+
+        if (!CONST_INT_P (op0))
+          {
+            error ("%s expects a compile time long integer constant"
+                   " as first argument", bname);
+            return target;
+          }
+      }
     }
 
-  for (i = 0, d = bdesc_1arg; i < ARRAY_SIZE (bdesc_1arg); i++, d++)
-    if (d->id == id)
+  /* No special treatment needed: vanilla expand.  */
+  
+  switch (d->n_args)
+    {
+    case 0:
+      emit_insn ((GEN_FCN (d->icode)) (target));
+      return 0;
+      
+    case 1:
       return avr_expand_unop_builtin (d->icode, exp, target);
-
-  for (i = 0, d = bdesc_2arg; i < ARRAY_SIZE (bdesc_2arg); i++, d++)
-    if (d->id == id)
+      
+    case 2:
       return avr_expand_binop_builtin (d->icode, exp, target);
-
+      
+    case 3:
+      return avr_expand_triop_builtin (d->icode, exp, target);
+    }
+  
   gcc_unreachable ();
 }
 
+
+/* Implement `TARGET_FOLD_BUILTIN'.  */
+
+static tree
+avr_fold_builtin (tree fndecl, int n_args ATTRIBUTE_UNUSED, tree *arg,
+                  bool ignore ATTRIBUTE_UNUSED)
+{
+  unsigned int fcode = DECL_FUNCTION_CODE (fndecl);
+  tree val_type = TREE_TYPE (TREE_TYPE (fndecl));
+
+  if (!optimize)
+    return NULL_TREE;
+  
+  switch (fcode)
+    {
+    default:
+      break;
+
+    case AVR_BUILTIN_SWAP:
+      {
+        return fold_build2 (LROTATE_EXPR, val_type, arg[0],
+                            build_int_cst (val_type, 4));
+      }
+  
+    case AVR_BUILTIN_INSERT_BITS:
+      {
+        tree tbits = arg[1];
+        tree tval = arg[2];
+        tree tmap;
+        tree map_type = TREE_VALUE (TYPE_ARG_TYPES (TREE_TYPE (fndecl)));
+        double_int map;
+        bool changed = false;
+        unsigned i;
+        avr_map_op_t best_g;
+
+        if (TREE_CODE (arg[0]) != INTEGER_CST)
+          {
+            /* No constant as first argument: Don't fold this and run into
+               error in avr_expand_builtin.  */
+            
+            break;
+          }
+        
+        map = tree_to_double_int (arg[0]);
+        tmap = double_int_to_tree (map_type, map);
+
+        if (TREE_CODE (tval) != INTEGER_CST
+            && 0 == avr_map_metric (map, MAP_MASK_PREIMAGE_F))
+          {
+            /* There are no F in the map, i.e. 3rd operand is unused.
+               Replace that argument with some constant to render
+               respective input unused.  */
+            
+            tval = build_int_cst (val_type, 0);
+            changed = true;
+          }
+
+        if (TREE_CODE (tbits) != INTEGER_CST
+            && 0 == avr_map_metric (map, MAP_PREIMAGE_0_7))
+          {
+            /* Similar for the bits to be inserted. If they are unused,
+               we can just as well pass 0.  */
+            
+            tbits = build_int_cst (val_type, 0);
+          }
+
+        if (TREE_CODE (tbits) == INTEGER_CST)
+          {
+            /* Inserting bits known at compile time is easy and can be
+               performed by AND and OR with appropriate masks.  */
+
+            int bits = TREE_INT_CST_LOW (tbits);
+            int mask_ior = 0, mask_and = 0xff;
+
+            for (i = 0; i < 8; i++)
+              {
+                int mi = avr_map (map, i);
+
+                if (mi < 8)
+                  {
+                    if (bits & (1 << mi))     mask_ior |=  (1 << i);
+                    else                      mask_and &= ~(1 << i);
+                  }
+              }
+
+            tval = fold_build2 (BIT_IOR_EXPR, val_type, tval,
+                                build_int_cst (val_type, mask_ior));
+            return fold_build2 (BIT_AND_EXPR, val_type, tval,
+                                build_int_cst (val_type, mask_and));
+          }
+
+        if (changed)
+          return build_call_expr (fndecl, 3, tmap, tbits, tval);
+
+        /* If bits don't change their position we can use vanilla logic
+           to merge the two arguments.  */
+
+        if (0 == avr_map_metric (map, MAP_NONFIXED_0_7))
+          {
+            int mask_f = avr_map_metric (map, MAP_MASK_PREIMAGE_F);
+            tree tres, tmask = build_int_cst (val_type, mask_f ^ 0xff);
+
+            tres = fold_build2 (BIT_XOR_EXPR, val_type, tbits, tval);
+            tres = fold_build2 (BIT_AND_EXPR, val_type, tres, tmask);
+            return fold_build2 (BIT_XOR_EXPR, val_type, tres, tval);
+          }
+
+        /* Try to decomposing map to reduce overall cost.  */
+
+        if (avr_log.builtin)
+          avr_edump ("\n%?: %X\n%?: ROL cost: ", map);
+        
+        best_g = avr_map_op[0];
+        best_g.cost = 1000;
+        
+        for (i = 0; i < sizeof (avr_map_op) / sizeof (*avr_map_op); i++)
+          {
+            avr_map_op_t g
+              = avr_map_decompose (map, avr_map_op + i,
+                                   TREE_CODE (tval) == INTEGER_CST);
+
+            if (g.cost >= 0 && g.cost < best_g.cost)
+              best_g = g;
+          }
+
+        if (avr_log.builtin)
+          avr_edump ("\n");
+                     
+        if (best_g.arg == 0)
+          /* No optimization found */
+          break;
+        
+        /* Apply operation G to the 2nd argument.  */
+              
+        if (avr_log.builtin)
+          avr_edump ("%?: using OP(%s%d, %X) cost %d\n",
+                     best_g.str, best_g.arg, best_g.map, best_g.cost);
+
+        /* Do right-shifts arithmetically: They copy the MSB instead of
+           shifting in a non-usable value (0) as with logic right-shift.  */
+        
+        tbits = fold_convert (signed_char_type_node, tbits);
+        tbits = fold_build2 (best_g.code, signed_char_type_node, tbits,
+                             build_int_cst (val_type, best_g.arg));
+        tbits = fold_convert (val_type, tbits);
+
+        /* Use map o G^-1 instead of original map to undo the effect of G.  */
+        
+        tmap = double_int_to_tree (map_type, best_g.map);
+        
+        return build_call_expr (fndecl, 3, tmap, tbits, tval);
+      } /* AVR_BUILTIN_INSERT_BITS */
+    }
+
+  return NULL_TREE;
+}
+
+\f
+
+/* Initialize the GCC target structure.  */
+
+#undef  TARGET_ASM_ALIGNED_HI_OP
+#define TARGET_ASM_ALIGNED_HI_OP "\t.word\t"
+#undef  TARGET_ASM_ALIGNED_SI_OP
+#define TARGET_ASM_ALIGNED_SI_OP "\t.long\t"
+#undef  TARGET_ASM_UNALIGNED_HI_OP
+#define TARGET_ASM_UNALIGNED_HI_OP "\t.word\t"
+#undef  TARGET_ASM_UNALIGNED_SI_OP
+#define TARGET_ASM_UNALIGNED_SI_OP "\t.long\t"
+#undef  TARGET_ASM_INTEGER
+#define TARGET_ASM_INTEGER avr_assemble_integer
+#undef  TARGET_ASM_FILE_START
+#define TARGET_ASM_FILE_START avr_file_start
+#undef  TARGET_ASM_FILE_END
+#define TARGET_ASM_FILE_END avr_file_end
+
+#undef  TARGET_ASM_FUNCTION_END_PROLOGUE
+#define TARGET_ASM_FUNCTION_END_PROLOGUE avr_asm_function_end_prologue
+#undef  TARGET_ASM_FUNCTION_BEGIN_EPILOGUE
+#define TARGET_ASM_FUNCTION_BEGIN_EPILOGUE avr_asm_function_begin_epilogue
+
+#undef  TARGET_FUNCTION_VALUE
+#define TARGET_FUNCTION_VALUE avr_function_value
+#undef  TARGET_LIBCALL_VALUE
+#define TARGET_LIBCALL_VALUE avr_libcall_value
+#undef  TARGET_FUNCTION_VALUE_REGNO_P
+#define TARGET_FUNCTION_VALUE_REGNO_P avr_function_value_regno_p
+
+#undef  TARGET_ATTRIBUTE_TABLE
+#define TARGET_ATTRIBUTE_TABLE avr_attribute_table
+#undef  TARGET_INSERT_ATTRIBUTES
+#define TARGET_INSERT_ATTRIBUTES avr_insert_attributes
+#undef  TARGET_SECTION_TYPE_FLAGS
+#define TARGET_SECTION_TYPE_FLAGS avr_section_type_flags
+
+#undef  TARGET_ASM_NAMED_SECTION
+#define TARGET_ASM_NAMED_SECTION avr_asm_named_section
+#undef  TARGET_ASM_INIT_SECTIONS
+#define TARGET_ASM_INIT_SECTIONS avr_asm_init_sections
+#undef  TARGET_ENCODE_SECTION_INFO
+#define TARGET_ENCODE_SECTION_INFO avr_encode_section_info
+#undef  TARGET_ASM_SELECT_SECTION
+#define TARGET_ASM_SELECT_SECTION avr_asm_select_section
+
+#undef  TARGET_REGISTER_MOVE_COST
+#define TARGET_REGISTER_MOVE_COST avr_register_move_cost
+#undef  TARGET_MEMORY_MOVE_COST
+#define TARGET_MEMORY_MOVE_COST avr_memory_move_cost
+#undef  TARGET_RTX_COSTS
+#define TARGET_RTX_COSTS avr_rtx_costs
+#undef  TARGET_ADDRESS_COST
+#define TARGET_ADDRESS_COST avr_address_cost
+#undef  TARGET_MACHINE_DEPENDENT_REORG
+#define TARGET_MACHINE_DEPENDENT_REORG avr_reorg
+#undef  TARGET_FUNCTION_ARG
+#define TARGET_FUNCTION_ARG avr_function_arg
+#undef  TARGET_FUNCTION_ARG_ADVANCE
+#define TARGET_FUNCTION_ARG_ADVANCE avr_function_arg_advance
+
+#undef  TARGET_RETURN_IN_MEMORY
+#define TARGET_RETURN_IN_MEMORY avr_return_in_memory
+
+#undef  TARGET_STRICT_ARGUMENT_NAMING
+#define TARGET_STRICT_ARGUMENT_NAMING hook_bool_CUMULATIVE_ARGS_true
+
+#undef  TARGET_BUILTIN_SETJMP_FRAME_VALUE
+#define TARGET_BUILTIN_SETJMP_FRAME_VALUE avr_builtin_setjmp_frame_value
+
+#undef  TARGET_HARD_REGNO_SCRATCH_OK
+#define TARGET_HARD_REGNO_SCRATCH_OK avr_hard_regno_scratch_ok
+#undef  TARGET_CASE_VALUES_THRESHOLD
+#define TARGET_CASE_VALUES_THRESHOLD avr_case_values_threshold
+
+#undef  TARGET_FRAME_POINTER_REQUIRED
+#define TARGET_FRAME_POINTER_REQUIRED avr_frame_pointer_required_p
+#undef  TARGET_CAN_ELIMINATE
+#define TARGET_CAN_ELIMINATE avr_can_eliminate
+
+#undef  TARGET_CLASS_LIKELY_SPILLED_P
+#define TARGET_CLASS_LIKELY_SPILLED_P avr_class_likely_spilled_p
+
+#undef  TARGET_OPTION_OVERRIDE
+#define TARGET_OPTION_OVERRIDE avr_option_override
+
+#undef  TARGET_CANNOT_MODIFY_JUMPS_P
+#define TARGET_CANNOT_MODIFY_JUMPS_P avr_cannot_modify_jumps_p
+
+#undef  TARGET_FUNCTION_OK_FOR_SIBCALL
+#define TARGET_FUNCTION_OK_FOR_SIBCALL avr_function_ok_for_sibcall
+
+#undef  TARGET_INIT_BUILTINS
+#define TARGET_INIT_BUILTINS avr_init_builtins
+
+#undef  TARGET_BUILTIN_DECL
+#define TARGET_BUILTIN_DECL avr_builtin_decl
+
+#undef  TARGET_EXPAND_BUILTIN
+#define TARGET_EXPAND_BUILTIN avr_expand_builtin
+
+#undef  TARGET_FOLD_BUILTIN
+#define TARGET_FOLD_BUILTIN avr_fold_builtin
+
+#undef  TARGET_ASM_FUNCTION_RODATA_SECTION
+#define TARGET_ASM_FUNCTION_RODATA_SECTION avr_asm_function_rodata_section
+
+#undef  TARGET_SCALAR_MODE_SUPPORTED_P
+#define TARGET_SCALAR_MODE_SUPPORTED_P avr_scalar_mode_supported_p
+
+#undef  TARGET_ADDR_SPACE_SUBSET_P
+#define TARGET_ADDR_SPACE_SUBSET_P avr_addr_space_subset_p
+
+#undef  TARGET_ADDR_SPACE_CONVERT
+#define TARGET_ADDR_SPACE_CONVERT avr_addr_space_convert
+
+#undef  TARGET_ADDR_SPACE_ADDRESS_MODE
+#define TARGET_ADDR_SPACE_ADDRESS_MODE avr_addr_space_address_mode
+
+#undef  TARGET_ADDR_SPACE_POINTER_MODE
+#define TARGET_ADDR_SPACE_POINTER_MODE avr_addr_space_pointer_mode
+
+#undef  TARGET_ADDR_SPACE_LEGITIMATE_ADDRESS_P
+#define TARGET_ADDR_SPACE_LEGITIMATE_ADDRESS_P  \
+  avr_addr_space_legitimate_address_p
+
+#undef  TARGET_ADDR_SPACE_LEGITIMIZE_ADDRESS
+#define TARGET_ADDR_SPACE_LEGITIMIZE_ADDRESS avr_addr_space_legitimize_address
+
+#undef  TARGET_MODE_DEPENDENT_ADDRESS_P
+#define TARGET_MODE_DEPENDENT_ADDRESS_P avr_mode_dependent_address_p
+
+#undef  TARGET_PRINT_OPERAND
+#define TARGET_PRINT_OPERAND avr_print_operand
+#undef  TARGET_PRINT_OPERAND_ADDRESS
+#define TARGET_PRINT_OPERAND_ADDRESS avr_print_operand_address
+#undef  TARGET_PRINT_OPERAND_PUNCT_VALID_P
+#define TARGET_PRINT_OPERAND_PUNCT_VALID_P avr_print_operand_punct_valid_p
+
 struct gcc_target targetm = TARGET_INITIALIZER;
 
+\f
 #include "gt-avr.h"