OSDN Git Service

PR middle-end/32398
[pf3gnuchains/gcc-fork.git] / gcc / config / pa / pa.h
index 3088425..1ae199a 100644 (file)
@@ -1,6 +1,6 @@
 /* Definitions of target machine for GNU compiler, for the HP Spectrum.
    Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
-   2001, 2002, 2003, 2004 Free Software Foundation, Inc.
+   2001, 2002, 2003, 2004, 2005, 2006, 2007 Free Software Foundation, Inc.
    Contributed by Michael Tiemann (tiemann@cygnus.com) of Cygnus Support
    and Tim Moore (moore@defmacro.cs.utah.edu) of the Center for
    Software Science at the University of Utah.
@@ -19,8 +19,8 @@ GNU General Public License for more details.
 
 You should have received a copy of the GNU General Public License
 along with GCC; see the file COPYING.  If not, write to
-the Free Software Foundation, 59 Temple Place - Suite 330,
-Boston, MA 02111-1307, USA.  */
+the Free Software Foundation, 51 Franklin Street, Fifth Floor,
+Boston, MA 02110-1301, USA.  */
 
 enum cmp_type                          /* comparison type */
 {
@@ -46,129 +46,18 @@ enum processor_type
 };
 
 /* For -mschedule= option.  */
-extern const char *pa_cpu_string;
 extern enum processor_type pa_cpu;
 
-#define pa_cpu_attr ((enum attr_cpu)pa_cpu)
-
-/* Which architecture to generate code for.  */
-
-enum architecture_type
-{
-  ARCHITECTURE_10,
-  ARCHITECTURE_11,
-  ARCHITECTURE_20
-};
+/* For -munix= option.  */
+extern int flag_pa_unix;
 
-struct rtx_def;
-
-/* For -march= option.  */
-extern const char *pa_arch_string;
-extern enum architecture_type pa_arch;
+#define pa_cpu_attr ((enum attr_cpu)pa_cpu)
 
 /* Print subsidiary information on the compiler version in use.  */
 
 #define TARGET_VERSION fputs (" (hppa)", stderr);
 
-/* Run-time compilation parameters selecting different hardware subsets.  */
-
-extern int target_flags;
-
-/* compile code for HP-PA 1.1 ("Snake").  */
-
-#define MASK_PA_11 1
-
-/* Disable all FP registers (they all become fixed).  This may be necessary
-   for compiling kernels which perform lazy context switching of FP regs.
-   Note if you use this option and try to perform floating point operations
-   the compiler will abort!  */
-
-#define MASK_DISABLE_FPREGS 2
-#define TARGET_DISABLE_FPREGS (target_flags & MASK_DISABLE_FPREGS)
-
-/* Generate code which assumes that all space register are equivalent.
-   Triggers aggressive unscaled index addressing and faster
-   builtin_return_address.  */
-#define MASK_NO_SPACE_REGS 4
-#define TARGET_NO_SPACE_REGS (target_flags & MASK_NO_SPACE_REGS)
-
-/* Allow unconditional jumps in the delay slots of call instructions.  */
-#define MASK_JUMP_IN_DELAY 8
-#define TARGET_JUMP_IN_DELAY (target_flags & MASK_JUMP_IN_DELAY)
-
-/* Disable indexed addressing modes.  */
-#define MASK_DISABLE_INDEXING 32
-#define TARGET_DISABLE_INDEXING (target_flags & MASK_DISABLE_INDEXING)
-
-/* Emit code which follows the new portable runtime calling conventions
-   HP wants everyone to use for ELF objects.  If at all possible you want
-   to avoid this since it's a performance loss for non-prototyped code.
-
-   Note TARGET_PORTABLE_RUNTIME also forces all calls to use inline
-   long-call stubs which is quite expensive.  */
-#define MASK_PORTABLE_RUNTIME 64
-#define TARGET_PORTABLE_RUNTIME (target_flags & MASK_PORTABLE_RUNTIME)
-
-/* Emit directives only understood by GAS.  This allows parameter
-   relocations to work for static functions.  There is no way
-   to make them work the HP assembler at this time.  */
-#define MASK_GAS 128
-#define TARGET_GAS (target_flags & MASK_GAS)
-
-/* Emit code for processors which do not have an FPU.  */
-#define MASK_SOFT_FLOAT 256
-#define TARGET_SOFT_FLOAT (target_flags & MASK_SOFT_FLOAT)
-
-/* Use 3-insn load/store sequences for access to large data segments
-   in shared libraries on hpux10.  */
-#define MASK_LONG_LOAD_STORE 512
-#define TARGET_LONG_LOAD_STORE (target_flags & MASK_LONG_LOAD_STORE)
-
-/* Use a faster sequence for indirect calls.  This assumes that calls
-   through function pointers will never cross a space boundary, and
-   that the executable is not dynamically linked.  Such assumptions
-   are generally safe for building kernels and statically linked
-   executables.  Code compiled with this option will fail miserably if
-   the executable is dynamically linked or uses nested functions!  */
-#define MASK_FAST_INDIRECT_CALLS 1024
-#define TARGET_FAST_INDIRECT_CALLS (target_flags & MASK_FAST_INDIRECT_CALLS)
-
-/* Generate code with big switch statements to avoid out of range branches
-   occurring within the switch table.  */
-#define MASK_BIG_SWITCH 2048
-#define TARGET_BIG_SWITCH (target_flags & MASK_BIG_SWITCH)
-
-/* Generate code for the HPPA 2.0 architecture.  TARGET_PA_11 should also be
-   true when this is true.  */
-#define MASK_PA_20 4096
-
-/* Generate cpp defines for server I/O.  */
-#define MASK_SIO 8192
-#define TARGET_SIO (target_flags & MASK_SIO)
-
-/* Assume GNU linker by default.  */
-#define MASK_GNU_LD 16384
-#ifndef TARGET_GNU_LD
-#define TARGET_GNU_LD (target_flags & MASK_GNU_LD)
-#endif
-
-/* Force generation of long calls.  */
-#define MASK_LONG_CALLS 32768
-#ifndef TARGET_LONG_CALLS
-#define TARGET_LONG_CALLS (target_flags & MASK_LONG_CALLS)
-#endif
-
-#ifndef TARGET_PA_10
-#define TARGET_PA_10 (target_flags & (MASK_PA_11 | MASK_PA_20) == 0)
-#endif
-
-#ifndef TARGET_PA_11
-#define TARGET_PA_11 (target_flags & MASK_PA_11)
-#endif
-
-#ifndef TARGET_PA_20
-#define TARGET_PA_20 (target_flags & MASK_PA_20)
-#endif
+#define TARGET_PA_10 (!TARGET_PA_11 && !TARGET_PA_20)
 
 /* Generate code for the HPPA 2.0 architecture in 64bit mode.  */
 #ifndef TARGET_64BIT
@@ -185,6 +74,26 @@ extern int target_flags;
 #define TARGET_SOM 0
 #endif
 
+/* HP-UX UNIX features.  */
+#ifndef TARGET_HPUX
+#define TARGET_HPUX 0
+#endif
+
+/* HP-UX 10.10 UNIX 95 features.  */
+#ifndef TARGET_HPUX_10_10
+#define TARGET_HPUX_10_10 0
+#endif
+
+/* HP-UX 11.* features (11.00, 11.11, 11.23, etc.)  */
+#ifndef TARGET_HPUX_11
+#define TARGET_HPUX_11 0
+#endif
+
+/* HP-UX 11i multibyte and UNIX 98 extensions.  */
+#ifndef TARGET_HPUX_11_11
+#define TARGET_HPUX_11_11 0
+#endif
+
 /* The following three defines are potential target switches.  The current
    defines are optimal given the current capabilities of GAS and GNU ld.  */
 
@@ -220,98 +129,18 @@ extern int target_flags;
    need to generate additional code to save SP into the frame marker.  */
 #define TARGET_HPUX_UNWIND_LIBRARY 0
 
-/* Macro to define tables used to set the flags.  This is a
-   list in braces of target switches with each switch being
-   { "NAME", VALUE, "HELP_STRING" }.  VALUE is the bits to set,
-   or minus the bits to clear.  An empty string NAME is used to
-   identify the default VALUE.  Do not mark empty strings for
-   translation.  */
-
-#define TARGET_SWITCHES \
-  {{ "snake",                   MASK_PA_11,                            \
-     N_("Generate PA1.1 code") },                                      \
-   { "nosnake",                        -(MASK_PA_11 | MASK_PA_20),             \
-     N_("Generate PA1.0 code") },                                      \
-   { "pa-risc-1-0",            -(MASK_PA_11 | MASK_PA_20),             \
-     N_("Generate PA1.0 code") },                                      \
-   { "pa-risc-1-1",             MASK_PA_11,                            \
-     N_("Generate PA1.1 code") },                                      \
-   { "pa-risc-2-0",             MASK_PA_20,                            \
-     N_("Generate PA2.0 code (requires binutils 2.10 or later)") },    \
-   { "disable-fpregs",          MASK_DISABLE_FPREGS,                   \
-     N_("Disable FP regs") },                                          \
-   { "no-disable-fpregs",      -MASK_DISABLE_FPREGS,                   \
-     N_("Do not disable FP regs") },                                   \
-   { "no-space-regs",           MASK_NO_SPACE_REGS,                    \
-     N_("Disable space regs") },                                       \
-   { "space-regs",             -MASK_NO_SPACE_REGS,                    \
-     N_("Do not disable space regs") },                                        \
-   { "jump-in-delay",           MASK_JUMP_IN_DELAY,                    \
-     N_("Put jumps in call delay slots") },                            \
-   { "no-jump-in-delay",       -MASK_JUMP_IN_DELAY,                    \
-     N_("Do not put jumps in call delay slots") },                     \
-   { "disable-indexing",        MASK_DISABLE_INDEXING,                 \
-     N_("Disable indexed addressing") },                               \
-   { "no-disable-indexing",    -MASK_DISABLE_INDEXING,                 \
-     N_("Do not disable indexed addressing") },                                \
-   { "portable-runtime",        MASK_PORTABLE_RUNTIME,                 \
-     N_("Use portable calling conventions") },                         \
-   { "no-portable-runtime",    -MASK_PORTABLE_RUNTIME,                 \
-     N_("Do not use portable calling conventions") },                  \
-   { "gas",                     MASK_GAS,                              \
-     N_("Assume code will be assembled by GAS") },                     \
-   { "no-gas",                 -MASK_GAS,                              \
-     N_("Do not assume code will be assembled by GAS") },              \
-   { "soft-float",              MASK_SOFT_FLOAT,                       \
-     N_("Use software floating point") },                              \
-   { "no-soft-float",          -MASK_SOFT_FLOAT,                       \
-     N_("Do not use software floating point") },                       \
-   { "long-load-store",                 MASK_LONG_LOAD_STORE,                  \
-     N_("Emit long load/store sequences") },                           \
-   { "no-long-load-store",     -MASK_LONG_LOAD_STORE,                  \
-     N_("Do not emit long load/store sequences") },                    \
-   { "fast-indirect-calls",     MASK_FAST_INDIRECT_CALLS,              \
-     N_("Generate fast indirect calls") },                             \
-   { "no-fast-indirect-calls", -MASK_FAST_INDIRECT_CALLS,              \
-     N_("Do not generate fast indirect calls") },                      \
-   { "big-switch",              MASK_BIG_SWITCH,                       \
-     N_("Generate code for huge switch statements") },                 \
-   { "no-big-switch",          -MASK_BIG_SWITCH,                       \
-     N_("Do not generate code for huge switch statements") },          \
-   { "long-calls",              MASK_LONG_CALLS,                       \
-     N_("Always generate long calls") },                               \
-   { "no-long-calls",          -MASK_LONG_CALLS,                       \
-     N_("Generate long calls only when needed") },                     \
-   { "linker-opt",              0,                                     \
-     N_("Enable linker optimizations") },                              \
-   SUBTARGET_SWITCHES                                                  \
-   { "",                        TARGET_DEFAULT | TARGET_CPU_DEFAULT,   \
-     NULL }}
-
 #ifndef TARGET_DEFAULT
-#define TARGET_DEFAULT (MASK_GAS | MASK_JUMP_IN_DELAY)
+#define TARGET_DEFAULT (MASK_GAS | MASK_JUMP_IN_DELAY | MASK_BIG_SWITCH)
 #endif
 
 #ifndef TARGET_CPU_DEFAULT
 #define TARGET_CPU_DEFAULT 0
 #endif
 
-#ifndef SUBTARGET_SWITCHES
-#define SUBTARGET_SWITCHES
-#endif
-
 #ifndef TARGET_SCHED_DEFAULT
-#define TARGET_SCHED_DEFAULT "8000"
+#define TARGET_SCHED_DEFAULT PROCESSOR_8000
 #endif
 
-#define TARGET_OPTIONS                                                 \
-{                                                                      \
-  { "schedule=",               &pa_cpu_string,                         \
-    N_("Specify CPU for scheduling purposes"), 0},                     \
-  { "arch=",                   &pa_arch_string,                        \
-    N_("Specify architecture for code generation.  Values are 1.0, 1.1, and 2.0.  2.0 requires gas snapshot 19990413 or later."), 0}\
-}
-
 /* Support for a compile-time default CPU, et cetera.  The rules are:
    --with-schedule is ignored if -mschedule is specified.
    --with-arch is ignored if -march is specified.  */
@@ -339,10 +168,6 @@ extern int target_flags;
 #undef DBX_CONTIN_LENGTH
 #define DBX_CONTIN_LENGTH 3000
 
-/* Only labels should ever begin in column zero.  */
-#define ASM_STABS_OP "\t.stabs\t"
-#define ASM_STABN_OP "\t.stabn\t"
-
 /* GDB always assumes the current function's frame begins at the value
    of the stack pointer upon entry to the current function.  Accessing
    local variables and parameters passed on the stack is done using the
@@ -424,6 +249,12 @@ do {                                                               \
 #define CAN_DEBUG_WITHOUT_FP
 \f
 /* target machine storage layout */
+typedef struct machine_function GTY(())
+{
+  /* Flag indicating that a .NSUBSPA directive has been output for
+     this function.  */
+  int in_nsubspa;
+} machine_function;
 
 /* Define this macro if it is advisable to hold scalars in registers
    in a wider mode than that declared by the program.  In such cases, 
@@ -452,8 +283,22 @@ do {                                                               \
 
 /* Width of a word, in units (bytes).  */
 #define UNITS_PER_WORD (TARGET_64BIT ? 8 : 4)
+
+/* Minimum number of units in a word.  If this is undefined, the default
+   is UNITS_PER_WORD.  Otherwise, it is the constant value that is the
+   smallest value that UNITS_PER_WORD can have at run-time.
+
+   FIXME: This needs to be 4 when TARGET_64BIT is true to suppress the
+   building of various TImode routines in libgcc.  The HP runtime
+   specification doesn't provide the alignment requirements and calling
+   conventions for TImode variables.  */
 #define MIN_UNITS_PER_WORD 4
 
+/* The widest floating point format supported by the hardware.  Note that
+   setting this influences some Ada floating point type sizes, currently
+   required for GNAT to operate properly.  */
+#define WIDEST_HARDWARE_FP_SIZE 64
+
 /* Allocation boundary (in *bits*) for storing arguments in argument list.  */
 #define PARM_BOUNDARY BITS_PER_WORD
 
@@ -500,9 +345,6 @@ do {                                                                \
    when given unaligned data.  */
 #define STRICT_ALIGNMENT 1
 
-/* Generate calls to memcpy, memcmp and memset.  */
-#define TARGET_MEM_FUNCTIONS
-
 /* Value is 1 if it is a good idea to tie two pseudo registers
    when one has mode MODE1 and one has mode MODE2.
    If HARD_REGNO_MODE_OK could produce different values for MODE1 and MODE2,
@@ -526,6 +368,12 @@ do {                                                               \
 #define FRAME_POINTER_REQUIRED \
   (current_function_calls_alloca)
 
+/* Don't allow hard registers to be renamed into r2 unless r2
+   is already live or already being saved (due to eh).  */
+
+#define HARD_REGNO_RENAME_OK(OLD_REG, NEW_REG) \
+  ((NEW_REG) != 2 || df_regs_ever_live_p (2) || current_function_calls_eh_return)
+
 /* C statement to store the difference between the frame pointer
    and the stack pointer values immediately after the function prologue.
 
@@ -536,10 +384,10 @@ do {                                                              \
   do {(VAR) = - compute_frame_size (get_frame_size (), 0);} while (0)
 
 /* Base register for access to arguments of the function.  */
-#define ARG_POINTER_REGNUM 3
+#define ARG_POINTER_REGNUM (TARGET_64BIT ? 29 : 3)
 
 /* Register in which static-chain is passed to a function.  */
-#define STATIC_CHAIN_REGNUM 29
+#define STATIC_CHAIN_REGNUM (TARGET_64BIT ? 31 : 29)
 
 /* Register used to address the offset table for position-independent
    data references.  */
@@ -562,56 +410,74 @@ extern struct rtx_def *hppa_pic_save_rtx (void);
 #define EH_RETURN_DATA_REGNO(N)        \
   ((N) < 3 ? (N) + 20 : (N) == 3 ? 31 : INVALID_REGNUM)
 #define EH_RETURN_STACKADJ_RTX gen_rtx_REG (Pmode, 29)
-#define EH_RETURN_HANDLER_RTX \
-  gen_rtx_MEM (word_mode,                                              \
-              gen_rtx_PLUS (word_mode, frame_pointer_rtx,              \
-                            TARGET_64BIT ? GEN_INT (-16) : GEN_INT (-20)))
-                               
-
-/* Offset from the argument pointer register value to the top of
-   stack.  This is different from FIRST_PARM_OFFSET because of the
-   frame marker.  */
-#define ARG_POINTER_CFA_OFFSET(FNDECL) 0
+#define EH_RETURN_HANDLER_RTX pa_eh_return_handler_rtx ()
+
+/* Offset from the frame pointer register value to the top of stack.  */
+#define FRAME_POINTER_CFA_OFFSET(FNDECL) 0
+
+/* A C expression whose value is RTL representing the location of the
+   incoming return address at the beginning of any function, before the
+   prologue.  You only need to define this macro if you want to support
+   call frame debugging information like that provided by DWARF 2.  */
+#define INCOMING_RETURN_ADDR_RTX (gen_rtx_REG (word_mode, 2))
+#define DWARF_FRAME_RETURN_COLUMN (DWARF_FRAME_REGNUM (2))
+
+/* A C expression whose value is an integer giving a DWARF 2 column
+   number that may be used as an alternate return column.  This should
+   be defined only if DWARF_FRAME_RETURN_COLUMN is set to a general
+   register, but an alternate column needs to be used for signal frames.
+
+   Column 0 is not used but unfortunately its register size is set to
+   4 bytes (sizeof CCmode) so it can't be used on 64-bit targets.  */
+#define DWARF_ALT_FRAME_RETURN_COLUMN FIRST_PSEUDO_REGISTER
+
+/* This macro chooses the encoding of pointers embedded in the exception
+   handling sections.  If at all possible, this should be defined such
+   that the exception handling section will not require dynamic relocations,
+   and so may be read-only.
+
+   Because the HP assembler auto aligns, it is necessary to use
+   DW_EH_PE_aligned.  It's not possible to make the data read-only
+   on the HP-UX SOM port since the linker requires fixups for label
+   differences in different sections to be word aligned.  However,
+   the SOM linker can do unaligned fixups for absolute pointers.
+   We also need aligned pointers for global and function pointers.
+
+   Although the HP-UX 64-bit ELF linker can handle unaligned pc-relative
+   fixups, the runtime doesn't have a consistent relationship between
+   text and data for dynamically loaded objects.  Thus, it's not possible
+   to use pc-relative encoding for pointers on this target.  It may be
+   possible to use segment relative encodings but GAS doesn't currently
+   have a mechanism to generate these encodings.  For other targets, we
+   use pc-relative encoding for pointers.  If the pointer might require
+   dynamic relocation, we make it indirect.  */
+#define ASM_PREFERRED_EH_DATA_FORMAT(CODE,GLOBAL)                      \
+  (TARGET_GAS && !TARGET_HPUX                                          \
+   ? (DW_EH_PE_pcrel                                                   \
+      | ((GLOBAL) || (CODE) == 2 ? DW_EH_PE_indirect : 0)              \
+      | (TARGET_64BIT ? DW_EH_PE_sdata8 : DW_EH_PE_sdata4))            \
+   : (!TARGET_GAS || (GLOBAL) || (CODE) == 2                           \
+      ? DW_EH_PE_aligned : DW_EH_PE_absptr))
+
+/* Handle special EH pointer encodings.  Absolute, pc-relative, and
+   indirect are handled automatically.  We output pc-relative, and
+   indirect pc-relative ourself since we need some special magic to
+   generate pc-relative relocations, and to handle indirect function
+   pointers.  */
+#define ASM_MAYBE_OUTPUT_ENCODED_ADDR_RTX(FILE, ENCODING, SIZE, ADDR, DONE) \
+  do {                                                                 \
+    if (((ENCODING) & 0x70) == DW_EH_PE_pcrel)                         \
+      {                                                                        \
+       fputs (integer_asm_op (SIZE, FALSE), FILE);                     \
+       if ((ENCODING) & DW_EH_PE_indirect)                             \
+         output_addr_const (FILE, get_deferred_plabel (ADDR));         \
+       else                                                            \
+         assemble_name (FILE, XSTR ((ADDR), 0));                       \
+       fputs ("+8-$PIC_pcrel$0", FILE);                                \
+       goto DONE;                                                      \
+      }                                                                        \
+    } while (0)
 \f
-/* The letters I, J, K, L and M in a register constraint string
-   can be used to stand for particular ranges of immediate operands.
-   This macro defines what the ranges are.
-   C is the letter, and VALUE is a constant value.
-   Return 1 if VALUE is in the range specified by C.
-
-   `I' is used for the 11 bit constants.
-   `J' is used for the 14 bit constants.
-   `K' is used for values that can be moved with a zdepi insn.
-   `L' is used for the 5 bit constants.
-   `M' is used for 0.
-   `N' is used for values with the least significant 11 bits equal to zero
-                         and when sign extended from 32 to 64 bits the
-                         value does not change.
-   `O' is used for numbers n such that n+1 is a power of 2.
-   */
-
-#define CONST_OK_FOR_LETTER_P(VALUE, C)  \
-  ((C) == 'I' ? VAL_11_BITS_P (VALUE)                                  \
-   : (C) == 'J' ? VAL_14_BITS_P (VALUE)                                        \
-   : (C) == 'K' ? zdepi_cint_p (VALUE)                                 \
-   : (C) == 'L' ? VAL_5_BITS_P (VALUE)                                 \
-   : (C) == 'M' ? (VALUE) == 0                                         \
-   : (C) == 'N' ? (((VALUE) & (((HOST_WIDE_INT) -1 << 31) | 0x7ff)) == 0 \
-                  || (((VALUE) & (((HOST_WIDE_INT) -1 << 31) | 0x7ff)) \
-                      == (HOST_WIDE_INT) -1 << 31))                    \
-   : (C) == 'O' ? (((VALUE) & ((VALUE) + 1)) == 0)                     \
-   : (C) == 'P' ? and_mask_p (VALUE)                                   \
-   : 0)
-
-/* Similar, but for floating or large integer constants, and defining letters
-   G and H.   Here VALUE is the CONST_DOUBLE rtx itself.
-
-   For PA, `G' is the floating-point constant zero.  `H' is undefined.  */
-
-#define CONST_DOUBLE_OK_FOR_LETTER_P(VALUE, C)                         \
-  ((C) == 'G' ? (GET_MODE_CLASS (GET_MODE (VALUE)) == MODE_FLOAT       \
-                && (VALUE) == CONST0_RTX (GET_MODE (VALUE)))           \
-   : 0)
 
 /* The class value for index registers, and the one for base regs.  */
 #define INDEX_REG_CLASS GENERAL_REGS
@@ -629,28 +495,19 @@ extern struct rtx_def *hppa_pic_save_rtx (void);
    in some cases it is preferable to use a more restrictive class.  */
 #define PREFERRED_RELOAD_CLASS(X,CLASS) (CLASS)
 
-/* Return the register class of a scratch register needed to copy
-   IN into a register in CLASS in MODE, or a register in CLASS in MODE
-   to IN.  If it can be done directly NO_REGS is returned. 
-
-  Avoid doing any work for the common case calls.  */
-#define SECONDARY_RELOAD_CLASS(CLASS,MODE,IN) \
-  ((CLASS == BASE_REG_CLASS && GET_CODE (IN) == REG            \
-    && REGNO (IN) < FIRST_PSEUDO_REGISTER)                     \
-   ? NO_REGS : secondary_reload_class (CLASS, MODE, IN))
-
 #define MAYBE_FP_REG_CLASS_P(CLASS) \
   reg_classes_intersect_p ((CLASS), FP_REGS)
 
 /* On the PA it is not possible to directly move data between
-   GENERAL_REGS and FP_REGS.  */
-#define SECONDARY_MEMORY_NEEDED(CLASS1, CLASS2, MODE)          \
-  (MAYBE_FP_REG_CLASS_P (CLASS1) != FP_REG_CLASS_P (CLASS2)    \
-   || MAYBE_FP_REG_CLASS_P (CLASS2) != FP_REG_CLASS_P (CLASS1))
-
-/* Return the stack location to use for secondary memory needed reloads.  */
-#define SECONDARY_MEMORY_NEEDED_RTX(MODE) \
-  gen_rtx_MEM (MODE, gen_rtx_PLUS (Pmode, stack_pointer_rtx, GEN_INT (-16)))
+   GENERAL_REGS and FP_REGS.  On the 32-bit port, we use the
+   location at SP-16.  We don't expose this location in the RTL to
+   avoid scheduling related problems.  For example, the store and
+   load could be separated by a call to a pure or const function
+   which has no frame and uses SP-16.  */
+#define SECONDARY_MEMORY_NEEDED(CLASS1, CLASS2, MODE)                  \
+  (TARGET_64BIT                                                                \
+   && (MAYBE_FP_REG_CLASS_P (CLASS1) != FP_REG_CLASS_P (CLASS2)                \
+       || MAYBE_FP_REG_CLASS_P (CLASS2) != FP_REG_CLASS_P (CLASS1)))
 
 \f
 /* Stack layout; function entry, exit and calling.  */
@@ -662,11 +519,11 @@ extern struct rtx_def *hppa_pic_save_rtx (void);
 /* Believe it or not.  */
 #define ARGS_GROW_DOWNWARD
 
-/* Define this if the nominal address of the stack frame
+/* Define this to nonzero if the nominal address of the stack frame
    is at the high-address end of the local variables;
    that is, each additional local variable allocated
    goes at a more negative offset in the frame.  */
-/* #define FRAME_GROWS_DOWNWARD */
+#define FRAME_GROWS_DOWNWARD 0
 
 /* Offset within stack frame to start allocating local variables at.
    If FRAME_GROWS_DOWNWARD, this is the offset to the END of the
@@ -703,7 +560,7 @@ extern struct rtx_def *hppa_pic_save_rtx (void);
 
 /* Define this if the above stack space is to be considered part of the
    space allocated by the caller.  */
-#define OUTGOING_REG_PARM_STACK_SPACE
+#define OUTGOING_REG_PARM_STACK_SPACE 1
 
 /* Keep the stack pointer constant throughout the function.
    This is both an optimization and a necessity: longjmp
@@ -872,29 +729,28 @@ struct hppa_args {int words, nargs_prototype, incoming, indirect; };
   the standard parameter passing conventions on the RS6000.  That's why
   you'll see lots of similar code in rs6000.h.  */
 
+/* If defined, a C expression which determines whether, and in which
+   direction, to pad out an argument with extra space.  */
 #define FUNCTION_ARG_PADDING(MODE, TYPE) function_arg_padding ((MODE), (TYPE))
 
+/* Specify padding for the last element of a block move between registers
+   and memory.
+
+   The 64-bit runtime specifies that objects need to be left justified
+   (i.e., the normal justification for a big endian target).  The 32-bit
+   runtime specifies right justification for objects smaller than 64 bits.
+   We use a DImode register in the parallel for 5 to 7 byte structures
+   so that there is only one element.  This allows the object to be
+   correctly padded.  */
+#define BLOCK_REG_PADDING(MODE, TYPE, FIRST) \
+  function_arg_padding ((MODE), (TYPE))
+
 /* Do not expect to understand this without reading it several times.  I'm
    tempted to try and simply it, but I worry about breaking something.  */
 
 #define FUNCTION_ARG(CUM, MODE, TYPE, NAMED) \
   function_arg (&CUM, MODE, TYPE, NAMED)
 
-/* Nonzero if we do not know how to pass TYPE solely in registers.  */
-#define MUST_PASS_IN_STACK(MODE,TYPE) \
-  ((TYPE) != 0                                                 \
-   && (TREE_CODE (TYPE_SIZE (TYPE)) != INTEGER_CST             \
-       || TREE_ADDRESSABLE (TYPE)))
-
-/* For an arg passed partly in registers and partly in memory,
-   this is the number of registers used.
-   For args passed entirely in registers or entirely in memory, zero.  */
-
-/* For PA32 there are never split arguments. PA64, on the other hand, can
-   pass arguments partially in registers and partially in memory.  */
-#define FUNCTION_ARG_PARTIAL_NREGS(CUM, MODE, TYPE, NAMED) \
-  (TARGET_64BIT ? function_arg_partial_nregs (&CUM, MODE, TYPE, NAMED) : 0)
-
 /* If defined, a C expression that gives the alignment boundary, in
    bits, of an argument with the specified mode and type.  If it is
    not defined,  `PARM_BOUNDARY' is used for all arguments.  */
@@ -909,28 +765,6 @@ struct hppa_args {int words, nargs_prototype, incoming, indirect; };
     : GET_MODE_SIZE(MODE) <= UNITS_PER_WORD)                           \
    ? PARM_BOUNDARY : MAX_PARM_BOUNDARY)
 
-/* In the 32-bit runtime, arguments larger than eight bytes are passed
-   by invisible reference.  As a GCC extension, we also pass anything
-   with a zero or variable size by reference.
-
-   The 64-bit runtime does not describe passing any types by invisible
-   reference.  The internals of GCC can't currently handle passing
-   empty structures, and zero or variable length arrays when they are
-   not passed entirely on the stack or by reference.  Thus, as a GCC
-   extension, we pass these types by reference.  The HP compiler doesn't
-   support these types, so hopefully there shouldn't be any compatibility
-   issues.  This may have to be revisited when HP releases a C99 compiler
-   or updates the ABI.  */
-#define FUNCTION_ARG_PASS_BY_REFERENCE(CUM, MODE, TYPE, NAMED)         \
-  (TARGET_64BIT                                                                \
-   ? ((TYPE) && int_size_in_bytes (TYPE) <= 0)                         \
-   : (((TYPE) && (int_size_in_bytes (TYPE) > 8                         \
-                 || int_size_in_bytes (TYPE) <= 0))                    \
-      || ((MODE) && GET_MODE_SIZE (MODE) > 8)))
-#define FUNCTION_ARG_CALLEE_COPIES(CUM, MODE, TYPE, NAMED)             \
-  FUNCTION_ARG_PASS_BY_REFERENCE (CUM, MODE, TYPE, NAMED)
-
 \f
 extern GTY(()) rtx hppa_compare_op0;
 extern GTY(()) rtx hppa_compare_op1;
@@ -954,6 +788,11 @@ void hppa_profile_hook (int label_no);
 /* The profile counter if emitted must come before the prologue.  */
 #define PROFILE_BEFORE_PROLOGUE 1
 
+/* We never want final.c to emit profile counters.  When profile
+   counters are required, we have to defer emitting them to the end
+   of the current file.  */
+#define NO_PROFILE_COUNTERS 1
+
 /* EXIT_IGNORE_STACK should be nonzero if, when returning from a function,
    the stack pointer does not matter.  The value is tested only in
    functions that have frame pointers.
@@ -1096,7 +935,6 @@ extern int may_call_alloca;
       emit_insn (gen_dcacheflush (start_addr, end_addr, line_length)); \
       emit_insn (gen_icacheflush (start_addr, end_addr, line_length,   \
                                  gen_reg_rtx (Pmode),                  \
-                                 gen_reg_rtx (Pmode),                  \
                                  gen_reg_rtx (Pmode)));                \
     }                                                                  \
   else                                                                 \
@@ -1129,7 +967,6 @@ extern int may_call_alloca;
       emit_insn (gen_dcacheflush (start_addr, end_addr, line_length)); \
       emit_insn (gen_icacheflush (start_addr, end_addr, line_length,   \
                                  gen_reg_rtx (Pmode),                  \
-                                 gen_reg_rtx (Pmode),                  \
                                  gen_reg_rtx (Pmode)));                \
     }                                                                  \
 }
@@ -1145,11 +982,6 @@ extern int may_call_alloca;
 
 #define EXPAND_BUILTIN_VA_START(valist, nextarg) \
   hppa_va_start (valist, nextarg)
-
-/* Implement `va_arg'.  */
-
-#define EXPAND_BUILTIN_VA_ARG(valist, type) \
-  hppa_va_arg (valist, type)
 \f
 /* Addressing modes, and classification of registers for them. 
 
@@ -1164,18 +996,27 @@ extern int may_call_alloca;
 
 /* Macros to check register numbers against specific register classes.  */
 
-/* These assume that REGNO is a hard or pseudo reg number.
-   They give nonzero only if REGNO is a hard reg of the suitable class
+/* The following macros assume that X is a hard or pseudo reg number.
+   They give nonzero only if X is a hard reg of the suitable class
    or a pseudo reg currently allocated to a suitable hard reg.
    Since they use reg_renumber, they are safe only once reg_renumber
    has been allocated, which happens in local-alloc.c.  */
 
-#define REGNO_OK_FOR_INDEX_P(REGNO) \
-  ((REGNO) && ((REGNO) < 32 || (unsigned) reg_renumber[REGNO] < 32))
-#define REGNO_OK_FOR_BASE_P(REGNO)  \
-  ((REGNO) && ((REGNO) < 32 || (unsigned) reg_renumber[REGNO] < 32))
-#define REGNO_OK_FOR_FP_P(REGNO) \
-  (FP_REGNO_P (REGNO) || FP_REGNO_P (reg_renumber[REGNO]))
+#define REGNO_OK_FOR_INDEX_P(X) \
+  ((X) && ((X) < 32                                                    \
+   || (X >= FIRST_PSEUDO_REGISTER                                      \
+       && reg_renumber                                                 \
+       && (unsigned) reg_renumber[X] < 32)))
+#define REGNO_OK_FOR_BASE_P(X) \
+  ((X) && ((X) < 32                                                    \
+   || (X >= FIRST_PSEUDO_REGISTER                                      \
+       && reg_renumber                                                 \
+       && (unsigned) reg_renumber[X] < 32)))
+#define REGNO_OK_FOR_FP_P(X) \
+  (FP_REGNO_P (X)                                                      \
+   || (X >= FIRST_PSEUDO_REGISTER                                      \
+       && reg_renumber                                                 \
+       && FP_REGNO_P (reg_renumber[X])))
 
 /* Now macros that check whether X is a register and also,
    strictly, whether it is in a specified class.
@@ -1192,13 +1033,18 @@ extern int may_call_alloca;
 
 #define MAX_REGS_PER_ADDRESS 2
 
+/* Non-TLS symbolic references.  */
+#define PA_SYMBOL_REF_TLS_P(RTX) \
+  (GET_CODE (RTX) == SYMBOL_REF && SYMBOL_REF_TLS_MODEL (RTX) != 0)
+
 /* Recognize any constant value that is a valid address except
    for symbolic addresses.  We get better CSE by rejecting them
    here and allowing hppa_legitimize_address to break them up.  We
    use most of the constants accepted by CONSTANT_P, except CONST_DOUBLE.  */
 
 #define CONSTANT_ADDRESS_P(X) \
-  ((GET_CODE (X) == LABEL_REF || GET_CODE (X) == SYMBOL_REF            \
+  ((GET_CODE (X) == LABEL_REF                                          \
+   || (GET_CODE (X) == SYMBOL_REF && !SYMBOL_REF_TLS_MODEL (X))                \
    || GET_CODE (X) == CONST_INT || GET_CODE (X) == CONST               \
    || GET_CODE (X) == HIGH)                                            \
    && (reload_in_progress || reload_completed || ! symbolic_expression_p (X)))
@@ -1236,24 +1082,28 @@ extern int may_call_alloca;
 #define LEGITIMATE_CONSTANT_P(X)                               \
   ((GET_MODE_CLASS (GET_MODE (X)) != MODE_FLOAT                        \
     || (X) == CONST0_RTX (GET_MODE (X)))                       \
-   && (NEW_HP_ASSEMBLER || TARGET_GAS || GET_CODE (X) != LABEL_REF)    \
-   && !(TARGET_64BIT && GET_CODE (X) == CONST_DOUBLE)          \
-   && !(TARGET_64BIT && GET_CODE (X) == CONST_INT              \
-       && !(HOST_BITS_PER_WIDE_INT <= 32                       \
-            || (reload_in_progress || reload_completed)        \
-            || LEGITIMATE_64BIT_CONST_INT_P (INTVAL (X))       \
-            || cint_ok_for_move (INTVAL (X))))                 \
+   && (NEW_HP_ASSEMBLER                                                \
+       || TARGET_GAS                                           \
+       || GET_CODE (X) != LABEL_REF)                           \
+   && (!TARGET_64BIT                                           \
+       || GET_CODE (X) != CONST_DOUBLE)                                \
+   && (!TARGET_64BIT                                           \
+       || HOST_BITS_PER_WIDE_INT <= 32                         \
+       || GET_CODE (X) != CONST_INT                            \
+       || reload_in_progress                                   \
+       || reload_completed                                     \
+       || LEGITIMATE_64BIT_CONST_INT_P (INTVAL (X))            \
+       || cint_ok_for_move (INTVAL (X)))                       \
    && !function_label_operand (X, VOIDmode))
 
-/* Subroutines for EXTRA_CONSTRAINT.
+/* Target flags set on a symbol_ref.  */
 
-   Return 1 iff OP is a pseudo which did not get a hard register and
-   we are running the reload pass.  */
-#define IS_RELOADING_PSEUDO_P(OP) \
-  ((reload_in_progress                                 \
-    && GET_CODE (OP) == REG                            \
-    && REGNO (OP) >= FIRST_PSEUDO_REGISTER             \
-    && reg_renumber [REGNO (OP)] < 0))
+/* Set by ASM_OUTPUT_SYMBOL_REF when a symbol_ref is output.  */
+#define SYMBOL_FLAG_REFERENCED (1 << SYMBOL_FLAG_MACH_DEP_SHIFT)
+#define SYMBOL_REF_REFERENCED_P(RTX) \
+  ((SYMBOL_REF_FLAGS (RTX) & SYMBOL_FLAG_REFERENCED) != 0)
+
+/* Defines for constraints.md.  */
 
 /* Return 1 iff OP is a scaled or unscaled index address.  */
 #define IS_INDEX_ADDR_P(OP) \
@@ -1272,62 +1122,6 @@ extern int may_call_alloca;
    && REG_OK_FOR_BASE_P (XEXP (OP, 0))                 \
    && GET_CODE (XEXP (OP, 1)) == UNSPEC)
 
-/* Optional extra constraints for this machine. Borrowed from sparc.h.
-
-   `A' is a LO_SUM DLT memory operand.
-
-   `Q' is any memory operand that isn't a symbolic, indexed or lo_sum
-       memory operand.  Note that an unassigned pseudo register is such a
-       memory operand.  Needed because reload will generate these things
-       and then not re-recognize the insn, causing constrain_operands to
-       fail.
-
-   `R' is a scaled/unscaled indexed memory operand.
-
-   `S' is the constant 31.
-
-   `T' is for fp loads and stores.
-
-   `U' is the constant 63.  */
-
-#define EXTRA_CONSTRAINT(OP, C) \
-  ((C) == 'Q' ?                                                                \
-   (IS_RELOADING_PSEUDO_P (OP)                                         \
-    || (GET_CODE (OP) == MEM                                           \
-       && (reload_in_progress                                          \
-           || memory_address_p (GET_MODE (OP), XEXP (OP, 0)))          \
-       && !symbolic_memory_operand (OP, VOIDmode)                      \
-       && !IS_LO_SUM_DLT_ADDR_P (XEXP (OP, 0))                         \
-       && !IS_INDEX_ADDR_P (XEXP (OP, 0))))                            \
-   : ((C) == 'A' ?                                                     \
-      (GET_CODE (OP) == MEM                                            \
-       && IS_LO_SUM_DLT_ADDR_P (XEXP (OP, 0)))                         \
-   : ((C) == 'R' ?                                                     \
-      (GET_CODE (OP) == MEM                                            \
-       && IS_INDEX_ADDR_P (XEXP (OP, 0)))                              \
-   : ((C) == 'T' ?                                                     \
-      (GET_CODE (OP) == MEM                                            \
-       && !IS_LO_SUM_DLT_ADDR_P (XEXP (OP, 0))                         \
-       && !IS_INDEX_ADDR_P (XEXP (OP, 0))                              \
-       /* Using DFmode forces only short displacements                 \
-         to be recognized as valid in reg+d addresses.                 \
-         However, this is not necessary for PA2.0 since                \
-         it has long FP loads/stores.                                  \
-                                                                       \
-         FIXME: the ELF32 linker clobbers the LSB of                   \
-         the FP register number in {fldw,fstw} insns.                  \
-         Thus, we only allow long FP loads/stores on                   \
-         TARGET_64BIT.  */                                             \
-       && memory_address_p ((TARGET_PA_20 && !TARGET_ELF32             \
-                            ? GET_MODE (OP)                            \
-                            : DFmode),                                 \
-                           XEXP (OP, 0)))                              \
-   : ((C) == 'S' ?                                                     \
-      (GET_CODE (OP) == CONST_INT && INTVAL (OP) == 31)                        \
-   : ((C) == 'U' ?                                                     \
-      (GET_CODE (OP) == CONST_INT && INTVAL (OP) == 63) : 0))))))
-       
-
 /* The macros REG_OK_FOR..._P assume that the arg is a REG rtx
    and check its validity for a certain class.
    We have two alternate definitions for each of them.
@@ -1409,7 +1203,7 @@ extern int may_call_alloca;
    function's constant-pool, because such addresses can actually be
    output as REG+SMALLINT. 
 
-   Note we only allow 5 bit immediates for access to a constant address;
+   Note we only allow 5-bit immediates for access to a constant address;
    doing so avoids losing for loading/storing a FP register at an address
    which will not fit in 5 bits.  */
 
@@ -1469,13 +1263,32 @@ extern int may_call_alloca;
       if (base                                                         \
          && GET_CODE (index) == CONST_INT                              \
          && ((INT_14_BITS (index)                                      \
-              && (TARGET_SOFT_FLOAT                                    \
-                  || (TARGET_PA_20                                     \
-                      && ((MODE == SFmode                              \
-                           && (INTVAL (index) % 4) == 0)               \
-                          || (MODE == DFmode                           \
-                              && (INTVAL (index) % 8) == 0)))          \
-                  || ((MODE) != SFmode && (MODE) != DFmode)))          \
+              && (((MODE) != DImode                                    \
+                   && (MODE) != SFmode                                 \
+                   && (MODE) != DFmode)                                \
+                  /* The base register for DImode loads and stores     \
+                     with long displacements must be aligned because   \
+                     the lower three bits in the displacement are      \
+                     assumed to be zero.  */                           \
+                  || ((MODE) == DImode                                 \
+                      && (!TARGET_64BIT                                \
+                          || (INTVAL (index) % 8) == 0))               \
+                  /* Similarly, the base register for SFmode/DFmode    \
+                     loads and stores with long displacements must     \
+                     be aligned.                                       \
+                                                                       \
+                     FIXME: the ELF32 linker clobbers the LSB of       \
+                     the FP register number in PA 2.0 floating-point   \
+                     insns with long displacements.  This is because   \
+                     R_PARISC_DPREL14WR and other relocations like     \
+                     it are not supported.  For now, we reject long    \
+                     displacements on this target.  */                 \
+                  || (((MODE) == SFmode || (MODE) == DFmode)           \
+                      && (TARGET_SOFT_FLOAT                            \
+                          || (TARGET_PA_20                             \
+                              && !TARGET_ELF32                         \
+                              && (INTVAL (index)                       \
+                                  % GET_MODE_SIZE (MODE)) == 0)))))    \
               || INT_5_BITS (index)))                                  \
        goto ADDR;                                                      \
       if (!TARGET_DISABLE_INDEXING                                     \
@@ -1484,7 +1297,12 @@ extern int may_call_alloca;
          && (TARGET_NO_SPACE_REGS                                      \
              ? (base && REG_P (index))                                 \
              : (base == XEXP (X, 1) && REG_P (index)                   \
-                && REG_POINTER (base) && !REG_POINTER (index)))        \
+                && (reload_completed                                   \
+                    || (reload_in_progress && HARD_REGISTER_P (base))  \
+                    || REG_POINTER (base))                             \
+                && (reload_completed                                   \
+                    || (reload_in_progress && HARD_REGISTER_P (index)) \
+                    || !REG_POINTER (index))))                         \
          && MODE_OK_FOR_UNSCALED_INDEXING_P (MODE)                     \
          && REG_OK_FOR_INDEX_P (index)                                 \
          && borx_reg_operand (base, Pmode)                             \
@@ -1591,6 +1409,11 @@ do {                                                                     \
       else                                                             \
        newoffset = offset & ~mask;                                     \
                                                                        \
+      /* Ensure that long displacements are aligned.  */               \
+      if (!VAL_5_BITS_P (newoffset)                                    \
+         && GET_MODE_CLASS (MODE) == MODE_FLOAT)                       \
+       newoffset &= ~(GET_MODE_SIZE (MODE) -1);                        \
+                                                                       \
       if (newoffset != 0 && VAL_14_BITS_P (newoffset))                 \
        {                                                               \
          temp = gen_rtx_PLUS (Pmode, XEXP (new, 0),                    \
@@ -1629,15 +1452,10 @@ do {                                                                    \
 /* Go to LABEL if ADDR (a legitimate address expression)
    has an effect that depends on the machine mode it is used for.  */
 
-#define GO_IF_MODE_DEPENDENT_ADDRESS(ADDR,LABEL)       \
-  if (GET_CODE (ADDR) == PRE_DEC       \
-      || GET_CODE (ADDR) == POST_DEC   \
-      || GET_CODE (ADDR) == PRE_INC    \
-      || GET_CODE (ADDR) == POST_INC)  \
-    goto LABEL
+#define GO_IF_MODE_DEPENDENT_ADDRESS(ADDR,LABEL)
 \f
 #define TARGET_ASM_SELECT_SECTION  pa_select_section
-   
+
 /* Return a nonzero value if DECL has a section attribute.  */
 #define IN_NAMED_SECTION_P(DECL) \
   ((TREE_CODE (DECL) == FUNCTION_DECL || TREE_CODE (DECL) == VAR_DECL) \
@@ -1666,8 +1484,7 @@ do {                                                                      \
        && TREE_READONLY (DECL) && ! TREE_SIDE_EFFECTS (DECL)           \
        && (! DECL_INITIAL (DECL) || ! reloc_needed (DECL_INITIAL (DECL))) \
        && !flag_pic)                                                   \
-   || (TREE_CODE_CLASS (TREE_CODE (DECL)) == 'c'                       \
-       && !(TREE_CODE (DECL) == STRING_CST && flag_writable_strings)))
+   || CONSTANT_CLASS_P (DECL))
 
 #define FUNCTION_NAME_P(NAME)  (*(NAME) == '@')
 
@@ -1705,7 +1522,7 @@ do {                                                                      \
 /* Define if loading in MODE, an integral mode narrower than BITS_PER_WORD
    will either zero-extend or sign-extend.  The value of this macro should
    be the code that says which one of the two operations is implicitly
-   done, NIL if none.  */
+   done, UNKNOWN if none.  */
 #define LOAD_EXTEND_OP(MODE) ZERO_EXTEND
 
 /* Nonzero if access to memory by bytes is slow and undesirable.  */
@@ -1781,7 +1598,7 @@ do {                                                                      \
    delay slot of the millicode call -- thus they act more like traditional
    CALL_INSNs.
 
-   Note we can not consider side effects of the insn to be delayed because
+   Note we cannot consider side effects of the insn to be delayed because
    the branch and link insn will clobber the return pointer.  If we happened
    to use the return pointer in the delay slot of the call, then we lose.
 
@@ -1812,9 +1629,14 @@ do {                                                                     \
 /* This is how to output the definition of a user-level label named NAME,
    such as the label on a static function or variable NAME.  */
 
-#define ASM_OUTPUT_LABEL(FILE, NAME)   \
-  do { assemble_name (FILE, NAME);     \
-       fputc ('\n', FILE); } while (0)
+#define ASM_OUTPUT_LABEL(FILE,NAME) \
+  do {                                                 \
+    assemble_name ((FILE), (NAME));                    \
+    if (TARGET_GAS)                                    \
+      fputs (":\n", (FILE));                           \
+    else                                               \
+      fputc ('\n', (FILE));                            \
+  } while (0)
 
 /* This is how to output a reference to a user-level label named NAME.
    `assemble_name' uses this.  */
@@ -1831,6 +1653,14 @@ do {                                                                     \
     fputs (xname, FILE);               \
   } while (0)
 
+/* This how we output the symbol_ref X.  */
+
+#define ASM_OUTPUT_SYMBOL_REF(FILE,X) \
+  do {                                                 \
+    SYMBOL_REF_FLAGS (X) |= SYMBOL_FLAG_REFERENCED;    \
+    assemble_name (FILE, XSTR (X, 0));                 \
+  } while (0)
+
 /* This is how to store into the string LABEL
    the symbol_ref name of an internal numbered label where
    PREFIX is the class of label and NUM is the number within the class.
@@ -1839,6 +1669,17 @@ do {                                                                     \
 #define ASM_GENERATE_INTERNAL_LABEL(LABEL,PREFIX,NUM)  \
   sprintf (LABEL, "*%c$%s%04ld", (PREFIX)[0], (PREFIX) + 1, (long)(NUM))
 
+/* Output the definition of a compiler-generated label named NAME.  */
+
+#define ASM_OUTPUT_INTERNAL_LABEL(FILE,NAME) \
+  do {                                                 \
+    assemble_name_raw ((FILE), (NAME));                        \
+    if (TARGET_GAS)                                    \
+      fputs (":\n", (FILE));                           \
+    else                                               \
+      fputc ('\n', (FILE));                            \
+  } while (0)
+
 #define TARGET_ASM_GLOBALIZE_LABEL pa_globalize_label
 
 #define ASM_OUTPUT_ASCII(FILE, P, SIZE)  \
@@ -1887,25 +1728,28 @@ do {                                                                    \
   fprintf (FILE, "\t.blockz "HOST_WIDE_INT_PRINT_UNSIGNED"\n",         \
           (unsigned HOST_WIDE_INT)(SIZE))
 
+/* This says how to output an assembler line to define an uninitialized
+   global variable with size SIZE (in bytes) and alignment ALIGN (in bits).
+   This macro exists to properly support languages like C++ which do not
+   have common data.  */
+
+#define ASM_OUTPUT_ALIGNED_BSS(FILE, DECL, NAME, SIZE, ALIGN)          \
+  pa_asm_output_aligned_bss (FILE, NAME, SIZE, ALIGN)
+  
 /* This says how to output an assembler line to define a global common symbol
    with size SIZE (in bytes) and alignment ALIGN (in bits).  */
 
-#define ASM_OUTPUT_ALIGNED_COMMON(FILE, NAME, SIZE, ALIGNED)           \
-{ bss_section ();                                                      \
-  assemble_name ((FILE), (NAME));                                      \
-  fprintf ((FILE), "\t.comm "HOST_WIDE_INT_PRINT_UNSIGNED"\n",         \
-          MAX ((unsigned HOST_WIDE_INT)(SIZE),                         \
-               ((unsigned HOST_WIDE_INT)(ALIGNED) / BITS_PER_UNIT)));}
+#define ASM_OUTPUT_ALIGNED_COMMON(FILE, NAME, SIZE, ALIGN)             \
+  pa_asm_output_aligned_common (FILE, NAME, SIZE, ALIGN)
 
 /* This says how to output an assembler line to define a local common symbol
-   with size SIZE (in bytes) and alignment ALIGN (in bits).  */
+   with size SIZE (in bytes) and alignment ALIGN (in bits).  This macro
+   controls how the assembler definitions of uninitialized static variables
+   are output.  */
 
-#define ASM_OUTPUT_ALIGNED_LOCAL(FILE, NAME, SIZE, ALIGNED)            \
-{ bss_section ();                                                      \
-  fprintf ((FILE), "\t.align %d\n", ((ALIGNED) / BITS_PER_UNIT));      \
-  assemble_name ((FILE), (NAME));                                      \
-  fprintf ((FILE), "\n\t.block "HOST_WIDE_INT_PRINT_UNSIGNED"\n",      \
-          (unsigned HOST_WIDE_INT)(SIZE));}
+#define ASM_OUTPUT_ALIGNED_LOCAL(FILE, NAME, SIZE, ALIGN)              \
+  pa_asm_output_aligned_local (FILE, NAME, SIZE, ALIGN)
+  
   
 #define ASM_PN_FORMAT "%s___%lu"
 
@@ -1935,22 +1779,16 @@ do {                                                                    \
 /* Print a memory address as an operand to reference that memory location.  */
 
 #define PRINT_OPERAND_ADDRESS(FILE, ADDR)  \
-{ register rtx addr = ADDR;                                            \
-  register rtx base;                                                   \
-  int offset;                                                          \
+{ rtx addr = ADDR;                                                     \
   switch (GET_CODE (addr))                                             \
     {                                                                  \
     case REG:                                                          \
       fprintf (FILE, "0(%s)", reg_names [REGNO (addr)]);               \
       break;                                                           \
     case PLUS:                                                         \
-      if (GET_CODE (XEXP (addr, 0)) == CONST_INT)                      \
-       offset = INTVAL (XEXP (addr, 0)), base = XEXP (addr, 1);        \
-      else if (GET_CODE (XEXP (addr, 1)) == CONST_INT)                 \
-       offset = INTVAL (XEXP (addr, 1)), base = XEXP (addr, 0);        \
-      else                                                             \
-       abort ();                                                       \
-      fprintf (FILE, "%d(%s)", offset, reg_names [REGNO (base)]);      \
+      gcc_assert (GET_CODE (XEXP (addr, 1)) == CONST_INT);             \
+      fprintf (FILE, "%d(%s)", (int)INTVAL (XEXP (addr, 1)),           \
+              reg_names [REGNO (XEXP (addr, 0))]);                     \
       break;                                                           \
     case LO_SUM:                                                       \
       if (!symbolic_operand (XEXP (addr, 1), VOIDmode))                        \
@@ -1987,47 +1825,11 @@ do {                                                                    \
 /* The number of Pmode words for the setjmp buffer.  */
 #define JMP_BUF_SIZE 50
 
-#define PREDICATE_CODES                                                        \
-  {"reg_or_0_operand", {SUBREG, REG, CONST_INT, CONST_DOUBLE}},                \
-  {"call_operand_address", {LABEL_REF, SYMBOL_REF, CONST_INT,          \
-                           CONST_DOUBLE, CONST, HIGH, CONSTANT_P_RTX}}, \
-  {"indexed_memory_operand", {SUBREG, MEM}},                           \
-  {"symbolic_operand", {SYMBOL_REF, LABEL_REF, CONST}},                        \
-  {"symbolic_memory_operand", {SUBREG, MEM}},                          \
-  {"reg_before_reload_operand", {REG, MEM}},                           \
-  {"reg_or_0_or_nonsymb_mem_operand", {SUBREG, REG, MEM, CONST_INT,    \
-                                      CONST_DOUBLE}},                  \
-  {"move_dest_operand", {SUBREG, REG, MEM}},                           \
-  {"move_src_operand", {SUBREG, REG, CONSTANT_P_RTX, CONST_INT, MEM}}, \
-  {"reg_or_cint_move_operand", {SUBREG, REG, CONST_INT}},              \
-  {"pic_label_operand", {LABEL_REF, CONST}},                           \
-  {"fp_reg_operand", {REG}},                                           \
-  {"arith_operand", {SUBREG, REG, CONST_INT}},                         \
-  {"arith11_operand", {SUBREG, REG, CONST_INT}},                       \
-  {"pre_cint_operand", {CONST_INT}},                                   \
-  {"post_cint_operand", {CONST_INT}},                                  \
-  {"arith_double_operand", {SUBREG, REG, CONST_DOUBLE}},               \
-  {"ireg_or_int5_operand", {CONST_INT, REG}},                          \
-  {"int5_operand", {CONST_INT}},                                       \
-  {"uint5_operand", {CONST_INT}},                                      \
-  {"int11_operand", {CONST_INT}},                                      \
-  {"uint32_operand", {CONST_INT,                                       \
-   HOST_BITS_PER_WIDE_INT > 32 ? 0 : CONST_DOUBLE}},                   \
-  {"arith5_operand", {SUBREG, REG, CONST_INT}},                                \
-  {"and_operand", {SUBREG, REG, CONST_INT}},                           \
-  {"ior_operand", {CONST_INT}},                                                \
-  {"lhs_lshift_cint_operand", {CONST_INT}},                            \
-  {"lhs_lshift_operand", {SUBREG, REG, CONST_INT}},                    \
-  {"arith32_operand", {SUBREG, REG, CONST_INT}},                       \
-  {"pc_or_label_operand", {PC, LABEL_REF}},                            \
-  {"plus_xor_ior_operator", {PLUS, XOR, IOR}},                         \
-  {"shadd_operand", {CONST_INT}},                                      \
-  {"div_operand", {REG, CONST_INT}},                                   \
-  {"ireg_operand", {REG}},                                             \
-  {"cmpib_comparison_operator", {EQ, NE, LT, LE, LEU,                  \
-   GT, GTU, GE}},                                                      \
-  {"movb_comparison_operator", {EQ, NE, LT, GE}},
-
 /* We need a libcall to canonicalize function pointers on TARGET_ELF32.  */
 #define CANONICALIZE_FUNCPTR_FOR_COMPARE_LIBCALL \
   "__canonicalize_funcptr_for_compare"
+
+#ifdef HAVE_AS_TLS
+#undef TARGET_HAVE_TLS
+#define TARGET_HAVE_TLS true
+#endif