OSDN Git Service

compiler, runtime: Reject surrogate pair converting int to string.
authorian <ian@138bc75d-0d04-0410-961f-82ee72b054a4>
Sat, 22 Sep 2012 06:52:18 +0000 (06:52 +0000)
committerian <ian@138bc75d-0d04-0410-961f-82ee72b054a4>
Sat, 22 Sep 2012 06:52:18 +0000 (06:52 +0000)
git-svn-id: svn+ssh://gcc.gnu.org/svn/gcc/branches/gcc-4_7-branch@191637 138bc75d-0d04-0410-961f-82ee72b054a4

gcc/go/gofrontend/lex.cc
libgo/runtime/go-int-to-string.c

index 25aaeb7..6add84e 100644 (file)
@@ -1312,6 +1312,12 @@ Lex::append_char(unsigned int v, bool is_character, std::string* str,
          // Turn it into the "replacement character".
          v = 0xfffd;
        }
          // Turn it into the "replacement character".
          v = 0xfffd;
        }
+      if (v >= 0xd800 && v < 0xe000)
+       {
+         warning_at(location, 0,
+                    "unicode code point 0x%x is invalid surrogate pair", v);
+         v = 0xfffd;
+       }
       if (v <= 0xffff)
        {
          buf[0] = 0xe0 + (v >> 12);
       if (v <= 0xffff)
        {
          buf[0] = 0xe0 + (v >> 12);
index e9645bf..17a5fcb 100644 (file)
@@ -17,6 +17,11 @@ __go_int_to_string (int v)
   unsigned char *retdata;
   struct __go_string ret;
 
   unsigned char *retdata;
   struct __go_string ret;
 
+  /* A negative value is not valid UTF-8; turn it into the replacement
+     character.  */
+  if (v < 0)
+    v = 0xfffd;
+
   if (v <= 0x7f)
     {
       buf[0] = v;
   if (v <= 0x7f)
     {
       buf[0] = v;
@@ -34,6 +39,10 @@ __go_int_to_string (int v)
         "replacement character".  */
       if (v > 0x10ffff)
        v = 0xfffd;
         "replacement character".  */
       if (v > 0x10ffff)
        v = 0xfffd;
+      /* If the value is a surrogate pair, which is invalid in UTF-8,
+        turn it into the replacement character.  */
+      if (v >= 0xd800 && v < 0xe000)
+       v = 0xfffd;
 
       if (v <= 0xffff)
        {
 
       if (v <= 0xffff)
        {