OSDN Git Service

2001-12-13 Benjamin Kosnik <bkoz@redhat.com>
[pf3gnuchains/gcc-fork.git] / libstdc++-v3 / src / locale.cc
1 // Copyright (C) 1997, 1998, 1999, 2000, 2001 Free Software Foundation, Inc.
2 //
3 // This file is part of the GNU ISO C++ Library.  This library is free
4 // software; you can redistribute it and/or modify it under the
5 // terms of the GNU General Public License as published by the
6 // Free Software Foundation; either version 2, or (at your option)
7 // any later version.
8
9 // This library is distributed in the hope that it will be useful,
10 // but WITHOUT ANY WARRANTY; without even the implied warranty of
11 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 // GNU General Public License for more details.
13
14 // You should have received a copy of the GNU General Public License along
15 // with this library; see the file COPYING.  If not, write to the Free
16 // Software Foundation, 59 Temple Place - Suite 330, Boston, MA 02111-1307,
17 // USA.
18
19 // As a special exception, you may use this file as part of a free software
20 // library without restriction.  Specifically, if other files instantiate
21 // templates or use macros or inline functions from this file, or you compile
22 // this file and link it with other files to produce an executable, this
23 // file does not by itself cause the resulting executable to be covered by
24 // the GNU General Public License.  This exception does not however
25 // invalidate any other reasons why the executable file might be covered by
26 // the GNU General Public License.
27
28 #include <bits/std_clocale.h>
29 #include <bits/std_cstring.h>
30 #include <bits/std_cassert.h>
31 #include <bits/std_cctype.h>
32 #include <bits/std_limits.h>
33 #include <exception>
34 #include <bits/std_stdexcept.h>
35 #include <bits/std_locale.h>
36 #include <bits/std_istream.h>
37 #include <bits/std_ostream.h>
38 #include <bits/std_vector.h>
39 #include <bits/std_memory.h>      // for auto_ptr
40 #ifdef _GLIBCPP_USE_WCHAR_T  
41 # include <bits/std_cwctype.h>     // for towupper, etc.
42 #endif
43
44 namespace std 
45 {
46   // Defined in globals.cc.
47   extern locale::_Impl locale_impl_c;
48   extern locale locale_c;
49
50   // Definitions for static const data members of locale.
51   const locale::category        locale::none;
52   const locale::category        locale::ctype;
53   const locale::category        locale::numeric;
54   const locale::category        locale::collate;
55   const locale::category        locale::time;
56   const locale::category        locale::monetary;
57   const locale::category        locale::messages;
58   const locale::category        locale::all;
59
60   locale::_Impl*                locale::_S_classic;
61   locale::_Impl*                locale::_S_global; 
62   const size_t                  locale::_S_num_categories;
63   const size_t                  locale::_S_num_facets;
64
65   // Definitions for locale::id of standard facets. 
66   locale::id ctype<char>::id;
67   locale::id codecvt<char, char, mbstate_t>::id;
68
69 #ifdef _GLIBCPP_USE_WCHAR_T  
70   locale::id ctype<wchar_t>::id;
71   locale::id codecvt<wchar_t, char, mbstate_t>::id;
72 #endif
73
74   // Definitions for static const data members of locale::id
75   size_t locale::id::_S_highwater;  // init'd to 0 by linker
76
77   // Definitions for static const data members of locale::_Impl
78   const locale::id* const
79   locale::_Impl::_S_id_ctype[] =
80   {
81     &std::ctype<char>::id, 
82     &codecvt<char, char, mbstate_t>::id,
83 #ifdef _GLIBCPP_USE_WCHAR_T
84     &std::ctype<wchar_t>::id,
85     &codecvt<wchar_t, char, mbstate_t>::id,
86 #endif
87     0
88   };
89
90   const locale::id* const
91   locale::_Impl::_S_id_numeric[] =
92   {
93     &num_get<char>::id,  
94     &num_put<char>::id,  
95     &numpunct<char>::id, 
96 #ifdef _GLIBCPP_USE_WCHAR_T
97     &num_get<wchar_t>::id,
98     &num_put<wchar_t>::id,
99     &numpunct<wchar_t>::id,
100 #endif
101     0
102   };
103   
104   const locale::id* const
105   locale::_Impl::_S_id_collate[] =
106   {
107     &std::collate<char>::id,
108 #ifdef _GLIBCPP_USE_WCHAR_T
109     &std::collate<wchar_t>::id,
110 #endif
111     0
112   };
113
114   const locale::id* const
115   locale::_Impl::_S_id_time[] =
116   {
117     &__timepunct<char>::id, 
118     &time_get<char>::id, 
119     &time_put<char>::id, 
120 #ifdef _GLIBCPP_USE_WCHAR_T
121     &__timepunct<wchar_t>::id, 
122     &time_get<wchar_t>::id,
123     &time_put<wchar_t>::id,
124 #endif
125     0
126   };
127   
128   const locale::id* const
129   locale::_Impl::_S_id_monetary[] =
130   {
131     &money_get<char>::id,        
132     &money_put<char>::id,        
133     &moneypunct<char, false>::id, 
134     &moneypunct<char, true >::id, 
135 #ifdef _GLIBCPP_USE_WCHAR_T
136     &money_get<wchar_t>::id,
137     &money_put<wchar_t>::id,
138     &moneypunct<wchar_t, false>::id,
139     &moneypunct<wchar_t, true >::id,
140 #endif
141     0
142   };
143
144   const locale::id* const
145   locale::_Impl::_S_id_messages[] =
146   {
147     &std::messages<char>::id, 
148 #ifdef _GLIBCPP_USE_WCHAR_T
149     &std::messages<wchar_t>::id,
150 #endif
151     0
152   };
153   
154   const locale::id* const* const
155   locale::_Impl::_S_facet_categories[] =
156   {
157     // Order must match the decl order in class locale.
158     locale::_Impl::_S_id_ctype,
159     locale::_Impl::_S_id_numeric,
160     locale::_Impl::_S_id_collate,
161     locale::_Impl::_S_id_time,
162     locale::_Impl::_S_id_monetary,
163     locale::_Impl::_S_id_messages,
164     0
165   };
166
167   locale::~locale() throw()
168   { _M_impl->_M_remove_reference(); }
169
170   void
171   locale::_M_coalesce(const locale& __base, const locale& __add, 
172                       category __cat)
173   {
174     __cat = _S_normalize_category(__cat);  
175     _M_impl = new _Impl(*__base._M_impl, 1);  
176
177     try 
178       { _M_impl->_M_replace_categories(__add._M_impl, __cat); }
179     catch (...) 
180       { 
181         _M_impl->_M_remove_reference(); 
182         __throw_exception_again;
183       }
184   }
185
186   locale::locale() throw()
187   { 
188     _S_initialize(); 
189     (_M_impl = _S_global)->_M_add_reference(); 
190   } // XXX MT
191
192   locale::locale(const locale& __other) throw()
193   { (_M_impl = __other._M_impl)->_M_add_reference(); }
194
195   // This is used to initialize global and classic locales, and
196   // assumes that the _Impl objects are constructed correctly.
197   locale::locale(_Impl* __ip) throw() : _M_impl(__ip)
198   { }
199
200   locale::locale(const char* __s)
201   {
202     if (__s)
203       {
204         _S_initialize(); 
205         if (strcmp(__s, "C") == 0 || strcmp(__s, "POSIX") == 0)
206           (_M_impl = _S_classic)->_M_add_reference();
207         else if (strcmp(__s, "") == 0)
208           _M_impl = new _Impl(setlocale(LC_ALL, __s), 1);
209         else
210           _M_impl = new _Impl(__s, 1);
211       }
212     else
213       __throw_runtime_error("attempt to create locale from NULL name");
214   }
215
216   locale::locale(const locale& __base, const char* __s, category __cat)
217   { 
218     // NB: There are complicated, yet more efficient ways to do
219     // this. Building up locales on a per-category way is tedious, so
220     // let's do it this way until people complain.
221     locale __add(__s);
222     _M_coalesce(__base, __add, __cat);
223   }
224
225   locale::locale(const locale& __base, const locale& __add, category __cat)
226   { _M_coalesce(__base, __add, __cat); }
227
228   bool
229   locale::operator==(const locale& __rhs) const throw()
230   {
231     string __name = this->name();
232     return (_M_impl == __rhs._M_impl 
233             || (__name != "*" && __name == __rhs.name()));
234   }
235
236   const locale&
237   locale::operator=(const locale& __other) throw()
238   {
239     __other._M_impl->_M_add_reference();
240     _M_impl->_M_remove_reference();
241     _M_impl = __other._M_impl;
242     return *this;
243   }
244
245   locale
246   locale::global(const locale& __other)
247   {
248     // XXX MT
249     _S_initialize();
250     _Impl* __old = _S_global;
251     __other._M_impl->_M_add_reference();
252     _S_global = __other._M_impl; 
253     if (_S_global->_M_check_same_name() && _S_global->_M_names[0] != "*")
254       setlocale(LC_ALL, __other.name().c_str());
255
256     // Reference count sanity check: one reference removed for the
257     // subsition of __other locale, one added by return-by-value. Net
258     // difference: zero. When the returned locale object's destrutor
259     // is called, then the reference count is decremented and possibly
260     // destroyed.
261     return locale(__old);
262   }
263
264   string
265   locale::name() const
266   {
267     string __ret;
268     // Need some kind of separator character. This one was pretty much
269     // arbitrarily chosen as to not conflict with glibc locales: the
270     // exact formatting is not set in stone.
271     const char __separator = '|';
272
273     if (_M_impl->_M_check_same_name())
274       __ret = _M_impl->_M_names[0];
275     else
276       {
277         for (size_t i = 0; i < _S_num_categories; ++i)
278           __ret += __separator + _M_impl->_M_names[i];
279       }
280     return __ret;
281   }
282
283   locale const&
284   locale::classic()
285   {
286     // XXX MT
287     if (!_S_classic)
288       {
289         try 
290           {
291             // 26 Standard facets, 2 references.
292             // One reference for _M_classic, one for _M_global
293             _S_classic = new (&locale_impl_c) _Impl("C", 2);
294             _S_global = _S_classic;         
295             new (&locale_c) locale(_S_classic);
296           }
297         catch(...) 
298           {
299             // Just call destructor, so that locale_impl_c's memory is
300             // not deallocated via a call to delete.
301             if (_S_classic)
302               _S_classic->~_Impl();
303             _S_classic = _S_global = 0;
304             __throw_exception_again;
305           }
306       }
307     return locale_c;
308   }
309
310   locale::category
311   locale::_S_normalize_category(category __cat) 
312   {
313     int __ret = 0;
314     if (__cat == none || (__cat & all) && !(__cat & ~all))
315       __ret = __cat;
316     else
317       {
318         // NB: May be a C-style "LC_ALL" category; convert.
319         switch (__cat)
320           {
321           case LC_COLLATE:  
322             __ret = collate; 
323             break;
324           case LC_CTYPE:    
325             __ret = ctype;
326             break;
327           case LC_MONETARY: 
328             __ret = monetary;
329             break;
330           case LC_NUMERIC:  
331             __ret = numeric;
332             break;
333           case LC_TIME:     
334             __ret = time; 
335             break;
336 #ifdef _GLIBCPP_HAVE_LC_MESSAGES
337           case LC_MESSAGES: 
338             __ret = messages;
339             break;
340 #endif  
341           case LC_ALL:      
342             __ret = all;
343             break;
344           default:
345             __throw_runtime_error("bad locale category");
346           }
347       }
348     return __ret;
349   }
350
351   locale::facet::
352   facet(size_t __refs) throw() : _M_references(__refs) 
353   { }
354
355   void  
356   locale::facet::
357   _M_add_reference() throw()
358   { ++_M_references; }  // XXX MT
359
360   void  
361   locale::facet::
362   _M_remove_reference() throw()
363   {
364     if (_M_references-- == 0)
365       {
366         try 
367           { delete this; }  
368         catch (...) 
369           { }
370       }
371   }
372   
373   // Definitions for static const data members of ctype_base.
374   const ctype_base::mask ctype_base::space;
375   const ctype_base::mask ctype_base::print;
376   const ctype_base::mask ctype_base::cntrl;
377   const ctype_base::mask ctype_base::upper;
378   const ctype_base::mask ctype_base::lower;
379   const ctype_base::mask ctype_base::alpha;
380   const ctype_base::mask ctype_base::digit;
381   const ctype_base::mask ctype_base::punct;
382   const ctype_base::mask ctype_base::xdigit;
383   const ctype_base::mask ctype_base::alnum;
384   const ctype_base::mask ctype_base::graph;
385
386   // Platform-specific initialization code for ctype tables.
387   #include <bits/ctype_noninline.h>
388
389   const size_t ctype<char>::table_size;
390
391   ctype<char>::~ctype()
392   { if (_M_del) delete[] this->table(); }
393
394   // These are dummy placeholders as these virtual functions are never called.
395   bool 
396   ctype<char>::do_is(mask, char_type) const 
397   { return false; }
398   
399   const char*
400   ctype<char>::do_is(const char_type* __c, const char_type*, mask*) const 
401   { return __c; }
402   
403   const char*
404   ctype<char>::do_scan_is(mask, const char_type* __c, const char_type*) const 
405   { return __c; }
406
407   const char* 
408   ctype<char>::do_scan_not(mask, const char_type* __c, const char_type*) const
409   { return __c; }
410
411   char
412   ctype<char>::do_widen(char __c) const
413   { return __c; }
414   
415   const char* 
416   ctype<char>::do_widen(const char* __lo, const char* __hi, char* __dest) const
417   {
418     memcpy(__dest, __lo, __hi - __lo);
419     return __hi;
420   }
421   
422   char
423   ctype<char>::do_narrow(char __c, char /*__dfault*/) const
424   { return __c; }
425   
426   const char* 
427   ctype<char>::do_narrow(const char* __lo, const char* __hi, 
428                          char /*__dfault*/, char* __dest) const
429   {
430     memcpy(__dest, __lo, __hi - __lo);
431     return __hi;
432   }
433
434   template<>
435   ctype_byname<char>::ctype_byname(const char* /*__s*/, size_t __refs)
436   : ctype<char>(new mask[table_size], true, __refs)
437   { }
438
439 #ifdef _GLIBCPP_USE_WCHAR_T  
440   ctype<wchar_t>::__wmask_type
441   ctype<wchar_t>::_M_convert_to_wmask(const mask __m) const
442   {
443     __wmask_type __ret;
444     switch (__m)
445       {
446       case space:
447         __ret = wctype("space");
448         break;
449       case print:
450         __ret = wctype("print");
451         break;
452       case cntrl:
453         __ret = wctype("cntrl");
454         break;
455       case upper:
456         __ret = wctype("upper");
457         break;
458       case lower:
459         __ret = wctype("lower");
460         break;
461       case alpha:
462         __ret = wctype("alpha");
463         break;
464       case digit:
465         __ret = wctype("digit");
466         break;
467       case punct:
468         __ret = wctype("punct");
469         break;
470       case xdigit:
471         __ret = wctype("xdigit");
472         break;
473       case alnum:
474         __ret = wctype("alnum");
475         break;
476       case graph:
477         __ret = wctype("graph");
478         break;
479       default:
480         __ret = 0;
481       }
482     return __ret;
483   };
484   
485   ctype<wchar_t>::~ctype() { }
486
487   // NB: These ctype<wchar_t> methods are not configuration-specific,
488   // unlike the ctype<char> bits.
489   ctype<wchar_t>::ctype(size_t __refs) 
490   : __ctype_abstract_base<wchar_t>(__refs) { }
491
492   ctype<wchar_t>::ctype(__c_locale /*__cloc*/, size_t __refs) 
493   : __ctype_abstract_base<wchar_t>(__refs) { }
494
495   wchar_t
496   ctype<wchar_t>::do_toupper(wchar_t __c) const
497   { return towupper(__c); }
498
499   const wchar_t*
500   ctype<wchar_t>::do_toupper(wchar_t* __lo, const wchar_t* __hi) const
501   {
502     while (__lo < __hi)
503       {
504         *__lo = towupper(*__lo);
505         ++__lo;
506       }
507     return __hi;
508   }
509   
510   wchar_t
511   ctype<wchar_t>::do_tolower(wchar_t __c) const
512   { return towlower(__c); }
513   
514   const wchar_t*
515   ctype<wchar_t>::do_tolower(wchar_t* __lo, const wchar_t* __hi) const
516   {
517     while (__lo < __hi)
518       {
519         *__lo = towlower(*__lo);
520         ++__lo;
521       }
522     return __hi;
523   }
524
525   bool
526   ctype<wchar_t>::
527   do_is(mask __m, char_type __c) const
528   { return static_cast<bool>(iswctype(__c, _M_convert_to_wmask(__m))); }
529   
530   const wchar_t* 
531   ctype<wchar_t>::
532   do_is(const wchar_t* __lo, const wchar_t* __hi, mask* __m) const
533   {
534     while (__lo < __hi && !this->is(*__m, *__lo))
535       ++__lo;
536     return __lo;
537   }
538   
539   const wchar_t* 
540   ctype<wchar_t>::
541   do_scan_is(mask __m, const wchar_t* __lo, const wchar_t* __hi) const
542   {
543     while (__lo < __hi && !this->is(__m, *__lo))
544       ++__lo;
545     return __lo;
546   }
547
548   const wchar_t*
549   ctype<wchar_t>::
550   do_scan_not(mask __m, const char_type* __lo, const char_type* __hi) const
551   {
552     while (__lo < __hi && this->is(__m, *__lo) != 0)
553       ++__lo;
554     return __lo;
555   }
556
557   wchar_t
558   ctype<wchar_t>::
559   do_widen(char __c) const
560   { return btowc(__c); }
561   
562   const char* 
563   ctype<wchar_t>::
564   do_widen(const char* __lo, const char* __hi, wchar_t* __dest) const
565   {
566     mbstate_t __state;
567     memset(static_cast<void*>(&__state), 0, sizeof(mbstate_t));
568     mbsrtowcs(__dest, &__lo, __hi - __lo, &__state);
569     return __hi;
570   }
571
572   char
573   ctype<wchar_t>::
574   do_narrow(wchar_t __wc, char __dfault) const
575   { 
576     int __c = wctob(__wc);
577     return (__c == EOF ? __dfault : static_cast<char>(__c)); 
578   }
579
580   const wchar_t*
581   ctype<wchar_t>::
582   do_narrow(const wchar_t* __lo, const wchar_t* __hi, char __dfault, 
583             char* __dest) const
584   {
585     mbstate_t __state;
586     memset(static_cast<void*>(&__state), 0, sizeof(mbstate_t));
587     size_t __len = __hi - __lo;
588     size_t __conv = wcsrtombs(__dest, &__lo, __len, &__state);
589     if (__conv == __len)
590       *__dest = __dfault;
591     return __hi;
592   }
593
594   template<>
595   ctype_byname<wchar_t>::
596   ctype_byname(const char* /*__s*/, size_t __refs)
597   : ctype<wchar_t>(__refs) { }
598 #endif //  _GLIBCPP_USE_WCHAR_T
599
600   // Definitions for static const data members of time_base
601   template<> 
602     const char*
603     __timepunct<char>::_S_timezones[14] =
604     { 
605       "GMT", "HST", "AKST", "PST", "MST", "CST", "EST", "AST", "NST", "CET", 
606       "IST", "EET", "CST", "JST"  
607     };
608  
609 #ifdef _GLIBCPP_USE_WCHAR_T
610   template<> 
611     const wchar_t*
612     __timepunct<wchar_t>::_S_timezones[14] =
613     { 
614       L"GMT", L"HST", L"AKST", L"PST", L"MST", L"CST", L"EST", L"AST", 
615       L"NST", L"CET", L"IST", L"EET", L"CST", L"JST"  
616     };
617 #endif
618
619   // Definitions for static const data members of money_base
620   const money_base::pattern 
621   money_base::_S_default_pattern =  {{symbol, sign, none, value}};
622
623   template<>
624     const ctype<char>&
625     use_facet<ctype<char> >(const locale& __loc)
626     {
627       size_t __i = ctype<char>::id._M_index;
628       const locale::_Impl* __tmp = __loc._M_impl;
629       return static_cast<const ctype<char>&>(* (*(__tmp->_M_facets))[__i]);
630     }
631
632 #ifdef _GLIBCPP_USE_WCHAR_T
633   template<>
634     const ctype<wchar_t>&
635     use_facet<ctype<wchar_t> >(const locale& __loc)
636     {
637       size_t __i = ctype<wchar_t>::id._M_index;
638       const locale::_Impl* __tmp = __loc._M_impl;
639       return static_cast<const ctype<wchar_t>&>(* (*(__tmp->_M_facets))[__i]);
640     }
641 #endif
642
643
644   const char __num_base::_S_atoms[] = "0123456789eEabcdfABCDF";
645
646   const double __num_base::_S_scale_hex = log(10.0)/log(16.0);
647
648   const double __num_base::_S_scale_oct = log(10.0)/log(8.0);
649
650   bool
651   __num_base::_S_format_float(const ios_base& __io, char* __fptr, char __mod,
652                               streamsize __prec)
653   {
654     bool __incl_prec = false;
655     ios_base::fmtflags __flags = __io.flags();
656     *__fptr++ = '%';
657     // [22.2.2.2.2] Table 60
658     if (__flags & ios_base::showpos)
659       *__fptr++ = '+';
660     if (__flags & ios_base::showpoint)
661       *__fptr++ = '#';
662     // As per [22.2.2.2.2.11]
663     if (__flags & ios_base::fixed || __prec > 0)
664       {
665         *__fptr++ = '.';
666         *__fptr++ = '*';
667         __incl_prec = true;
668       }
669     if (__mod)
670       *__fptr++ = __mod;
671     ios_base::fmtflags __fltfield = __flags & ios_base::floatfield;
672     // [22.2.2.2.2] Table 58
673     if (__fltfield == ios_base::fixed)
674       *__fptr++ = 'f';
675     else if (__fltfield == ios_base::scientific)
676       *__fptr++ = (__flags & ios_base::uppercase) ? 'E' : 'e';
677     else
678       *__fptr++ = (__flags & ios_base::uppercase) ? 'G' : 'g';
679     *__fptr = '\0';
680     return __incl_prec;
681   }
682   
683   void
684   __num_base::_S_format_int(const ios_base& __io, char* __fptr, char __mod, 
685                             char __modl)
686   {
687     ios_base::fmtflags __flags = __io.flags();
688     *__fptr++ = '%';
689     // [22.2.2.2.2] Table 60
690     if (__flags & ios_base::showpos)
691       *__fptr++ = '+';
692     if (__flags & ios_base::showbase)
693       *__fptr++ = '#';
694     *__fptr++ = 'l';
695
696     // For long long types.
697     if (__modl)
698       *__fptr++ = __modl;
699
700     ios_base::fmtflags __bsefield = __flags & ios_base::basefield;
701     if (__bsefield == ios_base::hex)
702       *__fptr++ = (__flags & ios_base::uppercase) ? 'X' : 'x';
703     else if (__bsefield == ios_base::oct)
704       *__fptr++ = 'o';
705     else
706       *__fptr++ = __mod;
707     *__fptr = '\0';
708   }
709   
710   template<>
711     moneypunct_byname<char, false>::moneypunct_byname(const char* /*__s*/, 
712                                                       size_t __refs)
713     : moneypunct<char, false>(__refs) { }
714   
715   template<>
716     moneypunct_byname<char, true>::moneypunct_byname(const char* /*__s*/, 
717                                                      size_t __refs)
718     : moneypunct<char, true>(__refs) { }
719 } // namespace std