--- utf-8.xml Fri Apr 8 09:16:36 2005 +++ utf-8fr.xml Thu Apr 7 20:40:35 2005 @@ -1,5 +1,4 @@ - @@ -26,8 +25,8 @@ -1.7 -2005-03-25 +1.8 +2005-04-05 Encoder les caractères @@ -121,11 +120,11 @@

L'Unicode laisse de côté la représentation traditionnelle et limitée d'un octet -pour un caractère et, avec deux octets par caractère, il permet un maximum de -65536 caractères. Cela dit, même si ce nombre est très élevé comparé aux -encodages avec 7 ou 8 bits, il n'est toujours pas suffisant pour un jeu de -caractère pouvant être utilisé pour les symboles et scriptes utilisés uniquement -dans des domaines bien précis, comme les mathématiques par exemple. +pour un caractère. Il utilise 17 « plans » de 65.536 éléments, +permettant ainsi de décrire un maximum de 1.114.112 caractères. Le premier plan +nommé BMP (pour Basic Multilingual Plane, ou plan multi-langue basique) contient +presque tous les caractères que vous utiliserez jamais. C'est pour ça que +beaucoup croient à tort que l'Unicode est un set de caractères 16-bits.

@@ -812,6 +811,12 @@

  • UTF-8.com.
  • RFC 3629.
  • RFC 2277.
  • +
  • + Characters vs. + Bytes +
  • +