martes, febrero 07, 2006

libxml2 y el encoding


Ando trasteando con libxml2 y ésta página es la que hay que leer con respecto a los encodings.

Ya hace tiempo puse unos cuantos links sobre encodings; y ahora van un par mas extraidos de la página anterior:

Buscando en la web, el único thread que dice algo sobre la autodetección de los encodings para html es éste.

Actualización
Los encodings que soporta son:
  • UTF-8
  • UTF-16 little endian
  • UTF-16 big endian
  • UCS-4 little endian
  • UCS-4 big endian
  • EBCDIC
  • UCS-4 unusual ordering (UCS4_2143)
  • UCS-4 unusual ordering (UCS4_3412)
  • UCS-2
  • ISO-8859-1 ISO Latin 1
  • ISO-8859-2 ISO Latin 2
  • ISO-8859-3
  • ISO-8859-4
  • ISO-8859-5
  • ISO-8859-6
  • ISO-8859-7
  • ISO-8859-8
  • ISO-8859-9
  • ISO-2022-JP
  • Shift_JIS
  • EUC-JP
  • ASCII

No hay comentarios: