De HTML a XML con python
Ya hace tiempo, estuve mirando algun enlace al respecto, ya que intuía que me iba a tocar trastear con estos temas.
De nuevo me he encontrado con el siguiente articulo 'Wrestling HTML'. Es bueno, te cuenta lo que tienes que hacer para pasar de html a xml usando varias posibles herramientas. Menciona en el articulo tanto uTidyLib, como libxml2 HTMLParser.
El mismo autor tiene otro articulo sobre eluso de libxml.
Y para acabar este post unos links mas:
- sobre tratamiento de html en python
- sobre un memory leak de htmllib (cuando le heché un vistazo recuerdo me pareció interesante)
- Choosing a XML Parser.
No hay comentarios:
Publicar un comentario