Tidy
Tidy es una herramienta muy util para evitar errores de parseo usando parsers html, ya que 'corrige' el html.
Para usarlo dese python, he encontrado dos librerias:
El segundo (el unico que he probado) requiere:
- tener instalado tidylib.
- y tener instalado ctypes.
No hay comentarios:
Publicar un comentario