python:python_www
Revenir à l'accueil
Technologies HTML et complémentaires
Récupérer des pages HTML et les transformer en XML
LXML
BeautifulSoup
Trafilatura
Une nouvelle librairie en cours de développement, utile et clés en main, parfois un peu limitée dans les possitilités de choix (en fonction de la compléxité de la page
HTML)
-
-
-
war_entities_stag.csv.zip
python/python_www.txt · Dernière modification: 2021/02/01 01:12 par Francesco Beretta