wikipedia2XML 0.1

Licence: Gratuit ‎Taille du fichier: N/A
‎Note des utilisateurs: 3.0/5 - ‎1 ‎Votes

Sur wikipedia2XML

Une collection de scripts python pour créer et gérer un corpus XML (une grande collection de texte à des fins linguistiques) à partir d’un vidage de sauvegarde de base de données Wikipedia original. Il comprend un parser basé sur l’expression régulière pour le langage de balisage MediaWiki.