Web Data Extractor Pro est un outil de grattage web spécialement conçu pour la collecte de masse de différents types de données. Il peut récolter des URL, des numéros de téléphone et de fax, des adresses e-mail, ainsi que des informations meta tag et du texte du corps. La particularité de WDE Pro est l’extraction personnalisée de données structurées. Ce programme à grande vitesse et multithreaded fonctionne en utilisant un mot clé dans les moteurs de recherche, en spidering un site Web ou une liste d’URL à partir d’un fichier. Vous pouvez également lui permettre de suivre des liens externes à partir des pages d’origine, avec la possibilité d’aller aussi profondément dans les chemins URL que vous avez besoin et effectivement rechercher l’ensemble d’Internet. Web Data Extractor est supérieur pour la collecte d’informations structurées et de types de données spécifiques liés aux mots clés que vous fournissez en recherchant à travers plusieurs couches de sites Web.
historique de la version
- Version 3.10 posté sur 2020-01-06
Parser considérablement amélioré des adresses e-mail; La liste des agents utilisateurs a été mise à jour; Ajout "Retry URLs" non extrait; et "Enhanced Human factor" options en connexion pour un travail encore plus efficace avec les sites Web cibles; Ajout d’options "Check chaque X minutes " et "Renew après avoir lu y nombre de liens " dans les serveurs proxy pour un travail plus efficace avec procurations; Beaucoup d’améliorations ont été apportées en fonction des commentaires de nos clients! - Version 3.9 posté sur 2018-12-30
Liste des moteurs de recherche est effacé des liens obsolètes / cassés. Cela nous a permis d’augmenter la vitesse du logiciel en mode Moteurs de recherche; Analyse d’adresses e-mail considérablement améliorée, en particulier pour les e-mails cachés JS (JavaScript) ;Option améliorée pour importer ses propres serveurs proxy à partir de fichiers CSV;Amélioration du travail avec les sites Web HTTPS;Amélioration des performances lorsque vous travaillez avec de grandes listes d’URL;Amélioration "Cookie Capture" option; Diverses corrections/améliorations mineures selon les commentaires des clients - Version 3.8 posté sur 2017-12-29
Possibilité supplémentaire de charger et d’extraire des informations à partir de fichiers PDF; Possibilité supplémentaire de charger le fichier de licence directement à partir du formulaire d’interface utilisateur, lorsque la période d’essai d’utilisation du programme expire. Alternativement, le fichier de licence peut être téléchargé à partir des options -> Sur formulaire si la période d’essai n’a pas encore expiré; Amélioration significative du travail grâce aux serveurs proxy; Parser de JS-email codés a été amélioré ; L’élément de menu contextiel "Re-start URL" a été ajouté au "Bad URLs" list;Improved work with the software internal data dépôt; Ajout de la possibilité de supprimer des sessions avec toutes ses données et les fichiers de service, également un logiciel comprimer automatiquement le référentiel interne du programme pour réduire l’espace disque requis; Ajout "Initial Referrer" champ texte dans l’interface utilisateur. Certains sites Web peuvent afficher des informations différentes selon le site externe d’où ils proviennent. Le "Initial Referrer" champ vous permet de spécifier l’adresse Web d’un tel site; Nous avons également apporté divers changements et améliorations mineurs basés sur les commentaires de nos clients - Version 3.7 posté sur 2017-02-28
L’amélioration du travail de "Search Engines" mode;Improved "Remove HTML Tags" et "Page doit contenir le texte suivant pour extraire des données" filtres; Ajout "Use pays IP filter" filtre qui permet d’exclure les résultats des serveurs qui ne se rapportent pas (par géolocalisation) au pays sélectionné dans l’option "Search Engines; Parser email considérablement amélioré et parser Custom Builder; Améliorations générales de la détection et de l’extraction des données; Nous avons également apporté divers changements et améliorations mineurs basés sur les commentaires de nos clients - Version 3.6 posté sur 2016-08-22
Ajout d’une case à cocher et quot;Obtenez URL" redirigé; sur le formulaire "Custom Data Editor" formulaire pour extraire des urls (p. ex. adresses de site Web) qui sont présentées par une redirection; Ajout d’une case à cocher et quot;Mark Proxies non-répondants comme Inactive Automatiquement ". Si pendant le serveur proxy de session déterminé comme mauvais (ne fonctionne pas), il est automatiquement marqué comme inactif, et son non utilisé dans la session; Ajout d’une nouvelle option "Use single line merge" pour fusionner les données en une seule chaîne. Par exemple, vous pouvez exporter des couleurs de t-shirt comme : "T-Shirt", "Black, Yellow, Red, Green; Amélioration significative du chargement des serveurs proxy publics à partir d’Internet; "Human Factor" option a été améliorée; Amélioration d’un parser de fermé par adresses e-mail JS; Amélioration de l’option de passage de Google-captcha lors de la recherche de données via Google; Nous avons également apporté divers changements et améliorations mineurs basés sur les commentaires de nos clients - Version 2.0 posté sur 2012-08-29
Retravaillé l’algorithme pour déterminer la profondeur de l’analyse, la durabilité du programme pour les dommages physiques de la base de données est ajouté, Amélioration du contrôle des flux, qui a un impact positif sur les performances globales, Travail amélioré avec une grande liste de mots clés en "Search Engines " mode
Détails du programme
- Catégorie: Réseau & Internet > Outils de recherche/recherche
- Éditeur: WebExtractor System
- Licence: Essai gratuit
- Prix: $199.00
- Version: 3.10
- Plate-forme: windows