Octoparse 6.4.1
Vous pourrez télécharger en 5 secondes.
Sur Octoparse
Octoparse est un logiciel gratuit de raclage Web Windows côté client qui transforme les données non structurées ou semi-structurées des sites Web en ensembles de données structurés, sans codage nécessaire. Il s’agit d’un outil de grattage Web facile à utiliser qui recueille des données sur le Web. Les chenilles fonctionnent en Octoparse sont déterminées par les règles d’extraction configurées. La règle d’extraction dirait Octoparse: quel site web doit être ouvert; où sont les données que vous prévoyez d’explorer, etc fournit la collecte de données à grande vitesse, effectuant jusqu’à 10 threads simultanés. Étant une application Windows, Octoparse fonctionne bien pour les sites web statiques et dynamiques, y compris ceux dont les pages Web utilisent Ajax. Il existe différents formats d’exportation de votre choix comme CSV, EXCEL, HTML, TXT et bases de données (MySQL, SQL Server et Oracle). Octoparse simule l’opération humaine pour interagir avec les pages Web. Ses caractéristiques remarquables telles que remplir des formulaires, entrer un terme de recherche dans la boîte à texte, etc,, rendrait beaucoup plus facile d’extraire des données Web. Vous pouvez exécuter votre projet d’extraction soit sur vos propres machines (Extraction locale) soit dans le cloud (Extraction cloud). Octoparse fournit un volet d’opération visuelle, qui est très convivial et simple. Octoparse simule le comportement humain de navigation web comme l’ouverture d’une page Web, la connexion à un compte, la saisie d’un texte, le pointage et le clic sur l’élément Web, etc. Il suffit de cliquer sur les informations sur le site web dans le navigateur intégré et effectuer l’extraction, vous obtiendrez les données structurées dont vous avez besoin. Racler le web à grande échelle simultanément, basé sur l’informatique distribuée, est la caractéristique la plus puissante d’Octoparse. Après avoir téléchargé votre projet de configuration dans le cloud, vous pouvez choisir d’effectuer l’extraction simultanément en utilisant de nombreux serveurs cloud. Si vous avez besoin de gratter 10.000 pages Web dans un court laps de temps, puis octoparse service cloud s’adapte le mieux.