Smart Web Crawler - Effective Recursive Resource Grabber for Web - Couverture souple

Ramalingam, Manimegalai

 
9786200007759: Smart Web Crawler - Effective Recursive Resource Grabber for Web

Synopsis

Ce livre est conçu en utilisant Visual ASP .Net 2010 et MS-SQL Server 2008. Le langage de codage utilisé est VB.NET. Le projet implique des paramètres pour diverses options telles que la recherche dans les pages Web et extrait les identifiants de messagerie, les URL Web, les numéros de téléphone, les liens de téléchargement de chansons et les balises telles que les balises d'en-tête. Le niveau de profondeur est donné de sorte que non seulement à partir des pages Web données, mais aussi les pages liées à cette page Web sont recherchées et le contenu est extrait. L'approche multi-threading est utilisée afin que chaque page soit recherchée par un fil séparé, ce qui facilite le processus. Dans le système proposé, plusieurs pages Web peuvent être recherchées sur le même site Web ou sur un site Web différent avec une recherche intelligente, ainsi il prend la ressource d'une page Web avec l'utilisation de profondeurs. La recherche intelligente est effectuée à l'aide d'une extraction avancée appelée expression régulière et donc tout type d'informations peut être extrait. Par exemple, le motif \d{6} récupère les codes PIN indiens.

Les informations fournies dans la section « Synopsis » peuvent faire référence à une autre édition de ce titre.