2010/05/18 17:15:27

WebCrawler

WebCrawler — старейшая полнотекстовая поисковая система. Этот поисковик был написан в 1994 году Пинкертон Брайан, студентом университета Вашингтона, который продал его 1 июня 1995 года знаменитой компании America Online (AOL). Она смогла приложить достаточное количество усилий, времени, денег, чтобы наполнить его базу миллионами ссылок. Однако на сегодняшний день Webcrawler уже не является собственностью AOL, так как система была куплена Excite. Система Webcrawler широко известна среди ветеранов интернета, особенно в Америке.


Webcrawler осуществляет поиск не только в WWW, он является интерфейсом к поиску Gopher и поиску по FTP. Интерфейс у Webcrawler очень простой и понятный. Он несколько напоминает Excite. На основной странице помимо поля ввода запроса присутствуют: список каналов (рубрик каталога), четыре кнопки для получения помощи, отправки E-Mail и т.д, а также несколько "новостей дня". Каталог у Webcrawler по структуре схож с каталогом на Excite, хотя и имеет больше разделов, существует и аналогичная Excite возможность настройки, создания "своего канала", где будут выводиться только интересующие пользователя новости и т.д. Система поддерживает не только запросы с полным набором логических операций над словами, но и запросы на естественном языке.Объем индекса на Webcrawler меньше чем у других рассмотренных систем, однако, на простые запросы Webcrawler выдает гораздо больше релевантных результатов, чем, например, Altavista. При составлении запроса для Webcrawler следует помнить, что по умолчанию он использует логический оператор ИЛИ, т.е. запрос "Максим Фрай" интерпретируется как "Максим ИЛИ Фрай" - на странице должно присутствовать хотя бы одно из этих слов. Хотя документы, в которых присутствуют оба слова, появляются первыми, такой подход снижает релевантность результатов. Результаты поиска на Webcrawler по умолчанию выдаются в очень компактной форме - выводится только заголовок страницы, являющийся гиперссылкой на нее и процент релевантности. Для того чтобы изменить вид вывода результатов, надо перейти на отдельную страницу, эту операцию приходится повторять после каждого поиска. Если критерию поиска удовлетворяют страницы из каталога, то возле ссылки на страничку появляется ссылка "обзор" ("review"). Кроме того, в правой части страницы с результатами поиска выводится несколько иконок, нажав на которые, можно поискать ключевые слова в базе данных книг, просмотреть карту (если было упомянуто географическое название), и т.д. Для тех, кто не нашел необходимой информации, в самом низу страницы есть ссылка "Искать на Excite" ("Search on Excite"). Поиск русских ресурсов на Webcrawler теоретически возможен, но количество проиндексированных страниц так мало, что складывается впечатление, что они туда попали по чистой случайности.