Joomla портал
seo seo Subscribe
0
seo

Он сам настраивается на скорость обновления сайтов и отдельных стра

ниц и проверяет наиболее часто обновляемые ресурсы.

Документы индексируются следующим образом. При просмотре содержимо

го сервера для индексирования Апорт обязательно проверяет файл robots.txt.

Таким образом, вы можете использовать его, чтобы ограничить «деятельность»

системы на своем сервере. При желании установить селективные ограничения

только для Апорт следует использовать в качестве имени робота слово Aport.

Обзор поисковых систем

Будучи полнотекстовой поисковой машиной, Апорт индексирует все слова,

которые бы увидел на экране человек, просматривая конкретную страницу ваше

го сервера. В результате любое слово из текстов ваших документов может слу

жить критерием последующего поиска. Для документов HTML, кроме обычного

текста, индексируется также и содержимое ряда полей. К ним относятся заголо

вок документа (TITLE), ключевые слова (META NAME=“keywords”), описания

страниц (META NAME=“description”), подписи к картинкам (ALT), ссылки

(A HREF). Реализована возможность избирательного поиска по этим полям. Кроме

того, Апорт индексирует как принадлежащие документу тексты гиперссылок на него

с других страниц, находящихся как внутри сайта, так и за его пределами, а также

составленные или проверенные редакторами описания сайтов из своего каталога.

Кроме того, Апорт индексирует текстовые файлы (с расширением .txt), на ко

торые найдет ссылки.

Страница, показанная на рис. 3.11, позволяет задать поисковую фразу, выб

рать тематический раздел и дополнительно сузить область поиска при помощи

переключателя сайты – рефераты – знакомства – mp3 – новости – энциклопе

дия – работа – товары. Кроме того, возможно применение в строке запросов опе

раторов логики и расстояния между словами, а также поиск по адресам и полям,

что значительно расширяет область поиска.

Рис. 3.11. Страница поиска Апорт

Работа с поисковыми системами и каталогами

Вы можете искать документы не только по всему русскоязычному сектору

Internet, но и по его части. Самый простой случай – поиск по определенному сер

веру. Например:

url=www.inotec.ru i.ia.aiia

По данному запросу будут найдены все документы на сервере www.inotec.ru,

содержащие слово «программа».

Для получения списка всех документов, расположенных на указанном вами

сервере, следует набрать в строке запроса следующую фразу:

url=www.inotec.ru

На странице, изображенной на рис. 3.12, Апорт показывает количество най

денных сайтов и документов в поле Лучшие … сайтов (… документов). В даль

нейшем результаты выводятся по сайтам, однако возможность поиска отдельных

документов сохраняется постоянно.

Рис. 3.12. Страница результатов запроса Апорт

Каждый основной информационный блок начинается с символа «домик» ,

, обо

который обозначает сайт (в противоположность символу «страничка»

значающему отдельный документ). Обычно поисковые системы подразумевают

Обзор поисковых систем

под понятием «сайт» адрес сервера типа www.server.com (его доменное имя).

В этом случае адрес сайта определяется по адресу страницы простым отбрасыванием

правой части: так, из http://www.server.com/users/~vasya выводится www.server.com.

Для больших серверов, где размещены сайты множества фирм или частных лиц,

это неудачное решение. Апорт берет в качестве сайта сервер только в самом край

нем случае. Как правило, для определения группы страниц, являющихся логи

ческим целым (сайтом), Апорт использует информацию из базы данных своего

каталога, что обеспечивает большую точность, нежели любой автоматический

алгоритм (специальные алгоритмы используются для незарегистрированных

в каталоге сайтов).

В блоке каждого сайта Апорт приводит информацию об одной – самой подхо

дящей – из найденных на сайте страниц. При этом, кроме обычных для поиско

вых машин данных (адрес, заголовок, размер и дата файла и т. п.), система выдает

цитаты из документа. Они выбираются из полного текста и содержат искомые

слова. По цитатам зачастую легко понять, интересует вас документ или нет.

Здесь же вы найдете ссылку на реконструкцию полного текста документа. Она

нужна, если документ недоступен на самом сайте.

Чтобы получить информацию обо всех остальных страницах, которые Апорт

нашел на сайте, следует воспользоваться ссылкой, замыкающей блок результа

тов. Нажав указанную ссылку, вы откроете дополнительное окно с результатами

поиска по данному сайту. Они разбиты на постраничные блоки данных.

Очевидно, что поиск может считаться успешным, если удается найти нуж

ную информацию на одной из первых страниц с результатами поиска. В этом

отношении очень важна сортировка полученных данных. Перечень основных

критериев, которые Апорт учитывает при сортировке документов (сайтов), сле

дующий:

процентное соотношение искомых слов со всеми словами в тексте доку

мента и расстояние между поисковыми словами;

место в тексте, где встречаются поисковые слова (заголовок, описание, ме

татэг и т. п.

seo
5th Фев 2011
Теги:
seo

Написать ответ

seo
 
seo
Все права защищены © 2023 Joomla портал
 
 
seo