Кроме того, значимость поискового слова тем
выше, чем ближе оно к началу документа.
Обзор поисковых систем
Использование фреймов в документе не способствует успешному поиску. Это
не означает, что роботы не умеют сканировать фреймы. Просто отдельный отска
нированный фрейм не позволяет получить представление о целом документе.
Данное замечание не относится к случаю, когда фреймы в документе использу
ются исключительно для улучшения навигации. Роботы Rambler прекрасно
справляются с конструкциями фреймов, однако в текст таких документов реко
мендуется включать тэг
|
с последующим описанием документа и
ссылками. Разумеется, это увеличит размер страницы, но в то же время проде
монстрирует ваше корректное отношение к пользователям текстовых браузеров
и поисковым машинам.
Поисковый сервер Rambler автоматически исключает из индекса слова, встре
тившиеся более чем в 800 000 документов. Такие слова не являются информатив
ными при поиске, и в 99,9% случаев можно обойтись без них.
Предельная внимательность необходима при указании перекрестных ссылок
в документе. Надлежит проверить работоспособность каждой из них, иначе робо
ты не смогут добраться вглубь дерева документов. Следует также иметь в виду,
что с точки зрения протокола HTTP две следующие записи различны:
(neyo a eiioa nnueee)
Обычно при запросе по первой ссылке робот получит переадресацию на вто
рую, а значит, извлечет сам документ только на следующем проходе при обраще
нии к серверу. В итоге замедлится индексация сайта.
Максимальный размер документа для роботов Rambler составляет 200 Кб.
Документы большего размера урезаются до указанной величины.
Роботы Rambler обрабатывают ссылки типа ,
однако наряду со ссылкой такого вида рекомендуется поместить в текст
документа конструкцию
ментов, указанных в IMAGEMAP, и облегчит доступ к документам для обычных
браузеров.
Часто изменяющиеся (динамические) документы рекомендуется исключить
из списка индексируемых, так как они быстро теряют актуальность. Выполняет
ся эта процедура с помощью стандартного для HTTP механизма – посредством
файла robots.txt в головной директории вашего сайта.
Части документа, не требующие, по вашему мнению, индексации, можно отде
лять в документе с помощью тэгов ….
При написании документов не оставляйте без внимания раскладку клавиатуры.
Часто вместо русской буквы р используют латинскую p. Некоторые подобные
ошибки индексатор исправляет, но не все. Слова с такими опечатками теряют ин
формативность. Старайтесь не использовать символов переноса (), поскольку
иногда трудно определить, что они означают – перенос слова или его написание
через дефис. Помните, что браузер осуществляет представление документа соглас
но текущим установкам каждого конкретного пользователя.
Отнеситесь серьезно к планированию и размещению вашего сайта, чтобы вам
не приходилось направлять письма администраторам с просьбами переиндекси
Работа с поисковыми системами и каталогами
ровать ваш сайт в связи с изменением его адреса или структуры. Поисковые ма
шины нескоро учитывают коррективы такого рода.
Поисковая система Апорт
Поисковая машина Апорт (http://www.aport.ru/, владелец – компания «Голден Те
леком», http://www.goldentelecom.ru/) имеет богатые возможности формирования
запроса, в частности способна отслеживать сочетания терминов, если они находят
ся недалеко друг от друга (на расстоянии нескольких слов или предложений).
Апорт – двуязычная поисковая машина. Будучи наделенной теми же основ
ными характеристиками, что и AltaVista, она содержит намного больше ресурсов
современного российского Internet. Апорт входит в число ведущих поисковых
систем, сертифицированных Microsoft как локальные поисковые системы для
русской версии Microsoft Internet Explorer.
Основные свойства Апорт таковы:
•
автоматическая проверка орфографических ошибок запроса;
•
информативный вывод результатов поиска по найденным сайтам;
•
возможность поиска любых грамматических форм, что особенно важно для
русского языка;
•
мощный язык расширенных запросов для профессиональных пользователей.
Дополнительные свойства:
•
технология поиска с использованием ограничений по URL (адресу) и дате
документов;
•
осуществление поиска не только по тексту, но и по заголовкам, коммента
риям, подписям к картинкам и т. д.;
•
сохранение параметров поиска и определенного числа предыдущих запро
сов пользователя;
•
объединение копий документа, находящихся на разных серверах.
Апорт является совершенной полнотекстовой поисковой машиной с интегриро
ванным каталогом Internetресурсов. Подобная интеграция позволяет систематизи
ровать результаты поиска по рубрикам, представленным в каталоге, и осуществлять
поиск отдельно по тематикам, что делает навигацию по ресурсам очень удобной.
Поисковый робот Апорт обходит весь российский Internet в среднем за две
недели.