Joomla портал
seo seo Subscribe
0
seo

В русском языке словарными формами являются следующие:

для существительных – именительный падеж единственного числа;

для прилагательных – именительный падеж единственного числа мужско

го рода;

для глаголов, причастий и деепричастий – глагол в инфинитиве.

Все современные поисковые системы, работающие с учетом морфологии рус

ского языка, базируются на «Грамматическом словаре русского языка», состав

ленном А. А. Зализняком. Основное назначение этого словаря – отразить русское

словоизменение, то есть для каждого входящего в словарь слова дать сведения

о том, изменяемо ли оно, а если да, то как именно это слово склоняется или спря

гается. В ранней редакции этот словарь был назван «Обратный словарь русского

Анонсирование в поисковых системах

языка», так как в нем принят не обычный алфавитный порядок расположения

слов, а инверсионный (от конца слова к началу). Это обусловлено тем, что одина

ковый или похожий тип словоизменения в русском языке имеют слова со сход

ным концом, а не со сходным началом. Таким образом, при инверсионном алфа

витном расположении слова с одинаковым или сходным типом словоизменения

обычно оказываются рядом и образуют большие массивы.

Работы по формальному описанию естественного языка тесно связаны с идея

ми автоматического перевода, появление которых относится к 30м годам XX века.

Первые эксперименты в этой области начались в 1954 году в Джорджтаунском

университете (США). До сих пор все существующие автоматические переводчи

ки, как отечественные, так и зарубежные, хотя и умеют делать болееменее гру

бый подстрочник, даже близко не подошли к уровню профессионального худо

жественного перевода.

Важная часть морфологической обработки – выделение основы слова. Осно

вой называется часть, которая остается после отсечения окончания слова и с ко

торой связано его лексическое значение.

Одна из сложностей формального анализа русского языка – наличие в нем омо

нимов. Омонимы (от греч. homуs –одинаковый и уnyma –имя) – разные по значе

нию, но одинаково звучащие и пишущиеся слова, например: «рысь» – способ бега и

«рысь» – животное. С точки зрения автоматического разбора особенно сложны не

полные омонимы (поскольку они имеют одинаковую словоизменительную схему),

а омоформы. Это разные слова, часто являющиеся и разными частями речи, но со

впадающие по звучанию в отдельных формах, например: существительное «печь»

(печи, печью) и глагол «печь» (пеку, печешь); существительное «раздел» (раздел

книги) и глагол «раздел» (раздел донага). Очевидно, что определение семантики

в таких случаях можно произвести только по контексту.

Упомянутый выше словарь А. А. Зализняка включает 90 000 слов. Однако

в русском языке их больше, кроме того, постоянно появляются новые. Некоторые

системы, работающие с учетом морфологии русского языка (например, Яndex),

умеют обрабатывать эти слова, используя описанные в словаре Зализняка слово

образовательные типы. Результат обработки будет тем лучше, чем больше новое

слово похоже на обычные слова языка.

Релевантность

Релевантность – это мера соответствия получаемого результата желаемому, или,

в терминах поисковых систем, соответствие ответа запросу.

Релевантность можно представить как способ сортировки найденных по зап

росу документов. Каждая поисковая машина имеет свой алгоритм сортировки

результатов поиска. Чем больше документ соответствует запросу, тем выше он

должен находиться в списке отклика. Для достижения хорошего результата

обычно учитывают следующие параметры: количество найденных слов, «контра

стность» слова (относительную частоту его использования в данном документе),

расстояние между словами, положение слова в документе и в его зонах.

Этапы большого пути

Насколько ответ поисковой системы удовлетворяет интересы пользовате

ля, зависит не только от ее свойств, но и от того, насколько удачно сформули

рован запрос. Практика показывает, что люди не любят читать справочную

информацию и пользоваться операторами языка запросов. Для большинства

пользователей Internet более естественно задавать вопрос прямо, как при

обычном общении. Поэтому в современных поисковых машинах реализуется

естественноязыковый запрос, при котором читатель определяет примерную

область своих интересов. Кроме того, применяются функции «Искать в най

денном» и «Найти похожие документы», назначение которых понятно из их

названий.

Методы регистрации

Регистрация узла в поисковых системах Internet – процедура, трудоемкость ко

торой зависит от поставленной задачи и используемых инструментов. Неплохо

с самого начала разработки Webсайта определиться с двумя его важными компо

нентами: доменным именем и структурой.

Смысловая нагрузка на доменное имя сервера, будь то название компании,

продукта или профиля деятельности, весьма велика, а его изменение бывает рав

носильно смерти узла. Использование одногодвух ключевых терминов, фигури

рующих в доменном имени, для многих становится самым быстрым способом

локализовать искомый ресурс.

seo
5th Фев 2011
Теги:
seo

Написать ответ

seo
 
seo
Все права защищены © 2023 Joomla портал
 
 
seo