Индексирование Web-узлов


Разделители слов


Результат работы фильтра содержимого — поток символов, тогда как Index Sea индексирует слова. Поэтому, чтобы индексирование выполнялось корректно, Ind Server должен уметь выделять слова из потока символов. Эта задача усложняет тем, что в различных языках по-разному трактуют ее слова и разделители слов.

Чтобы справиться с этой задачей, Index Server задействует языково-зависимые программные разделители слов, которые корректно разделяют поток символов на слова. Разделители слов учитывают особенности структуры и синтаксиса конкретного языка для выделения слов из потока символов.

Примечание

. Во избежание проблем с кодовыми страницами и других трудностей, связанных с однобайтовыми наборами символов, Index Server использует для хранения всех своих индексных данных двухбайтовую кодировку Unicode









Начало  Назад  Вперед