Индекс (поисковой машины)

Индекс (поисковой машины)

Индекс (поисковой машины)

Индексирование, совершаемое поисковой машиной — процесс собирания, разбора и сохранения данных с целью облегчить быстрый и точный поиск информации. Дизайн индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики, информатики и физики. Альтернативное название для этого процесса в контексте поисковых машин, разработанных, чтобы искать веб-страницы в Интернете, является индексацией Сети

Популярные движки сосредотачиваются на полнотекстовой индексации в онлайне, документов естественного языка [1]. Мультимедийные документы, такие как видео и аудио [2] и графика [3][4] также могут участвовать в поиске.

Метапоисковые машины переиспользуют индексы других поисковых сервисов и не хранят локальный индекс, в то время как основанные на скешированных страницах поисковые машины надолго хранят как индекс, так и корпусы. В отличие от полнотекстовых индексов, частично-текстовые сервисы ограничивают глубину индексации, чтобы уменьшить размер индекса. Большие сервисы как правило выполняют индексацию в предопределенных временных рамках из-за необходимого времени и обработки затрат, в то время как поисковые машины основанные на агентах строят индекс в масштабе реального времени.

Содержание

Индексация

Цель использования индекса — в улучшении скорости и быстродействия при поиске релевантных документов по поисковому запросу. Без индекса поисковая машина должна была бы сканировать каждый документ в корпусе, что потребовало бы большого количества времени и вычислительной мощности. Например, в то время как индекс 10 000 документов может быть опрошен в пределах миллисекунд, последовательный просмотр каждого слова в 10 000 больших документов мог бы занять часы. Дополнительное хранилище, требуемое для хранения индекса, а также значительное увеличение времени, требуемого для его обновления, являются компромиссом за экономию времени при поиске информации.

Факторы учитываемые при дизайне индекса

Примечания

  1. Clarke, C., Cormack, G.: Dynamic Inverted Indexes for a Distributed Full-Text Retrieval System. TechRep MT-95-01, University of Waterloo, February 1995.
  2. Stephen V. Rice, Stephen M. Bailey. Searching for Sounds. Comparisonics Corporation. May 2004. Verified Dec 2006
  3. Charles E. Jacobs, Adam Finkelstein, David H. Salesin. Fast Multiresolution Image Querying. Department of Computer Science and Engineering, University of Washington. 1995. Verified Dec 2006
  4. Lee, James. Software Learns to Tag Photos. MIT Technology Review. November 09, 2006. Pg 1-2. Verified Dec 2006. Commercial external link

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать курсовую

Полезное


Смотреть что такое "Индекс (поисковой машины)" в других словарях:

  • Индекс — (лат. index список, реестр, указатель) число, буквы или другая комбинация символов, указывающая место элемента в совокупности или характеризующая состояние некоторой системы, например показатель активности, производительности, развития,… …   Википедия

  • Индекс — (Index) Определение индекса, виды индексов, расчет индексов Информация об определении индекса, виды индексов, расчет индексов Содержание Содержание Определение Морса Индекс подгруппы Индекс (поисковой машины) Индекс (базы ) Ветро холодовой индекс …   Энциклопедия инвестора

  • Индекс (информационные технологии) — У этого термина существуют и другие значения, см. Индекс. В информатике индекс может быть: Целое число, которое идентифицирует элемент массива Структура данных с сублинейным временем поиска Содержание 1 Идентификатор элемента массива …   Википедия

  • Индекс цитирования Яндекса — Запрос «тИЦ» перенаправляется сюда. Cм. также другие значения. Тематический индекс цитирования (тИЦ)  технология поисковой машины «Яндекс», заключающаяся в определении «авторитетности» интернет ресурсов с учётом качественной характеристики … …   Википедия

  • Поисковые машины — Поисковая система  веб сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp серверах, товары в… …   Википедия

  • Тематический индекс цитирования — Запрос «тИЦ» перенаправляется сюда; см. также другие значения. Тематический индекс цитирования (тИЦ)  технология поисковой машины «Яндекс», заключающаяся в определении авторитетности интернет ресурсов с учётом качественной… …   Википедия

  • ТЕМАТИЧЕСКИЙ ИНДЕКС ЦИТИРОВАНИЯ (тИЦ) — Технология поисковой машины Яндекс , заключающаяся в определении авторитетности интернет ресурсов с учетом качественной характеристики ссылок на них с других сайтов Словарь бизнес терминов. Академик.ру. 2001 …   Словарь бизнес-терминов

  • Поисковый индекс — Необходимо проверить качество перевода и привести статью в соответствие со стилистическими правилами Википедии. Вы можете помочь улучшить эту статью, исправив в ней ошибки. Оригинал не указан. Пожалуйста, укажите его. Индексиров …   Википедия

  • Поисковая оптимизация — У этого термина существуют и другие значения, см. Оптимизация. Поисковая оптимизация (англ. search engine optimization, SEO)  комплекс мер для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам… …   Википедия

  • SEO — Запрос «SEO» перенаправляется сюда. Cм. также другие значения. Не следует путать с (англ. search engine optimization, SEO) комплекс мер для поднятия позиций сайта в поисковых систем по определенным запросам пользователей. Обычно, чем выше позиция …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»