Декабрь 19, 2019 Просмотры 138 просмотров

Анатомия метапоиска

В нашу эпоху информационного взрыва, когда количество накопленных человечеством знаний увеличивается в геометрической прогрессии, на первый план выдвигается уже не задача сбора данных, а сохранение, классификация и самое основное, поиск информации. Представьте, сколько времени занял бы у Вас поиск нужной книжки в средней по размерам библиотеке, если бы все книги в ней лежали бы абсолютно бессистемно?
А если заботливый библиотекарь заранее разложит книжный фонд по рубрикам, создаст тематический каталог, добавит краткую аннотацию к каждой книге и будет находиться рядом, что бы дать квалифицированную консультацию, если Вы не смогли найти документ своими силами?
А если он помимо всего этого уже сам прочел все книги и по Вашей цитате сможет среди миллионного фонда найти вам именно ту, нужную?

Интернет можно грубо представить огромной библиотекой со множеством библиотекарей, роль которых выполняют ИПС (информационно-поисковые системы). Поскольку охватить весь фонд, исчисляемый десятками миллиардов страниц (да еще к тому же непрерывно изменяющийся) практически невозможно, каждый поисковик имеет свой «виртуальный» фонд, т.е. свою собственную базу проиндексированных страниц, которая постоянно обновляется и расширяется.

Количество проиндексированных страниц в базах ИПС различно, но даже база крупнейшей поисковой системы Google не претендует на охват и 1% Интернет-контента. И, если нам не смог помочь один поисковик, логично обратиться к другому, третьему и т. д., пока искомый документ не будет найден. Тем более, что каждая ИПС имеет свои особенности.
Например, Google – самую большую базу проиндексированных страниц, Yandex и Rambler, специально созданные для поиска на русском языке, - возможность поиска по различным формам заданного слова, что резко улучшает результаты поиска. Кроме того, эти ИПС имеют приятную возможность поиска по ходу в товарах и в новостях. Rambler, помимо всего прочего, умеет выдавать список похожих запросов других пользователей.

Для упрощения поиска информации сразу в нескольких поисковых системах существуют так называемые метапоисковые системы, задача которых и состоит в том, чтобы донести до пользователя информацию, полученную многими поисковиками. Они, как правило, не обладают собственной базой, а просто дают запрос конкретному поисковику, получают его ответ, некоторым образом преобразуют его и выдают пользователю.

В Интернете действуют более сотни метапоисковых систем. Все они условно делятся на два типа:

  • системы, выдающие результаты для каждого поисковика в отдельном фрейме или странице;
  • системы, выдающие сводный результат работы на одной странице

Примером системы первого типа служит xRambler, которая умеет искать в 15 поисковых системах, но результат каждого поисковика выводит в отдельном окне или фрейме. Фактически, эта система просто передача запроса сразу нескольким поисковикам.

Системы второго типа более интересны, так как они представляют информацию в виде одного списка, обрабатывая данные, полученные от поисковых систем определённым образом. Примерами систем второго типа являются метапоисковые системы MetaBot , Nigma, Mamma, SuperSearch, Искатель и другие.

Давайте условимся, что дальнейший разговор пойдет только о системах второго типа и термин метапоисковая система (МПС) будет применяться исключительно к ним.

Что должна уметь метапоисковая система

Каждая уважающая себя метапоисковая система должна обладать несколькими основными качествами:

  • выдавать результаты поиска в максимально удобном виде
  • сортировать сводный список найденной информации по релевантности
  • предоставлять дополнительные возможности пользователю (например список похожих результатов запроса)
  • иметь дружелюбный интерфейс
  • обладать настраиваемостью (например, возможностью отключения ненужных в данный момент поисковиков)
  • иметь достаточно малое время отклика (проще говоря - работать быстро)
  • ну и наконец, поскольку мы ведем речь о русскоязычной метапоисковой системе, она должна корректно обрабатывать запрос на русском языке.

Я на днях протестировал множество метапоисковых систем и отобрал две, на мой взгляд, наиболее удовлетворяющие приведенным критериям. Это уже упоминавшиеся выше системы MetaBot и Nigma. Все остальные либо не вели корректно поиск на русском языке ( Mamma, SuperSearch), либо очень долго осуществляли поиск (Искатель), либо имели весьма замудреный интерфейс или глюки в работе (MetaPing).

Сравнение метапоисковых систем

Рассмотрим системы MetaBot и Nigma более пристально. А так как в наших новостях промелькнуло сообщение о создании метапоисковой системы и в Узбекистане, уделим внимание и нашей местной GoGo.

METABOT

Строгий стиль, минимум рекламы, несколько не очень полезных ссылок на главной странице проекта, двуязычный интерфейс. Возможность отключения/включения поисковиков присутствует неявно и весьма нелогично (если выбран Русский поиск – ищется в Google, MSN, AltaVista, Aport и Rambler, если выбран Мировой поиск – ищется только в AltaVista и MSN). Порадовала возможность поиска файлов и мультимедийного контента. Результаты поиска с краткой аннотацией группируются с указанием на поисковые системы, нашедшие данную страницу. Система выстраивает список найденных документов, отсортированный по релевантности, вычисленной ею самой, как мне показалось менее достоверно, чем Nigma. Навигация по результатам поиска не очень удобна и не настраиваема. Реклама в результатах поиска присутствует, но ненавязчиво.

Резюме. Неплохая система. Рекомендую.

NIGMA

Первое, что бросается в глаза при запуске Nigma – это приятный интерфейс, который несколько подпорчен несимпатичным паучком на логотипе, гордое заявление «самая умная поисковая система», полное отсутствие рекламы и возможность отключения/включения поисковиков. Правда, как выяснилось чуть позже, из заявленных семи ИПС – три не работали: Yahoo, AltaVista и Yandex. Я связался с разработчиками системы и получил ответ от Виктора Лавренко, который гласил: «Спасибо, мы работаем над этой проблемой. Думаю, скоро ее решим». Хм, судя по оперативности ответа, проект действительно не заброшен и развивается.
Порадовала в системе выдача результатов поиска с указанием на каких именно поисковиках найден данный документ, места и краткой аннотацией. Кроме того, только у этой системы выдается результат так называемой кластеризации, т.е. разнесения результатов поиска по классам. Удобна и навигация по результатам поиска, правда, хотелось бы иметь возможность настраивать некоторые параметры (например, количество результатов на странице).

Резюме. Есть недоработки, но реально это, на мой взгляд, одна из лучших, если не самая лучшая метапоисковая система в РуНете. Не знаю как Вы, а я добавил ее адрес себе в Избранное.

GOGO

И, наконец, взглянем на наш метапоисковик GoGo. Сверхстрогий стиль, никакой рекламы, никаких ссылок. Первое впечатление скорее положительное. Опс!!! А где кнопочка «Поиск»? Не нужна? Ну-ну…
Вообще, минималистский стиль прямо-таки бросается в глаза. Нет возможности отключения/включения поисковиков, возможно по причине их малого количества, нет группировки результатов, навигация по результатам не настраиваемая. Собственный расчет релевантности найденных документов GoGo не выполняет, а просто выводит в общем списке результаты каждого поисковика отдельно.

Резюме. Метапоиск чем и привлекателен, так это возможностью, используя результаты, полученные от поисковых систем, выстроить свой, возможно более удачный список релевантной информации. Однако не стоит забывать, что "наш" поисковик очень молод и находится в стадии разработки. Будем ждать появления у GoGo новых и интересных возможностей.

В заключение

В этой статье я стороной обошел правовой аспект деятельности метапоисковых систем. Например, их создателям можно порекомендовать прочесть документ Лицензия на использование поисковой системы Яндекса.
Подобные же документы можно найти на любой ИПС. Вопрос легитимности подобных систем остается открытым.


Просмотры 138 просмотров

Статистика просмотров страницы:

  • за текущий месяц (Март 2024) - 1;
  • за прошлый месяц (Февраль 2024) - 3;
  • за последние 3 месяца (Декабрь 2023 - Февраль 2024) - 4;
  • за последний год (Март 2023 - Февраль 2024) - 28;

Отзывы

Админ
Отлично!
Март 28 Админ

Статьи и обзоры Все статьи

GT & Industrial Systems, LP, действующая в Узбекистане через зарегистрированное ...
В начале 2000-х мир киберспорта переживал свою золотую эпоху, а ...
Бухгалтерская программа 1C способствует успешному развитию бизнеса в условиях современной ...
Автоматизация бизнес-процессов и повышение эффективности компании с помощью программы 1С.