Search engines vs. Find engines | Seobaby

Автор/Время:

  • on 01.09.2007
  • at 05:37 ПП
  • by seobaby

Search engines vs. Find engines



Сегодня я написала пост в SE la vie, затрагивающий тему индексации веба альтернативными поисковиками. Чуть-чуть хочу поразмышлять на эту тему именно в этом блоге.

Почему тема больная? Ну прежде всего потому, что альтернативные поисковики – понятие еще пока не то чтобы не существующее, но какое-то.. неоформленное, что ли.. Особенно учитывая то, что даже просто понятие «Поисковая система» не имеет четкого определения. Есть много мнений. И вроде как все правильные. Но применительно к этому разговору хочу выделить мнение о том, что поисковая система – это сервис, который имеет своего поискового робота, индексирующего данные в Вебе и, соответственно, индекс, то есть базу данных. Я не возьмусь говорить, правильно это или не правильно. Потому что у медали, как известно, две стороны. Вернемся к альтернативам.

Я уже писала не так давно свое мнение на этот счет в «Альтернативах для чайников«:

…говорить о том, что у поисковой системы всенепременнейше должен быть собственный алгоритм – я не буду. А значит, не буду говорить и о том, что поисковая система – лишь тот сервис, у которого есть собственный поисковый кроулер. Если ПС заимствует индекс у стороннего сервиса и ей и так прекрасно живется, то паук ей зачем?..

Я до сих пор придерживаюсь этой точки зрения. При всем разнообразии альтернативных поисковиков, можно найти не один, которому собственный индекс совершенно не нужен, не говоря уж о просто мета-поисковых системах.

Тем не менее и утверждение, что ПС – это индекс и паук – вполне справедливо. Ну, во-первых, это принцип наиболее привычных и крупнейших поисковиков – индексировать все и вся на своем пути. Но если это вертикальный поиск по недвижимости, то с какой стати ему вообще нужно индексировать все то, что недвижимости совершенно не касается? И если у вас сайт не по недвижимости, то вроде как совершенно неудивительно, что робот этого поисковика к вам не заходил и не зайдет никогда. Поэтому говорить наверняка о том, что у того-то поисковика нет собственного индекса или паука – не стоит так сразу. Может он есть. Просто тихий.. незаметный такой. А то сразу обзываться – не поисковая система, не поисковая система..

Во-вторых, многие альтернативы все же стремятся построить именно свой индекс. Другой вопрос – как! Если это поиск по блогам – то совершенно естественно предположить, что индексируются не веб-страницы, а только лишь rss фиды – и самому поисковику и блогу от этого гораздо легче. Или мета-поисковик может иметь своего паука, котрый бродит по базам данных, а не по веб-страницам. Кстати, что интересно, многие альтернативные поисковики используют открытых пауков – то есть не собственные. И это их совершено не парит.

Далее. Сервисы, которые действительно полность используют чужую (лицензированную) базу и в кроулере не нуждаются – поисковые это системы или нет?

…Я бы сказала, что это промежуточная стадия – еще не поисковая система в смысле своей начинки, хотя для пользователя этот сервис является именно поисковой системой…

Ну например. Хочу я купить телевизор. Я могу пойти в обычный магазин техники. А могу заглянуть в его же представительство в интернете. По ассортименту товаров они будут абсолютно одинаковыми. Просто один реальный, другой виртуальный. Только в виртуальном удобнее, быстрее и, скорее всего, дешевле. А то, что там нету продавцов в привычном понимании этого слова – в костюмчиках и с улыбочкой – так что, это не магазин теперь? Магазин, только называется он – интернет-магазин. Разница в названии небольшая, а объясняет многое.

Я не считаю, что сервисы, не имеющие собственный индекс – ущербные. Просто тут такая мелочь выходит на первый план, как название. Поисковые системы – те, которые ищут. Вполне понятно желание некоторых людей впихивать в определение строчку про собственый индекс и поисковый паук.

В противовес Search Engine вполне можно поставить Find Engine – находящую систему. Это та система, которая скорее находит результаты в уже имеющейся базе в соответствии со своими моральными и религиозными принципами. Ну то есть как ее построят – так и будет находить и предоставлять эти результаты. Find engine – это сервис, который использует чужой индекс и лишь перерабатывает данные, полученные поисковыми системами (то есть теми, которые самостоятельно нашли их), представляя результаты по собственному алгоритму.

Как я уже говорила, find engine – это, скорее, промежуточная стадия. Все таки большинство поисковиков стремятся составить свой индекс. Тогда уж они точно не будут пустышками)) Quintura, например, активно занимается составлением своего индекса и вроде как его уже даже тестирует. Пожелаю удачи в бою. Кстати, себя они величают discovery engine. Но в некоторых случаях find engine вполне прекрасно чувствует себя в этой роли – находящего поисковика, так он себя позиционирует и совершенно при этом счастлив. Пример посвежее – tafiti.

Само собой, ничего особенно полезного сам факт другого названия человечеству не даст. Просто так удобнее будет анализировать стартапы. Плюс, возможно, это хоть как-то сможет уменьшить негатив в сторону альтернативных поисковиков по части того, что вовсе они не поисковые системы. Ну да, не поисковые. Но находящие. Плюс, возможно, это будет некоторый стимул для этих стартапов ;) Здесь можно почитать, что говорят руководители нескольких альтернативных поисковиков на тему индексации.

rss feed комментариев

Комментарии(3)

  1. Мирослав Маршалкин:

    Привет!
    Как развивается погодный стартап?

    А мы запустили новый сервис – виджет для блогов – HATE-LiST (лист ненавсти)

    ps. кстати отлично пишите, сорри, не всегда есть время комментировать, но не пропускаю ни одного поста.

  2. zeus:

    привет! впервые на блоге твоем, поздароваться хотел )

  3. Янис:

    Вы утверждаете, что find engines не ущербные? Хм… вы можете привести find engines, которые имеют нормальный доступ к базам крупных поисковиков, а не тупо парсят их выдачу?

Please, feel free to post your own comment