Что такое поисковая система, поисковые сайты, российские поисковики и каталоги, мировые поисковики и каталоги, как правильно составить поисковый запрос, язык запросов - об этом и не только, на этой странице. →
что такое поисковая системаДля начала – что такое «Поисковая система»?
Поисковая система – программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.
В просторечии, под поисковой системой, подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы.
Программной частью поисковой системы является поисковая машина (поисковый движок) – комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
как пользоваться поисковыми сайтами
Пользоваться поисковыми сайтами – просто!
На любом поисковом сайте – есть поисковая строка. В конце строки, на русскоязычных сайтах стоит – «найти», а на англоязычных сайтах – «search» (поиск).
Надо напечатать в поисковой строке то, что вы хотите найти и нажать — либо кнопку «найти» на сайте, либо клавишу Enter, на своём компьютере.
Но найти то, что ищете – довольно непросто!
Существуют некоторые правила и хитрости, для успешного поиска.
Как правильно составить поисковый запрос – смотрите в правой колонке этой страницы.
Большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках – украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм – так QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
По данным LiveInternet на 2010год, в России доли поисковых систем распределяются следующим образом:
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» – бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993.
Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор.
Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице – с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность.
В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivisimo.
В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов. Nigma тоже экспериментировала с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Для успешного поиска
на поисковых сайтах, надо
усвоить некоторые правила
и хитрости.
(Данные, для описания правильных поисковых запросов - получены с сайта Aborigen.rybolov.de).
Правила для поиска:
1. Пишите грамотно слова поискового запроса.
2. Используйте синонимы.
Если поиск нужных результатов не принес, попробуйте переформулировать запрос, используя синонимы.
3. Уточняйте запрос.
Чем точнее будет построен поисковый запрос, тем больше шансов, что в первых строках результата поиска будет нужный вам ресурс.
4. Используйте ключевые слова.
Если вы, предположим,
ищете информацию по «автомобилю Волга» – так и пишете «автомобиль Волга», а не просто «автомобиль»
и не просто «Волга».
5. Не пишите весь запрос из заглавных букв.
Все запросы желательно писать в нижнем регистре, потому что поиск обычно регистрозависимый и если вы напишите весь запрос из заглавных букв, то поисковик это найдёт при условии, что и искомые документы тоже будут состоять из заглавных букв, что маловероятно. Однако если вы ищете какие-то имена собственные, например: фамилия, название группы и т.д. – тогда пишите их с заглавных букв (именно с заглавных, а не все заглавными).
язык запросов для поиска
В сложных случаях
используйте
«язык запросов»
1. Включение/исключение определенных слов —
знаки « + » и « – » (плюс и минус).
В любом языке есть слова, которые встречаются намного чаще других. Слова, которые встречаются слишком часто, чтобы быть значимыми для поиска, называются стоп-словами. Как правило, это местоимения, предлоги и частицы.
Поисковые машины обычно игнорируют стоп-слова, даже если они встречаются в тексте запроса. Но если вам всё-таки надо ввести словосочетание с предлогом, то поставьте знак + (плюс), без пробела, впереди предлога и пробел перед самим плюсом.
Например:
[на дне] – надо написать –[ +на дне]
[идёт на дно] – надо написать [идёт +на дно].
Такое применение знаков "+" и "–" касается и других случаев.
Если, предположим, вы ищете [Иван Петров] и вам надо, чтобы в найденных документах встречались оба слова из запроса, то написать надо – [ +Иван +Петров], но если вы точно знаете, что искомый объект, скажем, не писатель, то и в запросе исключите это – [+Иван +Петров –писатель].
2. Перечисление альтернатив –
знак "|"
Вертикальная черта позволяет задать альтернативы: система ищет хотя бы одно из перечисленных слов. Например, если вы хотите найти страницы, где встречается одно из слов «папа», «мама», «дочка», «внучка» – поисковый запрос будет выглядеть следующим образом: [папа | мама | дочка | внучка].
3. Поиск точного соответствия – восклицательный знак "!"
Обычно поисковики ищут все словоформы введенного слова, даже если оно задано полностью: например, если в строке введено «машина», то первыми будут выведены страницы, где встречается именно «машина», но далее в результатах поиска окажутся «машины», «машинами» и т.д. Однако если вам нужно найти только данную конкретную форму – «машина», – тогда задавайте вопрос в поисковую строку, так: !машина.
4. Поиск точной фразы – " (кавычки)
Если вам нужна точная фраза – тогда при поиске заключите фразу в кавычки и в этом случае поисковик выведет только те страницы, где эти слова располагаются строго рядом.
5. Задание расстояния между словами – "/n"
В случае когда вы хотите найти все варианты фразы «красивая [любое слово] машина» – можно отразить это в поисковом запросе с помощью знака "/", означающего –«не превышало», и числа, показывающего допустимое количество слов, причем 1 – это значит отсутствие слов.
Поясняю
Запрос:
«красивая /+2 машина» означает команду искать все сочетания, где между «красивая» и «машина» не больше 1 слова.
То есть
«красивая машина» - подойдет, «красивая недорогая машина» – тоже подойдет, а «красивая недорогая подержаная машина» – уже нет.
Значок "+" означает, что слово (слова) должно быть справа, а "–" слева.
То есть запрос: «красивая /(–2 4) машина» означает, что слово «красивая» должно находиться от «машина» в интервале расстояний от 2 слов слева до 4 слов справа.
6. Ограничение по адресам – команда "#url"
Если вас интересует поиск, например, только на конкретном сервере или по конкретной группе адресов либо же, наоборот, поиск, который исключает конкретные адреса или группы адресов, можно воспользоваться командой #url="адрес или группа".
7. Поиск ссылок – команда "#link"
Иногда(особенно это бывает актуальным для владельцев собственных страничек) бывает очень интересно узнать, какие сайты ссылаются (ставят гиперссылку) на тот или иной адрес. В этом случае достаточно в строке поиска задать следующие данные: "#link="адрес"". То есть команда "#link="www.yandex.ru"" покажет все страницы, где стоят ссылки на http://www.yandex.ru/
Здесь перечислены только основные возможности языка запросов поисковой системы Яndex. Отмечу, что эти параметры, как правило, весьма похожи и в других поисковых системах, хотя в любом случае перед их использованием желательно посмотреть описание на конкретном поисковике.
Также следует иметь ввиду, что практически каждый поисковик позволяет создавать довольно сложные запросы с помощью специальной формы под названием «расширенный поиск», для работы с которой вам уже не нужно знать, как именно работает язык запросов в данном поисковике.
Автор – Алекс Экслер
(Статья в сокращении - более полное описание поисковых запросов
– на сайте http://aborigen.rybolov.de Поисковый запрос).
Все права на материалы, опубликованные на fulud.ru, охраняются в соответствии с законом об авторском праве. Разрешено копирование без согласования при условии указания гиперссылки на сайт.