Специализированные поисковые сервера. Информационно-поисковые системы

Поисковые серверы. Некоторые правила поиска

Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы, и получить множество ссылок на ресурсы с нужной информацией. Например, на запрос домашние животные поисковый сервер «Яндекс» (подробнее о нем см. ниже) выдает более 14 млн ссылок на страницы, содержащие нужные, на его взгляд, сведения. Однако далеко не все так гладко: при посещении некоторых найденных страниц выясняется, что искомой информации на них недостаточно, а то и вовсе нет.

Чтобы искать с максимальной результативностью, нелишне будет знать, как работают поисковые серверы.

Принципы работы поисковых серверов

Поисковый сервер – это довольно сложная программа, точнее, комплекс программ, в которых используются специальные алгоритмы анализа содержимого веб-сайтов в масштабах всего Интернета.

Интересный момент: на обработку того же запроса домашние животные у «Яндекса» ушло менее секунды. Невольно возникает вопрос: «А можно ли проанализировать весь Интернет за столь короткое время?» Однозначный ответ на это: «За столь короткое время проанализировать весь Интернет нельзя». Тем не менее факт остается фактом: на обработку запроса затрачено меньше секунды. Ответом на возникшее недоразумение будет описание принципов работы поисковых серверов.

Работа над запросом конкретного пользователя (а заодно и над всеми другими возможными запросами) началась задолго до его введения. Специальная программа, называемая «пауком», просматривает содержимое веб-сайтов. Ее задачи чем-то схожи с задачами обычного веб-браузера, только вместо того, чтобы показывать страницы на экране, «паук» передает их содержимое другой программе – «путешествующему пауку». Задача «путешествующего паука» – вычленение из загруженной страницы ссылок на другие сайты, по которым снова направляется «паук». Цикл этот повторяется многократно, точнее, непрерывно.

На этом работа не заканчивается. За дело принимается программа-индексатор, которая, используя определенные правила, анализирует полученные «пауками» страницы и формирует сложную базу данных поискового сервера. Вот эта самая база данных потом и выдает результаты поиска, которые появляются после обработки введенного запроса. На принципах работы индексатора остановимся подробнее, так как именно от него зависит то, что войдет в результаты поиска.

В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы и тем выше эта страница будет отображена в результатах поиска. Кроме того, учитывается индекс цитирования страниц, которые ссылаются на страницу, изучаемую индексатором.

Кроме индекса цитирования учитываются также следующие параметры:

Наличие искомых слов в заголовке страницы или названии сайта;

Частота повторений искомых слов на странице;

Размер шрифта, которым на странице написаны слова из поискового запроса, а также выделение этих слов шрифтами и стилями;

Тематика ссылающихся сайтов и некоторые другие.

После ввода запроса пользователем за дело берется последнее звено поискового сервера – система выдачи результатов. В итоге анализа и сопоставления упомянутых выше показателей эта система определяет степень соответствия содержимого страницы условиям запроса. Чем эта степень больше, тем выше станица будет представлена в списке найденных ресурсов.

Возвращаясь к вопросу о скорости обработки запроса, отмечу, что такая высокая скорость обеспечивается за счет того, что страницы Интернета проиндексированы заранее, а результаты поиска составляются на основе информации из базы данных поискового сервера.

Такой способ, как несложно догадаться, имеет очевидный недостаток, заключающийся в том, что содержимое веб-страниц может со временем изменяться, а «паук» не будет успевать найти их и обработать, следовательно, результаты поиска будут неточными. Еще раз упомянув о времени, необходимом поисковому серверу для просмотра и индексации всего Интернета, скажу, что на это у разных поисковиков уходит от нескольких суток до нескольких недель, в зависимости от алгоритма обработки информации. Так что сайты, появившиеся в Сети недавно, в результатах поиска представлены не будут.

Разработчики поисковых серверов борются с этим явлением разными способами и с переменным успехом. Например, большинство современных поисковиков предоставляет такой сервис, как поиск по новостным лентам, которые обновляются каждые несколько минут и поэтому чаще индексируются поисковиками. Как бы там ни было, лучшего способа, чем предварительная индексация страниц, сегодня не существует.

Правила построения поисковых запросов

Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.

Российские поисковые серверы:

«Яндекс» – http://www.yandex.ru;

«Рамблер» – http://www.rambler.ru;

«Апорт» – http://www.aport.ru;

Gogo – http://www.gogo.ru.

Зарубежные поисковые серверы:

Google – http://www.google.com;

AltaVista – http://www.altavista.com;

Yahoo! – http://www.yahoo.com.

Для поиска на русском языке лучше подходят российские серверы, на иностранном – зарубежные, хотя, например, Google неплохо справляется с поиском на многих языках. Подробнее о наиболее популярных поисковых системах поговорим позже, рассматривая расширенные возможности поиска, так как у каждой из этих систем есть свои особенности. Сейчас остановимся на некоторых базовых правилах построения поисковых запросов, общих для всех поисковиков.

Несмотря на заявления многих владельцев поисковых серверов, что запросы могут быть написаны практически на естественном языке, который люди используют для общения между собой, это далеко не так. По всей видимости, еще не скоро наступит время, когда компьютер и человек смогут общаться на естественном (для человека) языке. Впрочем, нужно отдать должное поисковым серверам, в последнее время они стали гораздо лучше понимать пользователя и результаты поиска теперь больше соответствуют ожиданиям, чем это было несколько лет назад. Произошло это во многом благодаря внедрению новых языковых технологий.

Из вышесказанного следует, что на практике рядовому пользователю находить нужную информацию стало проще. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Конечно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов. Теперь расскажу еще о нескольких таких фактах.

Поисковые серверы при обработке запроса не учитывают регистр символов. Поэтому запросы Отдых в Турции и отдых в турции с точки зрения поисковика идентичны.

Также следует помнить, что применять знаки препинания в поисковых запросах вовсе не обязательно, точнее, даже не нужно, так как они также игнорируются поисковыми серверами. Зато многие традиционные знаки препинания могут быть использованы при построении сложных, расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым.

Большинство поисковых серверов (кроме, пожалуй, Google) также игнорирует короткие слова, не несущие смысловой нагрузки. В русском языке это предлоги, союзы и т. д., в иностранных – например, артикли.

Многие поисковые серверы позволяют бороться с опечатками и неправильной раскладкой клавиатуры. Наверняка многим читателям часто случалось набрать при включенной английской раскладке клавиатуры русское слово, и получалось, например, gfhjdjp вместо паровоз. Тот же «Яндекс» сразу определит, что здесь что-то не так, и вверху страницы с результатами поиска выдаст ссылку Быть может, вы искали: паровоз, перейдя по которой можно получить страницу с правильными результатами. Аналогично можно бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой Быть может, вы искали…

Поговорим о том, какие слова лучше взять для запроса поисковому серверу. Во-первых, из интересующей пользователя темы нужно взять самые важные по смыслу слова, отражающие только сущность вопроса. Например, если необходим материал по теме «Ловля пингвинов в Антарктиде в условиях полярной ночи», то вовсе не обязательно писать фразу целиком, результаты поиска в этом случае, скорее всего не устроят запрашивающего, так как будет много лишнего. Есть выражение «Машина должна работать, человек – думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса – выделить ключевые слова, задача поискового сервера – наилучшим образом обработать введенный запрос. В рассматриваемом примере ключевыми можно считать слова ловля пингвинов. Ведь известно, что, кроме Антарктиды, они нигде больше не водятся, ну а «полярную ночь» стоит отбросить хотя бы потому, что в реальности в таких условиях работать достаточно сложно.

Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.

Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах, – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими, в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.

Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:

Выбирайте только самые важные, ключевые слова, касающиеся рассматриваемой темы;

Слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;

При неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;

Если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.

Надеюсь, что вышеизложенная информация поможет читателям находить в Сети необходимые сведения. Если найти что-то все равно никак не удается, то на помощь придут расширенные методы поиска.

Из книги Продвижение бизнеса в Интернет. Все о PR и рекламе в сети автора Гуров Филипп

Поисковые системы Поисковые системы (англ. search engine) представляют собой инструменты для поиска информации в Сети. Они индексируют сайты с помощью специальных программ (поисковых роботов). Когда посетители поисковой системы задают тот или иной вопрос, она ранжирует

Из книги Защита вашего компьютера автора Яремчук Сергей Акимович

7.3. Некоторые правила поведения пользователя в Интернете Популярность веб-форумов, онлайн-дневников (блогов) и различных средств общения вроде электронной почты, групп новостей, различных чатов сегодня велика. Кроме добропорядочных пользователей эти сервисы привлекают

Из книги Win2K FAQ (v. 6.0) автора Шашков Алексей

Некоторые правила использования Интернета В семье нужно определить, что является приемлемым при пользовании Интернетом, а что – нет. При этом поощряйте детей делиться впечатлениями, выходите в Интернет вместе, контролируйте ресурсы, которые посещает ребенок. Объясните,

Из книги WinXP FAQ (Часто задаваемые вопросы по ОС Windows XP) автора Шашков Алексей

(8.7) Под W2k не хотят работать некоторые программы, требующие интенсивного обращения к CD приводу, такие как Audiograbber, CDEx, программы для записи CD-RW, некоторые DVD декодеры, и т. д.. Многие программы, требующие непрерывного потока данных идущих на или с CD/DVD привод, нуждаются в

Из книги Популярный самоучитель работы в Интернете автора Кондратьев Геннадий Геннадьевич

7.4. Под XP не хотят работать некоторые программы, требующие интенсивного обращения к CD приводу, такие как Audiograbber, CDEx, программы для записи CD-RW, некоторые DVD декодеры, и т. д.. Многие программы, требующие непрерывного потока данных идущих на или с CD/DVD привод, нуждаются в

Из книги Реферат, курсовая, диплом на компьютере автора

Поисковые системы

Из книги Интернет. Новые возможности. Трюки и эффекты автора Баловсяк Надежда Васильевна

Поисковые машины Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих

Из книги 500 лучших программ для Windows автора Уваров Сергей Сергеевич

Поисковые программы В последнее время наряду с онлайновыми поисковыми машинами появляются и другие инструменты, предназначенные для поиска в Интернете. Одним из таких инструментов являются поисковые программы. Особенностью их работы является возможность искать сразу

Из книги Программирование на языке Пролог для искусственного интеллекта автора Братко Иван

Поисковые системы Пользователи, работающие в Сети, довольно часто применяют поисковые системы. Конечно, часть информации изначально ищется на тематических ресурсам, однако наиболее популярные поисковые системы также активно используются. Начал появляться класс

Из книги Интернет – легко и просто! автора Александров Егор

8.3.1. Некоторые правила хорошего стиля Предложения программы должны быть короткими. Их тела, как правило, должны содержать только несколько целей. Процедуры должны быть короткими, поскольку длинные процедуры трудны для понимания. Тем не менее длинные процедуры

Из книги С компьютером на ты. Самое необходимое автора Егоров А. А.

Поисковые системы Чтобы поиск в Интернете был удобным, быстрым и эффективным, созданы специальные поисковые системы. Убежден, что практически каждый сеанс вашей работы в Интернете не обойдется без того, чтобы вы не воспользовались любимой поисковой системой. Поэтому

Из книги Первые шаги с Windows 7. Руководство для начинающих автора Колисниченко Денис Н.

Поисковые системы Регистрация в поисковых системах – это важнейший шаг при раскрутке своего сайта, так как подавляющее большинство пользователей Интернета ищут инфор -мацию именно с помощью поисковых сайтов. Однако бездумная регистрация не сильно повысит

Из книги ПК без напряга автора Жвалевский Андрей Валентинович

8.2. Поисковые системы Для быстрого и удобного поиска информации во Всемирной паутине существуют специальные сайты - поисковые системы. В разд. 6.2 я уже упоминал об одной такой системе - Яндексе (http://www.yandex.ru). Кроме Яндекса существует еще несколько популярных поисковых

Из книги Работа в Интернете. Энциклопедия автора Ташков Петр Андреевич

10.2.1. Поисковые машины Интернет содержит огромное количество информации. Ведь в Интернете создать сайт может любой желающий, поэтому количество новых сайтов растет с каждым днем. Для поиска в Интернете используются поисковые машины.Поисковая машина - это специальный

Из книги автора

Поисковые системы Это адреса, которые вы должны запомнить прежде всего и крепко-накрепко. С помощью поисковых систем можно отыскать любой другой сайт в

Из книги автора

Поисковые серверы. Некоторые правила поиска Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы,

Специализированные поисковые системы

Специализированные поисковые системы позволяют искать информацию в других информационных "слоях" Интернета: серверах файловых архивов, почтовых серверах и др.

Поиск файлов. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы двух типов: поисковые системы на основе использования баз данных и каталоги файлов. Для поиска файла в системе с использованием базы данных достаточно ввести имя файла в поле поиска и поисковая система выдаст URL-адреса мест хранения данного файла.

В базе данных российской файловой поисковой системы (http://www.filesearch.ru) содержатся сведения о 6 миллионах файлов, размещенных на двух тысячах серверов файловых архивов российской части Интернета.

Осуществим сначала поиск файла программы интерактивного общения ICQ в базе данных российской файловой поисковой системы.

Поиск файлов

1. Открыть в браузере сервер www.filesearch.ru. В поле поиска ввести имя файла, например ICQ. Другие поля формы поиска позволяют уточнить условия поиска, но их заполнение необязательно.

Если имя файла неизвестно, но зато известно его назначение (например, драйвер), то можно воспользоваться тематическим каталогом драйверов.

3. Для поиска, например, драйвера принтера на начальной странице поисковой системы щелкнуть по ссылке Драйверы .

Затем выбрать в иерархическом дереве каталогов нужный тип принтера и активизировать ссылку на него.

Будет выведен перечень URL-адресов серверов файловых архивов, откуда можно загрузить требуемый драйвер.

Поиск адресов электронной почты. Специализированные поисковые системы позволяют искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определенного адреса электронной почты. Примером такой системы может служить поисковая система WhoWhere? (КтоГде?), расположенная по адресу: http://www.whowhere.com.

Практические задания

4.22. Осуществить поиск последних версий драйверов для периферийных устройств вашего компьютера.

Google – это самая крупная и самая популярная в мире поисковая система. Ежедневно на сайтах Google, доступных примерно на 200 языках, регистрируется более 50 миллионов поисковых запросов, при этом, под данным Alexa, основной сайт Google.com является самым популярным ресурсом интернета. Однако, несмотря на всемирное признание и несомненный успех, Google далеко не так хороша в качестве поисковой системы, как может показаться.

Всё дело в универсальности: невозможно одинаково хорошо искать в блогах и в научных статьях, в цифровых изображениях и кулинарных рецептах. Именно поэтому существует множество не столь известных специализированных поисковых систем, которые работают исключительно с какой-то одной категорией данных, но делают это на высочайшем уровне. Более того, многое из находимого такими поисковиками вообще невозможно отыскать при помощи Google и других универсальных систем: они просто не видят такую информацию, которая к тому же нередко умышленно закрыта для подобных «веб-пауков». Поговорим о нескольких таких «узких профессионалах», способных, возможно, открыть для вас ту сторону интернета, о которой вы и не подозревали.

1. Поиск среди удалённых из Google и заблокированных страниц

Не для кого не секрет, что правительства многих стран пытаются повлиять на то, какой сетевой контент доступен на территории их государств. Это может объясняться как чисто политическими соображениями, так и требованиями законодательства о противодействии терроризму и детской порнографии и, конечно же, влиянием лоббистов крупных правообладателей. Критерии запретов могут быть как вполне разумными, так и совершенно произвольными: всё зависит и от общего состояния правосознания в стране, и от вменяемости самих правоохранителей.

Поисковая система Google в большинстве случаев идёт навстречу мотивированным требованиям национальных правительств и удаляет из результатов поисковой выдачи сайты и страницы, доступ к которым через локализованные версии поисковика должен быть запрещён. Между тем удаление адреса из результатов поиска Google и даже блокировка URL и IP-адреса на уровне местного провайдера вовсе не означает, что такой ресурс исчез из интернета или больше недоступен.

Классическое средство обхода подобных ограничений – браузер Tor, основанный на системе альтернативной обычной «луковой» маршрутизации. Один из новейших пакетов, включающих в себя клиент Tor (Vidalia) и браузер Firefox Portable c расширением foxyproxy, носит вполне «говорящее» название PirateBrowser .

От других подобных пакетов он отличается тем, что не предназначен для полностью анонимного сёрфинга: PirateBrowser использует сеть Tor исключительно для обхода местных блокировок тех или иных страниц и сайтов, подставляя произвольные IP-адреса вместо настоящих. С его помощью вы можете зайти на заблокированную страницу, если уже знаете её адрес, либо поискать её, например, через основной сайт Google.com или какие-то другие его локальные версии.

В PirateBrowser уже встроены настройки для некоторых стран, включая Иран, Северную Корею, а также (сюрприз!) Великобританию, Нидерланды, Бельгию, Финляндию, Данию, Италию и Ирландию. Разумеется, ничто не мешает внести в систему и собственные настройки. К сожалению, в отличие от «полноценного» Tor, PirateBrowser доступен только в версии для Windows.

2. Поиск среди несуществующих версий страниц

Многие из нас пользовались кешем Google или «Яндекса», чтобы посмотреть недавно изменённую или удалённую страницу в том виде, в каком она была изначально опубликована в Сети. Обычно такой кеш доступен в поисковой выдаче довольно короткое время, ведь поисковый робот настроен на отслеживание и учёт всех изменений, чтобы выдавать наиболее актуальную версию интернет-ресурса.

Поэтому, если вы хотите знать, как выглядел тот или иной сайт месяц, год, а тем более несколько лет назад, вам придётся воспользоваться другим средством, а именно веб-сервисом «Архива Интернета », который носит название Wayback Machine , то есть что-то вроде «Машины времени». Некоммерческая организация «Архив Интернета» с 1997 года собирает копии веб-страниц, мультимедийный контент и программное обеспечение, размещаемое в Сети, и делает эти копии доступными бесплатно для всех желающих. При помощи Wayback Machine вы сможете найти не только версию знакомого вам сайта многолетней давности, но и даже те страницы, которых давно не существуют и которые попросту удалены из «обычного» интернета. На сегодня в архиве присутствует около 366 миллиардов страниц, и очень велика вероятность того, что среди них окажется та, что нужна именно вам.

Вот, например, как портал «Компьютерры» выглядел для посетителей 18 августа 2000 года – более тринадцати лет назад, когда интернет был медленным, а 14-дюймовые ЭЛТ-мониторы занимали половину стола.

3. Поиск изображений

Самый распространённый способ найти какую-то картинку – это, конечно же, воспользоваться Google Images. А как быть, если вы всё-таки не смогли найти подходящее изображение привычными средствами? Можно, к примеру, попробовать специализированный сервис Picsearch , в котором, как утверждают его создатели, проиндексировано больше трёх миллиардов цифровых картинок.

У Picsearch есть не только многоязычный пользовательский интерфейс, но и полноценный многоязычный поиск, а также несколько полезных фильтров, включая поиск только чёрно-белых или цветных изображений, картинок с преобладанием какого-то конкретного цвета, поиск «обоев» для рабочего стола, а также лиц или анимированных изображений.

Гораздо меньшим объёмом заявленной проиндексированной базы может похвастаться поисковая система Everystockphoto : она содержит более 20 миллионов изображений, хранящихся на онлайновых фотосайтах, включая Flickr, Fotolia и Wikimedia Commons. Тем не менее результаты её работы весьма впечатляют. Большинство из найденных снимков можно использовать бесплатно, но с условием указания имени фотографа или правообладателя.

4. Вычислительно-поисковая система

Как известно, поисковая система Google умеет проводить несложные вычисления, конвертировать из одних единиц в другие и делать некоторые другие полезные вещи, не связанные непосредственно с поиском. Однако если вам нужны ответы на действительно сложные вопросы в области математики, физики, медицины, статистики, истории, лингвистики и других областей науки, то вам не обойтись без «вычислительно-поисковой системы» WolframAlpha , способной предложить пользователю чуть ли не энциклопедические ответы на самые необычные вопросы.

Фактически это даже не совсем поисковая система, а огромная база данных, часть которой преобразована в вычислительные алгоритмы, что и позволяет получать готовые сведения о том, сколько граммов протеина содержится в десятке конфеток M&M’s, какова ожидаемая средняя продолжительность жизни в США, Швеции и Японии в текущем году или как решается алгебраическое уравнение.

Вместо того чтобы долго описывать функциональность WolframAlpha, предлагаем зайти на страницу примеров , где содержатся рассортированные по областям знания образцы того, на вопросы какого рода может дать ответ эта система и как будут выглядеть результаты выдачи.

К сожалению, WolframAlpha работает только с английским языком, и для её использования потребуется его довольно уверенное знание. Кроме того, не стоит слепо доверять тем результатам, которые рассчитывает система по вашим запросам, поскольку малейшая ошибка в базе данных приводит к полной недостоверности выдачи, и такое периодически случается (достаточно поискать в Сети).

5. Поиск людей

Казалось бы, найти человека в интернете, зная его имя и фамилию, проще простого. Да, если это какая-то знаменитость, кинозвезда, спортсмен или постоянный пользователь социальных сетей. Тогда первая же страница результатов поиска Google даст вам практически исчерпывающую информацию о том, кто это такой и чем занимался в последнее время. Если же тот, кого вы ищете, не жаждет широкой популярности и не увлекается сетевым эксгибиционизмом, найти информацию о нём в интернете будет не так просто.

В этом случае можно попробовать поисковую систему Pipl , которая осуществляет поиск людей в целом ряде публичных реестров, онлайновых баз данных, служб и всё-таки в социальных сетях, в том числе и профессиональных. В отличие от большинства подобных сервисов, Pipl работает и с кириллицей, так что он вполне работоспособен и с русскоязычными фамилиями.

Отечественный сервис SpravkaRU.NET поможет обнаружить адрес и домашний телефон жителя России, Украины, Беларуси, Казахстана, Латвии и Молдовы. Этот сайт представляет собой электронный телефонный справочник некоторых крупных городов перечисленных стран, но, увы, далеко не полный. Больше шансов найти жителей Москвы или Санкт-Петербурга, причём только тех, на кого оформлен домашний номер. В отличие от альтернативных сервисов, SpravkaRU.NET содержит вполне актуальные базы, и если вы располагаете хотя бы некоторой информацией о родственниках или примерном месте проживания разыскиваемого, то он способен помочь вам установить его телефон и адрес.

6. Поиск научной информации

Если вы занимаетесь наукой и хотите найти свежие научные публикации по вашей теме в Google, то вам нужно срочно забыть об открытиях и заняться чем-то менее интеллектуальным. В Google вы сможете обнаружить лишь ссылки на отдельные работы, опубликованные на каких-то общедоступных сайтах вроде Википедии. В действительности практически все научные статьи хранятся на веб-серверах, относящихся к категории так называемого глубокого Веба, который по различным причинам недоступен для универсальных поисковых систем.

Всё дело в принудительном запрете на индексацию каких-либо данных, которые хотя и не относятся к секретным, но составляют некую служебную информацию или не представляют интереса для широкой публики. Это и библиотечные каталоги, и медицинские или транспортные базы данных, и каталоги всевозможной промышленной продукции. «Пауки» не могут обойти систему обязательной регистрации или ограничения доступа, поэтому в результатах выдачи Google вы редко увидите научные материалы, попросту непонятные людям, которые не занимаются аналогичными исследованиями.

Приоткрыть дверь в научный «глубокий веб» способен специализированный поисковик CompletePlanet , имеющий доступ более чем к 70 000 научных баз данных и узконаправленных поисковых систем.

Ещё один превосходный научный поисковик Scirus , к сожалению, доживает последние недели: в начале 2014 года он прекратит своё существование, и постоянным пользователям предлагается за оставшееся время найти альтернативу (какую – увы, непонятно). Пока же Scirus имеет доступ ко множеству архивов научных статей и позволяет искать сведения по 575 миллионам проблем, включая публикации в узкоспециализированных и научно-популярных журналах, тексты патентов и сведения цифровых архивов.

Существование специализированных поисковых систем нисколько не отменяет достоинств тех же Google, «Яндекса» и других универсальных поисковиков: обойтись без них мы всё равно не сможем. Но настоящий профессионал не использует молоток там, где нужна отвёртка или нож, где уместен скальпель. Специальные системы позволяют осуществлять более тонкий поиск и поэтому способны давать более точные и достоверные ответы. Возьмём, к примеру, самый популярный тип спецпоисковиков – торгово-поисковые системы вроде «Яндекс.Маркета» и Price.Ru. Да, те же самые товары мы можем найти и в универсальном «Яндексе» или Google, но здесь мы сразу получаем структурированную и систематизированную информацию о наличии и цене товара, продавцах и их местонахождении, способах оплаты и доставки. Мы не просто экономим время: в нашем распоряжении появляются более точные и полные данные, которые можно сортировать в определённом порядке и сравнивать друг с другом. Этот простой пример – наглядное свидетельство того, насколько ценны специализированные поисковики и почему в целом ряде случаев они намного лучше Google.

Проверка никнейма по десяткам сервисов за раз, подсчет репостов в Facebook и визуализация связей Twitter-аккаунта.

Анализ контента в соцсетей - горячая тема среди стартаперов. Сервисов для поиска постов и людей с каждым годом появляется все больше. Но многие из них либо быстро исчезают, либо доступны в недоделанном состоянии, либо их использование дорого стоит.

В этом материале собраны те немногие их них, которые позволяют быстро и бесплатно получить реально полезную или просто интересную информацию.

1. Поиск профилей

Поисковая система Snitch позволяет искать профили человека в четырех десятках сервисов, включая сайты ведущих мировых университетов и базу преступников США:

К сожалению, некоторые из сайтов для которых можно выставить галочки уже не работают. К примеру, Google Uncle Sam, закрытый еще 5 лет назад. Но несмотря на этот и другие косяки Snitch - полезный сервис, позволяющий значительно сэкономить время при поиске информации о человеке.

Если для какого-то сервиса вместо блоков с результатами поиска отображается пустой экран, то для их просмотра надо перейти по ссылке Open a new window :

2. Поиск хештегов

Пользоваться очень просто. Надо вбить в форму поиска искомый хештег и через секунду появится список недавних записей отмеченных им в шести соцсетях:

3. Анализ последних твитов

Сервис позволяет получить список ста последних твитов содержащих искомое слово, хештег или имя аккаунта. А также узнать некоторую аналитическую информация о людях, сделавших эти твиты и времени их создания:

Предположим, вам нужно выявить, какой пользователь спровоцировал необычно высокое количество переходов на статью из Twitter. Мы смотрим 100 последних твитов и видим, кто из людей, упомянувших исходное понятие, имеет больше всего фолловеров:

Владельцам платной подписки доступно большое число твитов для анализа:

4. Анализ Twitter-аккаунта

На Mentionapp можно ввести имя аккаунта и получить информацию о нем (кого чаще всего ретвитит, какие хештеги использует и т.д.) в виде схемы связей:

5. Поиск твитов на карте

Если кликнуть на любое место карты на , то можно прочитать последние твиты, сделанные рядом:

6. Число упоминаний в соцсетях

Sharedcount помогает оценить популярность статьи/сайта в соцсетях. Вбиваешь URL и через пару секунд есть статистика упоминаний в Facebook, Google+, Pinterest, Linkedln и Stumble Upon:

7. Поиск по форумам

Boardreader - это поисковик по форум и доскам объявлений:

Оценка масштабов бедствия показала, что на одного жителя России приходится почти 4 ответа на этом портале.

8. Пробиваем логин по соцсетям

Идем на knowem.com и забиваем никнейм человека. В ответ получаем информацию о том, на каких сервисах он зарегистрирован:

9. Определяем имя человека по email

Если вы до сих пор ищете людей, забивая их почтовые адреса в Google, то вам следует отказаться от этого способа. Ведь есть pipl.com . Вбиваешь email (никнейм) и получаем список профилей в соцсетях:

Информация не всегда точна и полна, но сервис исключительно полезный.

Вот и все. Стоило было рассказать еще о Socialmention (недопиленный анализ отзывов), Yomapic (поиск фотографий из VK и Instagram на карте) и yandex.

Поисковики помогают пользователям интернета найти нужную информацию. В строке поиска человек вводит свой запрос: ключевое слово для поиска или сборник ключевых слов. И выбирает из списка понравившийся сайт, лучше всего отражающий суть заданного вопроса поисковой системе. Поисковые серверы интернета - это удобно и современно.

Обзор поисковых серверов

Обрабатывает сотни гигабайт информации и выдаёт пользователю нужные сайты в удобном формате списка найденных страниц. Этот список может состоять из сотен тысяч страниц, где встречаются эти слова. Из этого всего вы уже можете найти нужную информацию, это временами может быть и проблематично. А иногда вы сразу находите нужный сайт с соответствующей информацией.

Поисковой сервер AltaVista - самый малоизвестный поисковик в "Рунете". Был популярен у англоязычной аудитории во время запуска системы "Виста" от "Майкрософт". В его базе всего лишь пятьсот пятьдесят миллионов страниц. Четыре миллиона статей из 15.000 групп новостей внутри агрегатора "Юзенет". И доступен поиск по изображениям и прочим медийным файлам, типа видео и звуков. Выдача по картинкам производится в немного неудобном формате. Они выводятся все с описанием размера при наведении мышки на картинку.

Open Directory Project - этот сервис, скорее, относится к каталогам, чем к поисковикам. Но через него поиск осуществляется только по качественным ресурсам Сети интернет. Работу для удобства пользователей осуществляет около 38 тысяч редакторов, которые ежедневно отбирают сайты для своего каталога.

Поисковой сервер WebCrawler - количество индекса поискового сервиса около 1,6 миллиона проиндексированных материалов. Каталог проекта имеет около 100 000 категорий, куда можно определить практически любой сайт. У поисковика общая база данных с другим интернет проектом под названием Excite, но данный проект специализируется на развлекательном трафике, индексируя чаты и гороскопы.

Lycos - в этом сервере есть информация о 50-ти миллионах страниц. Вам приведены запросы к поисковому серверу. Вы можете написать, например: «Как написать статью для сайта», и поисковик выдаст нужную информацию. Отсортированы они релевантно вашему запросу. Возможно, среди них вы найдёте нужный. Приведены запросы к поисковому серверу для каждого поисковика ниже.

HotBot - содержит в себе информацию о 55 миллионах страниц со всего интернета. Среди них вы сможете найти нужную информацию. Для удобства можете указать нужное гео-положение. Например, вы ищете кафе в определённом городе и задаёте соответствующий запрос. Поисковик также совершает поиск по звукам, графике, скриптам сайта, и прочим нетривиальным вещам, которые могут быть вам нужны. Сервер недавно подключился к "Юзенет", и поиск также может совершаться там.

"Гугл" и "Яху" - гиганты поиска

Поисковой сервер "Гугл" (Google) - за всё время работы проиндексировано уже около 2-х миллиардов страниц, по которым производится поиск интересующего пользователя контента. "Рунет" проиндексирован неплохо, но лучше "Яндекса" "Гугл" не стал, поскольку тот учитывает индивидуальные особенности русского языка, орфографию и орфоэпию слов при поиске.

Поисковой сервер Яху (Yahoo!) - имеет развитый сервис новостей, собираемый из СМИ всего мира. В нём проиндексировано около 3 000 000 ссылок. Сервис достаточно неплохо структурирован. Является одним из первых в мире. Но не стал таким популярным как "Гугл".

Метасистемы

Кроме классических поисковых систем существуют метасистемы, которые осуществляют поиск сразу по всем системам сразу. Результаты будут представлены в удобном для вас виде. Сервис "Яндекс" - самый крупный в "Рунете" и первый в своём роде. После поисковик распространился и по странам СНГ, поскольку учитывает морфологию языка. Программа Copernic 2001 работает достаточно давно и постоянно обновляет свою базу данных от различных сервисов. Поиск может осуществляться по категориям или по геоданным. Выдача может быть привязана к местности, из которой поступает запрос.

Существует бесплатная и платная версия сервиса, которым пользуется уже больше четырнадцати миллионов человек. Сервер использует для поиска "Гугл", "Яндекс", и прочие.

"Рамблер" и "Яндекс" - крупнейшие каталоги сайтов

Rambler - российский сайт, который предоставляет услуги по поиску нужной информации в интернете. Поисковик достаточно молодой, но уже набравший популярность в России и СНГ, присутствует свой каталог и агрегатор новостей, в которых представлено огромное количество русскоязычных сайтов. Является крупнейшим в СНГ, после него идет "Яндекс", который обходит его по качеству. В "Яндекс" попасть достаточно сложно для малоизвестных сайтов. В "Рамблере" же регистрация является бесплатной для всех порталов, удовлетворяющих условиям принятия проекта в каталог.

Поиск файлов

"ФТП-индекс". В нём находится информация о ФТП-серверах, которые используются для хранения и распространения информации. Но информация в виде файлов.

Filez - с его помощью можно просматривать более чем 100 миллионов файлов, находящихся в индексе файлового поисковика.

Похожие публикации