Технология поиска информации в Интернете: информационные поисковые системы Интернета. Поиск информации в сети интернет

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат , добавлен 02.11.2010

    Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат , добавлен 12.05.2010

    Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.

    дипломная работа , добавлен 16.06.2015

    Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.

    реферат , добавлен 07.05.2011

    Рассмотрение поисковых систем интернета как программно-аппаратного комплекса с веб-интерфейсом, предоставляющего возможность поиска информации. Виды поисковых систем: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Яндекс, Bing и Rambler.

    реферат , добавлен 10.05.2013

    Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.

    курсовая работа , добавлен 29.03.2013

    Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация , добавлен 16.02.2015

    Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа , добавлен 26.03.2011

Наименование параметра Значение
Тема статьи: Поиск информации в Интернет
Рубрика (тематическая категория) Компьютеры

Чат (chat – разговор) - ϶ᴛᴏ ресурс Интернет, на котором посредством программ и скриптов реализована возможность одновременного общения большого количества пользователœей в реальном времени.

Каждый присутствующий в чате имеет свой ник (от англ. nickname – прозвище), и видит окно, ĸᴏᴛᴏᴩᴏᴇ периодически обновляется и заполняется фразами, которые за последние несколько секунд послали участники. Фразы набираются с клавиатуры в соответствующее поле ввода.

10.8.6. ICQ (от англ. I Seek You – я ищу тебя)

ICQ (Аська) - ϶ᴛᴏ очень быстрый и наиболее популярный способ on-line общения в Интернет. ICQ-клиенты загружается в фоновом режиме и позволяет постоянно (в режиме on-line) держать связь с друзьями и знакомыми в сети. Пользователь ICQ может одновременно работать или играть, а программа сама отыскивает компьютеры знакомых пользователœей и устанавливает связь с ним. В случае если на ICQ-клиент поступит сообщение или другая информация, то программа сама ее сохранит, ожидая пока пользователь ее просмотрит. Кроме обычных текстовых сообщений можно передавать звуковые сообщения, ссылки на web-странички, файлы, устроить разговор в реальном времени (chat) с одним или несколькими людьми из любой точки мира.

Каждый пользователь ICQ имеет свой личный номер (UIN) и ник, который можно помещать на визитных карточках и иных деловых бумагах.

Поисковая система - ϶ᴛᴏ комплекс программ и мощных компьютеров, автоматически просматривающих ресурсы Интернет и индексирующих их содержание. Поисковые системы могут отличаться по эффективности поиска, по языку поиска (русский, английский и др.) и другим возможностям. К примеру, одни поисковые системы находят информацию только в виде Web-страниц, другие могут просматривать и группы новостей, и файловые серверы. Результатом поиска являются гиперссылки на документы, содержащие требуемую информацию.

Наиболее известны следующие системы для поиска информации в международных информационных ресурсах:

Alta Vista (http://www.altavista.com/);

Google (http://www.google.com/);

Yahoo (http://www.yahoo.com/);

Infoseek (http://www.infoseek.com/);

Hot Bot (http://www.hotbot.com/)/.

Для поиска информации в российских информационных ресурсах:

Яндекс (http://www.yandex.ru/).

Рамблер (http://www.rambler.ru/);

Апорт (http://www.aport.ru/).

Для поиска информации в Интернет с использованием поисковой системы крайне важно перейти на ее WEB-страницу, набрав электронный адрес или воспользоваться гипертекстовой ссылкой на эту систему.

Поисковые системы бывают двух типов: универсальные и специализированные. Наиболее популярные современные поисковые системы сочетают в себе оба типа.

В универсальных системах используется обычный принцип поиска в неструктурированных документах – по ключевым словам. Ключевым словом (Keyword) документа принято называть отдельное слово или словосочетание, ĸᴏᴛᴏᴩᴏᴇ отражает содержание данного документа.

На начальной странице поисковой системы обычно расположено обширное меню тем и поле для ввода запроса. Для поиска документов по ключевому слову нужно ввести это слово в поле для ввода запроса и нажать кнопку ʼʼSearchʼʼ (или ʼʼПоискʼʼ в русских системах), расположенную рядом с полем ввода. Для поиска можно использовать словосочетание; для этого словосочетание заключаются в двойные кавычки. В некоторых системах можно осуществлять поиск по части слова, оставшаяся часть слова заменяется знаком ʼʼ*ʼʼ, как в шаблоне имени файла. Знаки ʼʼ+ʼʼ и ʼʼ-ʼʼ перед словом требуют обязательного присутствия или отсутствия этого слова в документе.

Существует также кнопка перехода к расширенному поиску (Advanced Search). Главное отличие расширенного поиска – использование в запросœе логических операторов и круглых скобок. Для построения сложного запроса используются логические операторы AND (И), OR (ИЛИ), NOT (НЕТ) и NEAR (около; не далее чем в 10 символах). Логические операторы ставятся между словами или словосочетаниями. Здесь могут использоваться даты документов, размер документов и другие критерии. Интерфейсы расширенного поиска у разных поисковых систем существенно отличаются; для наиболее эффективного использования нужно внимательно почитать раздел Advanced Search Help поисковой системы.

Поисковые системы обычно состоят из трех компонентов:

Поисковый робот (агент, паук или кроулер), который перемещается по сети и собирает информацию;

База данных, которая содержит всю информацию, собираемую роботом;

Поисковый механизм, который используется как интерфейс для взаимодействия с базой данных.

Поисковые роботы - ϶ᴛᴏ специальные программы, которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных.

При запросœе к поисковой системе база данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме поиска, и выводит список ссылок на документы, соответствующих запросу. В этом списке представлены ссылки на различные Web-страницы, причем ссылки располагаются по степени убывания встреченных на данных страницах слов, совпадающих с ключевыми словами. Некоторые системы составляют список ссылок по степени свежести страниц, другие же – по степени вероятности того, что данные страницы окажутся искомыми.

Для того чтобы обойти всю сеть, мощному поисковому роботу нужно от нескольких дней до нескольких недель. При этом составляется свежий и подробный индекс – опись доступных ресурсов. При каждом новом цикле индекс обновляется, и старые недействительные адреса удаляются. При этом автоматизированный подход приводит к тому, что индекс оказывается засоренным большим количеством профессионально слабых, неинформативных адресов, которые пользователь нередко и получает в результате поиска.

Специализированные справочные службы - ϶ᴛᴏ тематические каталоги, в которых собраны структурированные сведения об адресах серверов по какой-либо тематике. Ссылки в такие каталоги заносятся не автоматически, а с помощью администраторов. Οʜᴎ стараются сделать свои коллекции наиболее полными, включающими всœе доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать всœе ссылки по интересующему его вопросу, а достаточно найти данный вопрос в каталоге. Как правило, хорошие каталоги Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях.

Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, ᴛ.ᴇ. каждый шаг поиска это выбор подраздела с более конкретной тематикой искомой информации. На нижнем уровне поиска пользователь получает относительно небольшой список ссылок на искомую информацию.

Каталоги составляются администраторами, просматривающими каждый новый сайт прежде, чем включить его в индекс. Качество информации каталогов выше, и нетематическая информация попасть в каталог просто не может; но коллектив редакторов не может успевать за темпами расширения Интернета. Вместе с тем, чем дальше, тем больше в каталоге накапливается заброшенных или устаревших адресов (его не успевают чистить). В отличие от роботов, каталоги индексируют документ не по наиболее часто встречающимся словам, а по тем ключевым словам, которые вводятся администраторами.

Помимо услуг по нахождению сайтов, поисковые системы предоставляют широкий перечень разнообразной сопутствующей информации, к примеру: новости, гороскопы, почтовые ящики, электронная коммерция, котировки акций, погода, спорт, географические карты, программы телœевидения, лотереи и т.д.

Поиск информации в Интернет - понятие и виды. Классификация и особенности категории "Поиск информации в Интернет" 2017, 2018.

Тема урока: Поиск информации в сети Интернет

Учебник: Л. Л. Босова, А. Я. Босова «Информатика 9» Тип урока: урок открытия и обретения новых знаний, умений и навыков

Цель урока: познакомить учащихся с основными понятиями «поисковая система», «каталог ссылок», «поисковая машина» и показать практическое применение языка запросов, научить находить информацию в сети Интернет.

Задачи урока:

  • Образовательные: - познакомить учащихся с основными понятиями, научить создавать запросы для поиска в сети Интернет.
  • Развивающие: продолжить развитие внимания и мышления; формирования общеучебных и общекультурных навыков работы с информацией, самоконтроля и интереса к предмету.
  • Воспитательные: продолжить воспитывать информационную культуру, навыки учебного труда и ответственного отношения к предмету.

Оборудование, ресурсное обеспечение урока

Используемые на уроке средства ИКТ:

    • персональный компьютер учителя, мультимедийный проектор, экран;
    • персональные компьютеры учащихся с доступом в сеть Интернет

Электронные образовательные ресурсы

    • презентация
      Презентация к уроку
      PPTX / 2.59 Мб

Дополнительные ресурсы:

Раздаточный материал с практической работой «Поиск в сети Интернет»
Практическая работа
DOCX / 16.89 Кб
и рефлексией урокаРефлексия
DOCX / 15.5 Кб

1. Организационный этап

Учитель приветствует учащихся, проводит проверку готовности к уроку, способствует формированию положительного эмоционального фона. Учащиеся приветствуют учителя, занимают свои рабочие места

2. Актуализация опорных знаний

Учитель проверяет усвоение по изученному на предыдущих уроках материалу.

Для этого он использует кроссворд с основными понятиями компьютерных сетей (слайд 2 ). Следующие задания по установке соответствий между логотипами популярных браузеров и их названиями (слайд 3) , и названиями протоколов и их назначением соответственно (слайд 4) .

3. Этап получения новых знаний

Объяснение нового материала (слайд 5 - 20)

Поисковая система - это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос, который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности.

Учащиеся называют поисковые системы, которые они знают.

Основные характеристики поисковых систем

    • Полнота. Полнота является одной из главнейших характеристик поиска, она представляет собой отношение цифры найденных по запросу информационных документов к их общему числу в интернете, относящихся к данному запросу. Чем полнее сам поиск, тем больше вероятность, что пользователь найдет именно тот документ, который ему необходим, конечно, если он вообще существует.
    • Точность. Точность определяет степень соответствия запросу пользователя найденных страниц в Сети. Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
    • Актуальность. Актуальность характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика. К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
    • Скорость поиска. Такая функция как скорость поиска теснейшим образом связана с так называемой «устойчивостью к нагрузкам». Ежесекундно к поиску обращается огромное количество людей, подобная загруженность требует значительного сокращения времени для обработки одного запроса. Тут интересы, как поисковой системы, так и пользователя целиком совпадают: посетитель хочет получить результаты как можно быстрее, а поисковая система должна отработать его запрос тоже максимально быстро, чтобы не притормозить обработку последующих запросов.
    • Наглядность. Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения. Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.

Каталог ссылок - это разбитый по темам список ссылок на сайты с их кратким описанием.

Группы ссылок в зависимости от широты тематики

    • общие
    • специализированные (тематические)

Группы каталогов ссылок:

    • закрытые каталоги — добавление сайтов в данный каталог может проводить только одно ответственное лицо.
    • белые каталоги — НЕ требуют обратную ссылку и СТАВЯТ прямую ссылку.
    • серые каталоги — ТРЕБУЮТ обратную ссылку и СТАВЯТ прямую ссылку.
    • черные каталоги — ТРЕБУЮТ обратную ссылку и НЕ ставят прямую ссылку.
    • каталоги сайтов с прямыми ссылками — при регистрации сайта в данном каталоге веб-мастер получает ответную прямую (без перенаправления) ссылку на свой сайт.
    • каталоги сайтов с ссылками — регистрация сайта в данном каталоге не даёт ссылки на регистрируемый сайт. Ссылки в таких каталогах даны через перенаправление (редирект).

Поисковая машина - это автоматическая система, которая хранит информацию об известных ей веб-страницах и выдает по запросу адреса тех из них, где встречаются введённые ключевые слова.

Ключевые слова - это набор слов и выражений, которые отражают требуемую информацию.

Самая основная задача каждой поисковой системы - доставить людям именно тот вид информации, который им нужен.

Именно поэтому специалисты-разработчики поисковиков делают принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.

Для того чтобы получить правильные ответы на подобные вопросы, разработчики поиска постоянно улучшают принципы ранжирования и его алгоритмы, добавляют им новые возможности и функции и любыми средствами пытаются сделать быстрее работу системы.

Первой компьютерной программой для поиска в Интернете была программа Арчи (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.

Первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» — бот Мэтью Грэя (Matthew Gray) из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса.

Поисковая система «WebCrawler», запущенная в 1994 году - первая полнотекстовая системаиндексирующая ресурсы при помощи робота («craweler-based»).

Система позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем.

Поисковая система «WebCrawler» - первый поисковик, получивший широкое распространение.

В 1996 году реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.

Типы поисковых систем:

    • Системы, использующие поисковые роботы. Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.
    • Системы, управляемые человеком (каталоги ресурсов).Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел.
    • Гибридные системы. Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.
    • Мета-системы. Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась.

Многие поисковые системы, такие как Google и Bing, используют алгоритмы выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате, веб-сайты показывают только ту информацию, которая согласуется с прошлыми интересами пользователя. Этот эффект получил название «пузырь фильтров». Всё это ведёт к тому, что пользователи получают намного меньше противоречащей своей точке зрения информации и становятся интеллектуально изолированными в своём собственном «информационном пузыре».

Учитель проводит опрос с целью выяснить самый популярный поисковик в классе и знакомит учащихся с рейтингом поисковых систем в России.

Язык запросов

Запрет перебора всех словоформ.

Обязательное присутствие слов в найденных документах.

Исключение слова из результатов поиска.

& - обязательное вхождение слов в одно предложение.

~ - требование присутствия первого слова в предложении без присутствия второго.

| - поиск любого из данных слов.

«» - поиск устойчивых словосочетаний.

$title - поиск информации по названиям заголовков.

$anchor - поиск информации по названию ссылок.

4. Динамическая пауза

(слайд 21-23) Проводится динамическая пауза с учащихся, которая состоит из трех групп упражнений гимнастики для глаз, снятия напряжения и утомления по методике Э. С. Аветисова.

5. Этап закрепления изученного материала с последующей самопроверкой.

(слайд 24-25) Учитель проводит с учащимся практическую работу по поиску в сети Интернет.

Практическая работа.

Задание 1.

Особенности поиска по группе слов.

Заполните таблицу, используя поисковую систему Яндекс.

Структура запроса

Количество найденных страниц

Скоростной! трамвай!

Скоростной + трамвай

Скоростной - трамвай

«Скоростной трамвай»

Сталинградская битва

Сталинградская & битва

$title (река Волга)

$anchor (река Волга)

Задание 2.

Найдите информацию об интересных фактах Волгограда в Интернете

1. Чем уникальна улица Ковентри в Волгограде?

2. Где расположен самый высокий памятник в мире, установленный реальному человеку? Укажите его размеры и фото.

3. Какой размер имеет самый длинный дом в Европе? Укажите его адреса и фото

4. Когда Волгоград переименовывается в "город-герой Сталинград" (точные даты)

5. Чему равна протяженность самой длинной улицы России, которая не имеет официального статуса улицы? Какое название она носит?

После выполнения работы, проводится проверка результатов работы, и ученики ставят себе оценку за урок.

Учитель контролирует ход выполнения работы учащихся, помогает учащимся, у которых не получается самостоятельно выполнить задание.

Учащиеся под руководством учителя проверяют результаты выполнения практической работы, анализируют полученные ответы, определяются с оценкой результатов работы.

Примерные ответы на практическую работу (слайд 26-31)

Оценивание практической работы

5 - верно даны ответы на задание 1, задание 2 выполнено полностью с пояснениями и фотографиями.

4 - в задании 1 допущены неточности в 1-2 ответах, на один или два из вопроса задания 2 дан неполный ответ.

3 - в задании 1 допущены неточности в 3-4 ответах, на три вопроса задания 2 даны не полные ответы или отсутствуют ответы на 2 вопроса

6. Подведение итогов урока, рефлексия урока, постановка домашнего задания

Учитель задает домашнее задание, при необходимости комментирует его.

Домашнее задание

Выучить лекционный материал

Учебник Л. Л. Босова, А. Я. Босова «Информатика 9»

Рабочая тетрадь Л. Л. Босова, А. Я. Босова «Информатика 9»

Учитель с учениками подводит итог урока, выставляет оценки и благодарит за урок, предлагает учащимся заполнить лист рефлексии урока.

Ответьте выборочно на 2-3 из предложенных вопросов:

    • сегодня я узнал
    • у меня получилось
    • у меня возникли трудности
    • я выполнял задания
    • я научился
    • теперь я могу

Используемые ресурсы:

Л. Л. Босова, А. Я. Босова «Информатика 9»

И.Г. Семакин, Л.А. Залогова, С.В. Русаков, Л.В. Шестакова «Информатика и ИКТ 9»

ПРОФЕССИОНАЛЬНЫЙ ПОИСК ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

Интернет-поиск – важный элемент работы в Сети. Точное количество веб-ресурсов современного интернета вряд ли кому-либо точно известно. В любом случае, счет идет на миллиарды. Для того чтобы можно было использовать информацию, необходимую в данный конкретный момент, не важно, в рабочих или развлекательных целях, сначала нужно ее найти в этом постоянно пополняемом океане ресурсов.

Для того чтобы интернет-поиск был успешным, должны быть выполнены два условия: запросы должны быть хорошо сформулированы и задавать их нужно в подходящих местах. Другими словами, от пользователя требуется, с одной стороны, умение переводить свои поисковые интересы на язык поискового запроса, а с другой – хорошее знание поисковых систем, доступных инструментов поиска, их достоинств и недостатков, что позволит выбирать в каждом конкретном случае наиболее подходящие средства поиска.

В настоящее время не существует какого-либо одного ресурса, удовлетворяющего всем требованиям к интернет-поиску. Поэтому при серьезном подходе к поиску неизбежно приходится задействовать разные инструменты, используя каждый в наиболее подходящем случае.

Основные средства интернет-поиска можно разделить на следующие основные группы:

Поисковые машины;

Веб-каталоги;

Справочные ресурсы;

Локальные программы для поиска в интернете.

Наиболее популярным средством поиска являются поисковые машины – так называемые интернет-поисковики (Search Engines). Тройка лидеров в общемировом масштабе достаточно стабильна – это Google, Yahoo! и Bing. Во многих странах к этому перечню добавляются собственные локальные поисковики, оптимизированные для работы с местным контентом. С их помощью теоретически можно найти любое конкретное слово на страницах многих миллионов сайтов. С точки зрения пользователя основной недостаток поисковиков – это неизбежное наличие информационного шума в результатах. Так принято называть попавшие по тем или иным причинам в список выдачи результаты, не соответствующие запросу.

Несмотря на многие различия, все интернет-поисковики работают по схожим принципам и с технической точки зрения состоят из похожих подсистем. Первая структурная часть поисковика – специальные программы, применяемые для автоматического поиска и последующего индексирования веб-страниц. Такие программы обычно называют пауками, или ботами. Они просматривают код веб-страниц, находят расположенные на них ссылки и тем самым обнаруживают новые веб-страницы. Есть и альтернативный способ включения сайта в индекс. Многие поисковики предлагают владельцам ресурсов возможность самостоятельно добавить сайт в свою базу. Как бы то ни было, затем веб-страницы скачиваются, анализируются и индексируются. В них выделяются структурные элементы, находятся ключевые слова, определяются их связи с остальными сайтами и веб-страницами. Производятся и другие операции, результатом выполнения которых становится формирование индексной базы поисковика. Эта база – второй главный элемент любого поисковика. Сейчас не существует какой-либо одной абсолютно полной индексной базы, которая содержала бы сведения обо всем контенте интернета. Поскольку разные поисковики используют разные программы поиска веб-страниц и строят свой индекс с помощью разных алгоритмов, индексные базы поисковиков могут существенно различаться. Некоторые сайты оказываются проиндексированными несколькими поисковиками, однако всегда остается определенный процент ресурсов, включенных в базу только какого-либо одного поисковика. Наличие у каждого поисковика такой оригинальной и непересекающейся части индекса позволяет сделать важное практическое заключение: если вы пользуетесь только одним поисковиком, пусть даже самым крупным, вы обязательно потеряете некоторый процент полезных ссылок.

Следующая часть интернет-поисковика – собственно программы поиска и сортировки результатов. Эти программы решают две основные задачи: сначала находят в базе страницы и файлы, соответствующие поступившему запросу, а затем сортируют полученный массив данных в соответствии с различными критериями. От эффективности их работы во многом зависит успех в достижении целей поиска.

Последний элемент интернет-поисковика – пользовательский интерфейс. Кроме обычных для любых сайтов требований к эстетике и удобству, к интерфейсам поисковиков предъявляется еще одно важное требование: они должны предлагать различные инструменты составления и уточнения запросов, а также сортировки и фильтрации результатов. Преимущества поисковых машин – великолепный охват источников, сравнительно быстрое обновление содержимого базы и хороший выбор дополнительных функций.

Главный инструмент работы с поисковиками – это запрос.

Для интернет-поиска используются также специальные приложения, устанавливаемые на локальном компьютере. Это могут быть как простые программы, так и довольно сложные комплексы поиска и анализа данных. Наиболее распространены поисковые плагины для браузеров, панели для браузеров, предназначенные для работы с каким-либо конкретным поисковым сервисом, и метапоисковые пакеты с возможностями анализа результатов.

Веб-каталоги – это ресурсы, в которых сайты распределяются по тематическим категориям. Если с поисковиками пользователь работает только посредством запросов, то в каталоге есть возможность просматривать тематические разделы целиком. Второе принципиальное отличие каталогов от автоматических поисковиков – это то, что в их наполнении, как правило, непосредственно участвуют люди, которые просматривают ресурсы и относят сайт к той либо иной категории. Веб-каталоги принято делить на универсальные и тематические. Универсальные стараются охватить максимум тем. В них можно найти все, что угодно: от сайтов о поэзии до компьютерных ресурсов. Другими словами, широта поиска у них максимальная. Тематические же каталоги специализируются на определенной тематике, обеспечивая за счет сокращения широты охвата ресурсов максимальную глубину поиска.

Преимущества каталогов – сравнительно высокое качество ресурсов, поскольку каждый сайт в нем просматривается и отбирается человеком. Тематическая группировка сайтов позволяет удобно располагать сайты близкой тематики. Такой режим работы хорош для обнаружения новых для вас сайтов по интересующей теме – он точнее применения поисковой машины. Веб-каталоги рекомендуется использовать для первого знакомства с какой-либо предметной областью, а также поиска по нечетким запросам – у вас будет возможность «побродить» по разделам каталога и точнее определиться с тем, что именно вам требуется.

Недостатки веб-каталогов известны. В первую очередь, это медленное пополнение базы, поскольку включение сайта в каталог предполагает участие человека. В отношении оперативности веб-каталог – не соперник поисковикам. Кроме того, веб-каталоги существенно уступают поисковикам по размерам баз.

Говоря о интернет-поиске, нельзя обойти вниманием ряд терминов, которые тесно связаны с этой сферой и часто используются для описания и оценки поисковиков. Например: широта и глубина интернет-поиска. Широким называют поиск, который захватывает как можно большее количество источников информации. При этом достаточным считается хотя бы упоминание о том или ином подходящем запросу сайте. Глубина поиска относится к подробности индексирования и последующего поиска каждого конкретного ресурса. Например, многие поисковики по-разному подходят к индексированию разных сайтов. Крупные и популярные сайты индексируются в максимальном объеме, роботы стараются не упустить ни одной страницы такого ресурса. В то же время на других сайтах может быть проиндексирована только заглавная страница и пара страниц содержания. Эти обстоятельства, естественно, сказываются и на последующем поиске. Глубокий поиск работает по принципу «лучше включить в результаты лишнюю информацию, чем упустить какие-либо относящиеся к теме поиска данные».

Достаточно часто можно встретить такие понятия, как глобальный и локальный интернет-поиск. При локальном интернет-поиске учитывается географическое местоположение пользователя и предпочтение отдается результатам, так или иначе связанным с конкретной страной или местностью. При глобальном поиске эта информация не учитывается, и поиск ведется во всех доступных ресурсах.

При составлении запроса на интернет-поисковиках действуют различные режимы поиска. К типовым режимам поиска, которые встречаются на большинстве интернет-машин, можно отнести простой и расширенный поиск. Простой поиск позволяет в одном запросе указать только один поисковый признак. Расширенный поиск дает возможность составить запрос из нескольких условий, связав их логическими операторами.

Для уточнения поисковых запросов используются различные фильтры . Фильтрами называют те или иные вспомогательные средства составления запроса, которые не относятся к содержательной стороне условий запроса, а ограничивают результаты поиска каким-либо формальным признаком. Так, например, применяя при поиске фильтр типа файла, пользователь не сообщает системе сведений, относящихся к теме своего запроса, а просто ограничивает полученные результаты определенным типом файлов, указанным в условии своего запроса.

Для большинства пользователей универсальные поисковики являются основным, а зачастую и единственным средством интернет-поиска. Они предлагают хороший охват источников, а также набор инструментов, достаточный для решения основных поисковых задач.

Рынок универсальных поисковиков достаточно велик. Мы постарались проанализировать наиболее известные поисковые системы, а результаты представили в виде таблицы 1.

При выборе универсального поисковика важную роль играет качество находимых с его помощью ресурсов. Определить предпочтительный для конкретных задач поисковик можно «методом маркера». Суть его состоит в том, что вначале составляется некий тематический поисковый запрос, после чего опрашивается группа людей – экспертов в данной области на предмет выявления лучших, по их мнению, интернет-ресурсов по избранной теме. На основе данных опроса формируется список сайтов-маркеров, гарантированно релевантных запросу и содержащих качественную информацию. Затем запрос отправляется на тестируемые поисковики. Логика оценки проста: чем выше в результатах поиска будут расположены сайты-маркеры, тем лучше конкретный ресурс подходит для поиска информации по тестовой теме.


4. Глобальная сеть Интернет: поиск информации в сети

Интернет (англ. Internet, от Interconnected Networks – объединённые сети) – глобальная телекоммуникационная сеть информационных и вычислительных ресурсов. Служит физической основой для Всемирной паутины. Часто упоминается как Всемирная сеть, Глобальная сеть, либо просто Сеть. Когда сейчас слово Интернет употребляется в обиходе, то чаще всего имеется в виду Всемирная паутина и доступная в ней информация, а не сама физическая сеть. За последние годы Всемирная паутина стала настолько популярной, что сейчас Интернет является одним из основных средств публикации информации.

Основная цель пользователя при работе с сетью Internet – это получение информации, так как в первую очередь Internet является гигантским информационным ресурсом. Целенаправленный поиск явно или неявно требует формулировки цели поиска, понимания того, что является объектом поиска, обоснованного выбора средства поиска и эффективной методики.

В качестве объекта поиска может рассматриваться любая информация, если имеется возможность представления ее в Internet. Это могут быть телефоны и адреса, информация о товарах и услугах, радио и теле трансляции, методическая литература, учебные курсы, конспекты лекций, аналитические обзоры, графические материалы, файлы мультимедиа, программное обеспечение, и многое другое.

Поиск информации в сети – это последовательность действий, от определения предмета поиска, до получения ответа на имеющиеся вопросы с использованием всех поисковых сервисов, которые предоставляет сегодня Internet.

Средствами для нахождения информации в Интернете являются справочно-поисковые системы. Все существующие типы справочно-поисковых систем в Интернете могут быть разделены на следующие группы:

Системы Web‑поиска;

Системы поиска FTP‑файлов;

Системы поиска в архивах Gopher;

Системы поиска в Usenet;

Каталоги;

Порталы.

Каждая поисковая система индексирует страницы серверов особым способом, приоритеты в поиске по индексам тоже отличаются от других систем, поэтому запрос по ключевым словам и выражениям в каждой из поисковых систем может дать разные результаты.

Методика поиска включает правила формирования запроса на поиск, методы сужения области поиска, управление процессом поиска, выбор формы представления результатов. Существует два основных метода поиска информации в Internet – с использованием поисковой машины или с использованием каталога. При этом сам механизм поиска в обоих случаях практически одинаков. Различия возникают при составление списка ключевых слов: для поисковой машины – это составление списка ключевых слов, а для каталога на этом этапе производится определение тематики разделов, в которых может находиться необходимая информация.

4.1 Проблема поиска и поисковые системы

В закромах Internet находятся миллиарды Web‑страниц, терабайты информации в различных файлах, но вся проблема в том, что для получения нужной информации необходимо указать ее точный адрес – URL, который состоит из доменного имени (либо IP‑адреса), пути к файлу и имени файла. Если мы найдем такой URL, то без труда введем его в адресную строку программы Internet Explorer и увидим нужную Web‑страницу, либо скачаем файл. В минимальном варианте нам необходимо знать хотя бы доменное имя ресурса, а затем, щелкая по гиперссылкам, мы сможем добраться до действительно нужной нам информации.

Как найти адрес (URL)? Способов несколько. Самый простой способ – это увидеть доменные имена в различных рекламных материалах. Как правило, указывается короткий адрес, состоящий только из доменного имени, что-то наподобие: http://www.1tv.ru или еще короче: 1tv.ru.

Но как быть, если адрес совершенно неизвестен? Например, необходимо найти расписание поездов дальнего следования на лето. Для этого обратимся к хранилищам таких адресов, к специальным поисковым системам. Поисковые системы выполнены в виде Web‑страниц, но на этих страницах располагается не информация как таковая, а аннотированные ссылки на другие ресурсы (страницы, сайты). Для вызова поисковой системы необходимо в адресной строке программы, например Internet Explorer указать ее адрес. Поисковых систем в сети Internet сейчас достаточно много. В таблице ниже перечислены лишь наиболее популярные поисковые системы.

Первый этап работы поисковой системы – это индексирование информации, находящейся в Internet. Сетевой робот поисковой системы просматривает огромное количество страниц и заносит адреса и краткое содержание этих страниц к себе в базу данных, точнее в поисковый индекс. Владельцы сайтов будут очень рады, если их сайт просмотрит сетевой робот. Для того, чтобы робот обязательно просмотрел сайт и внес его в поисковый индекс, владельцы сами регистрируют свои сайты в поисковой системе (как правило, в нескольких поисковых системах). Процесс занесения адреса и описания страницы в поисковую систему называется индексация. Таким образом, когда спросите поисковую систему о том, где находится расписание поездов дальнего следования на лето, она не будет лихорадочно искать совпадения в огромной сети Internet, а всего лишь поищет в своем заранее подготовленном поисковом индексе, причем сделает это очень быстро.

Второй этап работы поисковой системы – это выдача накопленной и отобранной, отсортированной и классифицированной информации по запросам пользователей. Рассмотрим эту работу с наиболее популярной поисковой системой Яндекс.

4.2 Поиск по ключевым словам

Наиболее простым и результативным поиском является поиск по ключевым словам. Разберемся с правилами поиска по ключевым словам в поисковой системе Яндекс (рис. 15).

В других системах эти правила могут отличаться, но основные положения будут идентичны. Основной алгоритм поиска следующий: введите ключевые слова в поле запроса (например, расписание поездов), нажмите кнопку Найти. После нажатия кнопки Найти, Поисковая система выведет список ссылок на документы, наиболее точно соответствующие запросу.


Рисунок 15 – Заглавная страница поисковой системы Яндекс

1. Поисковая форма. Главный ее элемент – поле запроса.

2. Статистика поиска: число найденных документов и частота заданных в запросе слов.

4. Результаты поиска – список найденных ссылок. Для каждого документа выдается следующая информация: заголовок – ссылка на ресурс, краткая аннотации ресурса (страницы), найденные слова, похожие документы, еще с сайта, и, если найденный сайт описан в каталоге, переход в соответствующую рубрику каталога. Кроме этого, информация о размере, дате документа, URL документа.

5. Переход на следующие страницы результата (нужно щелкнуть по номерам страниц). Сортировка по убыванию дат (первоначально список сортируется по ревалентности, то есть по степени соответствия результата запросу).

6. «Колдунщик запросов». Здесь даются советы и предложения по уточнению вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

7. Популярные находки наших пользователей – ссылки на документы, выбранные пользователями по этому запросу (выводится только при точном соответствии).

8. Возможность поискать в других русскоязычных поисковых машинах.

9. Результат поиска в новостных лентах информационных агентств (выводится только при точном соответствии запросу). При высоком соответствии и актуальности эта секция может оказаться над результатами поиска.

11. Результат поиска в энциклопедических статьях (выводится только при точном соответствии запросу).

12. Результат поиска в базе товарных предложений магазинов (выводится только при точном соответствии запросу).

13. Метками R1‑R5 на рисунке помечены различные рекламные блоки.

Поскольку в поисковой системе очень много различной информации, то результат поиска по фразе «расписание поездов» очень обширен, для облегчения нахождения нужной информации его следует уточнить, для этого давайте рассмотрим, что для этого предусмотрено в поисковой форме (рис. 16).

Рисунок 16 – Поисковая форма системы Яндекс

Флажок «в найденном» позволяет искать в результатах предыдущего запроса. Например, по запросу расписание поездов система выдала 300 тыс. страниц, мы вводим следующий запрос дальнего следования и устанавливаем флажок «в найденном» – теперь поиск будет вестись среди этих 300 тыс. страниц. Ограничить область поиска можно, щелкнув по ссылкам Каталог, Новости, Маркет, Энциклопедии, Картинки. Щелчок по нужной ссылке заменяет нажатие кнопки Найти. Удобно сужать область поиска для нахождения картинок, например, введите в поисковое поле Путин и щелкните по ссылке Картинки. Для поиска картинки можно также указать желаемый размер картинки от значения «Мелочь» до «Огромные». Ограничивая область поиска, тем самым отсекаем часть заведомо ненужной нам информации. Но часто бывает необходимость вести поиск во всей базе, но для отсечения ненужной информации приходится вводить различные дополнительные сведения. Для этого служит Расширенный поиск. Он включается щелчком по ссылке «расширенный поиск», либо по значку «+» (рис. 17).

Эта страница позволяет Вам более тонко указать условия поиска. Важно то, что найденные в результате документы будут соответствовать сразу всем условиям, поставленным Вами. Давайте разберемся с особенностями ввода условий расширенного поиска.

Рисунок 17 – Страница ввода условий расширенного поиска


1. Поле запроса – введите слова, которые обязательно должны быть в найденных документах, перед словами, которых не должно быть в документах поставьте знак минус (пробел ставьте до знака, но не после), например, – электричка.

2. Расположение слов относительно друг друга – подряд, в одном предложении, не очень далеко (в пределах нескольких строк), на одной странице.

3. Расположение слов на странице – где угодно (в любом месте страницы), в заголовке (заголовок страницы отображается в заголовке окна программы Internet Explorer, то есть в синей полосе), в тексте ссылки (слово является гиперссылкой), также можно указать адрес, куда ведет данная ссылка – таким образом, удобно искать те страницы, которые ссылаются на данную.

4. Форма употребления слов. Поисковая система умеет склонять (спрягать) введенное слово и по умолчанию находит документы, в которых встречаются все формы слова. Если Вы выберите «точно так, как в запросе», то поисковая система будет искать только введенную Вами форму слова. Это удобно при поиске цитат.

5. Язык страницы – укажите язык, на котором должна быть выполнена страница. Язык содержится в невидимом пользователю заголовке страницы. В базу поисковой системы вносятся документы русскоязычного Интернета, находящиеся в доменах su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz, а также зарубежные сайты, представляющие интерес для русскоязычного поиска.

6. Дата страницы – укажите любой из предложенных вариантов, либо введите период (даты начала и конца), в пределах которого должна находиться дата документа.

7. Формат документа. Все Web‑страницы имеют формат HTML, то есть выполнены с использованием языка разметки гипертекста, однако, в сети Internet присутствуют документы и другого формата, которые также можно просматривать с помощью программы Internet Explorer: PDF – файл публикации, DOC – документ, созданный в программе Microsoft Word, RTF – форматированный текст (универсальный формат).

9. Страницы находятся на сайте – укажите доменное имя сайта.

10. Страницы похожи на страницу – укажите URL страницы-образца.

В нижней желтой панели «Итого:» полностью сформулирован запрос. Поскольку мы ищем «свежее» расписание движения поездов, то можно воспользоваться условием Дата страницы.

4.3 Язык запросов Синтаксис языка запросов. В поисковой системе существует специальный язык запросов, использовать который более сложно, чем форму расширенного поиска, но при его использовании можно получить наилучший результат. Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и специальные символы, позволяющие установить взаимосвязи между этими словами и ввести дополнительные параметры. Большинство этих символов представлено в табл. 1.

Таблица 1 – Синтаксис языка запросов системы Яндекс

Пример__«»

поиск фразы

«красная шапочка»
(эквивалентно красная /+1 шапочка)

+ обязательное наличие слова в найденном документе +быть или +не быть
~~ или – не должно быть слова в пределах документа (И НЕ) путеводитель по парижу ~~ (агентство | тур)
~ не должно быть слова в пределах предложения (И НЕ) банки ~ закон
! искать только указанную форму слова ! Путин
пробел или & логическое И (в пределах предложения) фабрика звезд
&& логическое И (в пределах документа) музыка && (фабрика звезд)
| логическое ИЛИ рисунок | картинка | фото | коллаж
/(n m) расстояние между словами (-назад +вперед)

поставщики /2 кофе
музыкальное /(-2 4) образование
вакансии ~ /+1 студентов

Проблемы