регистрация | карта сайта
Постоянно обновляемая лента новостей
Обзоры, комментарии и статьи
Даты и дополнительная информация о событиях компьютерного рынка
Контакты, виды деятельности, предложения и другая информация о компьютерных компаниях
Новости, анонсы и пресс-релизы компьютерных компаний
Конференции с участием ведущих специалистов и экспертов
Информация для пользователей ITware, изменения персональных настроек, персональные закладки и web-карточки, служба переадресации
   
    
     Как искать?   Расширенный поиск
 ITware :. Публикации :. Публикация      Вход для зарегистрированных пользователейВыход
Разделы
Software (84)
Hardware (76)
Internet и Жизнь (80)
Бизнес (69)
Телекоммуникации (56)
Архив за 2003 г.
Янв Фев Мар Апр
Май Июн Июл Авг
Сен Окт Ноя Дек
архив за 2002 г.
архив за 2001 г.
архив за 2000 г.
Поиск
Контакты
Редакция:

Web-мастер:

 
Реклама



Язык до сайта доведет

18 апреля 2003 г.

На правильно составленный запрос любая поисковая система в Интернете откликнется максимально быстро и наиболее эффективно. Но для получения такого ответа заранее изучите язык, на котором вы c ней поймете друг друга с полуслова.

В обычной жизни мы постоянно что-нибудь ищем √ книгу, товар, деньги, счастье... И при этом стараемся руководствоваться придуманной задолго до нас общепринятой логикой. Естественно, цель поиска и время, затраченное на получение желаемых результатов, являются связанными между собой звеньями одной цепочки. Чем меньше времени ушло на поиск, тем быстрее можно воспользоваться его результатами. И как это справедливо по отношению к нахождению важных для нас сведений в Интернете! Нельзя терять время, там оно действительно превращается в деньги, затраченные на доступ к провайдерскому серверу. Ежедневно армия новых пользователей осваивает хитросплетения Сети, чтобы получше реализовать ее огромные и уникальные возможности. На одном из первых мест по объемам среди ищущих √ старательные учащиеся всех категорий, денно и нощно выуживающие из Сети рефераты и курсовые. Им, как, впрочем, и работающей бизнес-братии, порой невдомек, что время на поиск можно свести к минимуму, если заранее узнать правила обращения с поисковыми машинами и говорить на "их" языке. Итак, в чем же секреты успешного поиска информации в Сети?

"Анатомия" поисковика

Нахождение сведений по вашему запросу в Сети возможно благодаря большому количеству поисковых систем, которые предоставляют обнаруженную информацию. Поисковики состоят из трех основных частей: робота, индекса и обработчика запросов.

Робот √ это программа, которая посещает вэб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Другое название такой программы √ Crawler ("Паук"). Робот возвращается через определенные периоды времени (например, каждый месяц) в изученное место и снова знакомится с изменениями на нем. Все, каждую просмотренную страницу, "Паук" заносит в индекс поисковой машины в виде встречающихся там значащих слов.

Индекс поисковой машины √ это огромнейшая база данных, с помощью которой можно быстро узнать, на какой именно странице в Сети встречается данное слово. Чтобы хоть приблизительно представить ее размеры, скажем лишь, что объем индекса поисковой системы Yandex.ru на момент написания этой статьи уже составлял 393,08 Гбайт.

Обработчик запросов ищет нужное слово или группы слов в индексе. Это программа, которая в соответствии с требованиями пользователя в поисках информации перебирает индексы и выдает сведения в порядке убывания релевантности (соответствия запросу). То есть любая система, получившая запрос, ищет ответ на него не по всему Интернету. Понимание этого приводит к выводам, что из-за постоянно растущего числа сайтов роботы не всегда успевают оперативно пополнять базу данных. Проиндексированные вэб-страницы могут поменять содержимое прежде, чем туда снова "придет" робот. К тому же есть определенные страницы сайтов, не индексируемые поисковиками. К ним относятся выполненные по технологии Macromedia Flash (мультимедийные проекты различного уровня сложности), динамические страницы вида .asp, .php, .pl, /cgi-bin/ и т. д.

Кроме того, определенная часть Интернета для поисковых машин как бы "закрыта". Это информация, доступ к которой разрешен только по паролю, а также базы данных, куда осуществляется вход по запросу из формы (а не по ссылке).

Эти выводы должны подвигнуть к тому, чтобы попробовать искать на другом поисковике при неудачном исходе на каком-либо из них. А если вам нужны сведения со страниц, которые находятся вне русскоязычного сегмента Сети (не в национальных доменах .ru, .su, .ua, .by, .kz, .kg, .uz, .ge, .md, .am ), то вашими помощниками, скорее всего, станут зарубежные службы Yahoo! или AltaVista.

"Купуйте українське"

На первый взгляд, наш сегмент Интернета никто не должен "знать" лучше, чем отечественные поисковые машины. На практике это не совсем так. Скажем, при поиске на одном из них по запросу "банки в Украине" среди найденных страниц оказались сайты Киевского и Николаевского зоопарков. Но сочтем это досадным недоразумением.

Какие же особенности украинских порталов следует учесть для большего эффекта? Есть слова, у которых написание на русском и украинском языках совпадает. Например, слово "лист" в украинском языке имеет значение "письмо". А слова-омонимы пишутся одинаково, но имеют разное значение ("ключ журавлиный" и "ключ от Audi"). Частично устранить эту неразбериху поможет оператор нормальной формы (восклицательный знак в запросе перед "подозрительным" словом). А при поиске по фразе омонимия языка практически не влияет на результаты.

Статистика на UAport свидетельствует, что чаще всего используют для поиска слово "работа". Безусловно, хорошей карьеры и материального удовлетворения многим в жизни недостает, но большинство зашедших туда доподлинно не знают, чем же еще может быть полезен Интернет. А вот работу или хороших сотрудников лучше искать на специальных сайтах (www.rabota.com.ua, www.careers.com.ua и др.), при этом обращая внимание на ресурсы, указанные в первой десятке или двадцатке найденных.

Зайти в каталог сайтов фактически любой области Украины и даже в раздел "Европоиск", где собрана замечательная коллекция ссылок на поисковики свыше 50 стран с описанием каждого из них, можно на www.meta-ukraine.com.

Информация в каталогах представлена достаточно удобно. Так, сайты на www.bigmir.net распределены по категориям: Бизнес и финансы, Компьютеры, Авто/Мото, Новости, Порталы, Развлечения, Спорт, Связь, Работа. Каждый сайт имеет свое место в общем рейтинге.

Никто не в состоянии запретить искать музыку в формате MP3 и слова, к примеру, "Червоної рути" на порталах Yahoo! или AltaVista. Даже о конституционных правах украинцев можно осведомиться там. Только вот ресурсы, где найдется нужное, все равно окажутся украинскими!

Хорошо отыщутся вышеупомянутыми поисковиками англоязычные термины или аббревиатуры. Так, на запрос "MMS" они сходу "выдали" страницы операторов сотовой связи и производителей телефонов с поддержкой этой функции.

Правила поиска на зарубежных порталах практически те же, что и на отечественных, ведь Сеть и ее поисковики родом "оттуда". Они предоставляют расширенный поиск (не соблазняйтесь: ничего особо "расширенного" там нет). Можно искать, включая все введенные слова, фразу или исключив некоторые. На Yahoo! кнопка More оptions позволит выбрать язык, страну, дату искомых документов. Можно попытаться найти определенную страницу сайта (Search by URL (Web Address).

Как нам предоставляют результаты?

Итак, вы получили ссылки на документы, по умолчанию уже отсортированные по релевантности. Посмотрите их описание: оно сообщит больше половины информации о найденном ресурсе и позволит решить, стоит ли его вообще открывать.

Оцените каждый адрес. Если нужна официальная информация, например технические характеристики офисной техники Siemens, лучше не обращать внимания на страницы с бесплатных серверов (типа narod.ru или boom.ru). Скорее всего, вас удовлетворит официальная страница фирмы или ее дилеров, которая обычно расположена в доменах уровней .ru., .ua или .com.

Обратите внимание и на дату, сопровождающую ссылку. Правда, не исключено, что даже если документ проиндексирован недавно и размещается в Сети, то он содержит устаревшую и поэтому бесполезную для вас информацию.

Возможно, целью вашего запроса является более объемная статья на определенную тему? Большинство поисковиков в результирующем отчете указывают размер найденного документа и число страниц, а иногда и названия документов (скажем, на Рамблере).

Несомненно, полезным в отчете является указание рубрики каталога, к которой относится найденный сайт (если он находится в каталогах на Aport, Yandex).

Кто знает, может, для вас важно знать город или страну, в которой зарегистрирован тот или иной сайт? Такой сервис есть в представлении результатов на Aport.

Практически каждый поисковый сервер оказывает услуги расширенного поиска. Это позволяет отрегулировать предоставление результатов. Так, при составлении запроса на Yandex (www.yan- dex.ru/advanced.html) возможности формы позволяют установить словарный фильтр для страниц, ограничить поиск по датам, исключить результаты с определенных сайтов, искать страницы, содержащие файлы объектов только данного типа (скрипты, апплеты), с картинками или без, со ссылками на URL и т. д. И не откажите себе в удовольствии получать ссылки на странице отчета в количестве 10, 25, 50 или 100 сразу.

Расширенный поиск на Рамблере имеет свои плюсы √ возможность сортировать страницы по дате или релевантности, выводить результаты в стандартной, краткой, детальной формах.

Итог зависит от намерений
Еще пару лет назад аналитики из Яndex, проанализировав первую десятку популярных слов к своему поисковому серверу, пришли к выводу, что ленивые студенты и школьники уже не пишут сами рефераты и дипломы, а "самые частые гости в Сети √ маньяки, лентяи и безработные". Лишь небольшая часть обращений к поисковым серверам содержит более двух слов и при этом корректно использует принятый на них язык запросов. Создается впечатление, что help-файлы к поисковым системам читают единицы из сотен тысяч, а большинство пользователей даже не задумывается о наличии языковых возможностей. Стоит заметить, что процент "интеллектуальных" запросов с тех пор несколько возрос, а состав рейтинговых слов свидетельствует, что все больше людей пытаются использовать Интернет с "серьезными намерениями".

Что можно посоветовать в такой ситуации? Во-первых, разделяйте свои информационные потребности на две категории √ стабильные и новостные. Для первой (поиска книг, рефератов, статей) используйте мощные поисковые системы, список которых общеизвестен. Однако чем больше ресурсов они охватывают, тем продолжительней период обновления информации на них. Поэтому для решения второй задачи лучше использовать специальные новостные сайты или разделы на поисковых серверах.

Во-вторых, ознакомьтесь с инструкцией на выбранном поисковике, начните с составления простых запросов, постепенно расширяя и уточняя их. Используйте логические или контекстные операторы, поиск по полям и т. п.

И, в-третьих, обязательно применяйте средства ранжирования выдачи. Это позволит быстрее оценить результаты, особенно когда их объемы превышают все разумные рамки.

А если не нашел?

Если после всяческих ухищрений, используя максимум возможностей порталов и ловко составленных запросов, вы так и не нашли необходимую информацию, нужно, не теряя времени, обратиться к специализированным поисковым системам.

Предположим, если финансовые новости и фондовые индексы для вас √ жизненно важная информация, вашим спасением окажется ресурс finance.com.ua. Здесь √ безналичные и наличные показатели, курсы валют нерезидентов, события на рынке ценных бумаг и облигаций Украины, ближнего и дальнего зарубежья, обзор аграрного рынка и море другой специфической информации.

Ну а если вам надо взять кредит или отправить деньги на депозит, а времени для хождения по банкам и выяснения условий кредитования каждого из них, как обычно, нет? На портале www.uabanker.net для вас уже собраны ссылки на страницы украинских банков. На своем ресурсе практически каждый из них указал телефон, по которому можно узнать любые подробности из первых уст. На этом портале есть ссылки

на различные ассоциации банков, на сайт Минфина Украины, сайты мировых банков. Только не запутайтесь в Сети!

Правила языка запросов
Наиболее распространенными для большинства поисковых систем являются команды так называемого поиска по маске, которые обозначаются символами "*" или "?". Знаком "?" в ключевом слове запроса заменяют один символ, на место которого может быть подставлена любая произвольная буква, а знаком "*" √ некая последовательность символов.

Допустим, вы забыли, как пишется слово "реализация". Не обязательно лихорадочно перерывать орфографический словарь в поисках правильного варианта, вполне достаточно указать в тексте запроса символ "?" вместо забытой буквы, например, следующим образом: "р?ал?зация".

Поисковый сервер самостоятельно расставит недостающие буквы по своим местам. Если же необходимо найти документы, содержащие любые возможные производные от слова "контакт", можно использовать вместо его окончания знак "*": контакт*.

Тогда будут найдены также слова "контакт", "контактный", "контактировать" и т. д., то есть все однокоренные со всевозможными окончаниями, автоматически подставляемые на место звездочки.

Команды "+" и "√" позволяют принудительно добавлять или исключать какие-либо слова из текста запроса. Слово, помеченное знаком "+", должно непременно присутствовать в искомом документе, а символом "√"═√ обязательно отсутствовать. Например, если вы хотите найти объявления о продаже недорогих автомобилей марки "Запорожец", задачу лучше сформулировать так: "продам Запорожец + недорого". Поисковая система будет искать все сообщения о продаже автомобилей, в тексте которых встречаются именно эти слова.

Предположим, вам необходимо разыскать в Интернете информацию о мониторах LG Flatron, но при этом хотелось бы исключить из результатов поиска сообщения об их продаже и любую рекламу на эту тему. В этом случае запрос следует составить примерно так: "монитор LG Flatron √ компьютерный √ магазин √ продажа".

Оператор "логическое И", обозначающийся знаком ампресанд (&), позволяет перечислять слова, которые должны встречаться в пределах только одного предложения. Например, запрос "коммерческое & предложение" заставит поисковик найти предложения, содержащие оба этих слова. Правда, в файл отчета попадут документы, в тексте которых искомые обозначения будут стоять как рядом, так и на расстоянии нескольких слов. Причем с точки зрения поискового механизма степень релевантности тем выше, чем ближе друг к другу в обнаруженной фразе стоят искомые слова. Поэтому ссылки на документы, точно содержащие заданные выражения, будут размещены в начале файла отчета, а затем √ все остальные варианты.

Если нужно найти документы, в которых фраза должна строго совпасть с введенной вами, используйте кавычки. Очень часто такой прием помогает при поиске фразы из какого-либо известного источника. Например, запрос "горе от ума", скорее всего, приведет в отчете поисковика на страницу с упоминанием о произведении Грибоедова. Хотя следует запомнить, что союзы "и", "от" и др. могут расцениваться поисковой машиной как малозначительные или неинформативные и не учитываться при поиске.

Оператор "логическое ИЛИ", передающийся, в частности, символом "|", позволяет искать документы, в тексте которых содержится только одно из перечисленных слов. Например, по запросу "рисунок | изображение | иллюстрация" будут найдены все файлы, в которых встречается одно из трех упомянутых слов.

Символ "тильда" (~), как правило, описывает действие, аналогичное действию знака "√", то есть исключает из искомого документа отмеченные подобным образом слова. Так, в ответ на запрос "программное обеспечение ~ цена" поисковик выдаст список документов, в которых есть словосочетание "программное обеспечение", но нет слова "цена".

Удвоение какой-либо команды означает, что ее необходимо применять не к одному предложению, а ко всему документу в целом. Например, запрос "столица Турции √√ турфирма" означает, что нужен список файлов, в которых встречаются слова "столица" и "Турции", но отсутствует "турфирма" в пределах всего документа, где они были обнаружены.

А запрос "строительные && материалы" указывает поисковику, что в файл отчета необходимо включать все документы, в тексте которых есть оба эти слова независимо от того, расположены они в одном предложении или разбросаны по тексту. Логические операторы языка запросов можно комбинировать. Для этих целей служат символы открывающей и закрывающей скобки. Например, запрос "музыка & (beatles | битлз)" означает, что пользователь ищет документы, содержащие либо слова "музыка" и beatles, либо слова "музыка" и "битлз". В некоторых случаях комбинировать операторы можно и без использования скобок. Например, фраза "легковые & автомобили && Mercedes √ новые" означает, что ищутся документы, в которых встречаются слова "легковые" и "автомобили" в пределах одного предложения, слово Mercedes в пределах всего текста и нет ни одного

слова "новые".

Если в строке запроса вы напечатали слово с маленькой буквы, то будут найдены слова с маленькой и большой буквы; в противном случае √ только с большой. Поэтому во избежание ошибок рекомендуется всегда вводить запрос строчными буквами, используя заглавные лишь для названий или имен. Есть и исключения (например портал www.uaport.net), где вы можете набирать даже комбинацию букв "ТЕЛЕвизиОННая ПРОГрамма", если так нравится: результат от этого зависеть не будет . Приведенные примеры использования языка запросов являются наиболее общими для всех поисковых машин. Зная их, вам станет проще удовлетворить свои "интеллектуальные нужды", не тратя времени на изучение страниц.




© ICC. Перепечатка допускается
только с разрешения .
Новости Публикации Календарь событий Пресс-центр
IT-каталог: продукты IT-каталог: компании Библиотека
Форум Персональные сервисы Регистрация Карта сайта
Звуки му последнее представление в киеве