Домашний_компьютер - Домашний компьютер №8 (122) 2006 Страница 36

Тут можно читать бесплатно Домашний_компьютер - Домашний компьютер №8 (122) 2006. Жанр: Компьютеры и Интернет / Прочая околокомпьтерная литература, год неизвестен. Так же Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте Knigogid (Книгогид) или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.

Домашний_компьютер - Домашний компьютер №8 (122) 2006 читать онлайн бесплатно

Домашний_компьютер - Домашний компьютер №8 (122) 2006 - читать книгу онлайн бесплатно, автор Домашний\_компьютер

Кроме поисковых машин существовали еще и сайты-каталоги (они же рубрикаторы, они же директории). Каждый сайт в них был отнесен к тому или иному разделу, и пользователь, углубляясь в интересующем направлении (например, Каталог/Культура/Музыка/Классическая музыка), сам должен был находить нужные ссылки и описания. В сайтах-рубрикаторах, разумеется, был и встроенный поиск по каталогу – по названию и краткому описанию сайта. Большинство каталогов были пре– или постмодерируемыми. Наиболее известным на Западе сайтом такого типа стал Yahoo!, появившийся в 1995 году и до сих пор являющийся одним из наиболее посещаемых ресурсов в мире. Попасть в его базу было непросто, и это считалось довольно почетным. Конечно, поисковые машины и каталоги были конкурирующими идеологиями, но для конечного пользователя они, скорее, дополняли друг друга. В конце концов, эти два способа упорядочивания Сети слились – так в 2004 году появился сервис Yahoo! Search (Yahoo купила в 2002 году Inktomi, a в 2003 – Overture, которая к тому времени владела, в свою очередь, проектами Altavista и появившимся в 1999 году AllTheWeb), такая же судьба постигла и остальные дожившие до наших дней проекты. А до запуска своего поиска Yahoo! использовала поисковые возможности героев следующей главы нашего рассказа.

1998

Именно в этом году возникла очередная поисковая машина, которой было суждено если не перевернуть представления о поиске, то, во всяком случае, показать миру, какой потенциал таит в себе эта отрасль. Большая цифра – единица со ста нулями – называется по-английски Googol (гугол). После небольшой обработки напильником это слово превратилось в Google. Согласно официальной легенде, название отражает стремление компании организовать и упорядочить сколь угодно большие объемы информации.

«Гугл» был основан выпускниками Стэндфордского университета Ларри Пэйджем (Larry Page) и выходцем из России Сергеем Брином. Разработка началась еще в 1996 году – именно тогда были заложены основы системы PageRank – алгоритма расчета авторитетности страницы. Система была основана на подсчете количества и «веса» ссылок, ведущих на тот или иной ресурс. Создатели Google предположили, что на интересный, полезный или популярный сайт ссылаться должны чаще, чем на скучный и одноразовый.

Первоначальные вложения в проект составили около 1 миллиона долларов. В сентябре 1998 года система, стартовавшая в статусе бета-версии, уже тогда обрабатывала десятки тысяч запросов в день. На поисковик обратили внимание интернет-гиганты AOL (купивший к тому времени портал Netscape) и Yahoo!. Каждый, в свою очередь, интегрировал поиск Google на свои порталы, и к концу 2000 года сервис обрабатывал до 100 миллионов (!) запросов ежедневно. (После обособления Yahoo! нагрузка снизилась, сегодня Google отвечает примерно на 50 миллионов запросов в день.)

Успех Google был во многом обусловлен качественным поисковым алгоритмом. Любая поисковая машина, разрастаясь, рискует стать свалкой. Сайты рождаются и умирают, их популярность изменяется, а кроме того, всем хочется всплыть на первую страницу результатов поиска, поэтому многие веб-мастера прибегают к так называемому «поисковому спаму» (о нем мы еще расскажем ниже). Задав один и тот же ключ поиска разным поисковым машинам, можно получить принципиально разные результаты, причем из года в год они могут изменяться еще более удивительным образом.

Если ранние поисковые машины просто индексировали все содержимое страницы, и особое внимание обращали на так называемые «метаописания», то Google действовал иначе. Его «движок» всегда игнорировал метаданные, ибо каждый охотник… то есть каждый неленивый веб-мастер писал туда все популярные ключи запросов в надежде увеличить стихийную, бесполезную, пусть даже чисто техническую посещаемость своего сайта.

Но хитрый Google анализирует всю страницу сайта, обращает внимание на размер и цвет шрифта, места расположения заголовков и текстовых абзацев, то есть, грубо говоря, моделирует в своем «мозгу» страницу, как ее увидел бы обычный пользователь, и сам расставляет на ней смысловые акценты.

Кроме того, Google подкупает пользователя простейшей и в меру забавной главной страницей: на ней нет ничего лишнего. Не стоит думать, что простота эта обусловлена ленью дизайнеров – за каждым элементом интерфейса сервисов Google стоят очень серьезные специалисты, и это приносит компании куда более значительные результаты, чем может показаться на первый взгляд.

Ты меня уважаешь?

Залог успеха Google – PageRank (сокращенно PR). Этот механизм обсчитывает важность той или иной страницы с точки зрения «мировой революции» (то есть в контексте всех других существующих страниц Интернета). PR высчитывается, исходя из количества ссылок на данную страницу, а также «веса» каждой ссылающейся страницы – зачастую ссылка с одного «важного» сайта окажется дороже ссылки с сотни, если не тысячи незначимых, спамерских. Таким образом, если вам пожал руку Пол Маккартни, с точки зрения Google вы будете куда авторитетнее человека, которому пожали руку сто человек по имени Павел Макаров – как-то так.

Кстати, ссылки с сайтов, специально предназначенных только для ссылок, Google фильтрует. PR специально накручиваемых сайтов может раз и навсегда обнулиться. Сайты, которые будут ссылаться на «проштрафившиеся» ресурсы с PR=0, также могут быть оштрафованы – «по подозрению в преступном сговоре». Google рекомендует: семь раз подумать и один раз сослаться.

 Поиск в Google можно описать следующим алгоритмом:

1) отбираются все страницы, в которых содержатся искомые слова;

2) страницы сортируются по текстовым критериям («всплывают» страницы, на которых искомая фраза встречается чаще и точнее);

3) производится поиск в тексте ссылок на каждый сайт;

4) окончательные результаты «причесываются» с учетом PR сайтов.

Приведенный пример довольно груб; для вычисления пункта номер 4 Google использует больше сотни факторов ранжирования, как положительно, так и отрицательно влияющих на положение сайтов в результате поиска. Специалисты по продвижению сайтов – «оптимизаторы» – знают все или почти все эти критерии (мы нашли в Сети классификацию 38 положительных и 24 отрицательных свойства сайта, а также 43 положительных и 13 отрицательных внешних факторов, влияющих на PR) и используют свои знания в профессиональных целях, разумеется, не бесплатно. В свою очередь, Google борется с подобными специалистами и результатами их деятельности, ратуя за естественную расстановку сил в Интернете.

Технологию, подобную PageRank, использует и «Яндекс». Практически все описанное выше, плюс-минус национальные особенности, применимо и к нему, но в его терминологии «авторитетность» сайта – это «тематический индекс цитирования» или тИЦ. Подробнее об этом начинающие веб-мастера можно узнать, пойдя по ссылке на странице help.yandex.ru/catalogue.

Мирный атом

Поисковые технологии на службе других сервисов – актуальнейшая тема современности. И именно Google показывает на этом поприще наиболее внушительные результаты.

Один из наиболее удачных сервисов – Gmail (Google Mail) – популярная почта от Google. Он до сих пор находится в статусе beta-версии и официально закрыт для публичной регистрации, но это уже напоминает маркетинговый ход. Дело в том, что у большинства пользователей Gmail есть до 100 пригласительных кодов, которые они могут раздать своим знакомым (или незнакомым) – для этой цели создано множество сетевых ресурсов. Каждый вновь зарегистрировавшийся в Gmail получает свою порцию приглашений, и история повторяется. Система приглашений напоминает социальную сеть, некий неявный эксперимент Google, но об этом мы вряд ли узнаем в скором времени.

Запустив этот сервис, Google произвел революцию в мире бесплатной почты. Дело в том, что в самом начале пользователям предлагался под почту целый гигабайт. Вскоре после запуска лимит был передвинут до двух гигабайт, а впоследствии начал плавно расти в реальном времени, и сейчас приближается к 3 Гбайтам (этот шаг, кстати, подвиг многие популярные почтовики серьезно увеличить квоту на место под почту, за что Google можно только поблагодарить). «Гугл» предлагает не удалять почту, а маркировать ее тематическими ярлыками и складывать в архив, то есть не складывать деловое письмо от друга из соседней компании в папку «Друзья» и копию – в папку «Работа», а приклеить к письму соответствующие ярлыки и впоследствии находить это письмо по ним, в зависимости от контекста. Для поиска и упорядочивания, разумеется, задействованы поисковые механизмы Google.

Разумеется, за любой бесплатный сервис кто-то все равно платит. Google компенсирует свои затраты с помощью собственной системы текстовой контекстной рекламы, которую показывает на страницах почтового сервиса (и не только там).

Реклама от Google называется AdSense – дословно «чувство рекламы». Она хороша тем, что показывается неслучайно: Google анализирует содержимое страницы и выдает информацию (напоминаем: текстовую, никакой раздражающей графики!), которая может заинтересовать читателей именно этой страницы. Нет, Google не читает вашу почту; робот анализирует текст, выбирает наиболее подходящее, по его мнению, объявление и забывает ваше письмо, переходя к следующей задаче. Опять же, не вся реклама бесполезна, и если уж от нее нельзя избавиться, лучше видеть что-то действительно интересное. Выбор наилучшей рекламы напоминает действие кнопки «Мне повезет!» на главной странице поисковика, только область поиска в данном случае – это пространство рекламных объявлений, а ключ – содержимое страницы. Получается «поиск наоборот», и тем не менее – это поисковый механизм…

Перейти на страницу:
Вы автор?
Жалоба
Все книги на сайте размещаются его пользователями. Приносим свои глубочайшие извинения, если Ваша книга была опубликована без Вашего на то согласия.
Напишите нам, и мы в срочном порядке примем меры.
Комментарии / Отзывы
    Ничего не найдено.