Обратные ссылки

We use cookies. Read the Privacy and Cookie Policy

Чтобы стать президентом класса, тебе нужно не перечислить наибольшее число лидеров, которых ты считаешь прекрасными, а набрать наибольшее число людей, отдавших за тебя свой голос. Другими словами, популярность определяется не тем, сколько людей тебе нравятся, а тем, скольким людям нравишься ты.

Изучая структуру Интернета, Ларри обнаружил схожую истину. Не имеет значения, на сколько сайтов ты ссылаешься. Что действительно важно, так это то, сколько сайтов ссылается на твою страницу. Чем больше сайтов со ссылками к тебе, тем релевантнее, значимее и авторитетнее твой сайт. Каждый ссылка с веб-страницы на твой сайт равна отданному голосу. Чем больше у страницы голосов, тем она важнее и тем, думается, информация в ней достовернее.

Эта мысль напомнила Ларри о том, о чем часто говорили в доме, где он рос: цитировании.

Представь, что ты ученый, который без устали трудится над исследованием в области изменения климата. Ты обнаруживаешь новые доказательства и подтверждаешь новые теории о том, как люди воздействуют на климат. Ты публикуешь эти теории в научном журнале. Дальше могут произойти две вещи. Твою работу попросту проигнорируют. Или же она может оказаться настолько значима, что ученые со всего света начнут ее обсуждать. Основываясь на твоем исследовании, другие ученые выведут его на новый уровень, проводя все новые разработки, эксперименты и приводя новые доказательства. И когда они опубликуют свои выводы, они упомянут в них тебя. Они процитируют твою работу, твое исследование, твой вклад в науку. Каждое такое упоминание называется цитированием. А что, если сотни и даже тысячи ученых цитируют твою работу? Это говорит о качестве и авторитетности исследования. С большим цитированием повышается важность работы.

Ларри интересовало, можно ли проанализировать обратные ссылки, чтобы определить авторитетность веб-страницы подобно тому, как цитирование придает силу исследованию. Это была его большая идея. Претворить ее в жизнь казалось непростым делом.

Чтобы достичь своей цели, Ларри было необходимо проводить поиски во Всемирной сети, исследовать веб-страницы, считать их обратные ссылки и упорядочивать результаты. Этому требовался продуманный математический алгоритм.

Математический алгоритм – это специальный набор шагов, которым необходимо следовать для решения какой-либо математической задачи или выполнения и завершения компьютерного процесса. Еще один способ представить алгоритм – посмотреть на него как на кулинарный рецепт. Пошаговое выполнение инструкций необходимо для достижения конкретного результата.

И у него на примете был как раз подходящий математический ум для этой работы: Сергей Брин. Оказалось, что Сергей тоже все еще был в поиске своей темы диссертации. Идея Ларри показалась ему захватывающей. Сергей объяснил: «Потому что она касалась сети, которая является отражением людских знаний, и потому что Ларри мне понравился».

Но это не было простой задачей. В конце концов, они собирались сосчитать и проанализировать все ссылки со всей всемирной паутины, все 10 миллионов страниц. Им бы понадобилось запустить поискового бота, собирать ссылки, хранить их, а затем еще и анализировать их ценность. Это значит, что нужно было скачать Всемирную сеть – всю целиком.

У поисковых ботов есть пара других крутых имен: сборщики и пауки! Боты это ничто иное, как программы, которые посещают веб-страницы и считывают их содержимое. Каждый сборщик (или бот) охотится на конкретную информацию. Как только он ее находит, паук создает базу данных или индекс того, что найдено, облегчая доступ к информации.

Пропускная способность, необходимая для такой задачи, должна была быть внушительной, намного шире, чем для обычного проекта студента Стэнфорда. Это было куда более крупное дело. Не говоря уже о том, что они собирались работать с кучей данных и им бы понадобился сервер, который бы смог вместить и хранить в себе столько информации.

Сервер – это компьютер со специальной задачей или набором задач. Есть много различных видов серверов. Некоторые, например, хранят файлы или управляют трафиком сети или обеспечивают загрузку веб-страниц. Предназначение сервера определяется его программным обеспечением.

Пропускная способность (ширина полосы) – это частота передачи данных, обычно измеряемая в битах в секунду для данного канала. Наименьшая единица информации в компьютере известна как двоичный символ или бит. Бит – это всегда 1 или 0. Если речь идет о битах в секунду, имеется в виду то, как быстро эти мельчайшие частицы информации передаются или принимаются за одну секунду.

В далеком 1995 году у людей были модемы, которые подключались к Интернету по телефонным линиям. Максимальная скорость была 0,056 мегабита в секунду (Мбит/с). Сегодня большинство людей в Америке подключаются к Интернету со скоростью как минимум в 20 Мбит/с. Это значит, что сегодня мы можем скачивать фотографии мгновенно. Но тогда даже загрузка одного изображения низкого качества могла занять несколько минут.