Статья: PageRank: анализ потоков

Это показывает, что:

Средний PageRank при большом количестве страниц близок к 1.

PageRank на сайте увеличился не на P0, а на 5.667=0.85/0.15 P0. Это произошло из-за существования обратной связи между главной и второстепенными страницами, т.е., волна PR как бы "откатилась обратно".

Однако, при обращении в ноль P0=0 средний PR не становится равным 1. Это происходит из-за того, что мы отказались от условия нормировки, но при "отрыве" сайта от внешней среды должны его снова применить. Отказ от нормировки позволяет сохранить связь с внешним PageRank, при этом мы помним о необходимости перенормировки из-за "стягивания одеяла на себя".

Можно ли получить большой PageRank только за счет массы сайта?

Судя по формуле, можно получить любое значение PageRank главной страницы только за счет увеличения количества страниц, ведь P1 линейно увеличивается при увеличении N. При этом все страницы сайта должны быть проиндексированы Google. Однако, вспомним о том, что существует минимальное значение PR, достичь которого необходимо для индексации документа Google. Но ведь PageRank второстепенных страниц (P2) уменьшается с N! Посмотрим на график:

Если число страниц на сайте окажется слишком большим, то второстепенные страницы просто не проиндексируются! И никакого сверхвысокого PR достигнуть не удастся. Можно попытаться:

Постепенно добавлять страницы Поставив несколько ссылок на другой странице с хорошим PR, дождаться индексации части страниц. Затем добавить еще несколько страниц. И так далее. Но: на полное добавление потребуется очень много времени!

Увеличить внешний PR Как видно, P2~P0/N. Т.е., увеличивая P0, можно добиться индексации второстепенных страниц. Но чем больше число страниц, тем больше придется работать на увеличение внешнего PR! На это тоже требуется много времени!

Использовать оба метода сразу

Ставить ссылки с второстепенных страниц друг на друга. Это мы рассмотрим далее: случай 2.

Итак, несмотря на явную зависимость P1 от N, нет возможности быстро увеличить свой PageRank - а это означает относительную устойчивость в распределении сил. К тому же, если сайт действительно очень хороший, и на него ссылаются "добровольно" - он всегда обгонит "плохой сайт" (за счет более полной индексации страниц в том числе). Алгоритм PageRank как бы подталкивает к постепенному развитию сайта и постепенному добавлению страниц.

Случай 2: "кольцо на палочке"

Добавим к предыдущему случаю одну ссылку на "соседа":

С головной страницы (PageRank=P1) есть ссылки на N эквивалентных подчиненных страниц (PageRank=P2). Подчиненные страницы связаны между собой: есть одна ссылка на соседнюю подчиненную страницу, на каждой из них есть одна ссылка на головную страницу.

Система уравнений: (N>=2)

P1=0.15+0.85*(P0+N*P2/2) - на страницу вида 1 ссылаются N страниц вида 2, на каждой из которых 2 ссылки

P2=0.15+0.85*(P1/N+P2/2) - на страницу вида 2 ссылается одна страница вида 1, на которй N ссылок; и одна страница вида 2, на которой 2 ссылки

Решение системы: P1=0.403+0.298*N+2.287*P0 P2=0.702+0.596/N+3.380*P0/N

Видно, что ситуация примерно такая же, как и в случае 1, однако теперь PageRank второстепенных страниц увеличился, а главной страницы - уменьшился. Это касается как зависимости от N, так и зависимости от P0.

В данном случае мы немного выигрываем в PR второстепенных страниц - это поможет их проиндексировать быстрее, но снизит PageRank главной страницы, ради которой все и затевалось. А что будет в предельном случае - когда все страницы плотно связаны?

Случай 3: "камушек"

С головной страницы (PageRank=P1) есть ссылки на N эквивалентных подчиненных страниц (PageRank=P2). Подчиненные страницы попарно связаны между собой: на каждой из них есть ссылки на всех N-1 соседей. На каждой из них есть одна ссылка на головную страницу.

Система уравнений:

P1=0.15+0.85*(P0+N*P2/N) - на страницу вида 1 ссылаются N страниц вида 2, на каждой из которых N ссылок (N-1 на соседей и одна на страницу 1)

P2=0.15+0.85*(P1/N+(N-1)*P2/N) - на страницу вида 2 ссылается одна страница вида 1, на которй N ссылок; и N-1 страниц вида 2, на каждой из которых N ссылок

К-во Просмотров: 266
Бесплатно скачать Статья: PageRank: анализ потоков