# 0 — PageRank.
# 1 Возраст ссылок является фактором ранжирования.
# 2 Трафик и % органического трафика являются факторами ранжирования.
# 3 Цифры в URL-адресах плохо влияют на ранжирование
# 4 Много косых черт в URL-адресах плохо влияет на ранжирование
#5 Жесткая пессимизация равна PR=0
# 6 Надежность хоста является фактором ранжирования.
# 7 Забавный факт: есть отдельный фактор ранжирования для поднятия Википедии.
#8 Множество факторов ранжирования, связанных с поведением пользователя — CTR, последний клик, время на сайте, показатель отказов.
# 9 Возраст документа и последнее обновление являются факторами ранжирования.
#10 Средняя позиция домена по всем запросам является фактором ранжирования.
# 11 Глубина сканирования является фактором ранжирования.
Держите важные страницы ближе к главной странице:
— верхние страницы: 1 клик с главной страницы
— важные страницы: <3 кликов
#12 Дополнительно: фактор ранжирования для страниц-сирот.
#13 Обратные ссылки с главных страниц важнее, чем с внутренних страниц.
# 14 Количество поисковых запросов вашего сайта / URL-адреса является фактором ранжирования. Понятно, что больше = лучше.
# 15 Трафик из Википедии является фактором ранжирования.
#16 Если ваш url будет последним для поисковой сессии (пользователь найдет то, что ему нужно) — это повлияет на ранжирование. Для этого есть строгие факторы, а также предсказуемые факторы.
# 17 Фактор ранжирования закладок. Чем больше пользователей добавляют в закладки URL-адрес, тем больше значение фактора он имеет
#18 Специальные факторы ранжирования для коротких видео (тикток, шорты, ролики)
#19 Maps js-api на странице (например, Google Maps) — это фактор ранжирования. В Google (например, в нише путешествий) также работает добавление карты с полезной информацией/функционалом.
# 20 Ключевые слова в URL — это факторы ранжирования. Как видно из описания — оптимальным будет включение до 3-х слов из поискового запроса.
# 21 Вернувшиеся пользователи являются фактором ранжирования. Создавайте продукты с хорошим удержанием, и это пойдет на пользу вашему SEO (есть много факторов ранжирования для его измерения).
#22 Процент ЗАГЛАВНЫХ БУКВ в <title> является фактором ранжирования. Действительно, как часто вы видите полностью заглавные названия веб-сайтов в топе Google?
# 23 Процент прямого трафика является фактором ранжирования. Если весь ваш трафик пришел из органического поиска — это подозрительно + плохо для ранжирования.
#24 Еще один фактор ранжирования по качеству контента — битое встроенное видео на странице.
Встраивайте видео — хорошо для ранжирования.
Неработающие встраиваемые видео — плохо.
# 25 Вариативные учетные записи в социальных сетях ранжируются иначе, чем другие URL-адреса.
Важно для поиска по бренду — в идеале при поиске по вашему бренду в топ-10 должны быть только ваши домены + проверенные социальные сети.
# 26 Если ваши анкоры обратных ссылок содержат все слова из ключевых слов — это хорошо для SEO.
Если в одной ссылке — выгоднее. Особенно, если порядок слов тот же.
# 27 Соотношение «хороших» и «плохих» обратных ссылок является фактором ранжирования.
К сожалению, не выяснено, что именно означает «хорошая» обратная ссылка, но это довольно ясно.
#28 Рейтинг качества текстов на домене является фактором ранжирования.
Страницы с некачественным контентом влияют на весь домен.
# 29 Количество рекламы на странице является фактором ранжирования.
Меньше = лучше.
#30 Забавно, есть рандом как отдельный фактор ранжирования.
Когда вы не понимаете, почему какая-то страница находится сверху — это может быть просто случайно (для проверки поведенческих факторов).
#31 JS из Google Analytics — фактор ранжирования.
Предсказуемо. Хорошие сайты чаще используют GA, чем плохие.
#32 Обратные ссылки с 100 лучших веб-сайтов по рейтингу PageRank влияют на ранжирование.
№1 FI_ADV: -0,2509284637
Этот фактор определяет наличие рекламы на сайте.
#2 FI_DATER_AGE: -0,2074373667
Фактор — это разница между текущей датой и датой документа, определяемой датировщиком. Значение равно 1, если дата документа совпадает с сегодняшней, 0 — документу более 10 лет или если дата не определена.
#3 FI_QURL_STAT_POWER: -0.1943768768
Фактор — это количество показов URL по запросу.
#4 FI_COMM_LINKS_SEO_HOSTS: -0.1809636391
Factor — доля внешних ссылок с «коммерческим» анкорным текстом. Коэффициент возвращается к 0,1, если доля таких ссылок превышает 50%, в противном случае устанавливается в 0.
#5 FI_GEO_CITY_URL_REGION_COUNTRY: -0,168645758
Фактор — географическое совпадение документа и страны, из которой пользователь искал.
#1 FI_URL_DOMAIN_FRACTION: +0,5640952971
Это какое-то странное маскирующее перекрытие запроса и домена. Приведен пример (Челябинская лотерея — челлото. Найдите закрытые трехбуквенные знаки (че, хель, лот, оло), посмотрите, какая доля всех трехбуквенных знаков была покрыта).
«Текстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа).»
«Priority bonus, приоритет 7 — текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум.»
«Приоритет strict для TR — текстовый приоритет — есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении).»
«Наличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor[5]»
«Встретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords).»
«Длинный документ (чем длиннее документ, тем больше значение фактора).»
«Hitweigt — вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0»
«Сумма idf слов запроса. Название не отражает суть: например, для запроса ‘Гадяч’ этот фактор будет больше, чем для запроса ‘Москва Питер Екатеринбург Самара’.»
«Длинный текст без ссылок.»
«Это морда.»
«Означает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))»
«Число, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок мало»
«В текстовой релевантности произошло совпадение леммы.»
«Число входящих ссылок. Ремапится.»
«Язык документа — русский.»
«Время добавления страницы, больше — более старый документ; кладется корень из времени, отображенный на интервал [0,1] так, чтобы 3+ года давало 1.»
«Простой BM25 по парам слов — берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-слово»
«У документа нет TR.»
«количество предложений, в которых встречается много слов по точной форме»
«наличие слов в заголовке по точной форме»
«наличие пар слов c учетом синонимов (>=TxtPair)»
«количество предложений, в которых встречается много слов c учетом синонимов»
«наличие слов в заголовке c учетом синонимов»
«Относительная частота слов запроса в ссылках (1 — слова запроса часто встречаются в ссылках, 0.3 — редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)»
«Качество текста. Считается по довольно сложной формуле»
«Качество текста (классификатор Алексеева)»
«Длина документа в предложениях»
«Означает совпадение региона, упомянутого в запросе и найденных сайтов на уровне областей. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))»
«Процент входящих ссылок со словами запроса»
«Процент входящих ссылок со всеми словами запроса»
«коммерческая страница (классификатор Савина)»
«в документе нет всех слов запроса (с точностью до синонима)»
«Длина текста страницы в словах TLen = Map(число слов, 1/400), где Map(x, y) = x*y / (1 + x*y)»
«Страница недостижима по ссылкам с морды.»
«Длина максимального совпадения по лемме в тексте и запросе»
«Варианты соответствующих факторов с учетом стоп слов»
«В URL есть древняя дата. Распознаются древние новости. Фактор 1 если в урле есть год <=2007.»
«Вес максимального совпадения форм в тексте и запросе»
«Поисковый трафик — переходы с поисковых систем на сайт (2-ая формула)»
«Нейронная модель качества контента для медицинской тематики (для экспов)»
«Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Bm11 по тексту и тайтлу документа»
«Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. CosineMatchMaxPrediction по тексту и тайтлу документа»
«Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchWeightedValue по стриму LongClick.»
«Фактор по оригинальному запросу. Считается по заголовку документа. Степень покрытия слов запроса с точностью до формы (без синонимов).»
«Фактор по оригинальному запросу. Считается по заголовку документа. Вес хита умножается на 1/ (1 + позиция слова в предложении) Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.5.»
«Фактор по оригинальному запросу. Считается по содержимому документа. Степень покрытия слов запроса в точной форме.»
«Url является каналом/постом из верифицированного аккаунта социальной сети»
«Статический URL фактор по поисковым сессиям за 1600 дней. Обычный Ctr.»
«Статический URL фактор по браузерным логам за максимальный период. Процент трафика с социальных сетей во всем трафике с других хостов и поиска.»
«Кликабельность владельца независимо от запроса, отдельно по регионам»
«Запрос полностью покрывается двумя точными группами, состоящими из exact match слов запроса подряд ((http://wiki.yandex-team.ru/poiskovajaplatforma/tr/CoverageByGroups Про покрытие группами))»
«Cуществует группа, состоящая из exact match слов запроса, покрывающая запрос (возможно, с пропуском, добавлением или заменой слова)»
«Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))»
«У документа есть текстовая релевантность»
«Показатель неестественности текста с точки зрения русского языка. Число плохих пар слов в тексте, перенормированное в отрезок [0,1] по формуле z/(z+10)»
«Число слов в тексте (Слово — то, что выделил леммер), отображается в [0,1] по формуле x/(x+A)»
«Доля разных частей речи в тексте. доля числительных (среди всех слов, у которых удалось распознать часть речи)»
«Качество входящих ссылок (классификатор Лещинера) исправленный»
«Периодичность ссылок на сайт»
«Medical host quality for new marks.»
«Medical host quality for new marks for experiments.»
«Наличие встроенного видеоплеера на странице»
«Униграммная языковая модель. Моделируется языковая по документу, сглаживается общеязыковой моделью. При построении модели по документу используется информацию о том, в каком поле документа встретилось слово запроса (Title, head или plain text)»
«Вероятностная модель, построенная по текстам входящих ссылок»