Здравствуйте, уважаемые читатели сайта Uspei.com. Что такое структура url и что такое url в принципе? Url это тот адрес, который мы видим в адресной строке браузера. В переводе с английского языка url расшифровывается как “универсальный показатель адресов“. Он чем-то очень напоминает путь файлов в нашей операционной системе. Если вы что-то устанавливали на свой компьютер вы указывали: С:/program files/games, и устанавливали туда какую-то программу.
Это практически то же самое. Только если мы в своих локальных путях выбираем локальный диск и каталоги, куда мы устанавливаем, то здесь мы выбираем домен, каталоги и файлы, которые мы просматриваем в нашем браузере. Полный адрес всегда начинается с сетевого протокола. Например, протокол https или чаще всего http, но в адресной строке браузеров для красоты это упускается и показывается только сам адрес.
Наряду с такими элементами внутренней оптимизации страницы как title description и keywords адрес страницы играет большую роль.
Что поисковую систему интересует в плане структуры url:
- Понятность адресов для обычных пользователей (чпу)
- Глубина вложенности страниц по url адресу
- Глубина вложенности страниц по клику
- Ответ сервера при смене структуры url (301 редирект)
Что такое ЧПУ адреса url
Первое, что интересует поисковую систему – это понятность или чпу. Чпу расшифровывается как человеко-понятные адреса. Бывают чпу адреса и не чпу адреса. Давайте рассмотрим примеры. Предположим мы увидели страницу с каким-то вот таким адресом:
uspei.com/index.php?id=23452.
Можно ли по адресу этой страницы понять, какое содержание этой страницы? Конечно же нет, то есть этот адрес мы не будем называть чпу адрес – он не понятный для человека. Если мы такой адрес скопируем и отправим кому-то, он посмотрит на него и не поймет, что за этим адресом скрывается.
А если мы отправим человеку адрес вот такого рода: uspei.com/noutbuk/apple он посмотрит и подумает: наверно по этому адресу я открою информацию про ноутбуки apple. Такой адрес мы называем чпу адресом или человеко понятным адресом.
Поисковые системы рекомендуют нам использовать чпу адреса на своих сайтах. Тем более, что сейчас современные системы управления сайтом (то есть движки как это называют обычно) в большинстве своем поддерживают структуру чпу адресов.
Оптимизация url адреса
Здесь есть несколько нюансов, как правильно сформировать чпу адрес:
- Часто спрашивают, что использовать – латиницу или кириллицу, какие символы вообще допускаются в чпу. На самом деле вы можете использовать как русские буквы так и буквы латинского алфавита, в этом нет никакой проблемы. Главное крайне желательно, чтобы все адреса на ваших страницах были в одном формате. То есть, если у вас на сайте половина страниц имеют кириллические адреса, а вторая половина страниц имеет латинские адреса, то это не очень удобно, во-первых, а во-вторых, может вызвать небольшие проблемы. Хотя чаще всего это тоже будет нормально восприниматься поисковой системой просто это не совсем удобно.
- И все же, если вы только планируете структуру сайта и перед вами стоит выбор, что все таки использовать, я рекомендую использовать транслитерацию вместо кириллицы, чуть позже объясню почему. Как транслитерировать, то есть как русские слова написать правильно латиницей? Существует специальный стандарт iso 9. Это международный стандарт транслитерации, по которому мы переводим русские слова в транслит. Также существуют онлайн-инструменты транслитерации. Нельзя в url использовать разнообразные символы апострофа, кавычки и все, что с этим связанно. Пробелы лучше всего заменять на минусы, то есть на короткое тире или нижнее подчеркивание. Это в принципе базовые принципы по формированию чпу адреса.
- Также не стоит злоупотреблять ключевыми словами в чпу, то есть не надо писать uspei.com/katalog_noutbuk/noutbuk_apple. Это злоупотребление ключевыми словами неправильно. За злоупотребления ключевыми словами в url поисковая система также может занизить рейтинг вашего сайта. Поэтому просто напишите uspei.com/noutbuk/apple, поисковой системе, как и человеку, достаточно такого url для того, чтобы понять содержание этой страницы. Кстати поисковики выделяют жирным ключевые слова в url адресе, не забываем.
- Еще один важный момент – крайне желательно все символы в url использовать в нижнем регистре, то есть писать маленькими буквами.
Почему я не рекомендую использовать кириллические url. На самом деле в них нет никакой проблемы, поисковая система нормально их сканирует и все с ними отлично, кроме одного маленького минуса.
Когда мы копируем такой url и вставляем в какой-то текстовый файл, а часто просто в почту или в какой-нибудь messenger (например Skype), то мы видим, что кириллический url превращается вот в такую длиннющую строку непонятных символов.
На самом деле вот так выглядит кириллический url, просто браузер его интерпретирует в понятный красивый вид.
Многие люди не знают особенности кириллических url и если вы сбросите им такой адрес, ну скажем каким-то личным сообщением в почте, то они могут просто испугаться нажимать на такой url, потому что подумают, что это какой-то вирус и не поймут, что вы им сбросили. Поэтому чаще всего рекомендую использовать url именно через транслитерацию.
Необязательно прописывать или транслитерировать URL вручную. Например, в WordPress можно настроить автоматическое формирование адреса создаваемой странички с помощью плагина Cyr-To-Lat (использую его на всех сайтах). В других CMS также есть аналогичные плагины.
Вложенность страниц по url адресу
Следующий элемент, который интересует поисковую систему в url – это вложенность. То есть мы поняли, что url должен быть красивый, но также url отражает структуру сайта и отражает важность страниц сайта в глазах поисковой системы (если он составлен правильно – на основе семантики).
Так, поисковая система считает первую страницу, главную страницу нашего сайта, страницей 1 уровня вложенности. Те страницы, которые вложены в нее, то есть находятся за первым слешем, называются страницами второго уровня вложенности. Страница за вторым слешем уже будет называться страницей третьего уровня вложенности и так далее.
Изначально поисковая система считает, что чем больше вложенность страницы, тем менее она важна. То есть логика очень простая, если мы что-то важное разместили на своем сайте, наверно мы разместили это поближе к главной странице или на главной странице.
Если это что-то неважное – мы, наверное, зарыли это куда-то поглубже. Чем больше вложенность страницы, тем на самом деле хуже для конкретно этой страницы. Это не критический фактор, это один из небольших факторов, о котором стоит нам помнить и его учитывать.
На самом деле допускаются страницы, имеющие вложенность третью и даже четвертую и даже пятую (именно по url), но далее 5 уровня вложенности крайне нежелательно размещать какие-либо страницы. В длинном адресе сложно разобраться и неудобно делиться с другими пользователями. А если это длинный (4-5 уровень вложенности) кириллический адрес, то вообще капец – портянка кракозябр отпугнет кого угодно.
То есть, если в адресе вашей страницы, которую вы оптимизируете, которую вы хотите потом разместить на хороших позициях в поисковой системе, если в адресе вашей страницы более четырех слешей, то это может вызвать небольшие проблемы. Старайтесь, чтобы все страницы вашего сайта имели не далее 5 уровня вложенности.
Вложенность страниц по количеству кликов
Уровень вложенности также оценивается поисковой системой по количеству кликов. То есть какое количество кликов необходимо сделать с главной для того, чтобы попасть на эту страницу.
Так, у нас есть к примеру главная страница, если мы делаем один клик – мы переходим на какую-то другую страницу. Эта страница будет называться страницей второго уровня вложенности по клику. Если мы делаем второй клик – это уже, соответственно, третий уровень вложенности по клику.
Идеально, если структура нашего сайта и структура нашего url совпадают. То есть вложенность страниц по клику соответствует вложенности страниц по url.
Такое, к сожалению, встречается не так часто, потому что большинство систем управления сайтами вставляют в url разные служебные надписи и добиться вот этого адреса страниц, которые полностью соответствуют структуре сайта и структуре кликов от структуры навигации достаточно сложно.
Но если вам это удалось, то это действительно хороший плюс и тогда поисковая система будет воспринимать ваш сайт максимально правильно в плане его структуры и расположению страниц относительно главной страницы.
Но все же мы должны помнить, что вложенность по клику – она важнее чем вложенность по url. Если дать короткий совет, то постарайтесь разместить все наиболее важные страницы, которые вы собираетесь продвигать и занимать высокие позиции, постарайтесь их разместить не далее 2 уровня вложенности.
Если сайт очень большой, то можете разместить на третьем, если сайт это какой-то огромный портал, то максимум 4 уровень вложенности. Но старайтесь, чтобы все важные страницы для небольшого сайта были на втором уровне вложенности по клику и не далее 5 уровня вложенности по url.
301 редирект при смене структуры url
Предположим, мы узнали, что адреса нашего сайта не идеальны. Мы обращаемся к разработчику и даем ему задание о том, как транслитерировать адреса, как сделать чпу, какая должна быть структура вложенности и все в этом духе. Но тут есть один серьезный момент, о котором стоит помнить.
Основной идентификатор страницы для поисковой системы это url, то есть адрес этой страницы. К примеру, если у нас есть какая-то страница и если адрес этой страницы будет изменяться хотя бы в один символ в один слэш или в одну цифру, в одну букву – это уже другая страница для поисковой системы. Даже если выглядят они идентично, поисковая система будет воспринимать эти две страницы как разные страницы (почитайте про дубликаты страниц). То есть основной идентификатор страницы для поисковой системы это уникальный url. И это очень важно понимать.
Предположим у нас ситуация: есть какая-то страница и ее url мягко скажем не очень хороший, вот что-то как мы рассматривали в первом примере, вот какой-то такой: uspei.com/index.php?id=23452. И мы, узнав про то, что нужно делать хорошие красивые url, решили сделать uspei.com/noutbuk/apple.
Предположим, мы уже отображались на каком-то хотя бы даже 15-м месте в поиске. Что будет, если мы просто поставим задачу разработчику взять и вместо этой страницы сделать вот такой адрес. На самом деле мы потеряем те позиции, которые мы уже имеем и вот почему.
Для того, чтобы в этом разобраться нужно разобраться в таком понятии как ответ сервера. Ответ сервера это 3 цифры, которые сообщают любой программе, допустим, браузеру либо поисковому боту как себя чувствует страничка.
О чем я говорю. Чаще всего вы сталкивались с ответом сервера 404, когда вы пытаетесь зайти на какую-то страницу. Браузер как бы стучится в эту страничку и спрашивает: как ты себя чувствуешь, страничка? Страничка ему в ответ отвечает ну, например, 404. Это значит, что страница не существует, она удалена.
Еще чаще браузер получает ответ сервера 200. 200 означает ok – все хорошо. В этом случае просто открываются страницы, вы даже этого не замечаете.
Что произойдет в нашем случае. Если вы взяли, и вот этот адрес заменили на этот адрес. Теперь поисковая система придет пересканировать старую страничку (ведь поисковик перепроверяет страницы, которые есть у него в индексе) и ему ответят кодом 404 – страницы больше нет, она удалена.
Вместе с ней, поскольку страница удалена, будет удалён весь ее рейтинг, вся ее релевантность, все ее позиции. А тут он найдет абсолютно новую страницу с кодом 200, абсолютно новую, без той релевантности, без того веса, которым обладала старая страница. Даже если она будет полностью скопирована – эта страница банально из-за возраста могла иметь какой-то рейтинг, который вы удалите просто отдав ответ 404.
Таким образом, если у нас были не очень красивые адреса по всему сайту и мы их изменили на красивые – мы можем потерять все позиции и это очень печально. Поэтому нам нужно, чтобы старый адрес отдавал ответ сервера 301. 301 означает, что страница переехала навсегда на новое место и перенаправляет по новому адресу – 301 редирект или перманентный редирект – это все одно и то же.
Теперь поисковый бот или браузер стучится на этот адрес и говорит: как ты страничка? Ему говорят – 301, я переехала навсегда. Тогда бот переспрашивает: а куда ты переехала? И ему сообщают адрес новой страницы.
Таким образом, поисковая система видит, что эта страница была не удалена, а перемещена навсегда на новый адрес. И уже если мы сообщаем ответ 301 со старой страницы и указываем куда она переехала корректно, тогда вес этой старой страницы будет перенесён на новую страницу. И чаще всего, если у нас и будут потери какие-то в позициях, то они будут незначительными.
К чему я это рассказывал. Очень важно, если вы просмотрели свой сайт и увидели, что вам не нравится структура url, потому что они не достаточно понятны или вы видите, что у вас какие-то ошибки в транслитерации или какие-то подобные проблемы и у вас возникла необходимость менять адреса, значит вам нужно сделать постраничный редирект всех старых адресов на новые адреса – на правильные.
Обычно, если сайт уже занимает лидирующую позицию по каким-то запросам и тем более таких позиций очень много, то адреса url не меняют, потому что при редиректе (при смене адреса) очень часто бывают небольшие проседания. То есть, если вы с первого места просядите на 4, то это обычно существенно отразиться на вашем трафике, тем более если вы уже на первом или на втором месте, то в принципе вы уже добились того результата в SEO, который вам был необходим.
Хотя структура и понятность адреса это важные факторы, но как любой фактор это не кардинальный фактор в сео. В сео нет фактора, который за секунду выдвинет вас топ 1. Каждый фактор имеет небольшой вес, небольшое влияние, но именно обработка большого списка разных моментов на сайте дает нам путь к хорошим позициям.
Итог
Подытожим. Когда мы меняем адреса, обязательно должны их перенаправить на соответствующие новые адреса, иначе мы потеряем вес. Часто задают вопрос, а что если мои старые страницы не имели никаких позиций, ну зачем их перенаправлять, если не было никакого веса?
На самом деле их тоже нужно перенаправить, потому что если эта страница уже была проиндексирована, а вы ее не перенаправите, а просто отдадите ответ 404, то поисковик зайдет на этот сайт и увидит: так, на нем было 10 страниц – они исчезли и появились 10 новых страниц. Это очень странно, то есть сайт непостоянный он работает с какими-то перебоями. Если часто на вашем сайте большое количество страниц выключается, а другие страницы в таком же большом объеме появляются, то поисковая система может сделать вывод, что ваш сайт еще не доработан и находится в разработке.
А если ваш сайт ещё находится в разработке, то зачем его показывает людям. То есть в любой момент эти страницы могут еще быть удалены, как-то изменен на них контент или еще что-то в этом духе. То есть, когда поисковая система понимает, что сайт не доработан – она просто не будет его показывать в поиске. Поэтому ваш сайт должен быть, во-первых, статичным, то есть вы сделали какие-то страницы не удаляйте их массово сразу более 40% страниц вашего сайта. Это может очень негативно сказаться на вашем сайте.
И, во-вторых, если вы что-то не удалили, а перенесли – обязательно 301 redirect, обязательно!