«Шингл
(с англ. shingle) - это хеш-значение непрерывной последовательности слов текста
фиксированной длины.»
Это официальная трактовка термина. Но, как-то от неё не
легче. Что ж, попробуем проще.
Одним из условий качественного выполнения заданий для
веб-райтера является уникальность написанных текстов. Поэтому в конце работы
идёт обязательная проверка почти готовой работы на уникальность. Почему почти?
Да потому, что при проверке (у кого чаще, у кого реже) выявляются неуникальные
части текста и приходится доводить его до «ума». И всё для того чтобы поисковая
система считала выполненную работу уникальной.
Идём дальше.
Для проверки текстов на уникальность веб-райтеры (как и сами
заказчики) используют специализированные онлайн-сервисы и программы. Я
пользуюсь последними. Кстати, в последнее время появилось довольно много
подобных программ, а всё дело в том, что каждая биржа контента считает своим
долгом иметь в своём арсенале фирменный софт для проверки уникальности.
Посоветовать что либо конкретное я не берусь. А дело вот в чём. Обычно, при
работе на заказ, вебмастер сам определяет систему с помощью которой будет
проводиться проверка, а веб-райтеру только и остаётся следовать указанию. Мне,
чаще всего, приходится работать с помощью программ бирж Advego и Еtxt и, сугубо по моему мнению, программа
от Etxt более удобна и
менее глючна.
Ну вот мы и пришли.
Программа проверки уникальности не отправляет полный текст
на «растерзание» поисковым машинам. Она делит текст на небольшие куски (шинглы –
вот они!) и отправляет их в качестве запроса поисковику, определяя тем самым
уникальность каждого короткого отрезка текста. А на основании всех проверок и
выдаётся общая картина уникальности.
О размере шингла ведутся разные разговоры. Чаще всего он
зависит от требований заказчика и «крутится» в районе 5. Если же веб-райтер
работает в «свободном полёте», т. е. пишет тексты для свободной продажи, то
имеет смысл и поиграть с этим значением (чаще в сторону уменьшения, особенно
это касается коротких текстов).
У шинглов есть и ещё одна фишка – поисковые системы «переваривая»
полученные данные своих роботов, выносят вердикт по уникальности
просканированного контента основываясь на тех же шинглах. Но сам алгоритм
оценки и размер шинглов (может он и динамичный) – это «военная тайна» поисковых
систем.
Комментариев нет:
Отправить комментарий