понедельник, 26 сентября 2011 г.

Что такое «Шингл»?


Начну с «мата».

 «Шингл (с англ. shingle) - это хеш-значение непрерывной последовательности слов текста фиксированной длины.»

Это официальная трактовка термина. Но, как-то от неё не легче. Что ж, попробуем проще.

Одним из условий качественного выполнения заданий для веб-райтера является уникальность написанных текстов. Поэтому в конце работы идёт обязательная проверка почти готовой работы на уникальность. Почему почти? Да потому, что при проверке (у кого чаще, у кого реже) выявляются неуникальные части текста и приходится доводить его до «ума». И всё для того чтобы поисковая система считала выполненную работу уникальной.

Идём дальше.

Для проверки текстов на уникальность веб-райтеры (как и сами заказчики) используют специализированные онлайн-сервисы и программы. Я пользуюсь последними. Кстати, в последнее время появилось довольно много подобных программ, а всё дело в том, что каждая биржа контента считает своим долгом иметь в своём арсенале фирменный софт для проверки уникальности. Посоветовать что либо конкретное я не берусь. А дело вот в чём. Обычно, при работе на заказ, вебмастер сам определяет систему с помощью которой будет проводиться проверка, а веб-райтеру только и остаётся следовать указанию. Мне, чаще всего, приходится работать с помощью программ бирж Advego и Еtxt и, сугубо по моему мнению, программа от Etxt более удобна и менее глючна.

Ну вот мы и пришли.

Программа проверки уникальности не отправляет полный текст на «растерзание» поисковым машинам. Она делит текст на небольшие куски (шинглы – вот они!) и отправляет их в качестве запроса поисковику, определяя тем самым уникальность каждого короткого отрезка текста. А на основании всех проверок и выдаётся общая картина уникальности.

О размере шингла ведутся разные разговоры. Чаще всего он зависит от требований заказчика и «крутится» в районе 5. Если же веб-райтер работает в «свободном полёте», т. е. пишет тексты для свободной продажи, то имеет смысл и поиграть с этим значением (чаще в сторону уменьшения, особенно это касается коротких текстов).

У шинглов есть и ещё одна фишка – поисковые системы «переваривая» полученные данные своих роботов, выносят вердикт по уникальности просканированного контента основываясь на тех же шинглах. Но сам алгоритм оценки и размер шинглов (может он и динамичный) – это «военная тайна» поисковых систем.

Комментариев нет:

Отправить комментарий

 
;