| 26 Наиболее устойчивы частоты повторяемости слов в тексте и в разговорной речи. Они глубже всего исследованы, и их труднее всего подделать. Самым известным лингвистическим законом о частотах слов в "естественных" текстах является закон Ципфа: если расположить слова на сайте в порядке их частоты употребления в текстовом массиве, то количество вхождений слова будет обратно пропорционально его номеру. В среднестатистическом тексе про продвижение сайтов, словосочетание раскрутка сайтов должна повторяться не более 4-5% раз. Закон Ципфа применяют для анализа текстов в самых разнообразных отраслях, в том числе даже для анализа шифров, когда необходимо понять, имеем ли мы дело с шифрованным, но все-таки естественным текстом. Частота употребления конкретного слова сильно зависит от тематики рассматриваемых текстов. Довольно часто компании по раскрутки сайтов грешат при составлении текстов несозмеримо часто употреблять фразы раскрутка сайтов или продвижение сайтов. Но в одной конкретной тематике эти частоты устойчивы и починяются алгоритму Ципфа. Учитывая этот закон и другие основные принципы поведения слов в тексте, поисковик может обнаружить неестественную плотность и расположение слов и на этом основании сделать выводы о неестественном характере текста. Например, в приведенном примере неестественного текста частота слова "раскрутка" почти в три раза выше, чем ожидаемое для естественных текстов. |
|||
Warning: require_once(/www/vhosts/good-tent.ru/html//lmp/lmpanel.php) [function.require-once]: failed to open stream: No such file or directory in /www/vhosts/good-tent.ru/html/lmp.php on line 82 Fatal error: require_once() [function.require]: Failed opening required '/www/vhosts/good-tent.ru/html//lmp/lmpanel.php' (include_path='.:/usr/local/lib/php') in /www/vhosts/good-tent.ru/html/lmp.php on line 82 | |||