О ЗАКОНЕ ЦИПФА И РАНГОВЫХ РАСПРЕДЕЛЕНИЯХ В ЛИНГВИСТИКЕ И СЕМИОТИКЕ
В статье уточняется ряд формул лингвистической статистики. Вводится понятие реальной и виртуальной мощности знака. Показывается, что формула, уточняющая закон Ципфа для частот встречаемости в частотных словарях, может быть распространена на произвольные знаковые объекты, т.е. на семиотические системы. Библиография: 11 названий. 1. Синтагматическая (упорядоченная) последовательность слов и маркеры писателей. А. Н. Колмогоров, Р. Л. Добрушин, С. М. Гусейн-Заде и многие другие математики и лингвисты интересовались математическими аспектами устройства и функционирования языка. У Колмогорова есть работы по статистическим законам стихосложения. Гусейн-Заде, основываясь на идеях Колмогорова и Шеннона, рассматривал частоту букв алфавита как маркер языка [1]. Естественно, возникает вопрос, нельзя ли рассматривать частоту встречаемости слов как маркер языка отдельных писателей.
Вопрос об атрибуции текстов, особенно текстов Шекспира (за что была предложена денежная премия в размере более миллиона фунтов стерлингов [2]), привлекал внимание исследователей не одно столетие.