Почему так часто повторяются некоторые слова в сканвордах?

Истинные причины частых повторов некоторых слов вразных сканвордах
 
Для начала нужно уточнить, что повторяются, по большей части, короткие слова. Причем повторяются именно те слова, которые начинаются с гласных букв. Так в чем же дело? Почему так часто повторяются определенные слова, такие как АРА, АБАК, АТАКА, ЕРИКА и т.п.? Причин тут две:

1. Соотношение количества слов разной длины.
2. Особенности построения сетки сканвордов.

Начнем с первой причины. В русском языке порядка 3.000 - 4.000 разговорных слов. Добавляем сюда более-менее известные термины, названия, фамилии, географические названия и получаем 12.000 – 14.000 слов. Причем я не беру во внимание слова длиной более девяти букв. Чем длиннее слова, тем реже они используются в сканвордах. Это обусловлено особенностями построения сеток сканвордов (это мы разберем чуть позже).

Так вот, 14.000 – это примерно тот список слов, используя который составляются относительно разгадываемые сканворды, рассчитанные на широкий круг любителей сканвордов. Увеличение словаря приводит к тому, что к таким сканвордам читатели начинают терять интерес, потому что они слишком сложны в разгадывании. А это, в свою очередь существенно сказывается на тиражах. Такие сканворды можно печатать только тогда, когда они выступают в роли призовых сканвордов. То есть за разгадывание такого сканворда читатель имеет возможность получить какой-то приз. Уменьшение же словаря приводит, соответственно, к более частым повторам слов.

А теперь попытаемся "препарировать" какой-нибудь словарь, используемый для составления сканвордов. Проще всего провести такой анализ на основе словаря, содержащего в себе 15 648 слов, который использует ваш покорный слуга при составлении сканвордов среднего уровня сложности. Что мы и сделаем. Причем, разбирать будет только самые используемые длины слов - 3, 4, 5, 6 и 7 букв.

    трехбуквенных - 621 слово
    четырехбуквенных - 1622 слова
    пятибуквенных - 2972 слова
    шестибуквенных - 3228 слов
    семибуквенных - 3269 слов

Я намеренно не затрагивал здесь двухбуквенные слова, которые я в принципе не использую, и слова, длиннее семи букв, которые, как уже говорилось, - весьма нечастые гости в сканвордах, а посему погоды нам не делают.

Глядя на вышеприведенный список становиться ясно, что чем меньше в в слове букв, тем меньше таких слов, из чего следует, что более короткие слова и повторяться будут чаще - вариантов-то меньше. Кто-то может задать резонный вопрос: "А почему нельзя использовать только длинные слова, чтобы было меньше повторов? Или больше длинных, но меньше коротких?".  А дело в том, что специфика построения сканвордных сеток такова, что все они, как правило, имеют очень высокую плотность пересечения слов, что и не дает возможным "вплетать" в них достаточное количество этих самых длинных слов. А чтобы была понятнее моя мысль, приведу разные сетки сканвордов, для наглядности смакетированные для слов одинаковых длин, и вы поймете, насколько сложно, а, порой, и просто невозможно, увязывать между собой многобуквенные слова:
Сетка сканворда из трехбуквенных слов
Сетка сканворда из четырехбуквенных слов
Сетка сканворда из пятибуквенных слов
Сетка сканворда из шестибуквенных слов
Сетка сканворда из семибуквенных слов