А что тут исследовать?
Если достать данные по алкоголикам, и по их ФИО, а также по всем гражданам, то элементарное дело - посчитать зависимость от имени и значимость отклонений...
Если например людей с именем Алексий 1% от популяции, а среди алкоголиков их 2%, то среднее отклонение этой цифры будет равно примерно корень (0,02/N). Проверим, укладывается ли разница (2%-1%) в 3 отклонения: 3* корень (0,02/N) = 0,01 отсюда, N=600 вроде бы...
Соответственно, если из 600 алкоголиков мы находим 12 человек с именем Алексий, то можно сделать вывод, что сие не случайно...
Ну вот, как-то так...
С учётом неоднородности выборок, надо бы конечно не 3 отклонения брать, а 6 допустим для верности... Соответственно, в 4 раза больше алкоголиков брать в рассмотрение...
Учитывая имена вроде Ярослав, которых не так уж много, надо ещё на 20 умножить выборку... Итого, 50 000 алкоголиков надо для выводов статьи, по моим прикидкам...
|