Курсовая работа: Применение методов математической статистики и теории вероятностей в задачах теоретической лингвистики при анализе устной и звучащей речи на русском и английском языках

Дискретный вариационный ряд длины словоформ в фонемах в данном стихотворении будет таков:

X 1 2 3 4 5 6 7
N 1 15 13 41 14 12 9

Где так же, как и в предыдущем примере, X – признак (количество фонем в слове), N – сумма всех вариант, – варианты, – число повторений вариант.

N = 105

Очевидным является то, что дискретные вариантные ряды двух стихотворений сильно отличаются друг от друга, это можно представить нагляднее, если вместо абсолютных частот указать относительные частоты в процентах:

X
f*100% 0,95% 14,28% 12,38% 39,04% 13,33% 11,42% 8,57%

Различие между длинами словоформ в рассматриваемых стихотворениях состоит в том, что у английского автора преобладают слова в четыре фонемы (39,04%), в то время как у Зинаиды Гиппиус – в шесть. Так же несложно заметить, что количество вариантов в стихотворении «TheCradleSong» значительно меньше, чем в «Свободный стих».

2.2 Непрерывные вариационные ряды

Непрерывные вариационные ряды, как и дискретные, широко распространены в анализе устной и звучащей речи, так как здесь значения признака:

длина

частота

интенсивность звука

могут отличаться друг от друга на как угодно малую величину. Поскольку отличия между вариантами имеют непрерывный характер, используется только интервальное построение вариационного ряда. Для исследования данных фонетических аспектов нужны специальные измерительные приборы для замеров звучания слогов. Несмотря на невозможность проведения данного анализа, я расскажу о его основном принципе.

При наличии результатов эмпирических исследований, создаются непрерывные интервальные ряды, где - длина слогов в мс, а интервалы вариант выглядят следующим образом – (, (), () и так далее.

Ширина интервала определяется по формуле Стерджесса:

.

При этом интервальная разность k округляется до ближайшего целого числа, число интервалов l определяется из выражения

.

2.3 Графическое построение дискретных лингвистических вариационных рядов для рассматриваемых стихотворений

Несмотря на его простоту, слабой стороной табличного описания колебания признака является недостаточная наглядность. Поэтому для достижения большей наглядности я использую графическое изображение интересующего меня распределения (длин словоформ по фонемам) – многоугольник распределения признака (полигон).


2.4 Ряды распределения дискретных случайных величин

Так как дискретная случайная величина может принимать возможные значения с различными вероятностями, чтобы охарактеризовать её в статистическом смысле, необходимо указать вероятности всех её значений.

Законом распределения вероятностей дискретной случайной величины называется таблица соответствия между возможными значениями этой величины и их вероятностями. Эта таблица – ряд распределения дискретной случайной величины.

Для первого стихотворения:

X 1 2 3 4 5 6 7 8 9
0.1238 0.0952 0.0762 0.1238 0.1333 0.1714 0.1047 0.0762 0.0476
X 10 11 12 13 14 15 16 17 18
0.0285 0 0.0095 0 0 0 0 0 0.0095

Для второго стихотворения:

X 1 2 3 4 5 6 7
0.095 0.1428 0.1238 0.3904 0.1333 0.1142 0.0857

По определению, сумма вероятностей событий в каждом из стихотворений должна быть равна 1

Сделаю проверку результатов. Для первого стихотворения:

0.1238 + 0.0952 + 0.0762 + 0.1238 + 0.1333 + 0.1714 + 0.1047 + 0.0762 + 0.0476 + 0.0285 + 0.0095 + 0.0095 = 0.9997 -

подсчёты произведены с небольшой погрешностью

Для второго стихотворения:

0.095 + 0.1428 + 0.1238 + 0.3904 + 0.1333 + 0.1142 + 0.0857 = 0.9971

К-во Просмотров: 412
Бесплатно скачать Курсовая работа: Применение методов математической статистики и теории вероятностей в задачах теоретической лингвистики при анализе устной и звучащей речи на русском и английском языках