Вероятностные расчеты в ДНК-дактилоскопии
В настоящее время в практику судебной медицины и криминалистики вошли новые методы идентификации, основанные на анализе дезоксирибонуклеиновой кислоты (ДНК). Информативность этих методов исключительно велика, так как высокий полиморфизм последовательностей ДНК делает ее неограниченным источником идентификационных признаков.
ДНК-анализ используется как в экспертизе вещественных доказательств, так и в экспертизе спорного происхождения детей.
Как и при классической дактилоскопии (исследовании папиллярных узоров), в ходе анализа ДНК не выявляются особые, свойственные только данному индивидууму, признаки. Каждый из изучаемых признаков обладает лишь групповой принадлежностью, однако в совокупности они позволяют индивидуализировать объект. Оценка идентификационного значения выявленных признаков осуществляется на основе вероятностных расчетов, базирующихся на данных о частотах встречаемости признаков у населения (в популяции). Частоты встречаемости признаков устанавливают опытным путем. Для этого исследуют определенную выборку людей, отражающую распределение признаков в популяции, и для каждого из них подсчитывают частоту встречаемости. Данные о частотах встречаемости позволяют вычислить вероятности идентификационных признаков. Вопросы, касающиеся расчета вероятности при оценке результатов ДНК-анализа, рассматриваются в ряде работ [1 - 14].
В вероятностных расчетах используют следующие обозначения и формулы.*
Основным идентификационным признаком является аллель. При популяционных исследованиях в пределах каждого локуса выявляется целый ряд аллелей; у отдельно взятого индивидуума при типировании локуса определяются один (го-мозиготная форма) или два (гетерозиготная форма) аллеля. Вероятность аллеля обозначается символом p. Символ pk означает вероятность того, что аллель принимает значение k. Например, символом p2 обозначается вероятность аллеля номер 2. Сумма вероятностей всех аллелей одного локуса в популяции равна 1, т.е. если в локусе n аллелей, то:
p1 + p2 +...... + pn = 1.
Вероятность встречаемости гетерозиготного профиля ДНК, состоящего из аллелей a и b (p a,b), равна удвоенному произведению вероятностей соответствующих аллелей a и b:
pa,b = 2 pa pb при a ¹ b.
Вероятность встречаемости гомозиготного профиля ДНК, содержащего, например, аллель a (p a,a), равна квадрату вероятности аллеля a: pa,a = p2а.
Вероятность pа вычисляют на основании величины qa, обозначающей вероятность присутствия у индивидуума в типируемом локусе (хотя бы в одной из парных хромосом) аллеля a. Вероятность qa равна сумме всех генотипов, включающих в себя аллель a:
qa = p1,a + p2,а +... + pa,а +... + pn,a = 2p1 pa + 2p2 pa +... + p2a +... + 2pn pa = pa (2 - pa).
Откуда:
.
Вероятность qa находят на основании данных популяционных исследований. Для этого подсчитывают qa(N) - частоту нахождения аллеля а в данном локусе ДНК, равную отношению числа проб (Nа), в которых был выявле аллель а, к общему числу исследованных проб (N):
qа(N) = Na /N.
Если N велико, то, по закону больших чисел, частота qa(N) практически совпадает с вероятностью qa. Поэтому правомерно употребление понятий "частота" и "вероятность" почти как синонимов, так как они обозначают фактически одно и то же число.
В литературе для обозначения qa часто используется термин "частота встречаемости аллеля а в популяции". ............