加齐▫ 裸眼看白si
关注数: 140 粉丝数: 612 发帖数: 23,643 关注贴吧数: 108
中国壮族群体父系单倍群及民族血统构成情况简介 壮族是我国人口最多的少数民族,民族语言为壮语,属汉藏语系壮侗语族壮傣语支。在我国境内的壮族总人口约为 1693 万(六普数据)。主要聚居在南方的各省市自治区,范围东起广东省连山壮族瑶族自治县,西至云南省文山壮族苗族自治州,北达贵州省黔东南苗族侗族自治州从江县,南抵北部湾,其中广西壮族自治区是壮族的主要分布区。此外,在越南等国家和地区也有其分布,被识别为岱依族和侬族。 23魔方祖源研究部对祖源数据库中的壮族群体的数据做一轮清洗和统计,以高区分度的视角下看我国壮族群体的父系类型以及民族血统的构成情况。 统计对象:民族问卷栏目中填写为「壮族」的样本。 数据清洗方法:对所有填写为「壮族」的样本进行基因关系计算,如果样本出现了 2-3 级基因关系亲属对的,则选择保留其中的一个男性样本;如果出现的 2-3级 基因关系亲属,民族为非壮族的,则视为有晚近的跨民族通婚,则剔除此样本。由此获得了排除近亲关系,无晚近跨民族通婚历史的壮族男性样本 801 个,以此口径进行统计。 统计结果如下: 一、壮族的民族血统构成情况:(%)可以看到我国的壮族群体,平均有三成以上的壮傣成分,该成分也是壮族群体和其他非壮傣群体区分度较大的特征成分。 二、壮族群体的父系单倍群构成情况: 我们对这 801 名男性壮族的父系单倍群类型进行了统计,发现 801 个样本分成了 207 个父系类型,父系单倍群多样性相对较高。在单倍群大类分型中,可以看到 O-M268 占比最高,占到了壮族群体的 52.93%。我们筛选了壮族群体较为常见的如下类型进行详细介绍: 1. D-MF2279 类型,占到了壮族群体人口的 1.75%,为壮族群体的常见的父系类型之一。 根据23魔方的研究显示,D-MF2279 的最近共祖时间约在 2530 年前(春秋时期),人口占到中国男性总人口的 0.17%,主要分布于广西以及其相邻省市,该类型可以占到广西当地人口的 2.12%,此外在贵州、广东等省约有 0.50% 左右的分布。该类型在广西梧州一带约占当地人口的 8% 左右。2. O-CTS4040*,为壮族群体的常见的父系类型之一,占到了壮族群体人口的 2.12%。经细化研究,发现该类型实际为 O-CTS4040 下游的 O-MF56251 分支,其最近共祖时间约在 3370 年前,初步估计该类型人口占到了中国男性总人口的 0.11%,主要分布于广西以及其相邻省市,该类型可以占到广西当地人口的 1.58%,此外在贵州 3.26%、广东和宁夏约有 2% 左右的分布。该类型在广西河池、来宾一带约占当地人口的 5~6% 左右。3. O-CTS651,为壮族群体较大的父系类型之一,占到了壮族群体人口的 6.62%。该类型的最近共祖时间约在 4890 年前,人口占到中国男性总人口的 0.49%,广泛分布于南方各地。该类型可以占到广西当地人口的 3.14%、贵州 1.61%、广东 1.00%、海南 0.97%、重庆 0.85%、江西 0.75%、福建 0.74%、四川 0.74%。在广西的百色、防城港、来宾,以及贵州黔西南、海南儋州等地,该类型可以占到当地人口的 5%~10% 左右的比例。其中在其 O-Z23917 类型下游,存在一个共祖 1180 年前的广西壮族黄氏家族。4. O-Z23762类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 14.36%。该类型最近共祖时间约在 1970 年前,人口约占中国男性人口的 0.32%。该类型占到广西当地人口的 7%,其中在广西河池,该类型占到当地人口的 32%,此外在来宾、柳州两地,该类型占到当地人口的 17% 以上,据23魔方的研究,此类型对应为壮族特色的韦氏家族。5. O-F923类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 9.11%。该类型的最近共祖时间约在 4350 年前,人口占到中国男性总人口的 0.78%,主要分布于华南。该类型可以占到广西当地人口的 7.01%、广东 3.38%、云南和海南的 1.70%。在广西的梧州、崇左、南宁、贺州、百色,以及广东的云浮、海南的儋州等地,该类型可以占到当地人口的 10% 左右。据23魔方的研究,此类型下游 O-MF60643 类型可以对应为分布于岭南的的莫氏家族。6. O-F789类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 9.74%。该类型的最近共祖时间约在 6320 年前,人口占到中国男性总人口的 0.79%,主要分布于广西以及相邻地区。该类型可以占到广西当地人口的 5.76%、云南 4.13%、贵州 2.41%、重庆 1.49%、四川的 1.32%。在广西的崇左该类型可以占到当地人口的 25% 左右。该类型在南亚和东南亚地区也有广泛的分布。7. O-SK1730 类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 8.24%。该类型的最近共祖时间约共祖于 2670 年前,人口占到中国男性总人口的 1.09%。主要分布于华南地区,该类型可以占到广西当地人口的 9.7%、广东 0.51%、海南 2.28%、云南 1.53%、贵州的 1.19%。据23魔方的研究,此类型下游 O-MF31768 类型可以对应为主体分布于壮族的覃氏家族。8. O-FGC61038 类型,为壮族群体的常见的父系类型之一,占到了壮族群体人口的 0.87%。该类型的最近共祖时间约共祖于 1630 年前,人口占到中国男性总人口的 0.03%。主要分布于广西地区,该类型可以占到广西当地人口的 0.64%、贵州的 0.10%。据23魔方的研究,此类型可以对应为主体分布于壮族和瑶族群体的潘氏家族。此外,C-AM00848、O-FGC61038、O-F4229、O-F838、O-MF117418、O-Y26367、O-Y37861、O-MF59333、O-CTS7228、O-Z3010、O-Z23392、O-F619、O-Z23327、N-Y24355 等类型在壮族群体里也占有一定的比例。 附图:壮族群体父系总体构成情况
【转魔方】中国人的父系有多少种? 中国人的父系有多少种?这是一个笼统的问题。 我们通常说的父系分类,是以特定的共祖年龄为条件的。 如以 7 万年(即共祖小于 7 万年的算作一种父系),则中国人几乎都属于 CT 这个支系。若以 5 万年为上限,则中国人也几乎都属于 F、C、D 这三种支系。 但是,我们测祖源显然不是只测到 F、C、D 就满足了,这和宣告自己是中国人或东亚人有什么区别?因此就有了不断往下分类的必要。 1. 以 16500 为上限,中国的父系分类 23魔方App 的「基因寻宗」提供了查看共祖年龄在 16500 的同支样本的功能。这样的分类源自于中国 Y 染色体谱系树习惯上的分法,也可以将分布较为相似的支系如 O-Page59(16000 年)、O-AM01822(15500 年)等设置为一个支系。 此种分类下中国人的父系主要有:上述统计对象为东亚人的父系,即新石器时代可能已主体或有较多人口生活在中国境内的支系,总计接近 40 种。 2. 以 7300 为上限,中国的父系分类 为什么不以 7000 年,而是 7300 年?因为 7000 年只是对于当前来说是一个整数,但历史意义却不明显。而 7300 年 BP( Before Present )这个节点更有意义,很多支系在此之后有了明显的分化,如 O-F8、O-SK1768、C-F10056 等。 23魔方目前已经发现的分开 7300 年的东亚人父系接近 300 种,为分开超过 16500 年的支系的数量的 7 倍左右。 3. 以 3100 为上限,中国的父系分类 23魔方 Y 染色体全序树上现有的东亚人支系中,分开 3100 年(西周初年以来)以上的分支及末端(单样本)接近 3000 种。据此估计,东亚人中分开 3100 年以上的不同支系可能达 4000 种。 这里有人可能会有疑问:是否还存在数量是已知支系好几倍的「超级芝麻型支系」等待去发现呢? 实际上,从人口发展模型来看,支系只有达到一定规模才能保证传承的稳定性,规模太小的支系漂变效应过强,极其容易被洗刷掉,此类支系绝大多数已经消失在历史长河里了。 4. 支系规模的天壤之别 据上述推断,中国的 3100 以内的父系可能多达数千种,但支系规模却呈天壤之别,人口规模较大(如:占中国男性 0.2% 以上)之的支系只是少数,但这些少数支系加起来的总比例又可以覆盖到较多的人口。 以 O-F8 为例,分开超过 3100 年的众多支系中,前六个人口最多的支系加起来即可占中国男性的 5.51%,占 O-F8 男性的 35% 左右。如下所示:若统计分开 2300 年的所有支系,前十大支系亦能占 O-F8 的 26.4% 左右。 因此,纵然支系种类很多,但由于少部分支系即可覆盖较多的人口,23魔方现有的 Y 全序树是能够让大部分检测者匹配到 2300 年内(秦汉及以后)的同宗的。当然,随着检测的人越来越多,匹配到晚近同宗的可能性也就越来越大。
1 下一页