漢族中有多少北方民族的血液?
作者簡(jiǎn)介:嚴實(shí),分子人類(lèi)學(xué)硏究者,語(yǔ)言愛(ài)好者,現在復旦大學(xué)現代人類(lèi)學(xué)教育部重點(diǎn)實(shí)驗室工作。推薦《人類(lèi)學(xué)雜記》系列。
我必須承認這個(gè)題目不是很好寫(xiě)?,F在網(wǎng)絡(luò )上關(guān)于漢族起源的各種聲音都不少,有主張漢族都是炎黃子孫的,有說(shuō)某個(gè)方言的漢族族群是最純正漢族的,有說(shuō)南方漢人主要是土著(zhù)漢化的,有說(shuō)北方人是胡種的。其實(shí)這些說(shuō)法很多都是片面的,有出于政治目的的,有因為偏見(jiàn)的,也有很多是出于顯示本族群的正統性而貶抑其他族群而制造出來(lái)的。我希望借本文從我現有的分子人類(lèi)學(xué)數據中舉出一些事實(shí)而還原出一部分真相。
本文所指的漢族就是目前一般意義上的漢族,可以暫時(shí)先不管近幾十年內漢族和其他民族通婚的后代,而包括了全國各省和各大方言區的漢族。至于漢族是什么定義,血統還是文化上的,這個(gè)問(wèn)題不在本文考慮范圍。好在不論什么定義的漢族,在現今狀態(tài)下包含的人差不太多。本文更不支持通過(guò)血統,尤其是單純根據Y染色體來(lái)劃分民族屬性的做法。本文就是想通過(guò)事實(shí),盡可能還原歷史上真正發(fā)生過(guò)的事情。
我之前的《人類(lèi)學(xué)雜記》系列中也提到,人的遺傳物質(zhì)分為常染色體、X染色體、Y染色體和線(xiàn)粒體。常染色體能顯示每個(gè)個(gè)人及人群的血統混合比例,以及族群之間和個(gè)人之間的遠近關(guān)系,但因為難以作演化樹(shù)(只能作聚類(lèi)樹(shù),而聚類(lèi)樹(shù)并不能顯示真實(shí)的演化關(guān)系),并不能反映血統的流向關(guān)系;X染色體因為復雜的遺傳模式(女性?xún)蓷l,可發(fā)生重組,男性一條),目前不能較好分析,且其遺傳規律仍會(huì )較接近常染色體;Y染色體反映父系;線(xiàn)粒體反映母系。
先說(shuō)Y染色體,大家已經(jīng)大概知道,漢族的最主要類(lèi)型是O3-M122,占到一大半,其余的包括O1-M119, O2-M268, C3-M217, N-M231, Q-M242等等。如果把省份分成北、東、南三塊,華東按江、浙、滬、皖四省市(因為在復旦收樣,這些地方樣本比較多),其余的省按通常意義的南北方來(lái)分。大體結果如表所示:
首先可以看出,漢族,不論北方、華東或南方,最常見(jiàn)的單倍群是相當一致的。尤其O3下面的O3a2c1a-M117, O3a2c1*-M134(xM117)以及O3a1c-002611三支,其總和占了整個(gè)漢族的45%左右,在南北方總體來(lái)說(shuō)差別都不大(除M134xM117在北方比南方略高)。在漢族中總體比較均勻的,還有N和O2*這兩大單倍群。這五大支,我認為都是屬于華夏較早期的成分,應該是5000-2000年前居住在黃河流域的。盡管這幾大支很可能不是同時(shí)同地擴張的,可能也不都是華夏最早的主要組成,但至少在漢族第一次大規模南遷(東晉)之前,以上的成分已經(jīng)相對混合得比較均勻了,因此南遷時(shí)能以大致相似的相對比例進(jìn)入南方漢人。
O1(尤其是其下的O1a1-P203支)在華東和南方比例明顯比北方多??紤]到O1在4000多年前在長(cháng)江三角洲的良渚文化的古DNA中已經(jīng)有很高比例(Li H. et al. 2007),可以認為華東和南方的O1至少很大一部分來(lái)自百越群體。不過(guò),考慮到北方漢族也有4%的O1,尤其在西部的回族、羌族,甚至東北的一些民族中也有一定比例的O1來(lái)看,不應把O1的來(lái)源完全歸結為越人。
O2包括O2*-M268(xPK4,M176)、O2a-PK4(下含O2a1-M95)和O2b-M176。從上表來(lái)看,O2*在全國是均勻的,O2a-PK4明顯在南方多一些??紤]到南方少數民族中南亞、壯侗、苗瑤等民族中普遍有高頻的O2a的分布,我們可以認為,南方漢族中的O2a主要是從少數民族中融入的。但同O1的情況,在各處漢族和北方少數民族也普遍有低頻的O2a存在來(lái)看,O2a可能也是在早期漢族中即存在的。
C3-M217是一個(gè)需要仔細討論的問(wèn)題。中國的C基本上都屬C3(南方有很少數的CxC3)。C和D一樣,是早期(應該在6 – 3萬(wàn)年前)到達東亞的單倍群。C3的年齡大致也和整個(gè)O相當。我不很同意把C和D稱(chēng)作“棕種人”或者“矮黑人”的提法,因為一來(lái)Y染色體不與體質(zhì)直接關(guān)聯(lián),二來(lái)當C、D的人群與N、O的人群兩三萬(wàn)年前在東亞最初相遇時(shí),誰(shuí)比誰(shuí)白也不好說(shuō),我覺(jué)得目前證據還不充足。
C3在北方的比例明顯比華東和華南高一些。參考北方的阿爾泰語(yǔ)系民族,如蒙古族、滿(mǎn)族中普遍較高的C3比例(他們的C也主要都是C3),可以推測,北方漢族中偏高的C3是與北方民族相關(guān)的。
(002611包含在本表的O3*里,占漢族17%左右,因為早期的文獻不測002611這個(gè)點(diǎn),表中沒(méi)有列。本表中的O3*相當于前面表中的M122, M324, 002611, M7四列的總和。兩表的原始樣本來(lái)源不同,數據稍有一兩個(gè)百分比的出入也是正常的。)
大家都知道,蒙古和滿(mǎn)人都曾經(jīng)統治過(guò)中國。那么漢族中的C3是否來(lái)源于蒙古人和滿(mǎn)人呢?Zerjal等人在2003年發(fā)現,在蒙古等大量阿爾泰人群的C3*中,存在著(zhù)一個(gè)特殊的STR組合(單倍型),稱(chēng)作“星簇”(star-cluster),占了蒙古人的20%以上,從東北到中亞的很多民族里也都有分布:
這個(gè)單倍型擴張年代很新,根據Zerjal計算只有1000年多一些(我仍然堅持認為用幾個(gè)到幾十個(gè)STR算出來(lái)的時(shí)間準確性很差)。且不論這個(gè)星簇是否是成吉思汗的后裔(我的朋友蘭??赡軙?huì )有專(zhuān)文來(lái)考證此事),至少以其在蒙古中的比例,可以將其看作是蒙古擴張的一個(gè)標記。假如蒙古人大規模融入漢族(考慮其當時(shí)的人口數,應該是均勻的),而假設漢族中有10%的父系是從蒙古人來(lái)的話(huà),漢族就應該有不下2%的比例屬C3的星簇。
然而我檢査了上千份漢族的樣本,僅發(fā)現一例東北漢族屬于星簇(通過(guò)STR判斷),這個(gè)人的父親還是孤兒,不知道祖上原來(lái)姓什么。這樣的話(huà),就可以作出一個(gè)結論:漢族(包括北方漢族)父系中幾乎不存在從蒙古人混入的成分。即使有的話(huà),混入比例也不超過(guò)1%。
此外,在北部通古斯人(鄂倫春、鄂溫克、赫哲)和部分蒙古族和哈薩克斯坦族中存在大量的(>30%)C3c-M48單倍群,滿(mǎn)族中也有少量,而這個(gè)類(lèi)型目前也未在我的漢族樣本中發(fā)現一例(在另一未公開(kāi)的北方某省上千例漢族樣本中發(fā)現了3例)。這也能說(shuō)明漢族中基本不存在蒙古來(lái)源。
滿(mǎn)族的來(lái)源中本來(lái)就有大量漢人,從前面表中可見(jiàn)漢族的各主要成分在滿(mǎn)族中都有一定比例。滿(mǎn)族中C3星簇的比例比蒙古族中略少(8%左右),評價(jià)滿(mǎn)人在漢族中混合比例稍為困難一些。但有清一代,滿(mǎn)族(旗人)都能記住自己的身份,基本到目前還都是能知道自己父系的,較少有父系旗人的人在民族劃分時(shí)算作漢族。漢族和滿(mǎn)族的父系關(guān)系,主要還是漢族的父系進(jìn)入滿(mǎn)族(主要是滿(mǎn)族三四百年前形成時(shí),另外不排除近年來(lái)隨母親民族進(jìn)入的)。
那么北方漢族中比例較高的C3是什么來(lái)源呢?不能排除是東晉前C3已大量存在于漢族,但未混勻。也可能是后來(lái)鮮卑等民族大量融入。因為目前已無(wú)鮮卑的直系后裔民族,古DNA的Y染色體結果也還很有限,還不能驗證這些C3是否源于鮮卑。但可以肯定的是,如此高比例的C3不是蒙古來(lái)源。
通過(guò)類(lèi)似的方法,也可以評估日本侵華時(shí)是否在中國遺留下后代。日本有35%的D型,都屬D2-M55。這個(gè)型代表了日本舊石器時(shí)期的早期居民——繩文人。除日本列島外,D2只在朝鮮半島存在低于1%的比例。目前,在大量的漢族數據中也沒(méi)測到一例D2。說(shuō)明日本人的父系沒(méi)有混入漢族。
后面說(shuō)一下代表母系遺傳的線(xiàn)粒體。文波等人2004年的研究以及薛付忠等人2008年的研究表明,南北漢族的父系是相當一致的,不存在一個(gè)明顯的南北界線(xiàn)(如本文前面所述)。中國南方的漢化主要應歸功于北方漢人的人口南遷,只有小部分是南方土著(zhù)漢化融入。但線(xiàn)粒體的南北有較明顯的區別,最明顯的界線(xiàn)正是在大約秦嶺-淮河一線(xiàn)。
這說(shuō)明,母系在漢族中的混合不如父系均勻,一個(gè)地方的土著(zhù)母系在有大量移民遷入時(shí)仍能保持較高的原有比例。這個(gè)從一般的人口遷徙規律也容易理解:本身男性比女性更容易進(jìn)行長(cháng)距離移動(dòng)并移民定居(相反,鄉村一級的母系比父系流動(dòng)更普遍)。歷史上的移民還有不少是軍隊的移動(dòng),有時(shí)是不攜帶女性的,這時(shí)就需要找當地女性結婚。漢族男性相比土著(zhù)擁有較高社會(huì )地位和較多財富也是歷史上漢族父系占優(yōu)勢的原因。
另外,還需要考慮到東亞絕大多數民族是父系社會(huì )。同一個(gè)父系的子女生活在一起,經(jīng)常形成同姓村,而女性在嫁娶時(shí)流動(dòng)。這樣,孩子的語(yǔ)言、民族屬性等一般都是隨父親的。這也是Y染色體(父系)和民族關(guān)聯(lián)更緊密,而線(xiàn)粒體(母系)和地理區域關(guān)聯(lián)更緊密的原因。
仍然要嘮叨一句:Y染色體只是DNA的眾多標記里其中的一個(gè)而已。人的全基因組有3 Gbp × 2(二倍體),而Y染色體只有60 Mbp,上面僅有幾個(gè)基因,既不決定體質(zhì)、相貌等等,也幾乎和各種疾病無(wú)關(guān)。之所以常用Y染色體來(lái)研究只是因為遺傳模式簡(jiǎn)單、容易研究,能相對說(shuō)得清楚一些。忽略了n代前的2?-1個(gè)祖先而只管一個(gè)純父系祖先傳下來(lái)的遺傳物質(zhì),也忽略掉各種文化屬性,而簡(jiǎn)單用Y染色體來(lái)判斷一個(gè)人的族屬,無(wú)疑是荒謬的。另外,現在的Y染色體研究也還未達到透徹,仍需要檢測更大數量的樣本,網(wǎng)上某些人那樣只看見(jiàn)一個(gè)C就說(shuō)是蒙古人,看見(jiàn)N就是北亞,看見(jiàn)Q就是印地安,看見(jiàn)O1就是百越這種簡(jiǎn)單的論調現在已經(jīng)不值一駁了。
——摘自嚴實(shí) 《人類(lèi)學(xué)雜記》
投稿郵箱:admin@zdic.net
漢典主站:www.songdeshuju.com
漢典論壇:bbs.zdic.net
漢典手機站:m.zdic.net