★阿修羅♪ > 近代史5 > 333.html
▲コメTop ▼コメBtm 次へ 前へ ★阿修羅♪
日本人の遺伝子の地域差 _ 近畿と四国は漢民族に近い
http://www.asyura2.com/20/reki5/msg/333.html
投稿者 中川隆 日時 2020 年 10 月 19 日 07:30:44: 3bF/xW6Ehzs4I koaQ7Jey
 

(回答先: 弥生人の起源 投稿者 中川隆 日時 2020 年 8 月 05 日 07:25:20)

日本人の遺伝子の地域差 _ 近畿と四国は漢民族に近い

雑記帳 2020年10月18日
都道府県単位の日本人の遺伝的構造
https://sicambre.at.webry.info/202010/article_25.html


 都道府県単位の日本人の遺伝的構造に関する研究(Watanabe et al., 2020)が報道され、話題になっているようです。日本語の解説記事もあります。この研究はオンライン版での先行公開となります。本論文では、日本人の遺伝的構造を解明するため、47都道府県単位と、さらに大きな9地域区分(北海道・東北・関東・中部・近畿・中国・四国・九州・沖縄)単位で遺伝的データが分析されました。この区分は、以下の本論文の図1で示されます。

画像
https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fs10038-020-00847-0/MediaObjects/10038_2020_847_Fig1_HTML.png


 日本列島には、アイヌと主に沖縄の琉球人という二つの小集団と、その他の大多数を占める「本土」日本人という大集団が存在します。日本人の人口史については、変容・置換・交雑という3モデルが提示されており、現在有力なのは、交雑モデルの一つである「二重構造モデル」です。このモデルでは、現代日本人は先住民である「縄文人(縄文文化関連個体群)」とアジア東部大陸部からの移民との混合により形成された、と想定されます。頭蓋形態に関する以前の研究では、アイヌと琉球人が「本土」日本人より「縄文人」に近く、東北地方の人々は形態的にアイヌに近い、と示唆されています。遺伝学的にも、アイヌと琉球人は「本土」日本人よりも「縄文人」の遺伝的影響を強く受けており、とくにアイヌではその影響がひじょうに高い、と推測されています(関連記事)。

 これまでの遺伝学的研究で、「本土」日本人と沖縄県民との間の遺伝的差異は示されていますが、「本土」日本人の都道府県間の遺伝的差異はよく理解されていません。以前の研究で、主成分分析から東北地方の人々が沖縄県民に近く、「縄文人」の遺伝的影響が強い、と示唆されています。しかし、東北地方の全県の人々が遺伝的に沖縄県民に近いのか不明で、さらに四国・中国地方の人々は対象とされていませんでした。本論文では、47都道府県全ての11069人のゲノム規模一塩基多型データが分析され、都道府県水準での日本人の遺伝的構造が明らかにされます。これは、ヤフー株式会社が提供するゲノム解析サービス「HealthData Lab」の顧客11069名の138688ヶ所の常染色体一塩基多型遺伝子型データに基づいています。その地域的内訳は、本論文の表1で示されています。

 まず、個体水準で主成分分析が行なわれ、琉球人(おもに沖縄県民)と「本土」日本人(おもに沖縄県以外の46都道府県民)が遺伝的に明瞭に分かれる、と確認されました。なお、本論文で用いられたデータにアイヌは含まれていないと考えられます。常染色体上の138688ヶ所の一塩基多型遺伝子型データから各個体の主成分得点が求められ、プロットされました。次に、47都道府県のそれぞれから50名ずつ無作為抽出されて各一塩基多型のアレル(対立遺伝子)頻度が計算され、中華人民共和国の北京の漢人も含めてペアワイズにf2統計量(2集団間の遺伝距離を測る尺度の一つで、一塩基多型データに対するf2統計量は、一塩基多型ごとにあれる頻度の集団間差の2乗を計算し、それらの平均値として与えられます)を求めてクラスタ分析(多数の変数、つまり多次元データからデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つで、グループ分けが階層的になされる階層的手法と、特定のクラスター数に分類する非階層的手法があり、本論文では階層的手法の一つであるウォード法が用いられました)が行なわれました。

 日本人11069人と103人の漢人を対象とした主成分分析では、漢人に近い個体を除くと、日本人は沖縄県民を中心とする「琉球クラスタ」と本土日本人を中心とする「本土日本クラスタ」に大きく二分されました(図1)。本土日本クラスタ内では、東北の個体群が沖縄県民と、近畿および四国の個体群が漢人と比較的近い、と明らかになりました。以下、日本人と漢人を対象とした主成分分析結果を示した本論文の図2です。

画像
https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fs10038-020-00847-0/MediaObjects/10038_2020_847_Fig2_HTML.png


 ADMIXTURE分析(K=2からK=5まで)では、系統の割合が沖縄県民と他の都道府県民との間でかなり異なっていました。K=2では(図3)、青色成分が沖縄県民の系統の大半を占めています。沖縄県を除く都道府県では、青色成分の割合が近畿と四国で比較的低く、東北・関東・九州で比較的高い、と明らかになりました。以下、K=2の場合のADMIXTURE分析結果を示した本論文の図3です。

画像
https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fs10038-020-00847-0/MediaObjects/10038_2020_847_Fig3_HTML.png


 都道府県単位のクラスタ分析では、沖縄県民が他の全都道府県民と大きく異なり、沖縄県民を除く都道府県民は大きく3クレード(単系統群)に区分されました。クレード1は東北の全県、クレード2は四国と近畿の全府県、クレード3は中国と九州の全県を含みます。したがって、これら5地域(東北・四国・近畿・中国・九州)は比較的遺伝的には均質と考えられます。f2統計に基づくと、九州、とくに鹿児島県民が遺伝的には沖縄県民に最も近い、と明らかになりました。

 47都道府県単位での主成分分析では、同じ地域の都道府県が近くに位置づけられました(図5)。PC1軸では、沖縄県が他の都道府県から離れており、東北と九州の諸県は沖縄県と比較的近くに位置します。沖縄から最も遠いのは、近畿と四国の諸府県です。PC2軸は緯度および軽度と強く相関しており、各都道府県の地理的位置が反映されていることを示します。以下、47都道府県単位での主成分分析結果を示した本論文の図5です。

画像
https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fs10038-020-00847-0/MediaObjects/10038_2020_847_Fig5_HTML.png


 主成分分析結果を示す上記の図2は、近畿と四国の人々が他の都道県民よりも遺伝的に漢人に近いことを示唆します。これを確認するためf2統計が行なわれ、近畿と四国の人々が他のほとんどの都道県民よりもかなり漢人に近い、と明らかになりました。本論文の分析では、47都道府県民のうち、漢人と遺伝的に最も近いのは奈良県民です。

 これらの分析結果を踏まえると、以前の研究と同様に、日本列島の現代人集団は遺伝的に沖縄と本土日本に区分される、と改めて確認されました。ただ、上述のように本論文ではアイヌは含まれないと考えられるので、アイヌを含めると二分ではなく三分されるでしょう。上述のように、以前の研究で本土日本人よりも琉球人の方が遺伝的には縄文人と近い、と示されていました。つまり、本土日本人は琉球人よりも、アジア東部大陸部からの(おそらくは弥生時代以降の)移民に遺伝的に近いことになります。これは、上記の図3で示されたK=2のADMIXTUREにおいて、青を縄文人由来、橙を弥生時代以降の移民に由来すると仮定した場合に確認されます。

 アジア東部大陸部からの弥生時代以降の移民は、遺伝的に漢人に近いと予測されます。上記の図5で示された主成分分析のPC1軸で沖縄から最も遠い近畿と四国の府県は、他のほとんどの都道県よりも漢人に近い、と明らかになりました。図5のPC1軸は、縄文人とアジア東部大陸部からの弥生時代以降の移民という二つの祖先集団との遺伝的類似性を反映しているようです。遺伝的に、東北と九州の個体群は他地方よりも縄文人に近く、一方で近畿と四国の個体群はアジア東部大陸部からの弥生時代以降の移民に近いようです。アイヌは北海道の在来集団ですが、現代の北海道民のほとんどは明治時代以降の本土日本からの移民の子孫です。したがって、アイヌは遺伝的に本土日本人よりも琉球人の方と類似していますが、現代の北海道民は琉球人と類似していません。縄文人系統の地域差が、現代日本人集団の遺伝的構造の主因かもしれません。

 主成分分析では、地理的位置が本土日本人の遺伝的構造に関わる主因の一つであることも明らかになりました。上記の図5のPC2軸と緯度もしくは経度との有意な相関は、隣接する都道府県間の移動によるものと考えられます。この結果は予測できましたが、ゲノム規模の一塩基多型遺伝子型データを用いて都道府県水準で大規模な分析を行なった本論で初めて示されました。

 本論文は、四国の住民が本土日本人の中では比較的漢人に近いことを始めて示しました。上記の図2では、四国の人々はわずかしか漢人クラスタと本土日本人クラスタとの間に位置づけられないので、四国の現代人は、中国人や朝鮮人とあまり混合していない可能性があります。したがって、アジア東部大陸部からの弥生時代以降の移民の遺伝的構成は四国でよく保存されている、と考えられます。アジア東部大陸部からの移民により導入された水稲耕作は九州北部で始まったので、この移民はまず九州北部に到来した可能性が高そうです。もしそうならば、アジア東部大陸部から四国への移住には、中国や九州を経由して瀬戸内海を渡る必要があります。それにも関わらず、四国は中国や九州よりも遺伝的に漢人に近く、弥生時代以降の渡来系統の程度がアジア東部大陸部からの移民の移動経路と必ずしも一致しない、と示唆されます。四国の人々のゲノムに関する将来の研究では、弥生時代以降におけるアジア東部大陸部からの移民の遺伝的背景が解明されるかもしれません。しかし、近畿の現代人と漢人との遺伝的類似性に関しては、図2の2集団間で位置づけられた個体群のように、最近の混合に由来するかもしれません。

 上記の図5で示される主成分分析では、東北だけではなく九州も沖縄県に近くなっています。これは図2の主成分分析により支持され、九州の一部個体が本土日本クラスタと沖縄クラスタの間に位置づけられます。その一因は、九州と沖縄の地理的近さで、最近になって九州に沖縄県から移住した人々や、沖縄県出身の両親がいるからです。九州の各県では鹿児島県が沖縄県に最も近くなっています。これは、鹿児島県に属する奄美群島が、かつて沖縄本島に存在した琉球王国の支配下にあったからと考えられます。九州と沖縄の遺伝的近縁性は、上述のように地理的近さが一因と考えられますが、九州北部の3県(福岡・佐賀・長崎)も沖縄に遺伝的に近くなっています。上述のように、アジア東部大陸部からの弥生時代以降の移民は九州北部にまず到来したと考えられますが、九州北部の現代人よりも四国や近畿の現代人の方が遺伝的には漢人と近くなっています。この結果は、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかったことを示唆しますが、これは将来解決されるべき問題です。

 また、日本人のさまざまな疾患に関連する多型を特定するため、遺伝的関連研究が行なわれてきました。偽陽性を回避するため、症例と対照の遺伝的背景はできるだけ一貫している必要があります。ゲノム規模関連研究では、ゲノム拡張係数もしくは主成分分析スコアの使用により、集団階層化による偽陽性は回避できるかもしれません。しかし、原因となる一塩基多型が被験者の遺伝的不均質に寄与している場合、こうした調整が偽陰性を引き起こすかもしれません。これらの問題に完全に対処することは困難ですが、本論文の結果は、患者と対照群は、上述の各クレード(クレード1〜3および沖縄)内の都道府県から募集する必要がある、と示唆します。

 まとめると、本土日本人は遺伝的に不均一で、これは、各地域で縄文人とアジア東部大陸部からの弥生時代以降の移民との間の混合の程度と、近隣の都道府県間の限定的な移住によりもたらされた可能性があります。


 以上、本論文についてざっと見てきました。本論文は都道府県単位での日本人の遺伝的構造を示しており、ひじょうに有益だと思います。ただ、日本列島の現代人集団の遺伝的構造の地域差がどのように形成されてきたのか解明するには、やはり日本列島全域での通時的な古代ゲノムデータが必要となります。その意味で、現代日本人、さらにはその地域差の形成過程を、本論文から過剰に読み取ってはならない、とは思います。あくまでも、本論文はそうした問題に関して重要な基礎的情報を提供した、と考えるべきでしょう。

 本論文が提示する現代日本人の遺伝的構造の地域差は興味深く、今後の研究でより詳細に解明されていく、と期待されます。本論文では、日本列島の現代人のうち本土集団と琉球集団が取り上げられています。どちらも、日本人起源論で以前から提示されている「二重構造モデル」で説明されます。上述のように、縄文人とアジア東部大陸部からの弥生時代以降の移民との混合により、日本列島の現代人集団は形成された、というわけです。ただ、本論文で取り上げられていないアイヌ集団に関しては、上述のように縄文人の遺伝的影響が本土集団および琉球集団よりもずっと高く、本土集団との混合が前近代より進行していたとはいえ(関連記事)、アジア東部大陸部からの弥生時代以降の移民の遺伝的影響は本土集団および琉球集団よりもはるかに低いでしょう。

 このアジア東部大陸部からの弥生時代以降の移民と遺伝的構成が最も類似していると推測されるのは、現時点で確認されている古代人では新石器時代黄河流域集団となります(関連記事)。このモデルでは、新石器時代黄河流域集団は出アフリカ現生人類(Homo sapiens)集団の中で位置づけられます。出アフリカ現生人類は、ユーラシア東部系統と西部系統に分岐し、ユーラシア東部系統は南方系統と北方系統に分岐します。ユーラシア東部南方系統に位置づけられるのは、現代人ではパプア人やオーストラリア先住民やアンダマン諸島人、古代人ではアジア南東部狩猟採集民のホアビン文化(Hòabìnhian)集団です。一方、ユーラシア東部北方系統からはアジア東部系統が分岐し、アジア東部系統はさらに南方系統と北方系統に分岐します。アジア東部北方系統は新石器時代黄河流域集団、アジア東部南方系統は新石器時代の福建省や台湾の集団(おそらくは長江流域新石器時代集団も)に代表され、オーストロネシア語族現代人の主要な祖先集団(祖型オーストロネシア語族集団)です(関連記事)。

 現代において、日本列島本土集団や漢人やチベット人などアジア東部現代人集団の主要な遺伝的祖先はアジア東部北方系統ですが、漢人は北部から南部への遺伝的勾配で特徴づけられ、それはアジア東部北方系統とアジア東部南方系統との混合により形成された、と推測されます。チベット人はアジア東部北方系統とユーラシア東部南方系統との、日本列島本土集団はアジア東部北方系統と縄文人との混合により形成されましたが、いずれもアジア東部北方系統の遺伝的影響の方がずっと高くなっています(80%以上)。縄文人は、ユーラシア東部南方系統(45%)とアジア東部南方系統(55%)との混合と推定されています。

 本論文では、日本列島の現代人集団のうち本土集団と琉球集団は、先住の縄文人とアジア東部大陸部からの弥生時代以降の移民の混合と指摘されていますが、後者は基本的に新石器時代黄河流域集団に代表されるアジア東部北方系統と考えられます。ただ、稲作の北上に伴って黄河流域でも後期新石器時代にはアジア東部南方系統の割合の増加が指摘されているように(関連記事)、アジア東部大陸部から日本列島への弥生時代以降の移民も、アジア東部北方系統を基本としつつ、アジア東部南方系統の遺伝的影響を受けている、と推測されます。

 本論文の結果を踏まえると、沖縄県民ではアジア東部北方系統の遺伝的影響が他の都道府県民(本土集団)よりも低く、本土集団でも地域差がある、と言えそうです。本論文が指摘するように、アジア東部大陸部からの弥生時代以降の移民はまず九州北部に到来したと考えられるのに、その遺伝的影響は九州よりも近畿と四国で高くなっています。本論文はこれに関して、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかった可能性を示唆します。ただ、ヤマト政権成立後に、アジア東部北方系統の遺伝的構成の人々が朝鮮半島から日本列島に到来し(いわゆる渡来人)、畿内に優先的に居住したことを反映している可能性も考えられます。弥生時代だけではなく、古墳時代以降の混合も地域差を形成したかもしれない、というわけです。四国に関しては、近畿との歴史的なつながりを反映しているかもしれません。また関東の現代人がクレードを形成しなかったことについては、近代以降の各地からの移住の影響が大きいかもしれません。これらの問題の解明には、やはり広範囲で通時的な古代ゲノムデータが必要で、今後の研究の進展が期待されます。


参考文献:
Watanabe Y, Isshiki M, and Ohashi J.(2020): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics.
https://doi.org/10.1038/s10038-020-00847-0


https://sicambre.at.webry.info/202010/article_25.html  

  拍手はせず、拍手一覧を見る

コメント
1. 2020年10月25日 12:20:11 : maeqeulk3U : ai5wQnR4S0NjYVU=[24] 報告
2020/10/14
都道府県レベルでみた日本人の遺伝的集団構造
〜縄文人と渡来人の混血がもたらした本土日本人内の遺伝的異質性〜

渡部 裕介(研究当時:生物科学専攻 博士課程3年生)
一色 真理子(研究当時:生物科学専攻 博士課程3年生)
大橋 順(生物科学専攻 准教授)
https://www.s.u-tokyo.ac.jp/ja/press/2020/7056/

発表のポイント
47都道府県に居住する日本人約11,000名の全ゲノムSNP遺伝子型データを解析し、現代日本人の遺伝的構造は各都道府県における縄文人と渡来人の混血の程度と地理的位置関係によって特徴づけられることを示した。
都道府県レベルで日本人の遺伝的集団構造を初めて明らかにした。
本研究により、日本人の形成過程の理解が進むだけでなく、疾患遺伝子関連研究において、適切な検体収集地域の選定が可能になると期待される。

発表概要
今回、東京大学大学院理学系研究科の渡部裕介・一色真理子大学院生(研究当時)と大橋順准教授は、47都道府県に居住する日本人約11,000名の全ゲノムSNP遺伝子型データを用いて、都道府県レベルで日本人の遺伝的集団構造を調べた。クラスター分析により、47都道府県は沖縄県とそれ以外の都道府県に分かれ、沖縄県以外は九州・中国地方、東北・北海道地方、近畿・四国地方の3つのクラスターに大別された。関東地方や中部地方の各県は1つのクラスター内に収まらなかった。主成分分析の結果、第1主成分は沖縄県との遺伝的距離と関連しており、第2主成分は緯度・経度と関連していた。これらの結果は、各都道府県の縄文人と大陸から来た渡来人との混血の程度の違いと地理的位置関係が現代日本人の遺伝的地域差を形成した主な要因であることを示唆している。

本研究は、都道府県レベルで日本人の遺伝的集団構造を初めて明らかにした。今後、不明な点が多い縄文人と渡来人の混血過程の理解が進むだけでなく、疾患遺伝子関連研究において、集団階層化によるバイアスを避けた検体収集が可能になると期待される。

発表内容
研究の背景・先行研究における問題点
現代の日本人(アイヌ人、琉球人、本土人)は、縄文人の系統と、渡来人の系統が混血した集団の子孫であることが示唆されている(Japanese Archipelago Human Population Genetics Consortium. 2012, J Hum Genet)。日本の7つの地域間の遺伝的異質性を指摘した先行研究があるが(Yamaguchi-Kabata et al. 2008, Am J Hum Genet)、中国地方や四国地方の県は含まれておらず、7つの地域に分けることの妥当性を含め、日本人集団の詳細な遺伝的集団構造やかかる構造を生じさせた要因はよく理解されていなかった。また、地域間の遺伝的異質性が不明なため、日本人を対象とする疾患遺伝子関連研究(注1) において、集団階層化によるバイアス(注2) を避けた検体の収集が困難であった。

研究内容
今回、東京大学大学院理学系研究科の渡部裕介・一色真理子大学院生(研究当時)と大橋順准教授らのグループは、ヤフー株式会社が提供するゲノム解析サービスHealthData Labの顧客11,069名の138,688か所の常染色体SNP(注3)遺伝子型データを用いて、日本人の遺伝的集団構造を調べた。まず、個体レベルで主成分分析(注4)を行い、琉球人(主に沖縄県)と本土人(主に沖縄県以外の46都道府県)が遺伝的に明瞭に分かれることを確認した(図1)。なお、本研究に用いたデータにはアイヌ人は含まれていないと考えられる。

図1:日本人11,069名と中国・北京の漢民族の主成分分析の結果。常染色体上の138,688か所のSNP遺伝子型データから各個体の主成分得点を求めてプロットした。

次に、47都道府県のそれぞれから50名ずつ無作為抽出して各SNPのアリル頻度を計算し、中国・北京の漢民族も含めてペアワイズにf2統計量(注5)を求めてクラスター分析(注6)を行った(図2)。

図2:47都道府県と中国・北京の漢民族を対象にしたクラスター分析の結果。日本地図上の番号が各都道府県に対応している。47都道府県を4つのクラスターに分けると、沖縄地方、東北・北海道地方、近畿・四国地方、九州・中国地方に大別された。

47都道府県を4つのクラスターに分けると、沖縄地方、東北・北海道地方、近畿・四国地方、九州・中国地方に大別された。関東地方や中部地方の各県は1つのクラスター内に収まらなかった。このことは、関東地方もしくは中部地方の都県を遺伝的に近縁な集団とみなすことはできず、そのような単位で日本人集団の遺伝的構造を論じることや、疾患遺伝子関連研究の対象検体を収集することは適切ではないことを示している。

47都道府県を対象に主成分分析を行ったところ(図3)、第1主成分は沖縄県と各都道府県の遺伝的距離を反映していた。沖縄県に遺伝的に最も近いのは鹿児島県であった。図2でクラスターを形成した地方に着目すると、九州地方と東北地方が沖縄県に遺伝的に近く、近畿地方と四国地方が遺伝的に遠かった。さらに、f2統計量の解析から、近畿地方や四国地方は中国・北京の漢民族に遺伝的に近いこともわかった。第2主成分は都道府県の緯度および経度と有意に相関していた(緯度:P-value = 3.21 × 10-12、経度:P-value = 2.38 × 10-14)。

図3:47都道府県を対象にした主成分分析の結果。

本研究の結果は、各都道府県の縄文人と大陸から来た渡来人との混血の程度の違いと地理的位置関係が本土人の遺伝的地域差を形成した主な要因であることを示唆している。大部分の渡来人は朝鮮半島経由で日本列島に到達したと考えられるが、朝鮮半島から地理的に近い九州北部ではなく、近畿地方や四国地方の人々に渡来人の遺伝的構成成分がより多く残っていることは、日本列島における縄文人と渡来人の混血過程を考えるうえで興味深い。本土人のゲノム成分の80%程度は渡来人由来であると推定されているが、近畿地方や四国地方には、さらに多くの割合の渡来人が流入したのかもしれない。また、地理的位置も遺伝的構造に影響していることや、沖縄県に遺伝的に近い九州地方と東北地方が互いには近縁でないことから、渡来人との混血時に縄文人は遺伝的に分化していたと考えられる。

社会的意義・今後の予定
本研究では、都道府県レベルで本土日本人の遺伝的集団構造を初めて明らかにした。47都道府県の遺伝的近縁関係がわかったことで、日本列島全域での縄文人と渡来人の混血過程の理解が進むと期待される。また、日本人集団を対象にした疾患遺伝子関連研究において、集団階層化によるバイアスを極力避けた、適切な検体収集地域の選定が可能になると期待される。

発表雑誌
雑誌名 Journal of Human Genetics
論文タイトル Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals
著者 Yusuke Watanabe*, Mariko Isshiki*, Jun Ohashi (these authors contributed equally to this work)
DOI番号 10.1038/s10038-020-00847-0
アブストラクトURL https://www.nature.com/articles/s10038-020-00847-0

用語解説
注1 疾患遺伝子関連研究
多数の患者と対照の塩基配列を比較する(一般的には、多型のアリル頻度を比較する)ことで、疾患発症と関連する多型を検出する研究。関連多型が明らかになることで、疾患の発症機序の理解が進むだけでなく、各個体の発症リスクを推定することが可能となる。↑

注2 集団階層化によるバイアス
疾患遺伝子関連研究において、遺伝的背景の異なる患者と対照を調べると、疾患とは関連しない多型が見かけ上の関連(偽陽性)を示す可能性がある。統計学的手法によってバイアスを調整する努力もされているが、根本的に解決することは困難である。↑

注3 単塩基多型(SNP)
ヒトのDNAの塩基配列(A/T/G/Cの4種類の塩基による並び)を比較すると0.1%程度の違いがある。塩基配列の違いを多型といい、1つの塩基の違いによる多型を単塩基多型(single nucleotide polymorphism; SNP)とよぶ。↑

注4 主成分分析
多数の変数(多次元データ)から全体のばらつきをよく表す順に互いに直行する変数(主成分)を合成する多変量解析手法の一つ。主成分分析によって次元を削減することで、データ点を可視化することができる。本研究では、個体単位の解析では遺伝子型を、都道府県単位での解析ではアリル頻度を変数として用いた。↑

注5 f2統計量
2つの集団間の遺伝距離を測る尺度の一つ。SNPデータに対するf2統計量は、SNP毎にアリル頻度の集団間差の2乗を計算し、それらの平均値として与えられる。↑

注6 クラスター分析
多数の変数(多次元データ)からデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つ。グループ分けが階層的になされる階層的手法と、特定のクラスター数に分類する非階層的手法がある。本研究では、階層的手法の一つであるウォード法を用いた。↑

―東京大学大学院理学系研究科・理学部 広報室―

https://www.s.u-tokyo.ac.jp/ja/press/2020/7056/

2. 中川隆[-15399] koaQ7Jey 2021年11月10日 16:00:52 : lCCO7qVYNQ : TkZaNEtBbjVhVkU=[26] 報告
雑記帳
2021年11月10日
大橋順「アジア人・日本人の遺伝的多様性 ゲノム情報から推定するヒトの移住と混血の過程」
https://sicambre.at.webry.info/202111/article_10.html


 井原泰雄、梅ア昌裕、米田穣編『人間の本質にせまる科学 自然人類学の挑戦』所収の論文です。ヒトゲノムとは、ヒト(Homo sapiens)が持つ遺伝情報(全DNA配列)の1セットのことです。あらゆる生物の基本単位は細胞で、赤血球以外のヒトの体細胞は核膜で囲まれた球状の細胞核を持っています。細胞核の中に染色体があり、各染色体はヒストンとよばれるタンパク質にデオキシリボ核酸(DNA)が巻きついた棒状の構造をしています。DNAの最小単位(ヌクレオチド)は、塩基と糖とリン酸から構成されています。塩基にはアデニン(A)とグアニン(G)とシトシン(C)とチミン(T)の4種類があり、ヌクレオチドにはそのうち1塩基が結合しています。ヌクレオチドはリン酸を介して鎖状につながっており、DNA鎖と呼ばれます。2本のDNA鎖の塩基同士は水素結合によりつながっており、二重螺旋構造となっています。向かい合う塩基の組み合わせは特異的で相補的な関係にあり、具体的にはAとT、GとCです。DNA鎖における4種類の塩基の組み合わせが塩基配列で、生物が正常な生命活動を維持するための遺伝情報が含まれています。ヒトゲノムは約31億塩基対により構成され、その一部(数%)はタンパク質のアミノ酸配列を規定しており、そうした部位はタンパク質コード遺伝子と呼ばれます。ヒトゲノムには、約25000個のタンパク質コード遺伝子が存在します。


●性特異的遺伝マーカー

 ヒトの細胞核には、22対の常染色体(ヒトは二倍体生物なので44本)と1対の性染色体(女性はX染色体が2本、男性はX染色体とY染色体が1本ずつ)が含まれています。卵子には必ずX染色体が1本含まれますが、精子にはX染色体を含むものとY染色体を含むものがあり、精子が卵子と結合すると、前者ならば女子、後者ならば男子が生まれます。Y染色体は父親から息子にのみ伝わるので、父親の系譜を反映する遺伝マーカーとしてよく利用されます。

 ミトコンドリアは細胞質に存在する細胞小器官で、エネルギー産生や呼吸代謝の役割を担っています。ミトコンドリアもDNAを含んでおり(mtDNA)、核DNAと同様に親から子供に伝わります。受精のさい、父親由来のミトコンドリアは卵子の中に入らないか、入っても破壊されるので、mtDNAは母親からのみ子供に伝わります。この母系遺伝の性質から、mtDNAは母親の系譜を反映する遺伝マーカーとして利用されています。mtDNAは男性も有しており、細胞内のDNA量が多く解析しやすいため、これまでに多くの研究があります。


●SNP

 配偶子が形成されるさい、ひじょうに低い確率ではあるものの、DNA複製エラーによる塩基配列の変化が起きることもあり、突然変異と呼ばれます。突然変異には、塩基置換、塩基の挿入や欠失、繰り返し配列における繰り返し数の増減などがあり、突然変異により生じた新たな塩基配列が、世代経過に伴って集団中で頻度が増加すると、多型として観察されるようになります。ヒトゲノム中で最も高頻度に観察される多型は、SNP(一塩基多型)です。SNPとは、着目する集団において、塩基配列上のある特定の位置に、2種類以上の塩基が存在する部位のことです。SNPの異なる塩基をアレル(対立遺伝子)と呼びます。ヒトの点突然変異(1塩基が別の塩基に置換されること)率は1世代1塩基あたり1.2×10⁻⁸と低いので、大部分のSNPには2種類の塩基しか観察されず、そのほとんどが単一起源と考えられます。単一起源とは、祖先型がGアレルで派生型がAアレルの場合、GアレルからAアレルへの突然変異は過去に1回しか起きていない、ということです。二倍体生物のヒトは両親から相同染色体を1本ずつ受け継ぐので、各SNPに対して3種類の遺伝子型が存在し、たとえばA/GのSNPでは、A/AとA/GとG/Gの3通りの遺伝子型が存在します。

 タンパク質コード遺伝子上にあるSNPのうち、塩基の違いにより異なるアミノ酸となるものを非同義SNP、同じアミノ酸となるものを同義SNPと呼びます。多くのSNPはアメリカ国立生物工学情報センター(National Center for Biotechnology Information、略してNCBI)に登録されており、rsで始まるIDが付与されています。SNPを構成する2つのアレルのうち、頻度の低い方はマイナーアレル、頻度の高い方はメジャーアレルと呼ばれます。NCBIのdbSNPデータベースには、マイナーアレル頻度が1%以上の非同義SNPが101000個以上、同義SNPが89000個以上登録されています(2020年10月27日時点)。

 日本人を含むアジア東部人に特徴的な表現型を示すSNPに、ABCC11遺伝子上の非同義SNP(rs17822931)とEDAR遺伝子上の非同義SNP(rs3827760)があります。ABCC11はABC(ATP binding Cassette)トランスポータータンパク質の一つで、乳腺やアポクリン腺などの外分泌組織で作用するタンパク質です。rs17822931はABCC11タンパク質の180番目のアミノ酸残基がグリシン(Gアレル)もしくはアルギニン(Aアレル)となるSNPで、アルギニンとなるアレル頻度がアジア東部人では高く、A/A遺伝子型だと耳垢は乾燥型に、G/AもしくはG/G遺伝子型だと耳垢は湿った型になります。EDARはエクトジスプラシンA受容体で、胚発生において重要な役割を果たすタンパク質です。rs3827760はEDAR タンパク質の370番目のアミノ酸塩基がバリン(Tアレル)もしくはアラニン(Cアレル)となるSNPで、Cアレルを持つほど毛髪が太くなり、また切歯のシャベルの度合いが強くなります。乾燥型の耳垢と関連するrs17822931のAアレルには、アジア東部人の祖先集団で強い正の自然選択が作用した可能性が高く(関連記事)、それが明瞭な地域差を生じさせた、と考えられます。


●減数分裂と組換え

 生殖細胞系列で起こる細胞分裂の様式は減数分裂と呼ばれ、細胞が通常増殖するさいの様式は有糸分裂もしくは体細胞分裂と呼ばれます。減数分裂が体細胞分裂と異なる点は、染色体の複製跡に姉妹染色分体となり、2回連続して細胞分裂(減数第一分裂と減数第二分裂)が起きることで、最終的に配偶子では染色体数が分裂前の細胞に半分になることです。減数分裂により遺伝的多様性が生み出される仕組みに、非姉妹染色分体間で染色体の一部が入れ替わる交叉(乗換)があり、各染色体あたり約2ヶ所以上(減数分裂あたり約50ヶ所)で交叉が起きます。これにより、新たな塩基配列を有する染色体(組換え体)が子供に伝わることがあります。同一染色体上の2地点間で組換えが起こる頻度が1%以上の時、その2点間の遺伝距離を1センチモルガン(cM)と呼び、ヒトの場合は1.3cMの距離が約100万塩基に相当します。


●ハプロタイプと連鎖不平衡

 ハプロタイプとは、同一染色体上に存在する複数のSNPのアレルの組み合わせです。観察されるハプロタイプの種類数は、SNP部位間で過去に起きた組換えの回数に依存しており、SNP部位が近接している(正確には、遺伝的距離が短い)と組換え率が低いため、理論上の最大種類数よりも少なくなります。観察されるハプロタイプの種類や各ハプロタイプ頻度は集団により異なりますが、遺伝的に近い集団ではよく似ているので、ヒト集団間の遺伝的近縁関係や、ヒトの移住史の推定に用いられます。


 連鎖不平衡とは、同一染色体上の2つ以上の多型間のアレルに関連がある状態のことです。SNP1(AアレルとGアレル)とSNP2(CアレルとTアレル)により規定されるハプロタイプの場合、A-CとA-TとG-CとG-Tの4種類のハプロタイプが存在し得ます。ハプロタイプの頻度がそれを構成するアレル頻度の積と等しくない場合、両アレルは連鎖不平衡の関係にあると呼ばれ、ハプロタイプ頻度の方がアレル頻度の積よりも大きければ正の連鎖不平衡、小さければ負の連鎖不平衡と呼ばれます。A-CとA-TとG-CとG-Tの各ハプロタイプ頻度をh11とh12とh21とh22とする場合、AアレルとCアレルの各頻度はh11+h12とh11+h21です。AアレルとCアレルの連鎖不平衡係数を、A-Cハプロタイプ頻度からアレル頻度の積を引いたD11=h11- (h11+h12) (h11+h21)と定義すると、D11>0ならばAアレルとCアレルは負の連鎖不平衡、D11>0ならばAアレルとCアレルは負の連鎖不平衡、D11=0ならば、AアレルとCアレルは連鎖平衡にある、と呼ばれます。AアレルとTアレルの連鎖不平衡係数をD12、GアレルとCアレルの連鎖不平衡係数をD21、GアレルとTアレルの連鎖不平衡係数をD22と定義すると、D11=-D12=-D21=D22の関係が常に成立します。


●ゲノム人類学

 全ゲノム配列決定技術が実用化されたことで、ゲノム人類学研究において飛躍的な進展がみられています。ゲノム人類学とは、ヒトゲノムの多様性情報から、人類の進化過程や表現型の多様性の基盤となる遺伝因子を明らかにし、ゲノム水準で「生物としてのヒト」の理解を目指す学問分野と言えます。多くの生物種でゲノム解析が行なわれていますが、公共ゲノムデータベースが最も充実しているのはヒトで、データ解析のフリーソフトウェアも多数公開されています。一昔前までは、実験してDNA配列を決定するという、いわゆるwet解析抜きに研究を進めることは困難でしたが、現在ではデータベースのデータを利用したいわゆるdry解析のみで優れた成果を挙げられます。若い人が参入しやすい点からも、ゲノム人類学は今後ますます発展する、と期待されます。


●アジア人の形成過程

 人の進化を包括的に理解するには、より多くのヒト集団の解析が必要なので、大規模な国際共同研究計画が盛んに行なわれています。その一つにヒトゲノム解析機構(Human Genome Organisation、略してHUGO)の汎アジアSNP共同事業体(Pan-Asian SNP Consortium、略してPASC)があります。PASCでは、アジア人の形成過程を明らかにする目的で、アジアの73集団の1808人について、54794個のSNP遺伝子型が調べられています(関連記事)。

 これまで、アジア東部現代人の祖先集団の形成について、二つの仮説が提案されてきました。一方は、アジア東部集団とアジア南東部集団がアジア大陸南部の沿岸部に沿って到達し、一つの共通祖先を有しており、アジア南東部到達後にアジア東部まで北上した、という説です(南岸経路説)。もう一方は、アジア東部に到達した二つの移住経路があり、南を経由した移住の後に、より北方を経由して到達した(アジア中央部を介してヨーロッパ集団とアジア集団をつないだ)移住があった、という説です(南北両経路説)。代表的なアジア集団と、アフリカ集団とヨーロッパ集団とオセアニア集団とアメリカ大陸先住民集団を含めた、29集団を対象とした系統樹解析により、ヨーロッパ集団とアジアやオセアニアやアメリカ大陸先住民の集団とが分岐した後、オセアニア集団とアジアおよびアメリカ大陸先住民集団とが分岐し、最後にアジア東部集団とアメリカ大陸先住民集団とが分岐した、と示唆されました。なお、本論文はこのように指摘しますが、現生人類各集団間の関係は複雑で(関連記事)、遺伝的に大きく異なる集団間の混合により形成された集団を単純な系統樹に位置づけることには、難しさがあるように思います(関連記事)。

 SNPハプロタイプの多様度に注目すると、南の集団から北の集団にいくほど(緯度に比例して)、その多様性は減少しており、アジア集団の祖先は南から北へと移動してきた、と強く示唆されます。アジア東部集団で観察されるハプロタイプの90%のうち、50%はアジア南東部集団で観察される一方、わずか5%しかアジア中央部および南部集団では観察されませんでした。系統樹解析結果も合わせると、アジア東部集団の主要な起源はアジア南東部にあり、南岸経路説の方が有力と言えそうです。

 ネグリートは、アジア南東部からニューギニア島にかけて住む少数民族です。ネグリートは、低身長や暗い褐色の皮膚や巻毛といった特徴的な表現型を持ち、狩猟採集を営みながら孤立して存続してきたことから、その祖先集団や他のアジア集団との関係については諸説ありました。ネグリートは系統樹解析結果では、アジア東部人やアメリカ大陸先住民とともにオセアニア人から分岐しており、ネグリートの一部集団がアジア東部人やアメリカ大陸先住民と遺伝的に近いことから、ネグリートは他のアジア集団と共通祖先を有している、と考えられます。


●47都道府県の解析

 47都道府県の日本人11069個体の138688ヶ所の常染色体SNP遺伝子型データを用いて、日本人の遺伝的集団構造を調べた研究(関連記事)では、47各都道府県から50個体ずつ無作為抽出され、各SNPのアレル頻度が計算され、漢人(北京)も含めてペアワイズにf2統計量を求めてクラスタ分析が行なわれました。f2統計量とは、2集団間の遺伝距離を測定する尺度の一つで、SNPごとにアレル頻度の集団間差の2乗を計算し、全SNPの平均値として与えられます。クラスタ分析とは、多次元データからデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つで、この研究では階層的手法の一つであるウォード法が用いられています。47都道府県を4クラスタに分けると、沖縄、東方および北海道、近畿および四国、九州および中国に大別されます(図5.9、図のCHBは北京漢人)。関東や中部の各都県は1クラスタ内に収まりません。これは、関東もしくは中部の都県を遺伝的に近縁な集団とはみなせず、そうした単位で日本人集団の遺伝的構造を論じることは難しい、と示しています。以下は本論文の図5.9(本論文の参照文献より引用)です。
画像

 47都道府県を対象にした主成分分析結果(図5.10a)では、沖縄県に遺伝的に最も近いのは鹿児島県と示されます。主成分分析とは、多数の変数(多次元データ)から全体のバラツキをよく表す順に互いに直行する変数(主成分)を合成する、多変量解析の1手法です。最も多くの情報を含む第1主成分の値から、沖縄県と鹿児島県の遺伝的近縁性が示されます。これは、単に地理的近さだけではなく、奄美群島の存在も影響していると考えられます。図5.9でクラスタを形成した地方については、九州と東北が沖縄県と遺伝的に近く、近畿と四国が遺伝的に遠い、と示されます。第2主成分は、都道府県の緯度および経度と有意に相関しています。以下は本論文の図5.10(本論文の参照文献より引用)です。
画像

 日本列島には3万年以上前からヒトが棲んでおり、16000年前頃から縄文時代が始まります(開始の指標を土器だけで定義できるのか、開始も終了も地域差がある、との観点から、縄文時代の期間について議論はあるでしょう)。弥生時代が始まる3000年前頃(この年代についても議論があるとは思います)に、それまで日本に住んでいた「縄文人」が、アジア大陸部から到来してきた「渡来人」と混血した、と考えられています。現代日本人の成立については、おもに北海道のアイヌと、おもに沖縄県の琉球人と、本州・四国・九州を中心とする「本土人」から構成される「二重構造モデル」が想定されています。遺伝学的研究により、「縄文人」と「渡来人」の混血集団の子孫が「本土人」で、アイヌや琉球人、とくに前者は当時の混血の影響をあまり受けていない、と示されています。

 「渡来人」の主要な祖先集団の子孫と想定される北京漢人と、各都道府県のf2統計量を計算すると、沖縄県は漢人から遺伝的に最も遠く、近畿と四国が漢民族に近い(最も近いのは奈良県)、と示されました。したがって、図5.10aにおいて、第1主成分の値が大きい都道府県は「縄文人」と遺伝的に近く、値が小さい都道府県は「渡来人」と近い、と想定されます。大部分の「渡来人」は朝鮮半島経由で日本列島に到達したと考えられますが、朝鮮半島から地理的に近い九州北部ではなく、近畿や四国の人々に「渡来人」の遺伝的構成成分がより多く残っており、近畿と四国には、他地域よりも多くの割合の「渡来人」が流入したかもしれません。


●日本人に特徴的なY染色体

 Y染色体上の組換えを受けない領域の塩基配列の違いに基づいて、「縄文人」由来のY染色体を同定できる可能性があります。日本人男性345個体のY染色体の全塩基配列決定に基づく系統解析(関連記事)では、日本人のY染色体は主要な7系統に分かれました。他のアジア東部集団のY染色体データを含めての解析に基づくと、日本人で35.4%の頻度で見られる系統1は、他のアジア東部人ではほとんど観察されない、と示されました。系統1に属する日本人Y染色体の変異を詳細に解析すると、系統1はYAPという特徴的な変異を有するY染色体ハプログループ(D1a2a)に対応しています。YAP変異は、形態学的に「縄文人」と近縁と考えられているアイヌにおいて、80%以上という高頻度で観察されます。「渡来人」の主要な祖先集団の子孫である韓国人集団や中国人集団には系統1に属するY染色体がほとんど観察されなかったことから、系統1のY染色体は「縄文人」に由来する、と結論づけられます。なお、同一検体のmtDNAの系統解析からは、明らかに「縄文人」由来と想定されるような系統は検出されませんでした。


●今後の課題

 日本列島「本土人」の常染色体のゲノム成分の80%程度は「渡来人」由来と推定されており(関連記事)、「縄文人」と「渡来人」の混血割合は2:8程度だったと思われます。縄文時代晩期の人口は8万人程度と推定されており、その居住範囲は日本列島全域にわたっていました。混血割合から単純に考えると、32万人の「渡来人」が渡海して日本列島に流入したことになりますが、この推定値は多すぎると思われます。より少ない「渡来人」が日本列島で優勢になる可能性として、「渡来人」との戦闘により「縄文人」が激減した可能性も想定されます。しかし、「縄文人」由来の系統1のY染色体の割合が現代日本人では35%となることから、仮に大多数の「縄文人」男性が系統1のY染色体を有していても、2:8の混血割合であれば、せいぜい20%にしかならないはずです。戦闘でまず犠牲になるのは男性であることが多く、系統1のY染色体の頻度はさらに低くなるでしょう。この問題も含めて、日本人の集団史には未解明の問題が残っています。


 以上、本論文についてざっと見てきました。現代日本人は先住の「縄文人」と弥生時代以降にアジア大陸部から新たに日本列島に到来してきた「渡来人」との混合により形成された、との見解は現代日本社会においてかなり定着してきたように思います。しかし、近年の古代DNA研究の進展から、その形成過程はかなり複雑だったように思われます(関連記事)。朝鮮半島において、「縄文人」的構成要素でゲノムをモデル化できる個体が8300年前頃から確認されており、2800〜2500年前頃の朝鮮半島中部西岸の個体は日本列島「本土」現代人と遺伝的構成がよく似ています。これらを踏まえると、日本列島「本土」現代人の基本的な遺伝的構成は朝鮮半島において紀元前千年紀初頭には確立しており、この集団が弥生時代以降に日本列島に到来して勢力を拡大した、と考えられます。

 さらに、朝鮮半島では紀元前千年紀後期以降に人類集団の遺伝的構成に大きな変化があって現代北京漢人により近づき、そうした集団が弥生時代後期から飛鳥時代にかけて到来し、日本列島「本土」現代人の祖先集団に遺伝的影響を残した、と現時点では想定しています。47都道府県単位で奈良県民が遺伝的に最も北京漢人に近いのは、古墳時代から飛鳥時代に朝鮮半島から渡来した集団がおもにヤマト王権の中心地域に移住した結果だろう、と推測しています。また本論文では、「縄文人」由来と考えられる系統1のY染色体の割合が日本列島「本土」現代人で高い、と指摘されていますが、そのうち一定以上の割合は弥生時代以降に朝鮮半島から到来した可能性が高いように思います。もちろん、こうした私見も日本列島、さらにはユーラシア東部の人口史を過度に単純化しているのでしょうし、今後の古代DNA研究の進展により大きく見直す必要が出てくるかもしれません。


参考文献:
大橋順(2021)「アジア人・日本人の遺伝的多様性 ゲノム情報から推定するヒトの移住と混血の過程」井原泰雄、梅ア昌裕、米田穣編『人間の本質にせまる科学 自然人類学の挑戦』(東京大学出版会)第5章P78-91

https://sicambre.at.webry.info/202111/article_10.html

▲上へ      ★阿修羅♪ > 近代史5掲示板 次へ  前へ

  拍手はせず、拍手一覧を見る

フォローアップ:


★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
最新投稿・コメント全文リスト  コメント投稿はメルマガで即時配信  スレ建て依頼スレ

▲上へ      ★阿修羅♪ > 近代史5掲示板 次へ  前へ

★阿修羅♪ http://www.asyura2.com/ since 1995
スパムメールの中から見つけ出すためにメールのタイトルには必ず「阿修羅さんへ」と記述してください。
すべてのページの引用、転載、リンクを許可します。確認メールは不要です。引用元リンクを表示してください。
 
▲上へ       
★阿修羅♪  
近代史5掲示板  
次へ