首页 » 基因中的人类简史 » 基因中的人类简史全文在线阅读

《基因中的人类简史》第十章 DNA碎片

关灯直达底部

温故而知新。

——孔子

1999年的冬天,凌晨两点钟,斯科特·伍德沃德家里的电话铃响了,他立刻跳起来去接电话,打电话的是一个老人,他问:“这是斯科特·伍德沃德的家吗?”接着又问:“你了解DNA吗?”斯科特·伍德沃德是杨百翰大学分子遗传学的教授,家住犹他州,四个儿子都十几岁了。那个打电话的人说他名叫詹姆斯·莱沃伊·索伦森,犹他州人,曾经去挪威探寻祖先,想了解一下他同自己的家族史有什么关联,但是进展不大。他打电话的目的是想知道伍德沃德能否把挪威所有人的DNA检测并分析一下,如果可能,需要多少费用。

伍德沃德是一个比较悠闲的人,他说他得考虑一下,过几个星期再给索伦森打电话。伍德沃德回到实验室,费了很大劲才找来几个同办公室的人,告诉了他们索伦森的事,并且问道:“你们说这家伙是认真的吗?”这几个人回答说:“听说他净干荒唐事。”据了解,这个索伦森是犹他州的首富,也是世界富豪榜上的常客。他开了32家不同行业的公司,持有60项个人专利,他这一辈子挣了十亿多美元。人们普遍认为索伦森的项目往往涉及耗资巨大的发明,有时候还能赚取很大利润。其中一个是他在20世纪50年代发明的一次性外科手术用口罩。

于是,伍德沃德开始考虑索伦森的请求。检测挪威每个人的DNA需要多少费用呢?挪威有多少人口?怎样才能收集到每个人的血样?这得需要多少血样?这些都是非常要紧的问题,但是对此事考虑得是否周全,伍德沃德心里还是没底。花费几百万美元去分析整个国家的DNA是一回事,确定这件事值不值得做又是另一回事。花费这么多时间,雇用这么多人力,索伦森提供的经费是不是发挥了最大的效用?这个工程除了满足索伦森的请求以外,还能达到别的目的吗?

当然了,所有的专业科学家都必须重视预算问题,因为用于科研的经费是有额度的。为了能够有效地使用经费,他们必须证明自己能够用经费取得最佳成果。即使科学家们对于经费资源不进行竞争,但是从本质上讲,他们也必须小心谨慎地对待经费来源。从根本上讲,所有成功的研究项目都必须少做实验,多得成果。伍德沃德还没有想清楚,获得多少研究成果才能证明这样大的项目是值得做的。

在伍德沃德估计项目费用的同时,他还要思考是否能达到他的第二个目的,这就是花费如此巨额的经费,除了要给这个性格古怪的亿万富翁一个满意的结果外,还要为遗传学做出超值的贡献。然而,他认为这个工程还没有万事俱备,这样大的研究项目所需的经费简直就是天文数字。

两个星期以后,伍德沃德来到索伦森的办公室,索伦森问他给挪威人的基因进行遗传分类需要多少钱,伍德沃德说:“这个,所需费用可能相当大,恐怕你负担不起。”

“哦,是吗?”索伦森说,“到底多少钱?”

“五亿美元。”

索伦森耸了耸肩说:“我可以给。”

哇!伍德沃德想,我把价码定得太低了!

近年来,有很多人意识到了DNA不寻常的潜力,科学家们致力于研究通过Y染色体来追寻去世多年的人的活动,并且越来越清楚地认识到,如果你能够确切地解读Y染色体,那么任何群体的DNA都能开启通往模糊不清的人类历史的通道,让人们更清楚地认识历史。对于像索伦森那样异常精明的人来说,DNA的微粒无处不在,就像是这个星球上的旅游者一路旅行时洒下的面包屑。

更使人震惊的是,通过DNA认祖归宗还有一个根本性的作用,那就是通过DNA,你不但能够走进久远的世界历史,还可以探寻你的DNA是从哪里来的,出自哪些祖先。遗传学不仅仅能够使你纵览历史重大事件和知名人士的生活,还能给你个人绘制一幅家族历史的画面。

伍德沃德说,就索伦森的项目而言,分析每个挪威人基因组的成果是很有限的。项目可以让人们更多地了解到挪威历史,并且告诉索伦森他自己在历史中的位置。但是同样用这五亿美元,他们不但能解答索伦森个人的问题,同时还能解答许多其他的问题。

因此,伍德沃德对项目提出了不同的建议:首先从全世界五百个不同的人口群体中各挑选两百人进行基因组分析。这十万人的基因组就构成了整个人类基因库的缩影。这些DNA不但代表所有活着的人,还能代表已经离世的,特别是生活在几百年前的人的大部分DNA.伍德沃德说,这项研究不仅仅是为了分析并且匹配很多人的DNA,而且还能追寻到每个家谱中的四代人。这是把历史进行个性化的科学,但要达到这一目的,他们首先要让十万人贡献出自己的血样。

不完全是出于巧合,犹他州是世界上开展如此大规模研究的最佳地点,因为那里有非常巨大的遗传学数据库。因此,研究小组首先从杨百翰大学这个触手可及的目标开始着手,伍德沃德把几个学生也派进了项目组,他说:“目前每个犹他州人的祖先160年前都不在这里,因为在美国,除了原住民之外,其他人都是外来移民。因此,当你把家谱信息同搜寻到的DNA信息相比对时,就相当于迅速地进入到其他很多地方采集了血样。”这个小组用了两个星期就收集了3000份血样,用一年的时间收集了10000份血样,每份血样都含有200年到300年历史的宗谱和地理信息。这个项目很见成效。

在伍德沃德接到索伦森凌晨打给他的那个电话12年以后,我在伍德沃德的盐湖城实验室里拜访了他。我问他是如何说服人们参加这个项目,如何让项目延伸到了盐湖城以外的地区。他说,当犹他州的人口群体多样性被采集殆尽之后,项目组又充分利用了遍布世界各地的耶稣基督后期圣徒教会(LDS)的家族历史中心,并且与很多家谱协会进行了接洽。

伍德沃德的小组请人们将献出自己的DNA当作慈善行为。尽管这个研究项目独立于耶稣基督后期圣徒教会(LDS),但LDS的确帮到了项目组,因为教会早已经有了基于家谱的完善的慈善活动模式了。实际上,索伦森到挪威的最初目的是为他的祖先进行洗礼,让他们加入LDS.

虽然LDS家族历史中心的网络很大,但是还不能囊括全世界的数据。因此,伍德沃德小组一旦将LDS教会网络提供的数据挖掘殆尽之后,就必须寻找那些不但对这个研究项目非常感兴趣、愿意参与的群体,而且其自身的历史很有说服力的群体。于是,他们奔赴非洲收集了10000份血样,之后又到了亚洲,来到吉尔吉斯斯坦以及其他许多国家。他们最先去的国家之一是丝绸之路的主要途经国——蒙古,在那里收集了3000份血样。

伍德沃德还以索伦森为名,设立了“索伦森分子遗传学基金会(SMGF)",这是最早的遗传家谱公司之一。这个机构最终从全世界收集到了100000份血样,并分析了它们的Y染色体和线粒体DNA.在那个时代,这是个耗资巨大的研究项目,简直让人难以置信。但是,随着遗传学的飞速发展,他们当时所取得的成就同现在我们掌握的信息资源相比,就很有限了。2012年,索伦森分子遗传学基金会被世界最大的家谱公司Ancestry.com收购,自那以后,调查挪威人DNA的项目就完成了,而且研究成果超出了那位摩门教亿万富翁索伦森的预想。现在,伍德沃德领导的团队可以将几百万个有文件记载的家谱和70万个基因位点联系在一起,这些基因包括常染色体DNA、Y-DNA和线粒体DNA.

遗传和基因组的相关知识从发现到让公众接受,其速度之快是史无前例的。到2014年为止,除了美国《国家地理》杂志的基因图谱项目以外,还有Family Tree DNA公司、23andMe公司和AncestryDNA.com公司都可以为公众提供DNA检测和家谱查询服务。这一切取决于你购买了哪种服务,你可以对Y染色体中的111个片段进行检测(如果你是男性),还可以检测线粒体DNA,或者22个无性染色体。(23andMe公司还可以检测人体的健康和特质,详见第十四章。)一旦你掌握了这些基因组数据,还可以把它们用于DIY网站或非商业性网站,如SNPedia、Interpretome以及Dodecad来进行解读。这些遗传家谱公司经常调查的基因组部位远比几年前学术界所考虑的部位要多。当涉及个人遗传研究时,有很多个人可以付出许多研究人员无法承担的高额费用,也就是说,Family Tree DNA公司等机构拥有的基因库实际上属于众筹的极具价值的数据库。世界最大的Y染色体和线粒体DNA数据库不是由研究机构建成的,而是由Family Tree DNA公司创建的。

那么,这些非比寻常的公司到底是什么样子的呢?毕竟,基因组是一个信息宝库,信息量是美国国会图书馆的好多倍,也超过了早已消失的古埃及亚历山大图书馆。我真想亲眼看看这座宝库,于是我访问了Family Tree DNA公司。这家公司是1999年在得克萨斯州休斯敦成立的,是第一家遗传家谱公司。那天,天气极其炎热,我从休斯敦机场开车,穿过杂乱无章的市区,来到了一幢不太起眼的办公楼。接待我的是贝内特·格林斯潘,一个留着醒目胡须、带有得克萨斯州口音、善于表现的人。

格林斯潘坐下来准备跟我谈话,但是当我问他是否可以看看检测DNA的实验室时,他却说:“看那些地方没意思。”我急忙说:“哪能没意思?我还从来没见过DNA实验室呢,一定非常有意思。”他把我领到套房后边的房间,顾客送来的DNA血样在这里开封。这间房与休斯敦远郊的办公用房没什么两样。房间很小,配有家具,也有窗户。在房间的一角,有一台机器正在运转,发着轻微的声响。格林斯潘说,只要你用对了机器,你就不需要很大的空间,也不需要那些闪闪发光的整套设备。这话说得没错。

格林斯潘给我看了看接受检测的人送来的样本,通常是唾液或者口腔黏膜涂片。他们首先把样本送进机器,把DNA分离出来。再把DNA放进PCR(聚合酶链式反应机)里,俗称“摇摆烘烤机”。格林斯潘说,这个机器“给DNA加热,然后降温,再加热,再降温。通过温度的升降,产生的DNA就越来越多。其主要目的就是扩大DNA的量,一开始好比从草堆里找针,逐渐地找到的针就越来越多了”。这个步骤完成以后,把DNA放进冰柜,这可是“世界上最昂贵的冰柜”了,每个冰柜可以在零下29摄氏度的温度下储存八万个样本。冷冻的样本由机器人进行分析,这样可以杜绝人为差错。样本分析是在一台装有荧光磁珠的机器中进行的,如果在样本里有他们要找的DNA成分,这些成分就会附着在磁珠上。

公司一般以图解的方式显示被检测的染色体,如果是同一家庭的成员来检测基因组,他们可以把各自的照片叠加在一起,这样就能够看出他们的DNA确切重叠之处了。譬如,你之前很清楚自己眼睛的形状和姐姐的一模一样,但是现在还可以清楚地看到你的3号染色体(或其他染色体)的某个部分与姐姐的一模一样,你们俩的全部基因组真的出自同一种原材料。

所有公司都会对你的基因组揭示出的祖先信息给出解释。譬如,你的Y染色体可能通常只会出现在非洲、欧洲、印度或蒙古男性体内。你可能会发现体内常染色体的某个特定基因序列,属于芬兰或韩国祖先遗传基因的典型特征。就在几年以前,科研人员从人类的DNA中发现了远古时代两个非人类的穴居物种——尼安德特人和丹尼索瓦人的基因。这一发现震惊了整个科学界。如今,仅仅花费一点点费用,有些公司就能分析出你的基因组有多少来自于尼安德特人。(关于这两个物种的更多信息,详见第十二章。)

格林斯潘常常亲自帮助客户弄清对过去的疑问。譬如,有一位女士给他写信,说据她所知,她的家族里根本没有犹太祖先,但是她祖父的名字是赫谢尔,而且她父亲和叔父的中间名也是赫谢尔。几年前,她发现她祖父有一张画的背后印着几个用古希伯来文写的美术字“L'Shana Tova”,是手写的新年贺词,标明的日期是1891年。Family Tree DNA公司对她的DNA进行了检测,结果显示她极有可能就是犹太人。

还有一位女士,从小在西班牙长大,信奉天主教,而家族世代相传的口述历史显示她家在20代之前有犹太祖先。通过检测,格林斯潘发现这个女士的线粒体DNA与来自西班牙、希腊、阿尔及利亚、保加利亚和土耳其等地的西班牙裔犹太人的线粒体DNA相同。她请求格林斯潘给她写一封证明信,她要把信送到犹太人的法院,来领取一张回归证书,正式确认她是犹太人。

格里斯潘对我说:“我差一点就把她的事扔在一边不管了,因为这几乎是无法验证的,很难想象根据口头相传,就能确认一个家族属于这么一个少数群体长达20代之久,这太令人难以置信了。每逢我们在没有DNA数据的情况下处理口述历史时,我都非常担心,因为研究事实靠的是多方面的证据,而讲故事恰恰缺少证据。”

经过不到15年的经营,私人遗传公司已经建立起了一个以遗传学为基础的社会关系网,与这个关系网相比,21世纪初的关系网络简直就是小儿科了。23andMe公司、Family Tree DNA公司和AncestryDNA公司的顾客能够发现一大群有遗传关联的表亲,他们不但能追寻家人,还能追踪他们基因组中的特定片段。把几百万人的档案记录和他们的DNA分析结合起来,用户可以建立一份贯穿几百年甚至更长时间的人类关系网的拷贝,并在其中找到自己所处的位置。

当客户有一个或一个以上的DNA片段与另一位客户相同时,公司会提醒这位客户。遗传学家说这些片段具有“血统遗传的特征”,意思是它们出自同一个人,也就是说遗传给这两个人的DNA出自一个祖先。公司把这种DNA相匹配的人叫作“亲戚”或者“表亲”。从根本上讲,你同某人的关系越近,你们所共有的DNA片段就越多,并且延续时间也越长。

据说,常染色体DNA起码可以把你带回五代人之前的历史,通过常染色体DNA来确定第三代远房表亲的可能性是90%,第四代的可能性是50%,第五代的是10%。格林斯潘说,他听说有人用常染色体DNA确定了第八代远房表亲。随着科学的发展,找到更为久远的表亲的可能性还会增加。

如果某位祖先的后代足够多,那么甚至可以借助这些后代重构出这位祖先的基因组。每个在世的人的基因组就如同是虚拟拼图中的一块,可以拼出这个群体共有的祖先基因组。这些祖先没有留下有文字记载的历史记录,但是从理论上讲,他们的基因组可以重现,虽然还没有人真正实践过。伍德沃德说:“只要有足够的人体信息,你就可以重现过去,譬如,再造1850年英国西兰开夏郡利克镇的人口状况。”

几年前,一位学过分子生物学的知识产权律师布莱恩·贝廷格,开始搜寻他曾祖母的DNA.她生于1889年,活得很长。贝廷格今年38岁,他还记得他小时候曾祖母的模样。由于他的曾祖母是被收养的,因此,对于她的家族血统,贝廷格一无所知。然而,她是个“影响力很大的极其强壮的女人”,贝廷格把他家族里的一些特征叫作“涟漪式特征”,这些特征好像都来自于这位曾祖母。为了探寻曾祖母的来历和她对于这个家族的影响,贝廷格开始收集她后代的DNA,以便从他们那里分离出遗传自曾祖母的基因。

在曾祖母的两个孙子的帮助下,贝廷格确定有35个DNA片段出现在她和她丈夫遗传下来的染色体中。下一步,他要分别去寻找与这些DNA片段对应的亲戚,以便把出自这位曾祖母的DNA片段与出自她丈夫的DNA片段区分开来。在说服他的家人参加这项研究的同时,贝廷格还运用表亲匹配的办法寻找到了更多具有上述DNA片段的人。

对于那些之前很少想过自己的基因的人来说,解读个人基因组分析报告是件很恼人的事。贝廷格第一次检测DNA是在2003年,当时的检测公司可以解读常染色体上的175个标记;而现在他们可以检测100万个标记。结果,贝廷格成了遗传家谱学领域的领军人物,并成为一个精英团队中的一员,这个团队致力于帮助人们了解表亲关系网络和解读自身的DNA信息。贝廷格主要通过自己广受欢迎的博客网站TheGeneticGenealogist.com来帮助人们。

塞西·穆尔是一位遗传学家兼知名博主(YourGeneticGenealogist.com)。当她的一个侄女要结婚时,穆尔打算帮助侄女合并一份家谱,从那时起她就开始对这个主题感兴趣了。她说:“对于写家谱,我知道的并不多,但这非常容易使人上瘾。”穆尔曾经是个电视节目制作人,现在是遗传家谱学顾问,与小亨利·路易斯·盖茨合作,专为电视节目《寻根》和《家谱学巡演》出谋划策。她已经创建了一个全新的职业,这个职业不仅仅要解释和阐明DNA的方方面面,还要当遗传方面的侦探,帮助委托人寻找丢失的信息。现在她的日常生活里充斥着DNA,她每时每刻都离不开DNA,甚至夜里睡觉都在想着DNA.

穆尔还是Family Tree DNA公司“被收养人DNA项目”的管理人员,越来越多曾被收养的人请她帮助寻找原来的家人。她说:“我每天都收到人们发来的邮件,这些人发现自己从遗传学上讲并不是原来的自己了。有时候,人们突然发现父亲并不是亲生父亲,还有人说他们可能出生时在医院里被人调换了。”还有一次,有人请穆尔帮助查询自己的父母,说自己是在1916年被人放在这家人的门口外面的,还有人说自己是从垃圾箱里被人捡到的。在过去的一年里,就有六个人代表曾经被人遗弃的婴儿找她帮忙。

有的时候,人们没有追寻到预想的祖先,譬如,有人以为自己是爱尔兰人,但是检测结果却显示他们更有可能是俄罗斯犹太人。穆尔说:“这只是我的个人经验,人们之所以打算检测一下自己的DNA,是因为他们总觉得自己在这个家里不太对劲儿,或者脑子里老是有疑问。这样的人可太多了。”

通过从遗传家谱数据库中探寻人们在染色体中所共有的DNA片段,穆尔帮人找到了失联的兄弟姐妹,甚至父母。她先顺着表亲家族家谱找到他们共有的祖先,然后再顺着这位祖先向下追寻,直到他们的父母。她说:“你先顺着家族树向上追寻,然后再自上而下地追寻。譬如,如果预测的二代表亲和一个寻找生身父母的人(也许是高曾祖,如果他们共有的DNA不太多的话)共有一个曾祖,我们就可以顺着家族树向下追寻,找到年代、地点、性别都能对得上的人,问题就解决了。”有的时候,穆尔直接找到了相对应的人,因为从DNA中发现两人在很多染色体中都有共同之处,这说明他们是兄弟姐妹关系,或者是父母与子女的关系。穆尔建议她的委托人把自己的样本送到23andMe公司、Family Tree DNA公司和AncestryDNA公司,因为这三家公司共同管理着藏有一百多万个常染色体的数据库。穆尔说:“你必须在这三个池塘里钓鱼,才能确保取得可信的调查结果。”有时候,她只找到了一个大致的祖先群体,譬如,最近一个委托人发现自己原来是墨西哥人,仅此而已。

在遗传家谱学的帮助下,很多人的谜团得以揭开。如果我们把查寻的中心转向不同的人类群体,共有的常染色体DNA就可以把我们带到八代人以前的时代。

现代文明很善于保存近期的一般信息,自从发明了考古学和古人类学之后,我们也可以恢复一些远古时代的信息了。然而,要想了解关于古人的更多信息,我们就必须付出更多的努力才行。我们或许对于19世纪和18世纪的人物,甚至生活在1000年前的皮克特人,以及生活在2000年前的古罗马人有种亲近感,但是对于生活在2000多年前的绝大多数人,我们几乎已经感觉不到与他们有任何联系了。从他们留下的遗迹中,我们可以适当地了解到当时的一些信息,但是几乎感觉不到他们在现代社会中得到了某种传承,不像近500年来涌现的大人物,从列奥纳多·达·芬奇到莱特兄弟,我们能够清楚地说出他们的发明创造,以及留给我们的各种文化遗产。