不管是發(fā)現(xiàn)生物學(xué)還是前基因組學(xué),都遵循線性路徑:先建立假設(shè),,然后設(shè)計(jì)實(shí)驗(yàn),,仔細(xì)控制變量,一個(gè)一個(gè)證明或反駁假設(shè),。
此類“經(jīng)典”方式面臨不少挑戰(zhàn),,“一步一步來(lái)”節(jié)奏緩慢不說(shuō),建立假設(shè)時(shí)也嚴(yán)重受到目前知識(shí)和想象力的局限,。人們并不知道自己不知道哪些,,也無(wú)法界定未知知識(shí)領(lǐng)域的范圍,到底未知部分小如頂針,,還是大如無(wú)邊汪洋,?
在生物學(xué)方面,我們的知識(shí)仍然非常有限,。雖然數(shù)十年來(lái)的各種發(fā)現(xiàn)令人大開(kāi)眼界,,但即便面對(duì)研究最充分的囊性纖維化等單基因疾病,人類的知識(shí)仍然存在巨大差距。直到2018年,,科學(xué)家們才利用單細(xì)胞基因組學(xué)發(fā)現(xiàn)了呼吸道里表達(dá)CFTR突變導(dǎo)致囊性纖維化的細(xì)胞類型,。
雖然下面這句話準(zhǔn)確介紹了基因組學(xué)領(lǐng)域,但完全忽略了基因組學(xué)平臺(tái)對(duì)科學(xué)實(shí)驗(yàn)的巨大影響:
“基因組學(xué):生物技術(shù)的分支,,主要關(guān)于將遺傳學(xué)和分子生物學(xué)技術(shù)應(yīng)用于基因定位和DNA測(cè)序或特定生物體的完整基因組,。”——韋氏詞典
過(guò)去20年里,,陣列,、新一代測(cè)序和單細(xì)胞分析等實(shí)驗(yàn)平臺(tái)在降低實(shí)驗(yàn)成本的同時(shí)顯著提高了實(shí)驗(yàn)?zāi)芰Γ瑥亩鴮?shí)現(xiàn)了單次實(shí)驗(yàn)完成全基因組分析,。
隨著指數(shù)級(jí)進(jìn)步(10^6+),,諸多非假設(shè)驅(qū)動(dòng)的方法變?yōu)榭赡埽苿?dòng)基因組學(xué)領(lǐng)域向前發(fā)展,。剛開(kāi)始,,科學(xué)家們只能建立和測(cè)試關(guān)于單個(gè)基因的假設(shè)(然后推倒重來(lái)),現(xiàn)在則可以同時(shí)研究多個(gè)基因,。
雖然非假設(shè)驅(qū)動(dòng)以及龐大的多重實(shí)驗(yàn)推動(dòng)生物學(xué)領(lǐng)域大幅進(jìn)步,,但在很大程度上是一場(chǎng)基于觀察的革命。
舉例來(lái)說(shuō),,全基因組關(guān)聯(lián)研究(GWAS)中,,科學(xué)家通常在整個(gè)基因組中比較患病人群和對(duì)照人群,尋找統(tǒng)計(jì)意義上不同類型的變異,。相關(guān)研究確認(rèn)假定的致病變異,,并推斷出假定的致病基因。
進(jìn)展相當(dāng)不錯(cuò),。不過(guò)仍然存在兩個(gè)限制因素:
1.人們只能依靠低產(chǎn)量高成本的實(shí)驗(yàn)驗(yàn)證發(fā)現(xiàn),。此外,鑒定出的變異往往與目前對(duì)該疾病的理解沒(méi)有關(guān)聯(lián),,出現(xiàn)在“垃圾”DNA中,。之所以被稱為垃圾,主要因?yàn)槟壳斑€不了解其功能的重要性,。
2.也許更重要的是,,研究范圍僅限于自然出現(xiàn)的生物學(xué)。我們只是在測(cè)試自然界中的存在,,但進(jìn)化并不完全,。能測(cè)試非自然變異才可以解決“在燈柱下找鑰匙”的難題,大大拓展探索空間,,也極有可能發(fā)掘很多迄今難以想象的生物學(xué)觀點(diǎn)和潛在的商業(yè)機(jī)會(huì),。
例如CRISPR技術(shù)等合成生物學(xué)的進(jìn)展,,再加上基因組學(xué)與合成生物學(xué)初步融合,推動(dòng)基因組學(xué)探索自然遺傳空間以外更多領(lǐng)域,,從“觀察自然”的科學(xué)轉(zhuǎn)型為干預(yù)性努力,。
通過(guò)新一代測(cè)序技術(shù)能看到數(shù)百萬(wàn)種自然變異,但如果能干預(yù)細(xì)胞出現(xiàn)新變異,,然后大規(guī)模觀察,、測(cè)試和測(cè)量結(jié)果,將極大擴(kuò)展生物學(xué)知識(shí)范疇,。
一種早期方式是Perturb-seq技術(shù),,利用該技術(shù)研究人員能讓單個(gè)細(xì)胞中的單個(gè)基因失效,一次讓數(shù)千個(gè)失效,,然后通過(guò)RNA測(cè)序觀察結(jié)果,。
Perturb-seq技術(shù)可提供基因組范圍和分辨率,在基因組中進(jìn)行多重干預(yù),,第一次能做到分析非自然構(gòu)型,。
然而,Perturb-seq技術(shù)只能處理一種類型的突變,,即停止單個(gè)基因的轉(zhuǎn)錄,。要使用其他工具才能在基因組范圍內(nèi)實(shí)驗(yàn)性分析其他類型的遺傳變異,例如單核苷酸多態(tài)性,、多堿基變異、結(jié)構(gòu)變化,,以及啟動(dòng)子互換等,。
除了提升生物潛能,科學(xué)家還希望探索變異組合中的單個(gè)變異,。由單一高滲透性變異引起的疾病方面,,我們已經(jīng)積攢了不少經(jīng)驗(yàn)。
事實(shí)上,,正是相關(guān)知識(shí)推動(dòng)制藥和生物技術(shù)公司發(fā)現(xiàn)更多治療罕見(jiàn)病的方法,。我們對(duì)單基因疾病了解很多,因?yàn)楹苋菀子矛F(xiàn)有的工具進(jìn)行研究,。然而,,大多數(shù)困擾社會(huì)的疾病,例如心臟病和癌癥都是多個(gè)基因相互作用的結(jié)果,。為深入了解其中的復(fù)雜性,,我們需要基因組規(guī)模的工具,在細(xì)胞系中產(chǎn)生多個(gè)突變,,在不同環(huán)境下測(cè)試,,這里提到的都是大規(guī)模多重實(shí)驗(yàn),,要付出一定的成本。
例如,,Inscripta最近推出的新工具產(chǎn)生了超過(guò)200000個(gè)大規(guī)模并行,、精確定義的變異,主要針對(duì)大腸桿菌基因組,。
最后得到了一些明顯效果:(1)發(fā)現(xiàn)了100多種能提高賴氨酸產(chǎn)量的變異,,大多數(shù)不在已知基因范圍內(nèi);(2)發(fā)現(xiàn)有三種變異單個(gè)存在時(shí)僅能提高幾倍產(chǎn)量,,但聯(lián)合起來(lái)可以提高逾14000倍產(chǎn)量,。相關(guān)結(jié)果進(jìn)一步體現(xiàn)出人類對(duì)生物學(xué)的理解是多么有限,即使在研究最多的機(jī)體里采用最常見(jiàn)的手段,。
最新進(jìn)展讓人了解到海量新知識(shí),,也重新激起了科學(xué)家和企業(yè)家的興趣。了解越多,,就越意識(shí)到仍然需要學(xué)習(xí),。
使用分布式基因組工具可以實(shí)現(xiàn)高性價(jià)比,高度多重且遞歸的基因編輯,,還能結(jié)合當(dāng)前的遺傳分析平臺(tái),,如單細(xì)胞和新一代測(cè)序,實(shí)現(xiàn)閉環(huán)干預(yù)和分析,,充分發(fā)揮探索自然變異的潛力,。
至于相關(guān)技術(shù)會(huì)如何影響人們對(duì)生物學(xué)的理解,以及治療疾病,、提高農(nóng)作物產(chǎn)量和開(kāi)發(fā)新材料方面會(huì)出現(xiàn)哪些新產(chǎn)品,,很難想象,預(yù)測(cè)更難,。(財(cái)富中文網(wǎng))
約翰·施蒂爾普納格爾是Illumina和Ariosa Diagnostics的聯(lián)合創(chuàng)始人,。此外,他目前擔(dān)任Inscripta的董事會(huì)主席,。布萊恩·羅伯茨是Venrock的合伙人,。
如前述,Venrock是Inscripta的投資人,。
譯者:馮豐
審校:夏林