search
聽這位曾發現最多人類基因的中國科學家,告訴你基因測序的未來

聽這位曾發現最多人類基因的中國科學家,告訴你基因測序的未來

2014年人類全基因組測序成本降低至1000美元,全球基因檢測領域迎來了第一個春天,的基因檢測市場更是爆炸式增長。2017年,Illumina再次將全基因組測序成本降低到800美元。測序成本降低的同時,全世界的基因組數據也在以超摩爾比速度增加。基因數據的計算與解讀一直都是基因檢測的重要環節。在數據激增的情況下,如何更快速,更準確的進行數據分析和解讀,將是基因檢測領域下一個命題。藉此契機,動脈網將推出「基因&數據」系列報道,詳情可持續關注。

首度基因是一家專註 基因大數據的生物與IT技術相結合的公司 。公司擁有一支多年從事基因測序、分子生物學、演算法開發、與大數據處理的跨學科研發團隊,致力打造世界一流的生物信息分析中心,並建立國內權威的基因信息資料庫。

首度基因創始人兼CEO唐元華

創始人唐元華告訴動脈網記者:「華人的人口佔了世界總人口的1/4,但是針對華人的基因數據研究卻遠低於歐美人口。因此,我們想專註於打造華人的基因資料庫,包括人種的基因和癌症的變異。」

跨界:世界上發現人類基因最多的科學家

在創立首度基因之前,唐元華先後在美國幾家生物公司擔任生物信息部門的主管 。從個人履歷來看,這是一位生物信息學的專家。但唐元華告訴記者自己卻是數學背景出身,這讓記者頗感意外。

唐元華回憶:「去到美國的時候,是1988年。那時候人類全基因組計劃正在籌備中。在我剛入學的第一天,詹姆士·華生到我們的學校做了一次演講。 這次演講完全改變了我的生命軌跡。」

唐元華形容自己是個理想主義者,去到美國就是為了學習西方最先進的科學技術。「一聽到人類基因組計劃,堪比阿波羅登月計劃和曼哈頓原子彈計劃,這不正是我來到美國的目的嗎?」原本是學數學的唐元華,下定決心轉向了基因組學的研究。

生物信息學概念的正式提出,是在1993年。在唐元華讀博期間,國際上還沒有生物信息這個專業,但這個大趨勢是有了。這位數學系學生, 博士論文研究的問題,卻是生命科學方向了。畢業以後,唐元華更是全身心投身到人類基因組項目中,領導的團隊發現了超過20%的人類基因。 他是世界上發現人類基因最多的科學家,發現並命名了4個重要的基因家系。

「當時生物信息學還是一個處女學科,沒有自己的理論體系。對很多人來講,生命科學是一個實驗科學,學好它主要靠記憶。」唐元華回憶到。他告訴記者, 當時有一些數學家,希望能夠建立生命科學的理論基礎:「這就是當時的大背景,一群數學界的科學家希望尋找到一個統一的理論,可以解釋所有生命現象 。」

經過近30年的發展,「理論生物學」已經發展到了一個很成功的高度。生命科學的基礎,落實到了信息學的基礎之上。甚至說,它與計算機科學變成為同源的學科。到了今天,生物學家對生命本質的認識已經超越了物理學家對物理世界的認識。(因為生命的本質落實到了DNA的層次,是實驗能夠完全接觸的。而理論物理,卻還受到實驗方法的限制)。 能夠在生命信息學這個領域做一些開創性的工作,唐元華表示,自己感覺很自豪。

同源:生命即程序

早年間,唐元華通過基因組學的研究發現了一類新的搜索技術,在搜索的維度和問詢的複雜度方面,全面提升了當時的搜索演算法。這些發明專利,被包括谷歌、雅虎、IBM、微軟等世界IT巨頭引用。一位數學背景的生物信息學家,開發出了被這些IT巨頭公司採用的專利搜索技術,相信不少人也會跟記者一樣——驚呆了。

唐元華笑了笑表示,並非自己跨界跨得遠,而是信息科學本就是個多元學科。嚴格說來自己是信息科學家,所研究的也是信息技術。這些發明,是立足於信息學的發明。它們對生命科學是有用的,對計算機科學同樣是有用的。

他向記者解釋道:「這又要退會去講生命科學的本質了。」生命現象,從本質上講,是由基因組這個程序控制的化學反應與物理變化。引發生命的本質是信息。基因組是的信息是靜態的,人在被賦予基因那一刻,就註定了伴隨一生的生命信息。換個說法,可以將其理解為,所有地球上的生命其實是一個程序,是一個受基因組控制的生化與物理過程。

唐元華認為,生命科學,計算機科學,甚至是人類的理性、人工智慧都是同源的,都可以歸納到信息科學:「這就是為什麼信息技術的研究在計算機科學和生命科學界都有意義。」

頂級團隊:科研、臨床、創新,三管齊下

2013年,唐元華被從美國的「完全基因組公司」派到深圳的華大基因,負責核心演算法團隊的管理。唐元華回憶,這段時間自己在美國和來回跑,越發感覺到基因領域正在醞釀一次大爆發。2015年遇到一位做基金的朋友,原來也是做基因組學的。他們交談一番后,唐元華更加堅定了對市場的信心。這一年,唐元華決定在創業,成立了首度基因。

聯合創始人徐健

徐健博士,公司的聯合創世人,是比較傳統的分子生物學家。此前,徐健任職於國際知名生物技術公司凱傑,擔任基因技術部門的主管。後來,自己在矽谷創辦「多態 DNA 技術公司」, 擔任科研副總裁。現在,在首度基因,唐元華負責數據相關領域,徐健則負責生命科學領域。兩人更像是珠璧聯合、完美地互補。

公司員工60%都擁有碩士以上學歷。公司成立僅僅一年半,在生物信息領域已有15項專利申請,同時有5個授權的軟體著作權,這證明了他們超強的研發能力。談起自己的團隊,唐元華顯得很有信心:「我們的團隊覆蓋了基因組學的方方面面。從專業性上講,算得上生物信息領域的世界級團隊吧。」

成立不久,公司就獲得了1000萬美元的A輪融資,也得到蘇州工業園區的大力支持,一路都比較順利。公司還在合肥建立了醫學檢驗所,用於處理客戶的樣品;同時在科技大學設立了首度基因實驗室,用於開展高端產學研項目。雖然成立不久,但可以看出首度的遠大目標,在科研、臨床、創新,同時三管齊下。

資料庫與檢測服務,科研與臨床

在首度基因成立的第一年,他們並沒有急著往市場方向走,而是靜下心來做資料庫的建立和核心演算法的開發。經過整整一年的努力,他們已經建立起了比較完善和很有特色的產品線。並通過專利申請和軟體著作權對這些產品形成了一個保護層。

1

基因測序

為打造全民精準醫療信息平台,首度基因自主開發了FD-Exome全方位遺傳檢測。基於高通量測序平台,FD-Exome提供覆蓋遺傳腫瘤風險、常見疾病風險、營養代謝能力以及藥物使用風險在內的全方位健康風險基因檢測。

不同於全基因組檢測,首度基因的FD-Exome只針對人類全部基因的編碼區域進行檢測。「基因組包含的信息很多,但我們真正所了解的就是蛋白編碼區和其調控區域,大約佔總體的2%。」唐元華向記者介紹。剩下98%的區域都是目前無法解釋的。對於C端用戶來說,對98%的未知區域的測序意義就更不明顯了。相較全部基因組的檢測,FD-Exome大範圍砍掉了現目前用途並不明朗的區域,大大地降低了用戶的測序成本,使得今天基因測序就能成為每一位國人的產品,而不是等到遙遠的將來。

不僅如此,成本的降低並不意味著降低測序的深度。相反,因為採用了目標區域捕獲技術,對目標區域進行一次性平行捕獲,首度大大提升了測序深度(>200X),從而實現對於變異的臨床精度的檢測。 通過公司自主開發的變異動態註釋演算法,可掃描人類全部基因的外顯子區域變異情況,針對已知基因進行詳細解讀;對於未知的變異,也能做到實時跟蹤。通過全方位的基因解讀,幫助用戶實現有針對性的健康管理。不僅如此,對於B端用戶來說,動態的解釋服務能夠幫助他們及時跟蹤世界科技的進步,獲取最新的科研成果。

「對於C端用戶來說,我們的產品有實用價值;對於醫生來說,我們的產品具有臨床價值;對研究人員來說,它又有科研價值。」唐元華總結道:「最重要的是在價格上得到了有效的控制,使得人類基因組項目的成果,今天就可以在廣大的國民身上體現出來。」

除了檢測客戶遺傳信息的全基因測序, 公司還提供全套的癌症基因檢測服務,包括基於癌症組織的測序,和基於血液的ctDNA無創檢測。「FD-180-Tissue 是測序癌症組織的,FD-180-ctDNA 是測序客戶的血液樣品,可以實現對癌症患者病情的實時跟蹤。我們的目標用戶同時覆蓋健康和疾病人群,也幫助臨床醫生為癌症患者制定個性化的治療方案。」

2

數據服務

數據服務方面,首度基因通過癌症雲平台這一公益數據平台,為廣大癌症基因組學研究人員提供免費的資料庫資源。

資料庫的推出能夠共同推進癌症基因領域分析研究的發展,不斷完善有助於患者治療的癌症基因大數據。但這也只是首度基因構建癌症基因大數據的第一步。儘管目前公開的數據信息中也不乏華人資料庫,但並沒有完全針對華人的資料庫。

「東亞人口佔了全世界人口的1/4,但針對華人的研究數據量遠遠少於其他人種。」唐元華認為是一個很大的市場,基因特性跟歐美人種也存在不少差異。建立一個專業的,有統一標準的華人資料庫,很有必要。

「不同人種之間的不同癌症發病率存在明顯差異,比如乳腺癌,美國的發病率就比高出許多,而胃癌的發病率又低於。」他向記者解釋:「究竟不同癌症在不同人種之間存在什麼樣的差異,這必須要藉助大數據分析。」

唐元華透露,目前華人資料庫正在精密建設中,測序人數已經超過1000人。數據最終會通過雲平台對外開放,其中包括高頻癌症基因、華人基因曲線、以及癌症分佈等數據。

目前基因檢測行業百家爭鳴,不同檢測機構之間存在許多差異,測序基因不同,測序儀器不同,軟體分析標準不一樣,這導致了數據分析不能相互交流。首度基因希望在自身數據量達到一定規模后,能夠形成國內的行業標準。

未來20年,基因組學會像手機一樣普及

2017年,人類編碼基因的測序成本進入數百美元級時代,整個基因領域都為之振奮。成本的降低毫無疑問將進一步推動基因組學的普及。

唐元華預測,未來20年內,基因組學會像今天的手機一樣普及,每個人都能夠擁有自己的基因組數據,並通過這些數據了解自己的健康狀況,醫生可根據數據制定個性化健康管理方案。「首度基因的定位就是為每個人提供這樣的服務。」唐元華表示。

去年,國家衛計委通過的NIPT的批文,各地政府也在積極推廣,NIPT有望在未來實現臨床上的普及。「每年有1千7百萬的新生兒,從父母算起,到祖父母/外祖父母一輩,直接影響到的人口超過1億。」唐元華說。「雖然NIPT檢測的只是遺傳疾病中的很小一部分。但這是對遺傳檢測行業的非常大的東風,因為它會很快波及到人口的一個廣大層面,使得大家都對於基因檢測變得不再陌生。 順著這股東風,我們可以把遺傳疾病的篩查整盤推開。 再通過強調癌症遺傳基因、以及遺傳疾病基因在家族中的普遍性,一步一步把遺傳檢測產品在市場上推開。」在這裡,唐元華看到了全基因檢測在市場上普及的契機。

生物信息方面的核心競爭力,再加上測序行業的經驗,很難去界定首度基因是一家生物科技公司還是一家IT行業的公司。這正是首度基因不同與眾的地方。「國內眾多的基因檢測公司大多是分子生物學家創辦的,它們對於基因大數據行業的計算機、信息科技方面的知識,掌控不太全面。」唐元華說。「而首度基因,從創業的第一天開始,它就既是一家生物科技公司,又是一家IT技術公司。」 經歷了一年的發展,首度基因產品線逐漸豐富成熟,如今正是擴張時期。唐元華透露,目前公司B輪融資正在進行中,融資目標超過1億。公司希望融資后加大市場推廣力度,擴大消費群體,產生更多數據,為華人資料庫的建設添磚加瓦。

文|周夢亞

網站、公眾號等轉載請聯繫授權

tg@vcbeat.net

動脈網所刊載內容之知識產權為動脈網及/或相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23262次喜歡
留言回覆
回覆
精彩推薦