當前位置: 首頁 » 資訊 » 人才動態(tài) » 正文

鄭洪坤:用大數(shù)據(jù)之器破海洋生物基因組學之謎

發(fā)布日期:2020-12-29   來源:生物探索   瀏覽次數(shù):0
核心提示:近日,筆者十分有幸能夠采訪到百邁客創(chuàng)始人兼董事長鄭洪坤先生,從產(chǎn)業(yè)和科研兩個角度為我們細致地講述了建立海洋生物基因大數(shù)據(jù)
 近日,筆者十分有幸能夠采訪到百邁客創(chuàng)始人兼董事長鄭洪坤先生,從產(chǎn)業(yè)和科研兩個角度為我們細致地講述了建立海洋生物基因大數(shù)據(jù)平臺是海洋基因組學研究不斷完善的必由之路。同時,百邁客在這一完善過程中不僅僅要扮演好參與者的角色,還要努力成為海洋生物基因研究大數(shù)據(jù)方向的先鋒探索者和引領(lǐng)者。

 

微信截圖_20201229093353.png

百邁客創(chuàng)始人兼董事長鄭洪坤先生

 

產(chǎn)研對話:SLAF-seq助力海洋生物基因組科研

 

海洋生物是生物學研究的重要領(lǐng)域,也是破解人類起源之謎的重要板塊。自1997年起,美國便開始有計劃的開展對羅非魚、對蝦和牡蠣等海洋生物的基因組研究,并且多個海洋藍藻基因組計劃也相繼啟動。雖然我國起步較晚,但目前也已啟動了扁藻、螺旋藻、牡蠣、對蝦等基因組計劃。正如相建海老師所說:由于海洋生物基因組大、雜合度高、拼接難度大成為了全球研究海洋生物基因組的最大困擾。

 

工欲善其事,必先利其器。為了破解凡納濱對蝦的基因組密碼以便更好地培育對蝦,實現(xiàn)其經(jīng)濟價值和生物研究價值,相建海老師在基因測序的道路上開始了新的征程。多次嘗試使用二代測序技術(shù)都沒有辦法完成對蝦的基因組圖譜的重組,但在一次偶然的機會下他發(fā)現(xiàn)來自百邁客公司自主研發(fā)的SLAF-seq技術(shù)可以很好的完成這一問題。該技術(shù)前期利用生物信息學方法,對目標物種的參考基因組(或已知BAC序列)進行系統(tǒng)分析,設(shè)計標記開發(fā)方案,后期根據(jù)前期的方案,構(gòu)建SLAF-seq文庫,篩選特異性長度片段進行高通量測序,將獲得測序深度和質(zhì)量滿足要求的SLAF片段來代表目標物種的全基因組信息。于是產(chǎn)研互助,世界上第一個凡納濱對蝦的基因組圖譜在我國率先完成了,很快也在國際期刊《scientific reports》雜志上發(fā)表這一重大成果,獲得了國際上認可。

 

自此,百邁客公司自主研發(fā)的SLAF-seq技術(shù)奠定了在海洋生物基因研究上不可或缺的重要地位。

 

共建共享:基因大數(shù)據(jù)平臺提高公共基因利用率

 

數(shù)據(jù)是觀測生物遺傳信息的重要基礎(chǔ),不同生物的遺傳數(shù)據(jù)可謂是科研道路上必不可少的戰(zhàn)略性資源,但目前這種資源卻存在利用不足或者資源浪費的現(xiàn)象。

 

相建海老師對此提出了自己的建議:搭建生物大數(shù)據(jù)平臺勢在必行,這是發(fā)展海洋生物基因組學研究必不可少的事情。特別是如何共建共享生物領(lǐng)域的公共數(shù)據(jù)?如何利用數(shù)據(jù)不斷地更新迭代以完善生物基因組圖譜信息?更重要的是,如何把數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力,服務生物經(jīng)濟的發(fā)展;如何將數(shù)據(jù)轉(zhuǎn)化為科研動力,服務生物科研的前進。

 

面對這些問題,百邁客公司提出了自己的回答。而這一回答的答案便是:建立海洋生物基因大數(shù)據(jù)平臺。百邁客創(chuàng)始人兼董事長鄭洪坤先生為我們介紹到:自高通量基因測序發(fā)展的十幾年時間以來,業(yè)界已經(jīng)積攢了許多數(shù)據(jù),但這些數(shù)據(jù)的公共利用率卻不是很高。據(jù)了解,面對海量的數(shù)據(jù)不知從何下手、有效的數(shù)據(jù)不能得到專業(yè)性的轉(zhuǎn)化成為了阻礙基因公共數(shù)據(jù)利用率的兩座大山。

 

既然問題已經(jīng)很明顯了,那解決問題就很容易了。鄭洪坤先生表示:讓數(shù)據(jù)庫的數(shù)據(jù)可用,讓可用數(shù)據(jù)有工具再利用便是這一大數(shù)據(jù)平臺搭建的出發(fā)點。

 

如何搭建這一大數(shù)據(jù)平臺,鄭洪坤先生及其團隊有著自己的步驟和想法,他告訴生物探索記者:首先,我們從海洋生物信息的科研需求入手,打造一個海洋生物多組學數(shù)據(jù)庫。該數(shù)據(jù)庫包含了基因組、轉(zhuǎn)錄組、表觀組、代謝組、蛋白組等各種類型組學的數(shù)據(jù),把科研所需的數(shù)據(jù)一網(wǎng)打盡,為科研人員提供多方位全覆蓋的幫助。在這里,不僅可以幫助科研人員減少測序成本的浪費,也能夠提高基因公共數(shù)據(jù)的利用率,為數(shù)據(jù)更新迭代做出努力。

 

第二,既然有了數(shù)據(jù),如何才能把數(shù)據(jù)背后的價值挖得更加透?我們想要打造一個類似人工智能的交互平臺,依靠海量的基因公共數(shù)據(jù),利用互聯(lián)網(wǎng)大數(shù)據(jù)算法技術(shù),為科研人員提供相關(guān)建議和解決方案。例如,科研人員通過測序技術(shù)得出了海洋生物的一些數(shù)據(jù),但并不清楚這些數(shù)據(jù)能為科研提供何種幫助。這時,大數(shù)據(jù)的交互分析便成為了科研亟需的工具了。它就像一個人工智能科學家,幫助你解讀數(shù)據(jù)信息,幫你找到合適的工具、甚至我們可以設(shè)想它能夠幫助你找到研究的新突破口。

 

基因+:產(chǎn)業(yè)化支撐海洋生物信息產(chǎn)業(yè)發(fā)展

 

如今,大數(shù)據(jù)平臺的正式成立成為了新的開端,至于以后的發(fā)展如何,鄭洪坤先生也表示將繼續(xù)依托“基因+”多元化的發(fā)展理念,將海洋生物基因組學的研究推向新的高潮。但要堅持這一發(fā)展理念,也存在重重困境。

 

首先是生物信息人才的流失。鄭洪坤先生表示:“為什么IT行業(yè)不存在人才流失呢?是因為產(chǎn)業(yè)的支撐能力。隨著產(chǎn)業(yè)的不斷發(fā)展,產(chǎn)業(yè)價值的不斷豐富,給足了在此行業(yè)的工作人員安定定求發(fā)展的信心。如果如果想要留住專業(yè)的生物信息人才,我目前能想到的方法還是以互聯(lián)網(wǎng)商業(yè)化的形式將他們留住。舉個例子,如果市場需要一個基因組的解讀軟件,而恰好由我們的專業(yè)團隊開發(fā)出來了,他們的付出就應該得到回報,而這個回報可以是金錢。隨著在市場上用這個軟件的人越來越多用,他能夠得到的回報也就更多,也讓他有更多的信心和動力去不斷地對此軟件進行更新迭代。通過商業(yè)化的模式,有投入有回報,持續(xù)迭代,就有可能將其發(fā)展成為一個具有市場強競爭力的產(chǎn)品。”

 

其次是商業(yè)模式的選擇。既然要用商業(yè)化的方式留住人才,也就逃不開談到平臺的盈利模式。與會期間也有很多科研學者建議將此作為免費的科研服務平臺,對此鄭洪坤先生也表達了自己的意見:“目前我們團隊所設(shè)想的盈利模式可能很貼近互聯(lián)網(wǎng)的盈利模式,是將其放置一個相對長時間的周期里面來看的。開始投入市場的時候,可能會是免費試用的模式。因為初出茅廬的我們需要的是流量和培養(yǎng)用戶的體驗感,讓用戶不斷地給我們提意見進行改進。當我們的改進達到穩(wěn)定可持續(xù)的狀態(tài)時,我們需要的便是用戶的黏度了,也就是當用戶真正認可了我們的服務與價值,也就會很自愿地對我們的產(chǎn)品買單。”

 
 
 
 
?