真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!
時(shí)間:
2024-02-06
瀏覽次數(shù):

近日,真邁生物聯(lián)合深圳市環(huán)境科學(xué)院在《Frontiers in Environmental Science》雜志上發(fā)表了題為“FWAlgaeDB,an integrated?genome database of freshwater?algae”的研究成果,發(fā)布了淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,并闡述了數(shù)據(jù)庫(kù)的結(jié)構(gòu)及各功能板塊。研究還基于真邁生物GenoLab M高通量基因測(cè)序平臺(tái)對(duì)10個(gè)水庫(kù)水體樣本進(jìn)行了宏基因組測(cè)序,在藻類物種鑒定方面,比較了FWAlgaeDB與NT庫(kù)的差異及優(yōu)勢(shì)。


FWAlgaeDB是第一個(gè)專門的淡水藻類數(shù)據(jù)庫(kù),包含204個(gè)淡水藻類物種的生物學(xué)信息、基因組及功能注釋信息,并整合BLAST在線比對(duì)軟件,可以快速、準(zhǔn)確地完成序列相似性比對(duì)和物種鑒定,對(duì)淡水藻類物種多樣性保護(hù)及功能開(kāi)發(fā),具有重要作用。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!
背景簡(jiǎn)介

藻類是水生態(tài)系統(tǒng)中重要的成員,對(duì)碳固定和初級(jí)生產(chǎn)力的提高發(fā)揮關(guān)鍵作用,并在可再生能源、水產(chǎn)養(yǎng)殖和制藥產(chǎn)業(yè)中具有普遍應(yīng)用。淡水藻類廣泛分布于人類的生活環(huán)境中,包括淡水湖泊、沼澤、水庫(kù)、河流、溪流及冰川等,占據(jù)了淡水環(huán)境的重要生態(tài)位,與人類生存息息相關(guān)。近幾十年來(lái),淡水藻類在水質(zhì)監(jiān)測(cè)、生物多樣性評(píng)估與廢水重金屬去除等方面受到密切廣注。


藻類基因組包含重要的遺傳信息,是藻類功能開(kāi)發(fā)及遺傳改造的基礎(chǔ),為生態(tài)環(huán)境保護(hù)與生物資源利用提供重要的理論依據(jù)。然而,目前已發(fā)表的藻類基因組序列有限且分散。已有的藻類相關(guān)數(shù)據(jù)庫(kù),比如GenBank和JGI,沒(méi)有對(duì)淡水和海洋藻類進(jìn)行有效的區(qū)分,且不包含藻類的生物學(xué)信息,比如生活環(huán)境、分類學(xué)信息、形態(tài)學(xué)圖片等;而AlgaeBase和Algae-Hub,雖然包含藻類基本的生物學(xué)信息,但是沒(méi)有收錄其基因組信息。因此,對(duì)于專注于淡水藻類的研究人員來(lái)說(shuō),目前已有的藻類數(shù)據(jù)庫(kù)并不能滿足其研究需求?;诖?,真邁生物和深圳市環(huán)境科學(xué)院合作開(kāi)發(fā)了一個(gè)綜合性的、開(kāi)放訪問(wèn)的淡水藻類基因組平臺(tái)--FWAlgaeDB,助力淡水藻類研究和生態(tài)環(huán)境保護(hù)。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!
結(jié)果概要
01

數(shù)據(jù)來(lái)源

FWAlgaeDB目前包含來(lái)自于7個(gè)門204個(gè)物種的淡水藻類。其中,生物學(xué)特征信息來(lái)源于NCBI,公共數(shù)據(jù)庫(kù)以及已發(fā)表的文獻(xiàn)?;蚪M序列從NCBI下載,CDS及Protein序列一部分來(lái)源于NCBI已公布的文件(84個(gè)物種),另一部分來(lái)源于我們的基因預(yù)測(cè)(120個(gè)物種)。此外,我們對(duì)每個(gè)物種都進(jìn)行了功能注釋(NR,Swiss-Prot,GO,KEGG,COG和KOG),以幫助了解基因功能層面的信息。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖1?數(shù)據(jù)庫(kù)中204個(gè)藻類物種的分類及豐度


02

數(shù)據(jù)庫(kù)結(jié)構(gòu)

FWAlgaeDB包括搜索模塊、BLAST比對(duì)分析、基因組數(shù)據(jù)集(FWAlgae pool)/功能注釋文件(annotation)模塊,可以實(shí)現(xiàn)網(wǎng)站內(nèi)的快速檢索、相似性比對(duì)及基因組/注釋文件的免費(fèi)下載。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖2?數(shù)據(jù)庫(kù)搭建流程圖


搜索模塊



FWAlgaeDB集成了一個(gè)智能搜索模塊,可以幫助研究人員快速檢索感興趣的數(shù)據(jù)。FWAlgaeDB支持不同的搜索方法:①輸入分類學(xué)術(shù)語(yǔ)檢索(支持不同分類學(xué)水平,如綱,目,科,屬等),網(wǎng)站會(huì)輸出相應(yīng)水平上的物種列表以供選擇。研究人員確定目標(biāo)物種后,可以點(diǎn)擊并跳轉(zhuǎn)到特定頁(yè)面瀏覽、下載相關(guān)數(shù)據(jù)。②精確檢索,通過(guò)物種的科學(xué)名稱、數(shù)據(jù)庫(kù)編號(hào)或NCBI分類號(hào)來(lái)精確檢索物種信息。FWAlgaeDB使用模糊匹配算法,即使搜索字符串或拼寫不完整,也可以根據(jù)潛在相關(guān)性輸出搜索結(jié)果。


FWAlgae pool




展示204個(gè)淡水藻類的分類信息和基因組序列。淡水藻類的屬和種按字母順序排列在瀏覽界面上。每個(gè)物種都鏈接到一個(gè)特定的頁(yè)面,包含其生物分類學(xué)信息、生活環(huán)境、NCBI登錄號(hào)、地理分布、參考圖片和相關(guān)文獻(xiàn),以及可下載的基因組序列。在本頁(yè)面,研究人員可以下載相應(yīng)的FASTA格式的基因組序列。此外,單擊藻類名稱將直接進(jìn)入Annotation下載界面。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖3?FWAlgae pool界面展示


注釋文件展示和下載




注釋界面以表格形式呈現(xiàn),研究人員可以單獨(dú)選擇或一鍵打包Genome、CDS、Protein和不同的數(shù)據(jù)庫(kù)注釋文件進(jìn)行下載。為了更好地了解藻類基因組信息,我們還收集并注釋了204種藻類的主要基因家族,包括ABC transport、細(xì)胞色素p450、轉(zhuǎn)座酶、藻毒素基因簇等,供研究人員免費(fèi)下載使用。本頁(yè)內(nèi)嵌的搜索工具也支持通過(guò)物種名稱或數(shù)據(jù)庫(kù)ID進(jìn)行精確搜索。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖4?注釋文件展示和下載界面


BLAST比對(duì)




FWAlgaeDB集成了BLASTN/BLASTP比對(duì)工具,研究人員能夠?qū)⒋樵冃蛄?核苷酸或氨基酸序列)與整個(gè)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),并獲得BLAST比對(duì)報(bào)告。研究人員可以在操作界面中粘貼FASTA序列或上傳序列文件,快速搜索數(shù)據(jù)庫(kù)中與待查詢基因組或蛋白質(zhì)序列相匹配的物種列表。數(shù)據(jù)庫(kù)支持BLASTN、MEGABLAST和Discontiguous MEGABLAST比對(duì),且可以使用高級(jí)命令行參數(shù)對(duì)搜索進(jìn)行優(yōu)化。


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖5?BLAST比對(duì)分析展示



03

水庫(kù)樣本驗(yàn)證FWAlgaeDB的適用性

為了驗(yàn)證FWAlgaeDB的有效性,我們使用GenoLab M平臺(tái)對(duì)10個(gè)水庫(kù)水體樣本進(jìn)行了宏基因組測(cè)序,將測(cè)序得到的reads在FWAlgaeDB和NT藻類數(shù)據(jù)庫(kù)中進(jìn)行物種注釋的分析和比較。


基于NT藻類數(shù)據(jù)庫(kù)進(jìn)行物種鑒定時(shí),獲得了極其龐雜的物種鑒定結(jié)果,且需要進(jìn)一步區(qū)分是否是淡水藻類,后續(xù)的識(shí)別過(guò)程將極為復(fù)雜。NT數(shù)據(jù)庫(kù)獲得的海量數(shù)據(jù)可能會(huì)分散研究人員的注意力,并模糊一些重要信息。而基于FWAlgaeDB鑒定得到的物種,相對(duì)更為集中,且確定都是淡水來(lái)源的藻類。


另外,在NT數(shù)據(jù)庫(kù)中檢測(cè)到幾個(gè)公認(rèn)的海洋藻類物種(圖中橙色標(biāo)記),這是令人費(fèi)解且無(wú)法解釋的。因?yàn)闃颖緛?lái)源于淡水水庫(kù),理論上不存在海洋種類。這些潛在的假陽(yáng)性表明,F(xiàn)WAlgaeDB是鑒定淡水樣本中藻類物種的更優(yōu)選擇。當(dāng)然,如果要對(duì)這些假陽(yáng)性物種進(jìn)行確切的鑒定,還需要進(jìn)一步的濕實(shí)驗(yàn)驗(yàn)證,如藻類分離、培養(yǎng)和PCR鑒定。

真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!

圖6?FWAlgaeDB和NT藻類數(shù)據(jù)庫(kù)對(duì)10個(gè)水庫(kù)樣本藻類物種鑒定的比較


真邁生物聯(lián)合深圳市環(huán)境科學(xué)院開(kāi)發(fā)淡水藻類基因組數(shù)據(jù)庫(kù)——FWAlgaeDB,助力水生態(tài)環(huán)境保護(hù)!
結(jié)論

基于上述分析,我們得出如下結(jié)論:

1、FWAlgaeDB是目前第一個(gè)專門針對(duì)淡水藻類的基因組數(shù)據(jù)庫(kù),包含204種淡水藻類的生物學(xué)特征及基因組信息,可助力水生態(tài)環(huán)境相關(guān)研究的開(kāi)展;

2、FWAlgaeDB可以實(shí)現(xiàn)BLAST相似性比對(duì)及淡水藻類物種鑒定,且數(shù)據(jù)庫(kù)中所有信息文件都提供開(kāi)源、免費(fèi)的下載;

3、相對(duì)于NT數(shù)據(jù)庫(kù),F(xiàn)WAlgaeDB更適合淡水樣本的藻類物種鑒定。

相關(guān)推薦
Molecular Cell丨真邁SURFSeq 5000助力中山大學(xué)王金凱團(tuán)隊(duì)全長(zhǎng)單分子m6A檢測(cè)技術(shù)開(kāi)發(fā)
文章梗概近日,中山大學(xué)中山醫(yī)學(xué)院王金凱教授課題組在Molecular Cell(IF 14.5)上發(fā)表了題為“Single-molecule m6A detec...
科研論文丨真邁生物SURFSeq 5000助力胰腺神經(jīng)內(nèi)分泌腫瘤變異檢測(cè)與治療
文章梗概近日,莫斯科臨床科學(xué)中心、莫斯科高級(jí)研究中心和俄羅斯聯(lián)邦創(chuàng)新研究中心的科學(xué)家們?cè)贗nternational Journal of Molecular S...
科研論文 | 長(zhǎng)短結(jié)合!FASTASeq 300+ONT平臺(tái)助力湖北省疾控中心開(kāi)展人腺病毒基因組特征研究
文章梗概近日,真邁生物攜手湖北省疾病預(yù)防控制中心,在Scientific Reports上發(fā)表了題為“Hybrid sequencing for detaile...
科研論文丨FASTASeq 300助力ALK融合癌基因精準(zhǔn)檢測(cè)新方法開(kāi)發(fā)
文章梗概近日,真邁生物用戶俄羅斯莫斯科國(guó)立醫(yī)科大學(xué)、內(nèi)分泌學(xué)研究中心等機(jī)構(gòu)在cancers上發(fā)表了題為“A New Approach of Detecting?...