天津——2023年(nian)3月28日(ri),中國(guo)科學院(yuan)天津工業(ye)生(sheng)物技(ji)術研(yan)究所(以下簡(jian)稱天津工業(ye)生(sheng)物所)與亞(ya)馬遜云科技(ji)聯(lian)合(he)在天津舉辦(ban)“生(sheng)物計算設計“溝通(tong)會,就BT+IT結合(he)助(zhu)力合(he)成生(sheng)物學發(fa)展的現(xian)狀和未來進行溝通(tong)交流。
天津工業生(sheng)(sheng)(sheng)物(wu)(wu)所是(shi)中國(guo)合(he)(he)(he)成生(sheng)(sheng)(sheng)物(wu)(wu)學(xue)領域(yu)的核心力量,由中國(guo)科學(xue)院和(he)(he)(he)天津市人民政(zheng)府共建,牽頭組織承擔(dan)了(le)多項合(he)(he)(he)成生(sheng)(sheng)(sheng)物(wu)(wu)學(xue)、綠色(se)生(sheng)(sheng)(sheng)物(wu)(wu)制造等重點研發(fa)計劃任務。2019年,天津工業生(sheng)(sheng)(sheng)物(wu)(wu)所成立了(le)生(sheng)(sheng)(sheng)物(wu)(wu)設計中心平臺實驗室,并圍繞(rao)生(sheng)(sheng)(sheng)物(wu)(wu)計算(suan)設計,開始與亞馬遜云科技(ji)(ji)共同探索生(sheng)(sheng)(sheng)物(wu)(wu)技(ji)(ji)術(shu)(shu)和(he)(he)(he)信息技(ji)(ji)術(shu)(shu)相結合(he)(he)(he)(BT+IT)技(ji)(ji)術(shu)(shu)體系(xi),以進一步推(tui)動合(he)(he)(he)成生(sheng)(sheng)(sheng)物(wu)(wu)學(xue)發(fa)展,以期能夠為在健康、能源、農業和(he)(he)(he)環境等領域(yu)的重大(da)(da)突破提供(gong)技(ji)(ji)術(shu)(shu)支撐。至(zhi)今已推(tui)出(chu)了(le)全球首(shou)個基(ji)于(yu)(yu)圖數據庫的大(da)(da)腸桿菌調控代(dai)(dai)謝關系(xi)知識圖譜ERMer和(he)(he)(he)全流(liu)程高通量編輯序列(lie)設計云平臺AutoESD等20多項生(sheng)(sheng)(sheng)物(wu)(wu)計算(suan)設計工具和(he)(he)(he)軟(ruan)件應用。云原(yuan)生(sheng)(sheng)(sheng)的開發(fa)方(fang)(fang)式較(jiao)傳統方(fang)(fang)式大(da)(da)幅(fu)縮短開發(fa)時間,總(zong)體運行成本大(da)(da)幅(fu)降低,使得(de)團隊可以專注于(yu)(yu)業務代(dai)(dai)碼和(he)(he)(he)創(chuang)新。
圖數據庫助力構建專業大腸桿菌調控代謝知識圖譜,提升科研效率
細(xi)胞中(zhong)的(de)(de)(de)(de)(de)代(dai)(dai)謝(xie)調控(kong)(kong)非常(chang)復雜,一個特定的(de)(de)(de)(de)(de)細(xi)胞功能往(wang)往(wang)由(you)一系(xi)列(lie)不(bu)同(tong)類型(xing)(xing)的(de)(de)(de)(de)(de)代(dai)(dai)謝(xie)途徑調控(kong)(kong)相(xiang)(xiang)互(hu)作用決定。通常(chang)不(bu)同(tong)類型(xing)(xing)的(de)(de)(de)(de)(de)調控(kong)(kong)數(shu)(shu)(shu)據(ju)(ju)(ju)散落在各個不(bu)同(tong)的(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)庫,生(sheng)(sheng)物(wu)學家(jia)很難通過僅關(guan)注與所研究的(de)(de)(de)(de)(de)代(dai)(dai)謝(xie)物(wu)/蛋白(bai)質密切相(xiang)(xiang)關(guan)的(de)(de)(de)(de)(de)一兩類相(xiang)(xiang)互(hu)作用來識別這種復雜調控(kong)(kong)級聯關(guan)系(xi)。因此,將這些不(bu)同(tong)類型(xing)(xing)的(de)(de)(de)(de)(de)調控(kong)(kong)相(xiang)(xiang)互(hu)作用匯集(ji)在一起,并提供方便的(de)(de)(de)(de)(de)交互(hu)方式,將極大(da)的(de)(de)(de)(de)(de)方便生(sheng)(sheng)物(wu)學家(jia)挖掘和理解生(sheng)(sheng)物(wu)體內(nei)的(de)(de)(de)(de)(de)復雜調控(kong)(kong)關(guan)系(xi)。天津工業生(sheng)(sheng)物(wu)所生(sheng)(sheng)物(wu)設計(ji)中(zhong)心團隊(dui)聯合亞馬遜云科(ke)技(ji)團隊(dui)在計(ji)算(suan)生(sheng)(sheng)物(wu)學國(guo)際期刊Nucleic Acids Research上發表文章,發布(bu)了(le)全(quan)球(qiu)首個基于圖(tu)數(shu)(shu)(shu)據(ju)(ju)(ju)庫Amazon Neptune的(de)(de)(de)(de)(de)大(da)腸桿菌調控(kong)(kong)代(dai)(dai)謝(xie)關(guan)系(xi)知識圖(tu)譜ERMer,首次提供了(le)全(quan)局(ju)的(de)(de)(de)(de)(de)代(dai)(dai)謝(xie)調控(kong)(kong)圖(tu)譜,并通過可視化框架實(shi)現了(le)豐(feng)富(fu)的(de)(de)(de)(de)(de)搜索功能,如多步查詢(xun)、最短路徑查詢(xun)等。ERMer采用專門為高度關(guan)聯的(de)(de)(de)(de)(de)復雜數(shu)(shu)(shu)據(ju)(ju)(ju)集(ji)的(de)(de)(de)(de)(de)高效(xiao)存儲和查詢(xun)設計(ji)圖(tu)數(shu)(shu)(shu)據(ju)(ju)(ju)庫架構(gou),這打破了(le)傳統的(de)(de)(de)(de)(de)低效(xiao)數(shu)(shu)(shu)據(ju)(ju)(ju)檢索方式,有效(xiao)增(zeng)強(qiang)用戶和圖(tu)譜的(de)(de)(de)(de)(de)人機交互(hu),大(da)大(da)降(jiang)低了(le)使用門檻。
為充(chong)分發(fa)揮知識圖(tu)譜的(de)(de)價值(zhi),生(sheng)物設計中(zhong)心團隊(dui)還進一步采用(yong)基于(yu)圖(tu)神經網絡技術進行推理,成功實現了轉錄因(yin)子預(yu)測(ce)和轉錄因(yin)子靶點(dian)(dian)預(yu)測(ce)等功能,這將有助于(yu)挖掘(jue)潛(qian)在的(de)(de)關鍵調控(kong)因(yin)子和調控(kong)靶點(dian)(dian),構建新(xin)的(de)(de)調控(kong)代謝網絡,能夠為研究人員提供新(xin)的(de)(de)思路和方向。
云原生Serverless應用架構加速生物計算設計工具研發
模(mo)(mo)(mo)塊化(hua)(hua)、標準化(hua)(hua),是所有(you)工(gong)程學(xue)科(ke)的(de)(de)(de)(de)基礎,也(ye)是合(he)成(cheng)生(sheng)(sheng)物學(xue)區別于(yu)傳(chuan)統發(fa)酵行(xing)(xing)業(ye)的(de)(de)(de)(de)革命。工(gong)程學(xue)的(de)(de)(de)(de)可(ke)(ke)控(kong)性(xing)(xing),意味著其將(jiang)能(neng)夠與各種軟硬件(jian)進(jin)(jin)行(xing)(xing)結合(he),從而(er)走向(xiang)自(zi)(zi)動(dong)(dong)化(hua)(hua)與高(gao)通量,擺脫過往(wang)勞動(dong)(dong)密(mi)集(ji)型的(de)(de)(de)(de)研(yan)究模(mo)(mo)(mo)式,獲得更高(gao)的(de)(de)(de)(de)技術迭(die)代能(neng)力。而(er)對(dui)(dui)于(yu)這(zhe)個過程,除了(le)針(zhen)對(dui)(dui)元件(jian)工(gong)具以(yi)外,將(jiang)合(he)成(cheng)生(sheng)(sheng)物學(xue)的(de)(de)(de)(de)相關實驗流(liu)程進(jin)(jin)行(xing)(xing)模(mo)(mo)(mo)塊化(hua)(hua)、標準化(hua)(hua),也(ye)是自(zi)(zi)動(dong)(dong)化(hua)(hua)研(yan)究當中不可(ke)(ke)或(huo)缺(que)的(de)(de)(de)(de)一環。面向(xiang)微生(sheng)(sheng)物遺傳(chuan)操作(zuo),天津工(gong)業(ye)生(sheng)(sheng)物所生(sheng)(sheng)物設(she)(she)(she)計(ji)(ji)(ji)中心團隊開發(fa)得到了(le)第一個能(neng)夠在所有(you)操作(zuo)類型、任(ren)何基因組位點和(he)跨物種上進(jin)(jin)行(xing)(xing)精(jing)確、自(zi)(zi)動(dong)(dong)化(hua)(hua)和(he)高(gao)通量編輯序列設(she)(she)(she)計(ji)(ji)(ji)的(de)(de)(de)(de)云(yun)平臺AutoESD。AutoESD 的(de)(de)(de)(de)開發(fa)采用(yong)了(le)基于(yu)云(yun)端的(de)(de)(de)(de)無服務(wu)器架構(gou),確保了(le)高(gao)可(ke)(ke)靠性(xing)(xing)、穩(wen)健性(xing)(xing)和(he)可(ke)(ke)擴展(zhan)性(xing)(xing),能(neng)夠在幾分鐘內(nei)并(bing)行(xing)(xing)處(chu)理(li)包(bao)含上千個編輯序列設(she)(she)(she)計(ji)(ji)(ji)目標的(de)(de)(de)(de)數百個設(she)(she)(she)計(ji)(ji)(ji)任(ren)務(wu)。開發(fa)人員利用(yong)Amazon Step Functions實現可(ke)(ke)視化(hua)(hua)的(de)(de)(de)(de)工(gong)作(zuo)流(liu)管理(li),實現了(le)編輯序列設(she)(she)(she)計(ji)(ji)(ji)工(gong)作(zuo)流(liu)的(de)(de)(de)(de)串聯,從而(er)實現應用(yong)的(de)(de)(de)(de)快(kuai)速構(gou)建和(he)更新,同時(shi)快(kuai)速查詢(xun)處(chu)理(li)異常(chang)任(ren)務(wu);利用(yong)Amazon Lambda無服務(wu)計(ji)(ji)(ji)算將(jiang)不同的(de)(de)(de)(de)引(yin)物設(she)(she)(she)計(ji)(ji)(ji)、同源(yuan)臂(bei)設(she)(she)(she)計(ji)(ji)(ji)等編輯序列設(she)(she)(she)計(ji)(ji)(ji)模(mo)(mo)(mo)塊封裝打包(bao),滿足了(le)具體功(gong)能(neng)的(de)(de)(de)(de)模(mo)(mo)(mo)塊化(hua)(hua)開發(fa)要求(qiu),并(bing)方便(bian)地(di)對(dui)(dui)功(gong)能(neng)模(mo)(mo)(mo)塊進(jin)(jin)行(xing)(xing)管理(li)和(he)共享(xiang);利用(yong)Amazon DynamoDB提供毫秒(miao)級的(de)(de)(de)(de)動(dong)(dong)態資源(yuan)響應性(xing)(xing)能(neng),并(bing)自(zi)(zi)動(dong)(dong)擴展(zhan)所需資源(yuan)以(yi)應對(dui)(dui)增加(jia)的(de)(de)(de)(de)業(ye)務(wu)需求(qiu)。這(zhe)些Serverless服務(wu)幫助天津工(gong)業(ye)生(sheng)(sheng)物所團隊進(jin)(jin)一步簡化(hua)(hua)運維,使得開發(fa)人員可(ke)(ke)以(yi)專(zhuan)注(zhu)于(yu)業(ye)務(wu)代碼和(he)創新,與傳(chuan)統開發(fa)方式相比,開發(fa)時(shi)間縮短(duan)了(le)75%,總體擁有(you)成(cheng)本降低高(gao)達(da)50%。
未(wei)來,天津工(gong)業(ye)生(sheng)物所團隊希望基于亞馬(ma)遜云科技先進的(de)服(fu)務技術和能(neng)力,開展(zhan)更多“BT+IT”的(de)研(yan)(yan)發(fa)工(gong)作(zuo)(zuo),進一步助力研(yan)(yan)究所在合(he)成生(sheng)物領域的(de)科研(yan)(yan)探索。此(ci)外(wai),也期望通過亞馬(ma)遜云科技的(de)全球科研(yan)(yan)領域輻射能(neng)力,提升天津工(gong)業(ye)生(sheng)物所生(sheng)物計算設計方面的(de)國(guo)(guo)際影響(xiang)力,為世界各(ge)國(guo)(guo)的(de)合(he)成生(sheng)物學科研(yan)(yan)工(gong)作(zuo)(zuo)者提供優質(zhi)服(fu)務。
天津工業生物所生物設計中心主任馬紅武表示:“中國科(ke)學院天津工(gong)業(ye)生(sheng)物技(ji)(ji)術(shu)(shu)研(yan)(yan)究所肩負(fu)著(zhu)國家工(gong)業(ye)生(sheng)物技(ji)(ji)術(shu)(shu)發展的(de)重任,并正在加速利用云(yun)計算推動相關技(ji)(ji)術(shu)(shu)的(de)研(yan)(yan)發和成(cheng)果落地。亞馬遜云(yun)科(ke)技(ji)(ji)提(ti)供的(de)圖數據庫和Serverless服務(wu),突(tu)破傳統的(de)開發模(mo)式、提(ti)升研(yan)(yan)發效率、不(bu)斷優化云(yun)上成(cheng)本,生(sheng)物技(ji)(ji)術(shu)(shu)和信息技(ji)(ji)術(shu)(shu)相結合(he)的(de)技(ji)(ji)術(shu)(shu)體系將(jiang)進(jin)一步推動合(he)成(cheng)生(sheng)物領域的(de)發展和創(chuang)新。”
亞馬遜云科技中國區商用與公共市場事業部總經理李曉芒表示(shi):“亞(ya)馬遜云科技為全球數(shu)(shu)千家生(sheng)命科學領域客戶提(ti)供云服務(wu)和行(xing)業解(jie)決(jue)方案,助(zhu)力從實(shi)(shi)驗(yan)室(shi)到真實(shi)(shi)世界,全面加速(su)生(sheng)命科學數(shu)(shu)字(zi)化(hua)創新(xin)。我們(men)很高興能夠與天(tian)津(jin)工(gong)業生(sheng)物(wu)所一道,通過云技術(shu)和深厚的行(xing)業實(shi)(shi)踐推動合成生(sheng)物(wu)學領域的技術(shu)進步,開拓生(sheng)物(wu)制造產業的數(shu)(shu)字(zi)化(hua)創新(xin)路徑。”