圖靈·達爾文實驗室的問與答(dá) |
2020-02-21 18:06:32 文章來(lái)源:本站(zhàn) |
Q:中國科學院計(jì)算(suàn)技(jì)術(shù)研究所在生(shēng)命數(shù)據處理(lǐ)方面,未來(lái)的布局和(hé)規劃是什麽? A:生(shēng)命數(shù)據處理(lǐ)是計(jì)算(suàn)所重要的長期的研究方向,我們是國內(nèi)最早開(kāi)展生(shēng)物信息學課題研究的團隊之一。事實上(shàng),生(shēng)命科學數(shù)據處理(lǐ)一直是計(jì)算(suàn)所高(gāo)性能計(jì)算(suàn)機研究中心研制(zhì)高(gāo)性能計(jì)算(suàn)機的關鍵應用牽引,從曙光3000/4000系統開(kāi)始就确定了面向數(shù)據密集型高(gāo)性能計(jì)算(suàn)機的研制(zhì)方向,并在生(shēng)命科學數(shù)據處理(lǐ)應用上(shàng)發揮了重大(dà)作(zuò)用,我們還(hái)研制(zhì)了生(shēng)物信息處理(lǐ)專用高(gāo)性能計(jì)算(suàn)機曙光4000H,為(wèi)國內(nèi)生(shēng)命科學研究團隊提供了有(yǒu)力的支撐。 經過數(shù)十年的發展和(hé)積累,生(shēng)物醫(yī)學信息處理(lǐ)系統已經成為(wèi)計(jì)算(suàn)所“一三五”布局中的五個(gè)重點培育方向之一,研制(zhì)生(shēng)物醫(yī)學信息處理(lǐ)領域專用的軟硬件一體(tǐ)的可(kě)擴展系統,覆蓋基因組、蛋白質組和(hé)醫(yī)學影(yǐng)像組多(duō)模态跨尺度生(shēng)物醫(yī)學數(shù)據處理(lǐ)和(hé)分析。我們将在生(shēng)命數(shù)據處理(lǐ)和(hé)分析的專用加速芯片和(hé)人(rén)工智能軟件上(shàng)期望有(yǒu)所突破,形成完整的自主安全可(kě)控的端、邊和(hé)雲的軟硬件生(shēng)态,保障中國人(rén)的生(shēng)命數(shù)據始終掌握在中國人(rén)自己手裏。 Q:團隊經曆了什麽樣的曆程走到今天的? A:我們從參與人(rén)類基因組計(jì)劃在中國的百分之一項目開(kāi)始,提供高(gāo)性能設備和(hé)算(suàn)法平台,到現在以圖靈達爾文實驗室方式進入醫(yī)學多(duō)組學與融合計(jì)算(suàn)領域,目前已經可(kě)以為(wèi)臨床提供完整的解決方案。 基因數(shù)據産業具有(yǒu)數(shù)據量大(dà)、信息難于理(lǐ)解的特點。需要多(duō)學科團隊協同工作(zuò),并且要跨學科思考,否則難以産出創新型産品(這也是基因檢測行(xíng)業産品低(dī)水(shuǐ)平、同質化的原因)。跨學科說起來(lái)容易做(zuò)起來(lái)難,在一個(gè)較窄的學科方向上(shàng)出現學術(shù)牛人(rén)是司空(kōng)見慣,但(dàn)是在跨學科方向做(zuò)得(de)很(hěn)好的人(rén)就鳳毛麟角。哲源團隊在多(duō)年的國家(jiā)項目實踐中培養了具備跨學科素養的總師(shī),并且具有(yǒu)交叉學科産品研發的執行(xíng)力。團隊帶頭人(rén)集芯片設計(jì)、高(gāo)性能計(jì)算(suàn)、生(shēng)物信息學、實驗生(shēng)物學幾個(gè)方向知識素養和(hé)工作(zuò)經驗于一身,這些(xiē)也是基因數(shù)據産業做(zuò)大(dà)不可(kě)缺少(shǎo)的技(jì)術(shù)儲備。交叉不僅僅是學術(shù)的機會(huì),更是新産業的機會(huì),既考驗團隊是否懂得(de)跨學科的研發思路,更考驗是否有(yǒu)切身的實踐經驗。
Q:哲源科技(jì)與圖靈·達爾文實驗室之間(jiān)是什麽關系? A:哲源科技(jì)是中國科學院計(jì)算(suàn)技(jì)術(shù)研究所下屬公司,也是圖靈·達爾文實驗室行(xíng)業應用的實施主體(tǐ)。對于圖靈·達爾文實驗室已有(yǒu)成果的利用,包括已經證明(míng)實際有(yǒu)效的肺癌、乳腺癌、肝癌用藥咨詢等産品,哲源科技(jì)有(yǒu)完備的科研/商業合作(zuò)方案。 Q:圖靈·達爾文實驗室已經取得(de)了什麽進展? A:圖靈·達爾文實驗室主要的工作(zuò)就是将臨床場(chǎng)景中的關鍵問題,也就是痛點,提煉出來(lái)。然後将這些(xiē)問題轉化為(wèi)可(kě)計(jì)算(suàn)問題。 結合臨床端數(shù)據,我們可(kě)以進一步在我們已經搭建的算(suàn)法平台上(shàng)開(kāi)發新的方法流程,用來(lái)解決特别的臨床問題。 這裏面主要涉及兩個(gè)大(dà)的方向上(shàng)的問題要解決。 一是算(suàn)法問題,為(wèi)了解決複雜問題,我們必須放棄在人(rén)類知識體(tǐ)系中查字典的做(zuò)法,取而代之的,我們建立了以數(shù)據驅動結合知識驅動的融合計(jì)算(suàn)方法,賦能對更多(duō)數(shù)據的利用和(hé)消化來(lái)解決複雜的臨床問題。 二是算(suàn)力的問題,當我們采取數(shù)據驅動方法時(shí),必然增加計(jì)算(suàn)複雜性,對患者的數(shù)據采集要求也提高(gāo)了數(shù)量級,因此我們必須解決計(jì)算(suàn)成本高(gāo)耗時(shí)長的問題,我們圖靈·達爾文實驗室已經較好的解決了這個(gè)問題,目前可(kě)以在單機上(shàng)用一個(gè)小(xiǎo)時(shí)完成之前一個(gè)月的工作(zuò)量,真正地将計(jì)算(suàn)資源融合在臨床端,為(wèi)醫(yī)生(shēng)在複雜環境下作(zuò)出快速準确的判斷提供了堅強的智力保障。 目前,因為(wèi)我們可(kě)以深入臨床端,所以在許多(duō)方面都有(yǒu)了比較好的進展。例如針對基因檢測全陰肺癌患者的用藥方案,我們可(kě)以采取數(shù)據驅動方法來(lái)将不認識的這些(xiē)變異轉化為(wèi)腫瘤依賴的信号通(tōng)路活性信息,并加以藥物分配方案。比如針對非小(xiǎo)細胞肺癌的抗血管靶向藥物精确分配。 我們解決問題的思路和(hé)方法已經超出目前基因檢測行(xíng)業內(nèi)的一般認知,主要采取BT+IT的方法,數(shù)據+知識驅動的叠代學習路線來(lái)應對臨床的複雜問題。 同時(shí),我們在肺癌領域也關注其他痛點問題,例如肺癌腦(nǎo)轉移預測、原發耐藥機制(zhì)以及免疫藥物引起的超進展機制(zhì)等方面,這些(xiē)都有(yǒu)了很(hěn)好的進展。 圖靈·達爾文實驗室的成立,為(wèi)醫(yī)生(shēng)提供了床邊的人(rén)工智能服務,高(gāo)速将醫(yī)生(shēng)的臨床和(hé)科研問題轉化為(wèi)科學成果和(hé)臨床産品,為(wèi)患者提供更好的治療方案。我們也希望能在全國更多(duō)更好地與醫(yī)院和(hé)醫(yī)生(shēng)合作(zuò),結合各種臨床實際問題,為(wèi)臨床工作(zuò)者提供有(yǒu)力的偵查和(hé)戰鬥支持,造福患者和(hé)患者家(jiā)庭。 Q:如何與圖靈-達爾文實驗室展開(kāi)合作(zuò)? A:圖靈-達爾文實驗室目前主要在臨床科研與臨床試驗方面與醫(yī)生(shēng)展開(kāi)合作(zuò)。具體(tǐ)有(yǒu)兩種方式:(1)如果醫(yī)生(shēng)在實踐中有(yǒu)亟需解決的臨床科研問題,圖靈-達爾文實驗室可(kě)以幫助醫(yī)生(shēng)快速完成從實驗設計(jì)、數(shù)據分析、結果交付等研究流程環節。(2)圖靈-達爾文實驗室配備有(yǒu)每秒(miǎo)千萬億次的計(jì)算(suàn)平台,建立了完整的數(shù)據分析方法和(hé)模型,分析了上(shàng)萬份腫瘤基因組數(shù)據(以全外顯子組為(wèi)主),挖掘了百萬篇生(shēng)命醫(yī)學科學家(jiā)的研究成果。圖靈-達爾文實驗室采用數(shù)據驅動的人(rén)工智能方式已經挖掘出許多(duō)全新發現,這些(xiē)發現需要和(hé)相關領域的專家(jiā)進行(xíng)合作(zuò),在真實世界中,進行(xíng)科學有(yǒu)序的驗證。
聯系方式:TDLab@Philrivers.com |
support@philrivers.com |
※ 北京市海澱區(qū)中關村南一條乙3号中國科學報社314 | |
※ 廣東省深圳市南山(shān)區(qū)粵海街(jiē)道(dào)粵興三道(dào)2号深圳虛拟大(dà)學園院校(xiào)産業化綜合大(dà)樓B603-B604 |
support@philrivers.com |
北京市海澱區(qū)中關村南一條乙3号中國科學報社314 | |
廣東省深圳市南山(shān)區(qū)粵海街(jiē)道(dào)粵興三道(dào)2号深圳虛拟大(dà)學園院校(xiào)産業化綜合大(dà)樓B603-B604 |
掃一掃關注公衆号