1. 系統生物學:大型量化基因調控網路建置(GeNOSA與IRNet)
  2. 蛋白質序列功能預測之計分卡設計
  3. HIV藥物治療配方最佳化
  4. CRP binding site預測與分析

 

       重建出全基因的基因調控網絡在系統生物學中是一個高挑戰性的問題,其中包括生物調控領域知識,基因調控網絡的數學模型,並且最佳化該模型的大量參數。本實驗 室提出了兩個方法為GeNOSA和IRNet ,可以重建定量和穩定的基因調控網絡(GRNs) 。透過了解這些網絡調控關係,我們可以針對疾病的調控機制發現異常的調控關係。

       重建出可量化的GRNs仍然是一個挑戰,在不同實驗條件下的轉錄因子和基因有不同的定量關係。使用所提出的GeNOSA方法,可從微陣列數據建立的定量 GRNs ,找出能夠解釋的隱藏資訊,例如轉錄因子活性和它們的影響的下游基因的表達。 GeNOSA已成功地建立出與已知調控知識高度一致性的GRNs,且已用EMSA和real-time PCR在大腸桿菌中做實驗驗證。

       使用非線性模型可以反映出真實的生物反應,由於實驗數據有雜訊且基因數量多,且實驗數據量少,難以建立出穩定的網絡。我們提出一個逐漸重建網絡演算為 IRNet ,可以在每次迭代中決定調控關係且有繼承機制可以繼承每一代鎖定的調控關係,逐步降低解空間。最後IRNet可使用少量的生物實驗數據來重建出一個穩定的 GRNs。

221

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       本實驗室與本系黃慧玲教授共同提出之計分卡方法搭配使用繼承式雙目標之智慧式基因演算法(Inheritable Bi-objective Combinatorial Genetic Algorithm, IBCGA),可以輕易地從未知之蛋白質預測其是否為結晶蛋白質。目前已有很多計算方法來預測蛋白質的結晶,而大多數方法使用氨基酸和二肽組合物的一部分 的大量訊息的特點。要提前預測的準確度,支持向量機(SVM)的分類方法是有效和常用的技術。然而,這些技術大多只能表面的解釋蛋白質結晶能力。

       在這項研究中,我們利用新開發的記分卡方法(SCM)與二肽組成特徵來預測蛋白質的結晶。這SCM分類獲得的預測結果74%,分別為0.55和0.83的準 確性,敏感性和特異性,相對於SVM分類器,SCM的結果可以與之相比。實驗結果表明,SCM分類簡單,解釋性高,精度高的優點相比在預測蛋白質結晶。

222

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       HIV 相關研究中,主要目標為分析病毒序列並建立藥物治療模型,而研發過程分為三個重要步驟:(1)蒐集並建立病毒序列和病人生理表現之資料庫,以便於擷取作為 HIV個人化醫療的生物醫學特徵;(2)整合HIV病毒序列特性與生物醫學特徵來設計藥物治療模型,並將模型設計轉換成數個參數最佳化問題;(3)發展一 套以高效能繼承式雙目標基因演算法(IBCGA)作為核心的建模與預測演算法。

       目前已完成進入抑制劑的預測模型與病毒序列資料庫,並驗證所建立模型能有效地預測抑制病毒種類及決定進入抑制劑,其預測準確度為目前已發表方法中最高,以及首度發現在病毒V3環狀序列上影響病毒與協同受體連結的重要序列區域-crown-10區域。

223

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       CRP(cAMP 受體蛋白)為細菌中主要藉由與DNA特定序列結合來調控180種以上基因表現的重要轉錄因子,扮演促進或抑制的雙調控因子。CRP與DNA每種結合位子所 調控基因皆不同,因此研究CRP在DNA上結合區域與結合規則對於基因表現的研究有其重要性。本研究提出一預測系統-IdCRP,以CRP結合位資訊預測 CRP對於下游基因的調控模式(促進或抑制)並建立可解釋之判斷調控模式的轉錄規則。

       本系統主要由5個部份組成,(1)蒐集CRP結合位序列資訊及轉錄模式;(2)擷取序列與轉錄相關資訊;(3)特徵值選取;(4)建立可解釋之轉錄調控規 則;(5)CRP調控模型的建立。並預期將調控模式的預測結果應用於重建基因調控網路,抑或將轉錄規則應用於合成生物學中以幫助控制CRP相關之基因表達。

224