技術簡介
高等生物基因體中除了極少部分組成基因,絕大部分是由各種重複序列組成的非基因區〈某類果蠅基因體中甚至含高達百分之七十的重複序列〉。隨著人類與各種模型生物基因體定序計劃接近完成,基因體序列分析與註解已成為生物科技基因體研究的必要課題。
Abstract
The genomes in higher organisms often consist of a large portion of repeating sequences which rarely occur in the very limited intragenic regions. As more and more genome projects including human and several model organisms have been proceeding, genome analysis and annotation have become a must for genomics research in biotech. Here we developed a set of bioinformatics tools for repeat analysis and genome annotation.
技術規格
根據高等生物基因體中的各類型重複序列的樣式依paralogues, clustered repeats, inverted repeats, direct repeats及palindromes建立基本數學模式,再分別依數學模式編寫程式,並將分析所得與GenBank中的其他相關註解資料整合建成一關聯資料庫且配以搜尋介面與圖形呈現。此外,負責序列分析,註解資料整合,資料庫建立到圖形介面,搜尋引擎的許多程式全部整合成一系統。
Technical Specification
Specifically, we built mathematical models for each of the repeat types based on the repeating patterns existing in higher organisms, including paralogues, clustered repeats, inverted repeats, direct repeats and palindromes. Then programs were implemented
技術特色
1. 利用自行開發的快速序列比對軟體sFLAG 分析重複序列。
2. 對任何拼接完成的基因體,皆可進行REAP資料庫產生,使用者只需輸入基因體資料,電腦便自動進行所有運算產生該基因體的REAP資料庫。分析得的重複序列包括傳統實驗方法及以數學模式計算所得的各類重複序列,除了重複序列並包括各類註解資訊〈如基因〉。使用者除了可利用套件中提供的圖形介面進行資料庫搜尋,專業使用者還可以用Data mining 的方法找出資料庫中隱含的基因體特性。
應用範圍
略
接受技術者具備基礎建議(設備)
電腦設備:CPU --1.2G, RAM--3G, OS--Linux
接受技術者具備基礎建議(專業)
(1) 使用:略熟Linux上之操作。 (2) 維護:熟悉Perl, C++, PHP等程式語言及MySQL資料庫
聯絡資訊
聯絡人:陳廷碩 體外診斷醫材技術組
電話:+886-3-5912143 或 Email:CTS@itri.org.tw
客服專線:+886-800-45-8899
傳真:+886-3-5912444