基因組從頭測序(de novo sequencing),主要針對基因組序列未知或參考基因組組裝不理想的物種,構建不同類型的基因組DNA文庫,并進行序列測定。然后使用生物信息學方法對序列進行拼接、組裝和注釋,從而繪制該物種完整的基因組序列信息。簡單基因組:重復序列低于50%,且二倍體雜合度低于0.5%的物種。復雜基因組:重復序列高于50%,或二倍體雜合度高于0.5%,或其他多倍體物種。

技術路線

技術路線

分析內容

    1.     下機數據統計
    2.     數據質控
    3.     高質量數據獲取
    4.     Survey分析
    5.     基因組拼接
    6.     基因組拼接效果評價
    7.     基因組拼裝完整性與連續性評估
    8.     重復序列分析
    9.     非編碼 RNA 預測
    10.     蛋白編碼基因預測
    11.     蛋白編碼基因的序列比對
    12.     蛋白編碼基因的 GO 注釋
    13.     蛋白編碼基因的 eggNOG 注釋
    14.     蛋白編碼基因的 KEGG 注釋
    15.     蛋白編碼基因的 Swiss-Prot 注釋
    16.     蛋白編碼基因的TrEMBL注釋
    17.     蛋白編碼基因的NR注釋
    18.     蛋白編碼基因的Motif注釋
    19.     蛋白編碼基因的CAZy注釋
    20.     雜合度分析
    21.     有效種群大小估計
    22.     基因家族分析
    23.     染色體共線性分析
    24.     基因家族擴張和收縮分析
    25.     全基因組復制事件分析
    26.     基于全基因組單拷貝基因的進化樹重構
    27.     分歧時間估算
    28.     共有、特有基因家族分析
    29.     LTR插入時間
    30.     正選擇分析

部分分析結果展示
基因組結構與基因表達圈圖

基因組結構與基因表達圈圖

基因家族 Venn 圖
基因家族 Venn 圖

案例解析

蝴蝶蘭全基因組測序
本研究完成了蝴蝶蘭全基因組測序和組裝,是世界上第一個完成測序和分析的蘭科植物和景天酸代謝(CAM)植物的基因組圖譜。從基因組序列上來看,蝴蝶蘭共有29,431個蛋白編碼基因。這些蛋白編碼基因的平均內含子長度達到2,922堿基對,這一長度顯著超過了迄今為止所有植物基因組中平均內含子長度,進一步分析發現蝴蝶蘭內含子中的大量的轉座元件是蝴蝶蘭超長內含子的主要原因。

全基因組de novo測序


參考文獻:
Xiao Gou, Zhen Wang, Ning Li, et al. Whole-genome sequencing of six dog breeds from continuous altitudes reveals adaptation to high-altitude hypoxia .Genome Research, 2014.

訂購與咨詢

您可以通過以下任意方式下單或咨詢,工作時間我們保證在1小時內給您反饋:

  1. Email:將您的需求填寫完整后發送到support@synbio-tech.com
  2. 電話訂購:您可以直接撥打免費熱線4000-973-630(按1)聯系我們經驗豐富的工程師
  3. 在線咨詢:您有任何技術問題均可與我們進行網頁在線互動