Vietnamese
Albanian
Arabic
Armenian
Azerbaijani
Belarusian
Bengali
Bosnian
Catalan
Czech
Danish
Deutsch
Dutch
English
Estonian
Finnish
Français
Greek
Haitian Creole
Hebrew
Hindi
Hungarian
Icelandic
Indonesian
Irish
Italian
Japanese
Korean
Latvian
Lithuanian
Macedonian
Mongolian
Norwegian
Persian
Polish
Portuguese
Romanian
Russian
Serbian
Slovak
Slovenian
Spanish
Swahili
Swedish
Turkish
Ukrainian
Vietnamese
Български
中文(简体)
中文(繁體)
BMC Bioinformatics 2010-Jul

Graph-based clustering and characterization of repetitive sequences in next-generation sequencing data.

Chỉ người dùng đã đăng ký mới có thể dịch các bài báo
Đăng nhập Đăng ký
Liên kết được lưu vào khay nhớ tạm
Petr Novák
Pavel Neumann
Jirí Macas

Từ khóa

trừu tượng

BACKGROUND

The investigation of plant genome structure and evolution requires comprehensive characterization of repetitive sequences that make up the majority of higher plant nuclear DNA. Since genome-wide characterization of repetitive elements is complicated by their high abundance and diversity, novel approaches based on massively-parallel sequencing are being adapted to facilitate the analysis. It has recently been demonstrated that the low-pass genome sequencing provided by a single 454 sequencing reaction is sufficient to capture information about all major repeat families, thus providing the opportunity for efficient repeat investigation in a wide range of species. However, the development of appropriate data mining tools is required in order to fully utilize this sequencing data for repeat characterization.

RESULTS

We adapted a graph-based approach for similarity-based partitioning of whole genome 454 sequence reads in order to build clusters made of the reads derived from individual repeat families. The information about cluster sizes was utilized for assessing the proportion and composition of repeats in the genomes of two model species, Pisum sativum and Glycine max, differing in genome size and 454 sequencing coverage. Moreover, statistical analysis and visual inspection of the topology of the cluster graphs using a newly developed program tool, SeqGrapheR, were shown to be helpful in distinguishing basic types of repeats and investigating sequence variability within repeat families.

CONCLUSIONS

Repetitive regions of plant genomes can be efficiently characterized by the presented graph-based analysis and the graph representation of repeats can be further used to assess the variability and evolutionary divergence of repeat families, discover and characterize novel elements, and aid in subsequent assembly of their consensus sequences.

Tham gia trang
facebook của chúng tôi

Cơ sở dữ liệu đầy đủ nhất về dược liệu được hỗ trợ bởi khoa học

  • Hoạt động bằng 55 ngôn ngữ
  • Phương pháp chữa bệnh bằng thảo dược được hỗ trợ bởi khoa học
  • Nhận dạng các loại thảo mộc bằng hình ảnh
  • Bản đồ GPS tương tác - gắn thẻ các loại thảo mộc vào vị trí (sắp ra mắt)
  • Đọc các ấn phẩm khoa học liên quan đến tìm kiếm của bạn
  • Tìm kiếm dược liệu theo tác dụng của chúng
  • Sắp xếp sở thích của bạn và cập nhật các nghiên cứu tin tức, thử nghiệm lâm sàng và bằng sáng chế

Nhập một triệu chứng hoặc một căn bệnh và đọc về các loại thảo mộc có thể hữu ích, nhập một loại thảo mộc và xem các bệnh và triệu chứng mà nó được sử dụng để chống lại.
* Tất cả thông tin dựa trên nghiên cứu khoa học đã được công bố

Google Play badgeApp Store badge