Vietnamese
Albanian
Arabic
Armenian
Azerbaijani
Belarusian
Bengali
Bosnian
Catalan
Czech
Danish
Deutsch
Dutch
English
Estonian
Finnish
Français
Greek
Haitian Creole
Hebrew
Hindi
Hungarian
Icelandic
Indonesian
Irish
Italian
Japanese
Korean
Latvian
Lithuanian
Macedonian
Mongolian
Norwegian
Persian
Polish
Portuguese
Romanian
Russian
Serbian
Slovak
Slovenian
Spanish
Swahili
Swedish
Turkish
Ukrainian
Vietnamese
Български
中文(简体)
中文(繁體)
BMC Genomics 2005-Oct

Generation, annotation, analysis and database integration of 16,500 white spruce EST clusters.

Chỉ người dùng đã đăng ký mới có thể dịch các bài báo
Đăng nhập Đăng ký
Liên kết được lưu vào khay nhớ tạm
Nathalie Pavy
Charles Paule
Lee Parsons
John A Crow
Marie-Josee Morency
Janice Cooke
James E Johnson
Etienne Noumen
Carine Guillet-Claude
Yaron Butterfield

Từ khóa

trừu tượng

BACKGROUND

The sequencing and analysis of ESTs is for now the only practical approach for large-scale gene discovery and annotation in conifers because their very large genomes are unlikely to be sequenced in the near future. Our objective was to produce extensive collections of ESTs and cDNA clones to support manufacture of cDNA microarrays and gene discovery in white spruce (Picea glauca [Moench] Voss).

RESULTS

We produced 16 cDNA libraries from different tissues and a variety of treatments, and partially sequenced 50,000 cDNA clones. High quality 3' and 5' reads were assembled into 16,578 consensus sequences, 45% of which represented full length inserts. Consensus sequences derived from 5' and 3' reads of the same cDNA clone were linked to define 14,471 transcripts. A large proportion (84%) of the spruce sequences matched a pine sequence, but only 68% of the spruce transcripts had homologs in Arabidopsis or rice. Nearly all the sequences that matched the Populus trichocarpa genome (the only sequenced tree genome) also matched rice or Arabidopsis genomes. We used several sequence similarity search approaches for assignment of putative functions, including blast searches against general and specialized databases (transcription factors, cell wall related proteins), Gene Ontology term assignation and Hidden Markov Model searches against PFAM protein families and domains. In total, 70% of the spruce transcripts displayed matches to proteins of known or unknown function in the Uniref100 database (blastx e-value < 1e-10). We identified multigenic families that appeared larger in spruce than in the Arabidopsis or rice genomes. Detailed analysis of translationally controlled tumour proteins and S-adenosylmethionine synthetase families confirmed a twofold size difference. Sequences and annotations were organized in a dedicated database, SpruceDB. Several search tools were developed to mine the data either based on their occurrence in the cDNA libraries or on functional annotations.

CONCLUSIONS

This report illustrates specific approaches for large-scale gene discovery and annotation in an organism that is very distantly related to any of the fully sequenced genomes. The ArboreaSet sequences and cDNA clones represent a valuable resource for investigations ranging from plant comparative genomics to applied conifer genetics.

Tham gia trang
facebook của chúng tôi

Cơ sở dữ liệu đầy đủ nhất về dược liệu được hỗ trợ bởi khoa học

  • Hoạt động bằng 55 ngôn ngữ
  • Phương pháp chữa bệnh bằng thảo dược được hỗ trợ bởi khoa học
  • Nhận dạng các loại thảo mộc bằng hình ảnh
  • Bản đồ GPS tương tác - gắn thẻ các loại thảo mộc vào vị trí (sắp ra mắt)
  • Đọc các ấn phẩm khoa học liên quan đến tìm kiếm của bạn
  • Tìm kiếm dược liệu theo tác dụng của chúng
  • Sắp xếp sở thích của bạn và cập nhật các nghiên cứu tin tức, thử nghiệm lâm sàng và bằng sáng chế

Nhập một triệu chứng hoặc một căn bệnh và đọc về các loại thảo mộc có thể hữu ích, nhập một loại thảo mộc và xem các bệnh và triệu chứng mà nó được sử dụng để chống lại.
* Tất cả thông tin dựa trên nghiên cứu khoa học đã được công bố

Google Play badgeApp Store badge