Genom Boyu İlişkilendirme Çalışmaları


Cebeci Z., Şakiroğlu M., Bayraktar M.

Nobel Yayınevi, Ankara, 2024

  • Yayın Türü: Kitap / Ders Kitabı
  • Basım Tarihi: 2024
  • Yayınevi: Nobel Yayınevi
  • Basıldığı Şehir: Ankara
  • Çukurova Üniversitesi Adresli: Evet

Özet

Genom Boyu İlişkilendirme Çalışmaları (GWAS), örneklenen bireylerin tüm genomunu tarayarak bu bireylerdeki yüzbinlerce ve hatta milyonlarca genetik varyantın hedef fenotipik özellikler veya karakterlerle ilişkilendirilmesi için yapılan işlemlerdir. Bu kitap GWAS çalışmalarında kuramsal bilgilerden veri yapılarına ve tanınmış yazılımların kullanılmasına kadar ihtiyaç duyulabilecek teorik ve pratik bilgileri ve becerileri bütüncül bir yaklaşımla tanıtmak ve örneklerle göstermek amacıyla yazılmıştır. Kitap hem bir öğrenme kaynağı hem de bir başvuru kaynağı olarak kullanılabilecek şekilde tasarlanmıştır. Kitapta GWAS yanında populasyon yapısı, genetik çeşitlilik ve genomik seleksiyon çalışmaları için temel bilgiler de sunulmaktadır.
Kitabın ilk iki bölümünde GWAS hakkında temel teorik bilgiler verilmiştir. Üçüncü bölümde moleküler genomik veri formatları ve veri dosyası yapıları örnekleriyle tanıtılmıştır. Dördüncü bölümde veri formatları arasında dönüştürme yöntemleri ve yazılımlar uygulamalı olarak tanıtılmıştır. Beşinci bölümde gerek genomik araştırmalarda ve gerekse uygulama amacıyla genotipik ve fenotipik veri simülasyonu hakkında bilgiler verilmiştir. Altıncı bölümde genotipik veri kalitesi kontrolü geniş şekilde incelenmiştir. Bu bölümde ayrıca çeşitli yöntemlerle genomik ilişki matrislerinin oluşturulması, populasyon yapısını incelemek için temel bileşenler analizi, Q matrisi, MDS gibi yöntemler yanında t-SNE ve UMAP gibi yeni yöntemler tanıtılmıştır. Böylece populasyon yapısı analizi ve genetik çeşitlilik çalışmaları için temel oluşturacak uygulamalara da yer verilmiştir. Kitabın yedinci bölümünde GLM, MLM, CMLM ve MLMM gibi yaygın GWAS yöntemlerine ek olarak SUPER, FarmCPU ve BLINK yöntemleri tanıtılarak GLM ile GWAS modellerinin analizine ait işlemler adım adım sunulmuştur. Bu bölümde ayrıca GWAS sonuçlarının yorumlanması ve GWAS sonrası işlemler geniş şekilde açıklanmıştır. Sekizinci bölümde GWAS sonuçlarını görselleştirme ve raporlamada kullanılan grafik türleri ve bunları oluşturmak için gerekli araçlar tanıtılmıştır. Bu bölümde ayrıca GWAS sonrası bölgesel görüntüleme ve yakınlaştırma grafiklerine de ayrıntılı bir bakış yapılmıştır. Kitabın dokuzuncu bölümünde GWAS analizlerinde yaygın kullanılan yazılımlarla uygulama örnekleri verilmiştir. Bu bağlamda PLINK, KING ve TASSEL gibi yaygın kullanılan yazılımlarla birlikte rrBLUP, mrMLM, rMVP , bigsnpr ve GAPIT R paketleriyle uygulamalar da yapılmıştır. Son bölümde ise NAM ve GWAS.BAYES gibi yetenekli R paketleriyle Bayesçi GWAS uygulamaları sunulmuştur.

Genome-Wide Association Studies (GWAS) are processes performed to scan the entire genome of sampled individuals and associate hundreds of thousands or even millions of genetic variants in these individuals with target phenotypic traits or characters. This book was written to introduce and demonstrate with examples the theoretical and practical knowledge and skills that may be needed in GWAS studies, from theoretical knowledge to data structures and the use of well-known software. The book is designed to be used both as a learning resource and as a reference source. In addition to GWAS, the book also provides basic information for population structure, genetic diversity and genomic selection studies. The first two chapters of the book provide basic theoretical information about GWAS. The third chapter introduces molecular genomic data formats and data file structures with examples. The fourth chapter introduces methods for converting between data formats and software in practice. The fifth chapter provides information on genotypic and phenotypic data simulation for both genomic research and application purposes. The sixth chapter examines genotypic data quality control in detail. This section also introduces new methods such as t-SNE and UMAP, as well as methods such as the creation of genomic relationship matrices using various methods, principal component analysis for examining population structure, Q matrix, and MDS. Thus, applications that will form the basis for population structure analysis and genetic diversity studies are also included. In the seventh section of the book, in addition to common GWAS methods such as GLM, MLM, CMLM, and MLMM, SUPER, FarmCPU, and BLINK methods are introduced, and the procedures for analyzing GWAS models with GLM are presented step by step. In this section, the interpretation of GWAS results and post-GWAS processes are explained in detail. In the eighth section, the types of graphs used in visualizing and reporting GWAS results and the tools required to create them are introduced. In this section, a detailed look at regional visualization and zoom graphs after GWAS is also given. In the ninth section of the book, application examples with commonly used software in GWAS analyses are given. In this context, applications were made with widely used software such as PLINK, KING and TASSEL, as well as with rrBLUP, mrMLM, rMVP, bigsnpr and GAPIT R packages. In the last section, Bayesian GWAS applications were presented with capable R packages such as NAM and GWAS.BAYES.