Nobel Yayınevi, Ankara, 2024
Genom Boyu İlişkilendirme Çalışmaları (GWAS), örneklenen bireylerin tüm
genomunu tarayarak bu bireylerdeki yüzbinlerce ve hatta milyonlarca
genetik varyantın hedef fenotipik özellikler veya karakterlerle
ilişkilendirilmesi için yapılan işlemlerdir. Bu kitap GWAS
çalışmalarında kuramsal bilgilerden veri yapılarına ve tanınmış
yazılımların kullanılmasına kadar ihtiyaç duyulabilecek teorik ve pratik
bilgileri ve becerileri bütüncül bir yaklaşımla tanıtmak ve örneklerle
göstermek amacıyla yazılmıştır. Kitap hem bir öğrenme kaynağı hem de bir
başvuru kaynağı olarak kullanılabilecek şekilde tasarlanmıştır. Kitapta
GWAS yanında populasyon yapısı, genetik çeşitlilik ve genomik
seleksiyon çalışmaları için temel bilgiler de sunulmaktadır.
Kitabın
ilk iki bölümünde GWAS hakkında temel teorik bilgiler verilmiştir.
Üçüncü bölümde moleküler genomik veri formatları ve veri dosyası
yapıları örnekleriyle tanıtılmıştır. Dördüncü bölümde veri formatları
arasında dönüştürme yöntemleri ve yazılımlar uygulamalı olarak
tanıtılmıştır. Beşinci bölümde gerek genomik araştırmalarda ve gerekse
uygulama amacıyla genotipik ve fenotipik veri simülasyonu hakkında
bilgiler verilmiştir. Altıncı bölümde genotipik veri kalitesi kontrolü
geniş şekilde incelenmiştir. Bu bölümde ayrıca çeşitli yöntemlerle
genomik ilişki matrislerinin oluşturulması, populasyon yapısını
incelemek için temel bileşenler analizi, Q matrisi, MDS gibi yöntemler
yanında t-SNE ve UMAP gibi yeni yöntemler tanıtılmıştır. Böylece
populasyon yapısı analizi ve genetik çeşitlilik çalışmaları için temel
oluşturacak uygulamalara da yer verilmiştir. Kitabın yedinci bölümünde
GLM, MLM, CMLM ve MLMM gibi yaygın GWAS yöntemlerine ek olarak SUPER,
FarmCPU ve BLINK yöntemleri tanıtılarak GLM ile GWAS modellerinin
analizine ait işlemler adım adım sunulmuştur. Bu bölümde ayrıca GWAS
sonuçlarının yorumlanması ve GWAS sonrası işlemler geniş şekilde
açıklanmıştır. Sekizinci bölümde GWAS sonuçlarını görselleştirme ve
raporlamada kullanılan grafik türleri ve bunları oluşturmak için gerekli
araçlar tanıtılmıştır. Bu bölümde ayrıca GWAS sonrası bölgesel
görüntüleme ve yakınlaştırma grafiklerine de ayrıntılı bir bakış
yapılmıştır. Kitabın dokuzuncu bölümünde GWAS analizlerinde yaygın
kullanılan yazılımlarla uygulama örnekleri verilmiştir. Bu bağlamda
PLINK, KING ve TASSEL gibi yaygın kullanılan yazılımlarla birlikte
rrBLUP, mrMLM, rMVP , bigsnpr ve GAPIT R paketleriyle uygulamalar da
yapılmıştır. Son bölümde ise NAM ve GWAS.BAYES gibi yetenekli R
paketleriyle Bayesçi GWAS uygulamaları sunulmuştur.
Genome-Wide Association Studies (GWAS) are processes performed to scan the entire genome of sampled individuals and associate hundreds of thousands or even millions of genetic variants in these individuals with target phenotypic traits or characters. This book was written to introduce and demonstrate with examples the theoretical and practical knowledge and skills that may be needed in GWAS studies, from theoretical knowledge to data structures and the use of well-known software. The book is designed to be used both as a learning resource and as a reference source. In addition to GWAS, the book also provides basic information for population structure, genetic diversity and genomic selection studies. The first two chapters of the book provide basic theoretical information about GWAS. The third chapter introduces molecular genomic data formats and data file structures with examples. The fourth chapter introduces methods for converting between data formats and software in practice. The fifth chapter provides information on genotypic and phenotypic data simulation for both genomic research and application purposes. The sixth chapter examines genotypic data quality control in detail. This section also introduces new methods such as t-SNE and UMAP, as well as methods such as the creation of genomic relationship matrices using various methods, principal component analysis for examining population structure, Q matrix, and MDS. Thus, applications that will form the basis for population structure analysis and genetic diversity studies are also included. In the seventh section of the book, in addition to common GWAS methods such as GLM, MLM, CMLM, and MLMM, SUPER, FarmCPU, and BLINK methods are introduced, and the procedures for analyzing GWAS models with GLM are presented step by step. In this section, the interpretation of GWAS results and post-GWAS processes are explained in detail. In the eighth section, the types of graphs used in visualizing and reporting GWAS results and the tools required to create them are introduced. In this section, a detailed look at regional visualization and zoom graphs after GWAS is also given. In the ninth section of the book, application examples with commonly used software in GWAS analyses are given. In this context, applications were made with widely used software such as PLINK, KING and TASSEL, as well as with rrBLUP, mrMLM, rMVP, bigsnpr and GAPIT R packages. In the last section, Bayesian GWAS applications were presented with capable R packages such as NAM and GWAS.BAYES.