Between Data Dreams
Biyoinformatik Yarışması  ·  Son Tarih: 20 Mart
Ödüllerin

Ne Kazanabilirsin

Kademe Kim hak kazanır Ödül
🥇 Kaşif Tam genom + karşılaştırma + rapor Ücretsiz 30 dk birebir seans + kursta teşekkür + %40 indirim
🥈 İnşaatçı Kısmi pipeline + belgeleme %25 indirim + kişisel geri bildirim
🌱 Meraklı Depo keşfi + soruların belgelenmesi %10 indirim + her soru kişisel yanıtlandı
Son Tarih: 20 Mart  ·  betweendatadreams.com

Adım Adım

Kendi Genomunu Nasıl Yaparsın

Başlamadan önce tamamen oku. Adımlar birbirine bağlı — atlama sonradan zaman kaybettirir.

Başlamadan Önce

Bilgisayarında şunlara ihtiyacın var:

Komut satırını hiç kullanmadıysan önce 30 dakika temel bir terminal dersine bak — sonraki saatlerini kurtarır.

1
NCBI'de Türünü Bul

NCBI dünyanın en büyük genomik veri tabanıdır. Yolculuğun buradan başlıyor.

Organizmayı dikkatli seç:

Ham veriyi bul:

Monte edilmiş genomu İNDİRME. FASTQ formatında ham okumalar istiyorsun — SRA çalışma dosyalarını ara, GenBank derlemelerini değil.
conda install -c bioconda sra-tools
fasterq-dump SRR12345678 --split-files -O ./ham_veri/
Büyük veri setleri 30–60 dakika sürebilir. Gerekirse geceye bırak.
2
GitHub Deposunu Oluştur
git clone https://github.com/KULLANICI_ADIN/BenimGenomum-TurAdin.git
cd BenimGenomum-TurAdin
git clone https://github.com/zeyak/GenoDiplo.git
3
Bağımlılıkları Kur ve Yapılandır

Conda ortamını oluştur:

cd GenoDiplo
conda env create -f environment.yml
conda activate GenoDiplo
environment.yml başarısız olursa: conda update conda çalıştır ve tekrar dene.

config.yaml dosyasını türüne göre düzenle:

samples:
  turun_adi:
    reads: "../ham_veri/okumalar.fastq"

genome_size: "50m"     # NCBI'da türünün genom boyutunu ara
min_read_length: 1000  # 500'e düşür yeterli okuma geçmiyorsa
threads: 4             # CPU çekirdeği sayısı
Genom boyutu için: NCBI Genome veya Google Scholar'da '[tür adı] genome size' ara.
4
Pipeline'ı Çalıştır

Önce kuru çalıştırma yap:

snakemake --cores 4 --dry-run

Hata yoksa tam pipeline:

snakemake --cores 4
Pipeline muhtemelen bir yerinde duracak. Bu kasıtlıdır. Hata mesajını oku, Google'la, düzelt, tekrar dene. Her hatayı ve çözümü belgele — değerlendirme bunu ödüllendiriyor.
# Orta çöküşten devam etmek için:
snakemake --cores 4 --keep-going
5
Referans Genomla Karşılaştır

ncbi.nlm.nih.gov/genome'da yakın akraba bir tür için referans genom bul, FASTA olarak indir:

conda install -c bioconda quast
quast.py genomun.fasta -r referans_genom.fasta -o quast_cikti/
6
Değerlendirme Raporunu Yaz

Bilimsel makale olmak zorunda değil. Dürüst ve net olmalı:

7
20 Mart'a Kadar Gönder

Tüm çalışmanı GitHub'a gönder:

git add .
git commit -m "Son genom derlemesi ve rapor"
git push origin main

zeynepakdeniz@betweendatadreams.com adresine şunları gönder:

Başardın. Veri rüyası gerçek.

Daha Derine

Kaynaklar

İhtiyacın olan her şey — araç, arkasındaki bilim ve bu yarışmaya ilham veren araştırma.

Araç
GitHub Deposu
GenoDiplo — Genom Analiz Pipeline'ı
Bu yarışmada kullandığın açık kaynaklı Snakemake pipeline'ı. Klonla, README'yi oku, türüne göre uyarla.
github.com/zeyak/GenoDiplo
Bilim
Doktora Tezi — Uppsala Üniversitesi
Diplomonad Genomlarının Dizilenmesi ve Karşılaştırmalı Analizleri
GenoDiplo pipeline'ının temelini oluşturan Zeynep Akdeniz'in doktora tezi. Diplomonadların genomik yapısını, montaj metodolojisini ve grup genelindeki karşılaştırmalı analizleri kapsıyor.
uu.diva-portal.org/smash/get/diva2:1893897/FULLTEXT01.pdf
Yayınlanmış Makale — Scientific Data, Nature · Şubat 2025
Hexamita inflata'nın Genişlemiş Genomu, Serbest Yaşayan Bir Diplomonad
Hexamita inflata'nın ilk referans genomunu tanımlayan hakemli makale — 142 Mbp genoma ve 79.341 protein kodlayan serbest yaşayan bir diplomonad. İşte hedef bu.
nature.com/articles/s41597-025-04514-x
Veritabanları ve Araçlar
NCBI SRA
Dizi Okuma Arşivi
Ham genomik verileri (FASTQ) bul ve indir. 1. adım için.
ncbi.nlm.nih.gov/sra
NCBI Genome
Referans Genom Veritabanı
5. adımdaki karşılaştırma için monte edilmiş referans genomları.
ncbi.nlm.nih.gov/genome
Snakemake
İş Akışı Yönetim Sistemi
GenoDiplo'yu destekleyen Snakemake sisteminin tam dokümantasyonu.
snakemake.readthedocs.io
QUAST
Genom Derleme Kalite Değerlendirmesi
5. adımda derlemeni referansla karşılaştırmak için.
quast.sourceforge.net
Bioconda
Conda ile Biyoinformatik Yazılımı
İhtiyacın olan tüm araçlar — tek bir conda komutuyla kurulabilir.
bioconda.github.io