- Înțelegerea conceptului de integrare multi-omics (genomică, transcriptomică, epigenomică, proteomică).
- Exersarea metodelor computaționale de integrare (corelații, PCA comună, network fusion).
- Construirea unui mini-pipeline multi-omics pe date sintetice / reduse (SNP + expresie).
- Identificarea markerilor comuni între straturi (cross-omics markers).
- Înțelegerea aplicabilității în cancer, boli rare și farmacogenomică.
După ce în săptămânile 6–9 am studiat:
- rețele de gene (GCE)
- vizualizare & diseasome
- repurposing bazat pe rețele
- modele ML (supervised / unsupervised)
acum vom integra multiple tipuri de date biologice într-un singur spațiu analitic.
Integrarea multi-omics este esențială pentru:
- subtipare tumorală,
- stratificarea pacienților,
- descoperirea de biomarkeri,
- identificarea țintelor terapeutice.
Vom lucra pe un set simplificat (SNPs + expresie + opțional methylation) pentru a înțelege logica pipeline-ului.
- încarcă 2 matrici (SNP × samples, Expression × samples),
- normalizează fiecare layer,
- aliniază probele comune,
- construiește un feature matrix concat.pkl.
- aplică PCA pe date integrate,
- compară PCA_snp, PCA_expr, PCA_joint,
- vizualizează probele.
- calculează corelații SNP–gene,
- construiește un grafic bipartit SNP–gene,
- extrage perechi candidate pentru biomarkeri.
- construiți matricea multi-omics (concat),
- rulați PCA,
- salvați încărcăturile și proiecțiile PCA.
- identificați cele mai corelate perechi SNP–gene,
- filtrați la threshold (|r| > 0.5),
- exportați listele de candidați.
multiomics_concat_<handle>.csvpca_joint_<handle>.pngsnp_gene_pairs_<handle>.csvreport_lab10_<handle>.pdf(max 3 pagini)- checklist PR completat
- Deep learning pentru multi-omics (CNNs, autoencoders)
- Graph embeddings pentru integrative drug discovery
- Pregătirea proiectului final
- Preprocesarea și armonizarea datelor multi-omics.
- Aplicarea PCA pe date integrate.
- Descoperirea perechilor SNP–gene candidate la biomarkeri.
- Înțelegerea pipeline-urilor multi-omics folosite în genomica clinică.
- TCGA-BRCA, TCGA-GBM – multi-omics atlas
- iCluster, MOFA, OmicsIntegrator
- HapMap & GTEx cross-omics correlation
- Jolliffe – PCA
- Broad Institute: Single-Cell + multi-omics pipelines