Skip to content

Dokumentation Jonah

jonahdaus edited this page May 7, 2025 · 3 revisions

📄 Workflow-Dokumentation

Miniconda Setup

  • Miniconda wurde unter
    /storage/mi/dauj03/miniconda$ installiert.
  • myenv:
    Eine eigene Conda-Umgebung (workflow/env/myenv.yaml) wurde erstellt.
    Status: in Arbeit

Quality Control: FastQC und Trimming

Umsetzung

  • Neuer privater Branch: quality-control-fastqc-trimming
  • FastQC- und Trimmomatic-Integration erfolgreich abgeschlossen.
  • Entsprechende Anpassungen in der Snakefile-Regel all vorgenommen.
  • .snakemake-Verzeichnis und results-Ordner wurden in .gitignore aufgenommen, um temporäre Dateien nicht in Git zu versionieren.

Kommentare

  • FastQC hat Nextera Transposase Sequence Adapter in sample3 erkannt.
  • Empfehlung: Statt TruSeq3-PE.fa besser NexteraPE-PE.fa im Trimmomatic-ILLUMINACLIP-Schritt verwenden.

MultiQC

  • MultiQC wurde hinzugefügt, um Ergebnisse von Trimming und QC zusammenzufassen.
  • Output-Report:
    results/qc/multiqc_report.html

Noch offen

  • Integration des Bowtie2-Reports in den MultiQC-Report.

De-novo-Assemblierung

Umsetzung

  • Erfolgreich integriert.
  • Ort im Workflow: workflow/rules/denovo_assembly.smk
  • Hinweis:
    Der aktuelle Input sind Reads nach dem Trimming.
    Künftig Anpassung erforderlich: Input soll Reads nach Dekontaminierung sein.

Qualitätsbewertung der Assemblies

BUSCO

  • Status: Erfolgreich integriert
  • Ort im Workflow: workflow/rules/qc.smk
  • Conda-Umgebung: workflow/env/busco.yaml

QUAST

  • Status: Erfolgreich integriert
  • Conda-Umgebung: workflow/env/quast.yaml

  • Fehler bei der Erstellung des MultiQC-Reports wurden behoben.
  • Alle Samples sollten nun korrekt erkannt und ausgewertet werden.
  • Details dazu siehe Issue #4, #5, #6, #7.

MultiQC Reports wurde erweitert

  • Ein Report nur für Raw Reads.
  • Ein Report mit allen Schritten.
  • Ein Report nur mit getrimmten Reads.

BUSCO Rule wurde mit neuer Lineage verfeinert

  • Möglichst spezifisch (Spezies).
  • ODB ist noch nicht immer spezifisch genug.
  • Speziesbestimmung über NCBI (Screenshots beachten).
    • Lineage selbst wählen oder automatisch suchen lassen.
  • Lineage konnte aber nicht als Parameter übergeben werden.
  • Busco Download-Verhalten verbessert

    • --download-Flag soll ausschließlich den Download auslösen, ohne weitere Ausführung.
    • Nutzung von -l zum Spezifizieren des Pfads zur gewünschten Lineage.
    • Ziel: Lineage-Dateien sollen nur einmalig heruntergeladen werden (Caching vermeiden).

Clone this wiki locally