Code for pipeline for identification and extraction of prophage elements in genomic assemblies - outputs *.gbk of prophage genomes & *.tsv files with details of prophages identified. It depends on several conda environments with particular tools loaded to function.
The current version of the pipeline depends on the presence of conda environments with the installed software.
##################################################################################################################################################################################
These are as follows.
virsorter2_env - virsorter2 (v2.2.4)
checkv_env - checkv (v1.0.3)
pharokka_env - pharokka (v1.7.2)
bedtools_env (need to fix environment name....) - biopython (v1.84)
##################################################################################################################################################################################
Usage is as follows
rewrite headers of input fast to ensure compatibility with the script ./rewrite_fasta_headers-4-prophage-hunting-v1.1.sh genome.fna input-genome-fixed.fna
Run the prophage hunting script ./prophage-hunting-checkv-v3.1.sh -i input-genome-fixed.fna
Extract prophage sequences from pharokka annotation ./prophage_gbk+tsv_here_checkv-v1.sh <path_to_virsorter_output>
####################################################################################################################################################################################
The last script calls scripts from the processing_scripts_checkv_v1 folder - ensure it is placed in the same directory as /prophage_gbk+tsv_here_checkv-v1.sh script.
####################################################################################################################################################################################
Compare coverage Needs Samtools and Bowtie2
Execute as follows ./compare_coverage.sh <forward_reads> <reverse_reads> <genome_fasta> <coordinates_file> <output_file> <output_dir>