Fecha | Actividad | Autor |
---|---|---|
26/11/2010 | Publicación inicial | Jorge Iván Meza Martínez. |
01/12/2010 | Ajustes a los permisos y propietarios de los archivos para permitir ejecución por usuarios no root | Jorge Iván Meza Martínez. |
07/12/2010 | Ajustes para garantizar el directorio scratch . | Jorge Iván Meza Martínez. |
En el presente documento se describe el procedimiento de instalación y configuración inicial de InterProScan sin soporte para colas ni web.
La instalación se realizó sobre un servidor del cluster con las siguientes características.
Descargar las últimas versiones de los siguientes archivos desde el sitio ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan.
RELEASE/latest/iprscan-v[última versión disponible].tar.gz
BIN/4.X/iprscan_bin4.x_[Plataforma].tar.gz
BIN/4.4/[Plataforma]/FingerPRINTScan
DATA/iprscan_DATA_[última versión].tar.gz
(latest_nopthr
).DATA/iprscan_PTHR_DATA_[última versión].tar.gz
(latest_pthr
).DATA/iprscan_MATCH_DATA_[última versión].tar.gz
(latest_match
).Es posible utilizar las siguientes instrucciones para obtener los archivos, sin embargo se recomienda que verifique cuales son las últimas versiones disponibles.
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/RELEASE/latest/iprscan_v4.7.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.x/iprscan_bin4.x_Linux64.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.4/Linux_64/fingerPRINTScan # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_pthr.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_match.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_nopthr.tar.gz
Después de completarse las descargas se han obtenido los siguientes archivos.
-rw-r--r-- 1 root root 710035 Nov 25 15:44 fingerPRINTScan -rw-r--r-- 1 root root 9258798 Nov 24 19:51 iprscan_bin4.x_Linux64.tar.gz -rw-r--r-- 1 root root 773708 Nov 24 19:49 iprscan_v4.7.tar.gz -rw-r--r-- 1 root root 2212987399 Nov 24 23:31 latest_match.tar.gz -rw-r--r-- 1 root root 1509495292 Nov 26 14:14 latest_nopthr.tar.gz -rw-r--r-- 1 root root 935074998 Nov 24 21:39 latest_pthr.tar.gz
La ubicación de instalación elegida en este caso será /exports/interproscan
y se creará un enlace desde /opt/iprscan
para ser utilizado por los usuarios.
# mkdir /exports/interproscan && cd /exports/interproscan
Descomprimir los archivos recién descargados. $PAQUETES
hace referencia a la ruta donde se descargaron físicamente.
# tar zxvf $PAQUETES/iprscan_bin4.x_Linux64.tar.gz # tar zxvf $PAQUETES/iprscan_v4.7.tar.gz # tar zxvf $PAQUETES/latest_match.tar.gz # tar zxvf $PAQUETES/latest_pthr.tar.gz # tar zxvf $PAQUETES/latest_nopthr.tar.gz
Ajustar el nombre del directorio para separar las versiones y crear el enlace genérico para los usuarios finales.
# mv iprscan/ iprscan_4.7 # ln -s /exports/interproscan/iprscan_4.7 /opt/iprscan
Ubicar finalmente el archivo fingerPRINTScan
.
# mkdir /opt/iprscan/bin/binaries # cp $PAQUETES/fingerPRINTScan /opt/iprscan/bin/binaries
# yum install compat-libf2c-34
Si al intentar instalar las siguientes librerías obtiene el siguiente mensaje de error, revise primero el capítulo de Solución de problemas mas adelante.
Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.
Instalación de XML::Parser. Verificar por la última versión disponible.
# mkdir /tmp/xmlparser && cd /tmp/xmlparser # wget http://search.cpan.org/CPAN/authors/id/C/CH/CHORNY/XML-Parser-2.40.tar.gz # tar zxvf XML-Parser-2.40.tar.gz # cd XML-Parser-2.40 # perl Makefile.PL # make # make install
Instalar otras librerías a través del CPAN.
# cpan cpan> install Mail::Send cpan> install XML::Quote cpan> install XML::Parser
Según la documentación estas librerías también pueden ser requeridas por la aplicación.
# cd /opt/iprscan/ # ./Config.pl Reconfigure everything? (first time install) [n] /(y|n)/? : y Do you want to set paths to perl and the installation directory? [y] /y|n/? : y Please enter the full path for the InterProScan installation [/exports/interproscan/iprscan_4.7] /.+/? : Do you want to set another Perl command in place of [/usr/local/bin/perl]? [n] /y|n/? : Do you want to setup chunk size [y] /(y|n)/? : n Do you want to configure this? [y] /(y|n)/? : y Enter the maximum number of input protein sequences allowed [1000] /\d+/? : 50000 Enter the maximum number of input nucleic sequences allowed [100] /\d+/? : 500 Enter the maximum length (in nucleic acids) for a nucleotide sequence [10000] /\d+/? : 10000 Enter the minimum length (in amino acids) for a protein sequence [5] /\d+/? : 5 Enter the minimum allowed length of a translated orf [50] /\d+/? : 30 Enter the default codon table value to use to translate dna/rna in six frames [0] /\d+/? : 0 Do you want to setup applications (if you don't, no applications will be included in InterProScan by default)? [y] /(y|n)/? : y Do you wish to use a queue system? [n] /(y|n)/? : n Do you want to use blastprodom ? [y] /(y|n)/? : y Do you want to use coils ? [y] /(y|n)/? : y Do you want to use gene3d ? [y] /(y|n)/? : y Do you want to use hamap ? [y] /(y|n)/? : y Do you want to use hmmpanther ? [y] /(y|n)/? : y Do you want to use hmmpir ? [y] /(y|n)/? : y Do you want to use hmmpfam ? [y] /(y|n)/? : y Do you want to use hmmsmart ? [y] /(y|n)/? : y Do you want to use hmmtigr ? [y] /(y|n)/? : y Do you want to use fprintscan ? [y] /(y|n)/? : y Do you want to use patternscan ? [y] /(y|n)/? : y Do you want to use profilescan ? [y] /(y|n)/? : y Do you want to use superfamily ? [y] /(y|n)/? : y Do you want to use seg ? [y] /(y|n)/? : y Do you want to use signalp ? [n] /(y|n)/? : n Do you want to use tmhmm ? [n] /(y|n)/? : n Do you want to set an administrator email address? [y] /y|n/? : y Please enter the email address of the administrator: [] /[\w\.\-]+\@[\w\.\-]+/? : <email administrador> Do you want to run InterProScan using a web interface? [n] /y|n/? : n Would you like to register InterProScan? [y] /(y|n)/? : n If you installed the web interface, what is the server name? [] /(\S+|n)/? : n
# chown -R root:root /opt/iprscan # chmod -R 777 /opt/iprscan/tmp/
Garantizar la existencia de la ruta de scratch
por defecto, la cual es al menos por las aplicaciones gene3d.pl
y superfamily.pl
.
# mkdir -p /scratch/tmp # chmod -R 777 /scratch/tmp # ln -s /opt/iprscan /scratch/tmp/iprscan
# ls -l /opt/iprscan/data/ total 28695364 -rwxrwxrwx 1 root root 7432951 Jul 28 2009 evaluator.dat -rw-r--r-- 1 root root 85565 Feb 4 2010 FingerPRINTShierarchy.db -rw-rw-r-- 1 root root 159705 Feb 24 2006 FingerPRINTSparser.db -rw-rw-rw- 1 root root 885 Nov 26 14:52 formatdb.log -rw-r--r-- 1 root root 713954264 Feb 11 2010 gene3d.lib -rw-rw-rw- 1 root root 48068739 Nov 26 14:55 gene3d.lib.h3f -rw-rw-rw- 1 root root 340790 Nov 26 14:55 gene3d.lib.h3i -rw-rw-rw- 1 root root 297928166 Nov 26 14:55 gene3d.lib.h3m -rw-rw-rw- 1 root root 349778225 Nov 26 14:55 gene3d.lib.h3p -rw-r--r-- 1 root root 294912 Nov 26 14:53 gene3d.lib.inx -rw-rw-r-- 1 root root 51527443 Jun 2 11:25 hamap.prf -rwxrwxr-x 1 root root 5482 Oct 20 04:21 interpro.dtd -rw-rw-r-- 1 root root 97003434 Oct 19 04:56 interpro.xml -rw-r--r-- 1 root root 6057984 Nov 25 19:46 interpro.xml.inx -rwxrwxr-x 1 root root 850 Oct 20 04:21 match_complete.dtd -rw-rw-r-- 1 root root 18560977829 Oct 19 05:06 match_complete.xml -rw-r--r-- 1 root root 875147264 Nov 25 19:14 match_complete.xml.inx -rw-r--r-- 1 root root 199772 Feb 19 2010 model2sf_map.csv -rwxrwxrwx 1 root root 1128 Oct 13 2006 new_coil.mat drwxr-xr-x 4 root root 4096 Nov 25 16:42 Panther -rwxrwxrwx 1 root root 1009392527 Oct 7 2009 Pfam-A.hmm -rw-rw-rw- 1 root root 67152374 Nov 26 14:48 Pfam-A.hmm.h3f -rw-rw-rw- 1 root root 822072 Nov 26 14:48 Pfam-A.hmm.h3i -rw-rw-rw- 1 root root 419389244 Nov 26 14:48 Pfam-A.hmm.h3m -rw-rw-rw- 1 root root 493660313 Nov 26 14:48 Pfam-A.hmm.h3p -rw-r--r-- 1 root root 704512 Nov 26 14:46 Pfam-A.hmm.inx -rwxrwxrwx 1 root root 184425538 Oct 7 2009 Pfam-A.seed -rw-r--r-- 1 root root 1347584 Nov 26 14:52 Pfam-A.seed.inx -rwxrwxrwx 1 root root 328555 Oct 7 2009 Pfam-C -rw-r--r-- 1 root root 139264 Nov 26 14:46 Pfam-C.inx -rw-rw-r-- 1 root root 371192 Oct 7 10:02 pirsf.dat -rw-r--r-- 1 root root 56882960 Feb 4 2010 prints.pval -rw-r--r-- 1 root root 131072 Nov 26 14:46 prints.pval.inx -rwxrwxrwx 1 root root 15028745 Mar 18 2009 prodom.ipr -rw-rw-rw- 1 root root 10372747 Nov 26 14:46 prodom.ipr.phr -rw-rw-rw- 1 root root 411984 Nov 26 14:46 prodom.ipr.pin -rw-rw-rw- 1 root root 3658324 Nov 26 14:46 prodom.ipr.psd -rw-rw-rw- 1 root root 70128 Nov 26 14:46 prodom.ipr.psi -rw-rw-rw- 1 root root 6465078 Nov 26 14:46 prodom.ipr.psq -rw-rw-r-- 1 root root 26758380 Sep 8 05:23 prosite.dat -rw-rw-r-- 1 root root 450665191 Oct 7 10:47 sf_hmm -rw-rw-rw- 1 root root 241707939 Nov 26 14:46 sf_hmm.bin -rw-r--r-- 1 root root 184320 Nov 26 14:46 sf_hmm.inx -rw-rw-r-- 1 root root 0 Oct 7 10:01 sf_hmm_sub -rwxrwxr-x 1 root root 1424499434 Jan 13 2010 sf.seq -rw-rw-rw- 1 root root 218465280 Nov 26 14:51 sf.seq.00.phr -rw-rw-rw- 1 root root 23775656 Nov 26 14:51 sf.seq.00.pin -rw-rw-rw- 1 root root 1002971730 Nov 26 14:51 sf.seq.00.psq -rw-rw-rw- 1 root root 86512433 Nov 26 14:52 sf.seq.01.phr -rw-rw-rw- 1 root root 9299296 Nov 26 14:52 sf.seq.01.pin -rw-rw-rw- 1 root root 356456500 Nov 26 14:52 sf.seq.01.psq -rw-rw-rw- 1 root root 235 Nov 26 14:52 sf.seq.pal -rwxrwxr-x 1 root root 374174 Jan 13 2010 sf.tb -rw-rw-r-- 1 root root 46716677 Aug 12 11:28 smart.HMMs -rw-rw-rw- 1 root root 24866461 Nov 26 14:53 smart.HMMs.bin -rw-r--r-- 1 root root 61440 Nov 26 14:53 smart.HMMs.inx -rw-rw-r-- 1 root root 111360 Mar 6 2009 superfamily.acc -rw-rw-r-- 1 root root 918426748 Mar 6 2009 superfamily.hmm -rw-rw-rw- 1 root root 488212761 Nov 26 14:53 superfamily.hmm.bin -rw-r--r-- 1 root root 1081344 Nov 26 14:52 superfamily.hmm.inx -rw-rw-r-- 1 root root 793082 Mar 6 2009 superfamily.tab -rw-rw-r-- 1 root root 489282946 Jan 6 2010 TIGRFAMs_HMM.LIB -rw-rw-rw- 1 root root 263794770 Nov 26 14:55 TIGRFAMs_HMM.LIB.bin -rw-r--r-- 1 root root 225280 Nov 26 14:55 TIGRFAMs_HMM.LIB.inx
# index_data.pl -f interpro.xml -inx -v # index_data.pl -f match_complete.xml -inx -v # index_data.pl -f Pfam-A.seed -inx -v # index_data.pl -f Pfam-C -inx -v # index_data.pl -f prints.pval -inx -v # index_data.pl -f sf.seq -inx -v # index_data.pl -f sf_hmm -inx -v # index_data.pl -f smart.HMMs -inx -v # index_data.pl -f superfamily.hmm -inx -v # index_data.pl -f TIGRFAMs_HMM.LIB -inx -v
# /opt/iprscan/bin/iprscan -cli -i /opt/iprscan/test.seq -o /opt/iprscan/test.out -format raw -goterms -iprlookup
Comparar el archivo generado /opt/iprscan/test.out
con el provisto merged.raw.crc
.
Problema
Al intentar utilizar el cpan
para instalar librerías se obtiene el siguiente mensaje de error.
Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.
Solución
# perl -MCPAN -e shell cpan> force install "Scalar::Util" cpan> quit