Instalación y configuración inicial de InterProScan
Control de versiones
| Fecha | Actividad | Autor |
|---|---|---|
| 26/11/2010 | Publicación inicial | Jorge Iván Meza Martínez. |
| 01/12/2010 | Ajustes a los permisos y propietarios de los archivos para permitir ejecución por usuarios no root | Jorge Iván Meza Martínez. |
| 07/12/2010 | Ajustes para garantizar el directorio scratch. | Jorge Iván Meza Martínez. |
Introducción
En el presente documento se describe el procedimiento de instalación y configuración inicial de InterProScan sin soporte para colas ni web.
Requerimientos
La instalación se realizó sobre un servidor del cluster con las siguientes características.
- Scientific Linux 5.5 x86_64.
- Kernel 2.6.18-164.15.1.el5xen.
- Perl 5.8.8.
Obtener los archivos
Descargar las últimas versiones de los siguientes archivos desde el sitio ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan.
RELEASE/latest/iprscan-v[última versión disponible].tar.gzBIN/4.X/iprscan_bin4.x_[Plataforma].tar.gzBIN/4.4/[Plataforma]/FingerPRINTScanDATA/iprscan_DATA_[última versión].tar.gz(latest_nopthr).DATA/iprscan_PTHR_DATA_[última versión].tar.gz(latest_pthr).DATA/iprscan_MATCH_DATA_[última versión].tar.gz(latest_match).
Es posible utilizar las siguientes instrucciones para obtener los archivos, sin embargo se recomienda que verifique cuales son las últimas versiones disponibles.
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/RELEASE/latest/iprscan_v4.7.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.x/iprscan_bin4.x_Linux64.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.4/Linux_64/fingerPRINTScan # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_pthr.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_match.tar.gz # wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_nopthr.tar.gz
Después de completarse las descargas se han obtenido los siguientes archivos.
-rw-r--r-- 1 root root 710035 Nov 25 15:44 fingerPRINTScan -rw-r--r-- 1 root root 9258798 Nov 24 19:51 iprscan_bin4.x_Linux64.tar.gz -rw-r--r-- 1 root root 773708 Nov 24 19:49 iprscan_v4.7.tar.gz -rw-r--r-- 1 root root 2212987399 Nov 24 23:31 latest_match.tar.gz -rw-r--r-- 1 root root 1509495292 Nov 26 14:14 latest_nopthr.tar.gz -rw-r--r-- 1 root root 935074998 Nov 24 21:39 latest_pthr.tar.gz
Descomprimir y ubicar los archivos
La ubicación de instalación elegida en este caso será /exports/interproscan y se creará un enlace desde /opt/iprscan para ser utilizado por los usuarios.
# mkdir /exports/interproscan && cd /exports/interproscan
Descomprimir los archivos recién descargados. $PAQUETES hace referencia a la ruta donde se descargaron físicamente.
# tar zxvf $PAQUETES/iprscan_bin4.x_Linux64.tar.gz # tar zxvf $PAQUETES/iprscan_v4.7.tar.gz # tar zxvf $PAQUETES/latest_match.tar.gz # tar zxvf $PAQUETES/latest_pthr.tar.gz # tar zxvf $PAQUETES/latest_nopthr.tar.gz
Ajustar el nombre del directorio para separar las versiones y crear el enlace genérico para los usuarios finales.
# mv iprscan/ iprscan_4.7 # ln -s /exports/interproscan/iprscan_4.7 /opt/iprscan
Ubicar finalmente el archivo fingerPRINTScan.
# mkdir /opt/iprscan/bin/binaries # cp $PAQUETES/fingerPRINTScan /opt/iprscan/bin/binaries
Instalar las librerías necesarias
# yum install compat-libf2c-34
Si al intentar instalar las siguientes librerías obtiene el siguiente mensaje de error, revise primero el capítulo de Solución de problemas mas adelante.
Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.
Instalación de XML::Parser. Verificar por la última versión disponible.
# mkdir /tmp/xmlparser && cd /tmp/xmlparser # wget http://search.cpan.org/CPAN/authors/id/C/CH/CHORNY/XML-Parser-2.40.tar.gz # tar zxvf XML-Parser-2.40.tar.gz # cd XML-Parser-2.40 # perl Makefile.PL # make # make install
Instalar otras librerías a través del CPAN.
# cpan cpan> install Mail::Send cpan> install XML::Quote cpan> install XML::Parser
Según la documentación estas librerías también pueden ser requeridas por la aplicación.
- CGI
- DB_File.pm
- English
- File::Basename
- File::Copy
- File::Path
- File::Spec::Functions
- FileHandle
- IO::Scalar
- IO::String
- Sys::Hostname
- URI::Escape
Configuración incial
# cd /opt/iprscan/ # ./Config.pl Reconfigure everything? (first time install) [n] /(y|n)/? : y Do you want to set paths to perl and the installation directory? [y] /y|n/? : y Please enter the full path for the InterProScan installation [/exports/interproscan/iprscan_4.7] /.+/? : Do you want to set another Perl command in place of [/usr/local/bin/perl]? [n] /y|n/? : Do you want to setup chunk size [y] /(y|n)/? : n Do you want to configure this? [y] /(y|n)/? : y Enter the maximum number of input protein sequences allowed [1000] /\d+/? : 50000 Enter the maximum number of input nucleic sequences allowed [100] /\d+/? : 500 Enter the maximum length (in nucleic acids) for a nucleotide sequence [10000] /\d+/? : 10000 Enter the minimum length (in amino acids) for a protein sequence [5] /\d+/? : 5 Enter the minimum allowed length of a translated orf [50] /\d+/? : 30 Enter the default codon table value to use to translate dna/rna in six frames [0] /\d+/? : 0 Do you want to setup applications (if you don't, no applications will be included in InterProScan by default)? [y] /(y|n)/? : y Do you wish to use a queue system? [n] /(y|n)/? : n Do you want to use blastprodom ? [y] /(y|n)/? : y Do you want to use coils ? [y] /(y|n)/? : y Do you want to use gene3d ? [y] /(y|n)/? : y Do you want to use hamap ? [y] /(y|n)/? : y Do you want to use hmmpanther ? [y] /(y|n)/? : y Do you want to use hmmpir ? [y] /(y|n)/? : y Do you want to use hmmpfam ? [y] /(y|n)/? : y Do you want to use hmmsmart ? [y] /(y|n)/? : y Do you want to use hmmtigr ? [y] /(y|n)/? : y Do you want to use fprintscan ? [y] /(y|n)/? : y Do you want to use patternscan ? [y] /(y|n)/? : y Do you want to use profilescan ? [y] /(y|n)/? : y Do you want to use superfamily ? [y] /(y|n)/? : y Do you want to use seg ? [y] /(y|n)/? : y Do you want to use signalp ? [n] /(y|n)/? : n Do you want to use tmhmm ? [n] /(y|n)/? : n Do you want to set an administrator email address? [y] /y|n/? : y Please enter the email address of the administrator: [] /[\w\.\-]+\@[\w\.\-]+/? : <email administrador> Do you want to run InterProScan using a web interface? [n] /y|n/? : n Would you like to register InterProScan? [y] /(y|n)/? : n If you installed the web interface, what is the server name? [] /(\S+|n)/? : n
Ajustar las rutas, permisos y propietarios de los archivos
# chown -R root:root /opt/iprscan # chmod -R 777 /opt/iprscan/tmp/
Garantizar la existencia de la ruta de scratch por defecto, la cual es al menos por las aplicaciones gene3d.pl y superfamily.pl.
# mkdir -p /scratch/tmp # chmod -R 777 /scratch/tmp # ln -s /opt/iprscan /scratch/tmp/iprscan
Verificar la existencia de las bases de datos
# ls -l /opt/iprscan/data/ total 28695364 -rwxrwxrwx 1 root root 7432951 Jul 28 2009 evaluator.dat -rw-r--r-- 1 root root 85565 Feb 4 2010 FingerPRINTShierarchy.db -rw-rw-r-- 1 root root 159705 Feb 24 2006 FingerPRINTSparser.db -rw-rw-rw- 1 root root 885 Nov 26 14:52 formatdb.log -rw-r--r-- 1 root root 713954264 Feb 11 2010 gene3d.lib -rw-rw-rw- 1 root root 48068739 Nov 26 14:55 gene3d.lib.h3f -rw-rw-rw- 1 root root 340790 Nov 26 14:55 gene3d.lib.h3i -rw-rw-rw- 1 root root 297928166 Nov 26 14:55 gene3d.lib.h3m -rw-rw-rw- 1 root root 349778225 Nov 26 14:55 gene3d.lib.h3p -rw-r--r-- 1 root root 294912 Nov 26 14:53 gene3d.lib.inx -rw-rw-r-- 1 root root 51527443 Jun 2 11:25 hamap.prf -rwxrwxr-x 1 root root 5482 Oct 20 04:21 interpro.dtd -rw-rw-r-- 1 root root 97003434 Oct 19 04:56 interpro.xml -rw-r--r-- 1 root root 6057984 Nov 25 19:46 interpro.xml.inx -rwxrwxr-x 1 root root 850 Oct 20 04:21 match_complete.dtd -rw-rw-r-- 1 root root 18560977829 Oct 19 05:06 match_complete.xml -rw-r--r-- 1 root root 875147264 Nov 25 19:14 match_complete.xml.inx -rw-r--r-- 1 root root 199772 Feb 19 2010 model2sf_map.csv -rwxrwxrwx 1 root root 1128 Oct 13 2006 new_coil.mat drwxr-xr-x 4 root root 4096 Nov 25 16:42 Panther -rwxrwxrwx 1 root root 1009392527 Oct 7 2009 Pfam-A.hmm -rw-rw-rw- 1 root root 67152374 Nov 26 14:48 Pfam-A.hmm.h3f -rw-rw-rw- 1 root root 822072 Nov 26 14:48 Pfam-A.hmm.h3i -rw-rw-rw- 1 root root 419389244 Nov 26 14:48 Pfam-A.hmm.h3m -rw-rw-rw- 1 root root 493660313 Nov 26 14:48 Pfam-A.hmm.h3p -rw-r--r-- 1 root root 704512 Nov 26 14:46 Pfam-A.hmm.inx -rwxrwxrwx 1 root root 184425538 Oct 7 2009 Pfam-A.seed -rw-r--r-- 1 root root 1347584 Nov 26 14:52 Pfam-A.seed.inx -rwxrwxrwx 1 root root 328555 Oct 7 2009 Pfam-C -rw-r--r-- 1 root root 139264 Nov 26 14:46 Pfam-C.inx -rw-rw-r-- 1 root root 371192 Oct 7 10:02 pirsf.dat -rw-r--r-- 1 root root 56882960 Feb 4 2010 prints.pval -rw-r--r-- 1 root root 131072 Nov 26 14:46 prints.pval.inx -rwxrwxrwx 1 root root 15028745 Mar 18 2009 prodom.ipr -rw-rw-rw- 1 root root 10372747 Nov 26 14:46 prodom.ipr.phr -rw-rw-rw- 1 root root 411984 Nov 26 14:46 prodom.ipr.pin -rw-rw-rw- 1 root root 3658324 Nov 26 14:46 prodom.ipr.psd -rw-rw-rw- 1 root root 70128 Nov 26 14:46 prodom.ipr.psi -rw-rw-rw- 1 root root 6465078 Nov 26 14:46 prodom.ipr.psq -rw-rw-r-- 1 root root 26758380 Sep 8 05:23 prosite.dat -rw-rw-r-- 1 root root 450665191 Oct 7 10:47 sf_hmm -rw-rw-rw- 1 root root 241707939 Nov 26 14:46 sf_hmm.bin -rw-r--r-- 1 root root 184320 Nov 26 14:46 sf_hmm.inx -rw-rw-r-- 1 root root 0 Oct 7 10:01 sf_hmm_sub -rwxrwxr-x 1 root root 1424499434 Jan 13 2010 sf.seq -rw-rw-rw- 1 root root 218465280 Nov 26 14:51 sf.seq.00.phr -rw-rw-rw- 1 root root 23775656 Nov 26 14:51 sf.seq.00.pin -rw-rw-rw- 1 root root 1002971730 Nov 26 14:51 sf.seq.00.psq -rw-rw-rw- 1 root root 86512433 Nov 26 14:52 sf.seq.01.phr -rw-rw-rw- 1 root root 9299296 Nov 26 14:52 sf.seq.01.pin -rw-rw-rw- 1 root root 356456500 Nov 26 14:52 sf.seq.01.psq -rw-rw-rw- 1 root root 235 Nov 26 14:52 sf.seq.pal -rwxrwxr-x 1 root root 374174 Jan 13 2010 sf.tb -rw-rw-r-- 1 root root 46716677 Aug 12 11:28 smart.HMMs -rw-rw-rw- 1 root root 24866461 Nov 26 14:53 smart.HMMs.bin -rw-r--r-- 1 root root 61440 Nov 26 14:53 smart.HMMs.inx -rw-rw-r-- 1 root root 111360 Mar 6 2009 superfamily.acc -rw-rw-r-- 1 root root 918426748 Mar 6 2009 superfamily.hmm -rw-rw-rw- 1 root root 488212761 Nov 26 14:53 superfamily.hmm.bin -rw-r--r-- 1 root root 1081344 Nov 26 14:52 superfamily.hmm.inx -rw-rw-r-- 1 root root 793082 Mar 6 2009 superfamily.tab -rw-rw-r-- 1 root root 489282946 Jan 6 2010 TIGRFAMs_HMM.LIB -rw-rw-rw- 1 root root 263794770 Nov 26 14:55 TIGRFAMs_HMM.LIB.bin -rw-r--r-- 1 root root 225280 Nov 26 14:55 TIGRFAMs_HMM.LIB.inx
Indizar las bases de datos
# index_data.pl -f interpro.xml -inx -v # index_data.pl -f match_complete.xml -inx -v # index_data.pl -f Pfam-A.seed -inx -v # index_data.pl -f Pfam-C -inx -v # index_data.pl -f prints.pval -inx -v # index_data.pl -f sf.seq -inx -v # index_data.pl -f sf_hmm -inx -v # index_data.pl -f smart.HMMs -inx -v # index_data.pl -f superfamily.hmm -inx -v # index_data.pl -f TIGRFAMs_HMM.LIB -inx -v
Realizar pruebas de la instalación
# /opt/iprscan/bin/iprscan -cli -i /opt/iprscan/test.seq -o /opt/iprscan/test.out -format raw -goterms -iprlookup
Comparar el archivo generado /opt/iprscan/test.out con el provisto merged.raw.crc.
Solución de problemas
Undefined subroutine &Compress::Zlib::gzopen
Problema
Al intentar utilizar el cpan para instalar librerías se obtiene el siguiente mensaje de error.
Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.
Solución
# perl -MCPAN -e shell cpan> force install "Scalar::Util" cpan> quit