User Tools

Site Tools


interproscan:instalacion

Instalación y configuración inicial de InterProScan

Control de versiones

Fecha Actividad Autor
26/11/2010 Publicación inicial Jorge Iván Meza Martínez.
01/12/2010 Ajustes a los permisos y propietarios de los archivos para permitir ejecución por usuarios no root Jorge Iván Meza Martínez.
07/12/2010 Ajustes para garantizar el directorio scratch. Jorge Iván Meza Martínez.

Introducción

En el presente documento se describe el procedimiento de instalación y configuración inicial de InterProScan sin soporte para colas ni web.

Requerimientos

La instalación se realizó sobre un servidor del cluster con las siguientes características.

  • Scientific Linux 5.5 x86_64.
    • Kernel 2.6.18-164.15.1.el5xen.
  • Perl 5.8.8.

Obtener los archivos

Descargar las últimas versiones de los siguientes archivos desde el sitio ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan.

  • RELEASE/latest/iprscan-v[última versión disponible].tar.gz
  • BIN/4.X/iprscan_bin4.x_[Plataforma].tar.gz
  • BIN/4.4/[Plataforma]/FingerPRINTScan
  • DATA/iprscan_DATA_[última versión].tar.gz (latest_nopthr).
  • DATA/iprscan_PTHR_DATA_[última versión].tar.gz (latest_pthr).
  • DATA/iprscan_MATCH_DATA_[última versión].tar.gz (latest_match).

Es posible utilizar las siguientes instrucciones para obtener los archivos, sin embargo se recomienda que verifique cuales son las últimas versiones disponibles.

# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/RELEASE/latest/iprscan_v4.7.tar.gz
 
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.x/iprscan_bin4.x_Linux64.tar.gz
 
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/BIN/4.4/Linux_64/fingerPRINTScan
 
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_pthr.tar.gz
 
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_match.tar.gz
 
# wget ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/DATA/latest_nopthr.tar.gz

Después de completarse las descargas se han obtenido los siguientes archivos.

-rw-r--r-- 1 root root     710035 Nov 25 15:44 fingerPRINTScan
-rw-r--r-- 1 root root    9258798 Nov 24 19:51 iprscan_bin4.x_Linux64.tar.gz
-rw-r--r-- 1 root root     773708 Nov 24 19:49 iprscan_v4.7.tar.gz
-rw-r--r-- 1 root root 2212987399 Nov 24 23:31 latest_match.tar.gz
-rw-r--r-- 1 root root 1509495292 Nov 26 14:14 latest_nopthr.tar.gz
-rw-r--r-- 1 root root  935074998 Nov 24 21:39 latest_pthr.tar.gz

Descomprimir y ubicar los archivos

La ubicación de instalación elegida en este caso será /exports/interproscan y se creará un enlace desde /opt/iprscan para ser utilizado por los usuarios.

# mkdir /exports/interproscan && cd /exports/interproscan

Descomprimir los archivos recién descargados. $PAQUETES hace referencia a la ruta donde se descargaron físicamente.

# tar zxvf $PAQUETES/iprscan_bin4.x_Linux64.tar.gz
 
# tar zxvf $PAQUETES/iprscan_v4.7.tar.gz
 
# tar zxvf $PAQUETES/latest_match.tar.gz
 
# tar zxvf $PAQUETES/latest_pthr.tar.gz
 
# tar zxvf $PAQUETES/latest_nopthr.tar.gz

Ajustar el nombre del directorio para separar las versiones y crear el enlace genérico para los usuarios finales.

# mv iprscan/ iprscan_4.7
 
# ln -s /exports/interproscan/iprscan_4.7 /opt/iprscan

Ubicar finalmente el archivo fingerPRINTScan.

# mkdir /opt/iprscan/bin/binaries
 
# cp $PAQUETES/fingerPRINTScan /opt/iprscan/bin/binaries

Instalar las librerías necesarias

# yum install compat-libf2c-34

Si al intentar instalar las siguientes librerías obtiene el siguiente mensaje de error, revise primero el capítulo de Solución de problemas mas adelante.

Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.

Instalación de XML::Parser. Verificar por la última versión disponible.

# mkdir /tmp/xmlparser && cd /tmp/xmlparser
 
# wget http://search.cpan.org/CPAN/authors/id/C/CH/CHORNY/XML-Parser-2.40.tar.gz
 
# tar zxvf XML-Parser-2.40.tar.gz
 
# cd XML-Parser-2.40
 
# perl Makefile.PL
 
# make
 
# make install

Instalar otras librerías a través del CPAN.

# cpan
 
    cpan> install Mail::Send
 
    cpan> install XML::Quote
 
    cpan> install XML::Parser

Según la documentación estas librerías también pueden ser requeridas por la aplicación.

  • CGI
  • DB_File.pm
  • English
  • File::Basename
  • File::Copy
  • File::Path
  • File::Spec::Functions
  • FileHandle
  • IO::Scalar
  • IO::String
  • Sys::Hostname
  • URI::Escape

Configuración incial

# cd /opt/iprscan/
 
# ./Config.pl
 
  Reconfigure everything? (first time install) [n] /(y|n)/? : y
  Do you want to set paths to perl and the installation directory? [y] /y|n/? : y
  Please enter the full path for the InterProScan installation [/exports/interproscan/iprscan_4.7] /.+/? :
  Do you want to set another Perl command in place of [/usr/local/bin/perl]? [n] /y|n/? : 
  Do you want to setup chunk size [y] /(y|n)/? : n
  Do you want to configure this? [y] /(y|n)/? : y
  Enter the maximum number of input protein sequences allowed [1000] /\d+/? : 50000
  Enter the maximum number of input nucleic sequences allowed [100] /\d+/? : 500
  Enter the maximum length (in nucleic acids) for a nucleotide sequence [10000] /\d+/? : 10000
  Enter the minimum length (in amino acids) for a protein sequence [5] /\d+/? : 5
  Enter the minimum allowed length of a translated orf [50] /\d+/? : 30
  Enter the default codon table value to use to translate dna/rna in six frames [0] /\d+/? : 0
  Do you want to setup applications (if you don't, no applications will be included in InterProScan by default)? [y] /(y|n)/? : y
  Do you wish to use a queue system? [n] /(y|n)/? : n
  Do you want to use blastprodom ? [y] /(y|n)/? : y
  Do you want to use coils ? [y] /(y|n)/? : y
  Do you want to use gene3d ? [y] /(y|n)/? : y
  Do you want to use hamap ? [y] /(y|n)/? : y
  Do you want to use hmmpanther ? [y] /(y|n)/? : y
  Do you want to use hmmpir ? [y] /(y|n)/? : y
  Do you want to use hmmpfam ? [y] /(y|n)/? : y
  Do you want to use hmmsmart ? [y] /(y|n)/? : y
  Do you want to use hmmtigr ? [y] /(y|n)/? : y
  Do you want to use fprintscan ? [y] /(y|n)/? : y
  Do you want to use patternscan ? [y] /(y|n)/? : y
  Do you want to use profilescan ? [y] /(y|n)/? : y
  Do you want to use superfamily ? [y] /(y|n)/? : y
  Do you want to use seg ? [y] /(y|n)/? : y
  Do you want to use signalp ? [n] /(y|n)/? : n
  Do you want to use tmhmm ? [n] /(y|n)/? : n
  Do you want to set an administrator email address? [y] /y|n/? : y
  Please enter the email address of the administrator: [] /[\w\.\-]+\@[\w\.\-]+/? : <email administrador>
  Do you want to run InterProScan using a web interface? [n] /y|n/? : n
  Would you like to register InterProScan? [y] /(y|n)/? : n
  If you installed the web interface, what is the server name? [] /(\S+|n)/? : n

Ajustar las rutas, permisos y propietarios de los archivos

# chown -R root:root /opt/iprscan
 
# chmod -R 777 /opt/iprscan/tmp/

Garantizar la existencia de la ruta de scratch por defecto, la cual es al menos por las aplicaciones gene3d.pl y superfamily.pl.

# mkdir -p /scratch/tmp
 
# chmod -R 777 /scratch/tmp
 
# ln -s /opt/iprscan /scratch/tmp/iprscan

Verificar la existencia de las bases de datos

# ls -l /opt/iprscan/data/
 
  total 28695364
  -rwxrwxrwx 1 root root     7432951 Jul 28  2009 evaluator.dat
  -rw-r--r-- 1 root root       85565 Feb  4  2010 FingerPRINTShierarchy.db
  -rw-rw-r-- 1 root root      159705 Feb 24  2006 FingerPRINTSparser.db
  -rw-rw-rw- 1 root root         885 Nov 26 14:52 formatdb.log
  -rw-r--r-- 1 root root   713954264 Feb 11  2010 gene3d.lib
  -rw-rw-rw- 1 root root    48068739 Nov 26 14:55 gene3d.lib.h3f
  -rw-rw-rw- 1 root root      340790 Nov 26 14:55 gene3d.lib.h3i
  -rw-rw-rw- 1 root root   297928166 Nov 26 14:55 gene3d.lib.h3m
  -rw-rw-rw- 1 root root   349778225 Nov 26 14:55 gene3d.lib.h3p
  -rw-r--r-- 1 root root      294912 Nov 26 14:53 gene3d.lib.inx
  -rw-rw-r-- 1 root root    51527443 Jun  2 11:25 hamap.prf
  -rwxrwxr-x 1 root root        5482 Oct 20 04:21 interpro.dtd
  -rw-rw-r-- 1 root root    97003434 Oct 19 04:56 interpro.xml
  -rw-r--r-- 1 root root     6057984 Nov 25 19:46 interpro.xml.inx
  -rwxrwxr-x 1 root root         850 Oct 20 04:21 match_complete.dtd
  -rw-rw-r-- 1 root root 18560977829 Oct 19 05:06 match_complete.xml
  -rw-r--r-- 1 root root   875147264 Nov 25 19:14 match_complete.xml.inx
  -rw-r--r-- 1 root root      199772 Feb 19  2010 model2sf_map.csv
  -rwxrwxrwx 1 root root        1128 Oct 13  2006 new_coil.mat
  drwxr-xr-x 4 root root        4096 Nov 25 16:42 Panther
  -rwxrwxrwx 1 root root  1009392527 Oct  7  2009 Pfam-A.hmm
  -rw-rw-rw- 1 root root    67152374 Nov 26 14:48 Pfam-A.hmm.h3f
  -rw-rw-rw- 1 root root      822072 Nov 26 14:48 Pfam-A.hmm.h3i
  -rw-rw-rw- 1 root root   419389244 Nov 26 14:48 Pfam-A.hmm.h3m
  -rw-rw-rw- 1 root root   493660313 Nov 26 14:48 Pfam-A.hmm.h3p
  -rw-r--r-- 1 root root      704512 Nov 26 14:46 Pfam-A.hmm.inx
  -rwxrwxrwx 1 root root   184425538 Oct  7  2009 Pfam-A.seed
  -rw-r--r-- 1 root root     1347584 Nov 26 14:52 Pfam-A.seed.inx
  -rwxrwxrwx 1 root root      328555 Oct  7  2009 Pfam-C
  -rw-r--r-- 1 root root      139264 Nov 26 14:46 Pfam-C.inx
  -rw-rw-r-- 1 root root      371192 Oct  7 10:02 pirsf.dat
  -rw-r--r-- 1 root root    56882960 Feb  4  2010 prints.pval
  -rw-r--r-- 1 root root      131072 Nov 26 14:46 prints.pval.inx
  -rwxrwxrwx 1 root root    15028745 Mar 18  2009 prodom.ipr
  -rw-rw-rw- 1 root root    10372747 Nov 26 14:46 prodom.ipr.phr
  -rw-rw-rw- 1 root root      411984 Nov 26 14:46 prodom.ipr.pin
  -rw-rw-rw- 1 root root     3658324 Nov 26 14:46 prodom.ipr.psd
  -rw-rw-rw- 1 root root       70128 Nov 26 14:46 prodom.ipr.psi
  -rw-rw-rw- 1 root root     6465078 Nov 26 14:46 prodom.ipr.psq
  -rw-rw-r-- 1 root root    26758380 Sep  8 05:23 prosite.dat
  -rw-rw-r-- 1 root root   450665191 Oct  7 10:47 sf_hmm
  -rw-rw-rw- 1 root root   241707939 Nov 26 14:46 sf_hmm.bin
  -rw-r--r-- 1 root root      184320 Nov 26 14:46 sf_hmm.inx
  -rw-rw-r-- 1 root root           0 Oct  7 10:01 sf_hmm_sub
  -rwxrwxr-x 1 root root  1424499434 Jan 13  2010 sf.seq
  -rw-rw-rw- 1 root root   218465280 Nov 26 14:51 sf.seq.00.phr
  -rw-rw-rw- 1 root root    23775656 Nov 26 14:51 sf.seq.00.pin
  -rw-rw-rw- 1 root root  1002971730 Nov 26 14:51 sf.seq.00.psq
  -rw-rw-rw- 1 root root    86512433 Nov 26 14:52 sf.seq.01.phr
  -rw-rw-rw- 1 root root     9299296 Nov 26 14:52 sf.seq.01.pin
  -rw-rw-rw- 1 root root   356456500 Nov 26 14:52 sf.seq.01.psq
  -rw-rw-rw- 1 root root         235 Nov 26 14:52 sf.seq.pal
  -rwxrwxr-x 1 root root      374174 Jan 13  2010 sf.tb
  -rw-rw-r-- 1 root root    46716677 Aug 12 11:28 smart.HMMs
  -rw-rw-rw- 1 root root    24866461 Nov 26 14:53 smart.HMMs.bin
  -rw-r--r-- 1 root root       61440 Nov 26 14:53 smart.HMMs.inx
  -rw-rw-r-- 1 root root      111360 Mar  6  2009 superfamily.acc
  -rw-rw-r-- 1 root root   918426748 Mar  6  2009 superfamily.hmm
  -rw-rw-rw- 1 root root   488212761 Nov 26 14:53 superfamily.hmm.bin
  -rw-r--r-- 1 root root     1081344 Nov 26 14:52 superfamily.hmm.inx
  -rw-rw-r-- 1 root root      793082 Mar  6  2009 superfamily.tab
  -rw-rw-r-- 1 root root   489282946 Jan  6  2010 TIGRFAMs_HMM.LIB
  -rw-rw-rw- 1 root root   263794770 Nov 26 14:55 TIGRFAMs_HMM.LIB.bin
  -rw-r--r-- 1 root root      225280 Nov 26 14:55 TIGRFAMs_HMM.LIB.inx

Indizar las bases de datos

# index_data.pl -f interpro.xml -inx -v
 
# index_data.pl -f match_complete.xml -inx -v
 
# index_data.pl -f Pfam-A.seed -inx -v
 
# index_data.pl -f Pfam-C -inx -v
 
# index_data.pl -f prints.pval -inx -v
 
# index_data.pl -f sf.seq -inx -v
 
# index_data.pl -f sf_hmm -inx -v
 
# index_data.pl -f smart.HMMs -inx -v
 
# index_data.pl -f superfamily.hmm -inx -v
 
# index_data.pl -f TIGRFAMs_HMM.LIB -inx -v

Realizar pruebas de la instalación

# /opt/iprscan/bin/iprscan -cli -i /opt/iprscan/test.seq -o /opt/iprscan/test.out -format raw -goterms -iprlookup

Comparar el archivo generado /opt/iprscan/test.out con el provisto merged.raw.crc.

Solución de problemas

Undefined subroutine &Compress::Zlib::gzopen

Problema

Al intentar utilizar el cpan para instalar librerías se obtiene el siguiente mensaje de error.

Undefined subroutine &Compress::Zlib::gzopen called at /usr/lib/perl5/5.8.8/CPAN.pm line 5721.

Solución

# perl -MCPAN -e shell
 
   cpan> force install "Scalar::Util"
 
   cpan> quit

Enlaces

interproscan/instalacion.txt · Last modified: 2012/02/26 22:35 (external edit)