Partenaires



UNIVERSITE

PARIS DESCARTES

MAP5

Pages personnelles

Accueil

fsaLib : finite state automaton Library

Représentation au format dot de l'automate non déterministe associé à l'expression régulière
(a|c|g|t)*(a|cc|ggg|acgt)(a*|g*)
  • Partie mathématique : CR-CNRS Grégory NUEL (MAP5)
  • Partie pilotage (architecture, intégration, développement, tests, archivage et déploiement) : IR-CNRS Vincent DELOS (MAP5)

fsaLib permet de créer des automates déterministes ou probabilistes à partir d'expressions régulières ou de PSSM (Position Specific Scoring Matrix) et de procéder à un comptage d'occurences, chevauchantes ou renouvelantes, par exemple dans de volumineuses bases génétiques.

Exemple avec l'alphabet DNA par défaut (lettres a,c,g,t) :
./countmotif -p "at((a|c)(t|g)){1,4}a{4,5}tg" -f ./fasta/human_chr10.fasta
./countmotif -p "tta((gg)|(cctt)){2,3}a{1,2}gcat" -f ./fasta/human_chr10.fasta -r

Version 0.7.0:
-v [--version] : Give the current version.
-r [--renewal] : Print a count of renewal matching positions (the default mode is overlapping).
-s [--by-sequence] : Print all matching positions for each sequence.
-p [--pattern] ARG : Give a pattern coded as a regular expression.
-f [--fasta-file] ARG : Provide the fasta file to load the sequence.
--pssm ARG ARG : Provide the PSSM file and the non-negative threshold.

Parcourez la documentation doxygen+LaTeX.