En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal AgroParisTech

MIA Paris

Logiciel

CRAN : http://cran.r-project.org

Segmentation :

AR1seg

This package corresponds to the implementation of the robust approach for estimating change-points in the mean of an AR(1) Gaussian process by using the methodology described in the paper arXiv 1403.1958

HiCseg

C. Lévy-Leduc. R package: HiCseg (available on the CRAN) which allows you to detect domains in HiC data. The methodology that is used in this package is described in the paper “Two-dimensional segmentation for analyzing HiC data” by C. Lévy-Leduc, M. Delattre, T. Mary-Huard and S. Robin, Bioinformatics, vol. 30, n.17, p. 386-392.

B. Benmammar, C. Lévy-Leduc, F. Roueff. TopRank software (developped in C for detecting and localizing network anomalies), registered at the “Agence pour la Protection des Programmes”, IDDN.FR.001.100004.000.S.P.2008.000.20700, in 2008.

Blockseg

SegCorr

Détection de régions corrélées dans des données d’expression, prenant en compte des variations du nombre de copies .

Segmentor3IsBack

Segmentor3IsBack is a package for the exact and fast segmentation of large profiles

Référence : 
Cleynen A, Koskas M, Lebarbier E, Rigaill G, Robin S (2013) Segmentor3IsBack: an R package for the fast and exact segmentation of Seq-data, Algorithm for Molecular Biology, submitted 

CGHseg

Segmentation methods for array CGH analysis

Référence : 
Picard F, Lebarbier E, Hoebeke M, Rigaill G, Thiam B, Robin S (2011) Joint segmentation calling and normalization of multiple CGH profiles, Biostatistics, vol. 12 pp.413-428

Modèles à structures cachées 

Phylogenetic-EM

sur GitHub. Détection de saut adaptatif dans l’histoire d’un trait quantitatif.

BlockModels

Le package se nome blockmodels, il permet de faire du V-EM dans LBM et SBM avec les PDFs bernoulli, poisson, et gaussian, avec covariables (et une version avec un developpement polynomial pour bernoulli avec covariable pour réduire d'un ordre de cplx et vectoriser les calculs), et multivarié dans le cas gaussien (sans covariables) (homosc indép, indép, ou quelconque).

HTSCluster 

Réseaux 

Saturnin

inférence du réseau de régulation de gènes chez Arabidopsis thaliana, inférence de réseaux écologiques

Méthodes d’inférence pour les modèles parcimonieux en grande dimension

EstHer 

sélection des SNP causaux pour l’autisme.

Divers

dbmss

Tools to characterize point patterns

Référence : Marcon E, Traissac S, Puech F, Lang G (2013) Tools to Characterize Point Patterns: dbmss for R, Journal of Statistical Software, submitted

EBS

EBS is a package for the exact Bayesian segmentation of profiles

Références : 
Rigaill G, Lebarbier E, Robin S (2012) Exact posterior distributions and model selection criteria for multiple change-point detection problems, Statistics and Computing, 22:917–929 
Cleynen A, Robin S (2013) Comparing change-point locations of independent profiles, Computational Statistics & Data Analysis, submitted 

HiLMM

Estimation of heritability with confidence intervals in linear mixed models.

MixThres

MixThres est un package permettant la définition d’un seuil d’hybridation à partir de modèles de mélange sur la distribution d’un signal:

Référence :
Picard F, Martin-Magniette M.L, Gagnot S, Brunaud V, Aubert J, Gendrel V, Robin S, Caboche M, Lecharny A, Colot V (oct 2008), MixThres: mixture models to define a hybridization threshold in DNA microarray experiments 
preprint.

MultiChIPmixHMM

Le package MultiChIPmixHMM est un package R disponible sur http://cran.r-project.org/src/contrib/Archive/MultiChIPmixHMM/. C'est un modèle de mélange de deux régressions linéaires permettant d'analyser simultanément plusieurs réplicats biologiques de données de ChIP-chip. Quand les données sont produites avec des puces tiling array, la dépendance spatiale entre les sondes peut-être pris en compte grâce à une modélisation de la variable latente par une chaîne de Markov d'ordre 1.

Référence : 
Martin-Magniette ML, Mary-Huard T, Berard C, Robin S (2008), ChIPmix: Mixture model of regressions for two-color ChIP-chip analysis, Bioinformatics, 24(16):i181-i186 
doi:10.1093/bioinformatics/btn280

TAHMMAnnot

Bidimensionnal Gaussian mixture model, HMM and Annotation for ChIP-chip IP/IP and Transcriptome data analysis. 

Référence : 
Bérard C, Martin-Magniette ML, Brunaud V, Aubourg S, Robin S (2011), Unsupervised Classification for Tiling Arrays: ChIP-chip and Transcriptome,Statistical Applications in Genetics and Molecular Biology, Vol. 10: Iss. 1, Article 50 
http://www.bepress.com/sagmb/vol10/iss1/art50

HMMmix

The HMMmixture package allows one to reduce a K-states HMM to a D-states HMM, with D < K.

VBMA4hmm

Variational Bayes Model Averaging for hidden markov models. 

anapuce2.2

anapuce2.2 est un package rassemblant des outils pour l’analyse de microarrays. Il permet :

  • d’effectuer la normalisation de puces deux couleurs : normalisation globale par une loess + soustraction de la médiane par bloc
  • d’effectuer l’analyse différentielle : variance spécifique / variance homogène / une variance par groupe de gènes (méthode varmixt proposée par P. Delmar) + prise en compte de la multiplicité des tests via l’utilisation de la fonction p.adjust.
  • de calculer un FDR local à partir de pvalues brutes. Le FDR local associé à chaque gène mesure la probabilité que ce gène soit un faux positif.
  • de calculer le Label Bias Index. Cet index constitue une mesure globale du biais de marquage spécifique au gène. Un minimum de deux lames jaunes est nécessaire.

Références : 
Aubert J, Bar-Hen A, Daudin J.J, Robin S (2004), Determination of the differentially expressed genes in microarrays experiments using local FDR, BMC Bioinformatics 2004, 5:125. 
doi:10.1186/1471-2105-5-125 
Martin-Magniette M.L, Aubert J, Cabannes E, Daudin J.J (2005), Evaluation of the gene-specific dye bias in cDNA microarray experiments, Bioinformatics, 21(9), 1995-2000. 
doi:10.1093/bioinformatics/bti302

anapuce dispose d'une page Wiki.
La version 2.2 a été compilée avec la version 2.11.1 de R [MAJ 17/08/10]

varmixt0.2-4

Le package varmixt était un package définissant un modèle de mélange sur les variances dans le cadre de la recherche de gènes différentiellement exprimés entre deux conditions. Il n'est plus maintenu. La méthode est implémentée dans le package anapuce (fonction est.varmixt) et les fonctions DiffAnalysis.unpaired et DiffAnalysis permettent d'effectuer une analyse différentielle entre deux conditions en utilisant varmixt.

Référence : 
Delmar P, Robin S, Daudin J.J (2005), VarMixt: efficient variance modelling for the differential analysis of replicated gene expression data, Bioinformatics 2005 Feb 15;21(4):502-8. 
doi:10.1093/bioinformatics/bti023

MixNet

Le modèle Mixnet est un modèle de mélange pour graphes aléatoires (orientés ou non). Il vise à détecter des groupes de sommets ayant des profils de connexion similaires. L'estimation des paramètres est effectuée selon une méthode variationnelle qui permet de maximiser la vraisemblance approchée des données.

Mixnet is C++ package based on a probabilistic model for heterogeneous random graphs. This model is based on the hypothesis that real networks are made of classes of vertices which show specific connectivity patterns. Mixnet compute variationnal estimates of the parameters and a statistical criterion, ICL to select the number of classes.

Références : 
Daudin, J.-J., Picard, F., Robin, S.,  Mixture model for random graphs, Statistics and Computing, 2008.
Picard, F., Miele, V., Daudin,J-J., Cottret,L., Robin, S., Deciphering the connectivity structure of biological networks using MixNet, BMC Bioinformatics , Suppl 6, S17,2009, http://www.biomedcentral.com/1471-2105/10/S6/S17

wmixnet

Le Stochastic Block Model avec covariables est une extention du Stochastic Block Model qui a déjà fait l'objet d'une implémentation (MixNet, cf section précedente).

Ce modèle vise à estimer l'effet des covariables et à regrouper les sommets ayant des profils de connexion similaires conditionnellement aux covariables.

L'estimation est effectuée au moyen d'un EM variationel afin de maximiser une approximation de la vraissemblence des données. Le choix du nombre de groupe est effectuée avec le critère ICL.

Cette implémentation est effectuée en C++, liée avec des bibliothèques de calcul matriciel, et parralellisée.

Download and installation procedurepdf - 63,64 ko

The Stochastic Block Model with covariates is a extention of the Stochastic Block Model which is already implemented (MixNet, see below).

The aim of this model is to estimate the covariate effects, and grop vertices which have same connectivity profile conditionnaly to covariates.

The estimation is done by a variationnal EM to maximize a approximation of liklelihood, and the number of groups is choosen by the ICL criterion.

This program is written in C++, linked with algebra libraries, and parralellized.

SelvarClust

SelvarClust is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SR modeling proposed by Maugis et al. (2009) in Biometrics. This software allows us to study data where individuals are described by quantitative block variables. It returns a data clustering and the selected model, composed of the number of clusters, the mixture form and the variable partition.

SelvarClustMV is a software implemented in C++ with object-oriented programming. It is an extension of SelvarClust, it is devoted to the variable selection in model-based clustering allowing for missing value (Maugis-Rabusseau et al.(2012) in Journal de la SfdS. Currently, this software is proposed for Gaussian mixtures whose variance matrices are assumed to be identical and free (m=[pkLC]).

SelvarClustIndep is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SRUW modeling proposed by Maugis et al. (2009) in CSDA. The SRUW modeling takes into account three possible roles for each variable: relevant, redundant and independent. This software allows to study datasets where observations are described by quantitative variables. It returns a data clustering and the selected model composed of the number of clusters, the mixture form, the variance matrix form for the linear regression and the independent Gaussian density, and the variable partition.

Modèle C-Mixnet et ses applications

  • Package MATLAB [.zip] NECESSITE la ToolBox Optimisation
  • La présentation [.pdf]
  • Le rapport de stage [.pdf] d'Emeric Thibaud (juin 2009) encadré par Jean-Jacques Daudin.

Référence : 
Daudin, J.-J., Pierre, L., Vacher, C.,  Model for Heterogeneous Random Networks Using Continuous Latent Variables and an Application to a Tree-Fungus Network, Biometrics 66,1043-1051, December 2010.