Saturday, May 30, 2015

Prédiction de profil de restriction//Macherki M E

La digestion enzymatique d’un fragment d’ADN par des enzymes de restriction est une manipulation très rependu dans les analyses génétique. Comme tout procédé d’analyse, il y avait un but et des contraintes :
+Un résultat parfait qui répond à la question dans ce cas : quel est le nombre des bondes à trouver avec cette digestion ?
-Quel sera le résultat sachant qu’on utilise un gel d’agarose 1%(les bonde visualisées sont comprises entre 50 et 1000 paires des bases) ?
C’est question est typique disant académique pour apprendre la manipulation des séquences avec un logiciel. Nous proposons l’algorithme suivant élaborer avec le langage R  juste avec une fonction de trois lignes.


library("seqinr")
  mon_fonction_digestion<-function(Sequence,Marqueur){
  position<-unlist(gregexpr(Marqueur,c2s(Sequence))) ###en majuscule
  stripchart(diff(position)[diff(position)<1000& diff(position)>100],vertical = T,ylim=c(50,1050))
    }

Avec  Sequence: un vecteur contenant la séquence à analyser.
         Marqueur: la séquence palindromique (mode char)de l'enzyme de restriction

Exemple
se<-ec999[[1]] # un exemple de séquence
mr<-"ata"## un exemple de marquer
mon_fonction_digestion(se,mr)

Macherki M E:R course and applications in genomic 2014

Tuesday, May 26, 2015

Application de filtre linaire dans l’analyse de génome//Macherki M E

L’application de filtre linaire pour de série temporelle est très applicable. Dans le cas des acides nucléiques, il est très simple d’appliqué un tel genre d’analyse en utilisant un logicielle simple d’analyse tel que R. Le vecteur contenant les positions d’un oligo dans une séquence est la base de l’analyse en appliquant la fonction diff qui permettre de déterminer alors la distance entre deux oligo consécutif soit disant un dérivative de premier dégrée. En utilisant la fonction lm entre la somme cumulatif (position) de dérivatif et le vecteur normal, nous pouvons exprimer de  façon globale la fréquence de l’oligo étudié. Le graphique de résiduelle permet de schématiser la structure de chromosome avec détaille (origine et  terminus pour une bactérie par exemple E.coli K12 en utilisant l'oligo ‘GGG’  fig).

Il est simple de déterminer la valeur originale sur la séquence par juste une étape de retour en arrière. L’intérêt de filtre linéaire est plus clair si en va effectuer un alignement des séquences. Notant que la fréquence d’un oligo de la séquence à alignée est bien connu, en appliquant un retour en arrière    selon le coefficient de corrélation de séquence cible, nous pouvons  déterminer un intervalle ou la séquence sera exister. En utilisant plusieurs oligos (exemple pour n=5), nous somme capable de  prédire l’emplacement avec une exactitude parfaite.
Macherki M E:R course and applications in genomic 2014