AnalyseLexicale.incrementielle.htm

﻿<html>
	<head>
		<title>Analyse lexicale incrémentielle</title>
		<style>
SECTION { margin-left: 1em; }
.text {
	border: 1px solid #000;
	box-sizing: border-box;
	display: inline-block;
	padding: 4px;
	vertical-align: middle;
	white-space: nowrap;
	}
.sentence {
	border: 2px solid #000;
	box-sizing: border-box;
	display: inline-block;
	padding: 4px 2px;
	white-space: nowrap;
	vertical-align: middle;
	}
.sentence .word {
	float: left;
	}
.text .sentence .word,
.text .sentence .sentence {
	float: none;
	}
.word {
	background-color: #FFF;
	background-image: url(img/turing.png);
	border: 1px solid #000;
	box-sizing: border-box;
	display: inline-block;
	height: 20px;
	margin: 0 2px;
	vertical-align: middle;
	}
.caret {
	background-color: blue;
	display: inline-block;
	height: 20px;
	margin: 0 2px;
	width: 2px;
	vertical-align: middle;
	}
.red { background-color: red; }
.lime { background-color: lime; }
.yellow { background-color: yellow; }

.length1 { width:20px; }
.length2 { width:40px; }
.length3 { width:60px; }
.length4 { width:80px; }
.length5 { width:100px; }
.length10 { width:200px; }
		</style>
	</head>
	<body>
<a href="index.htm">Index</a>

<h1>Analyse lexicale incrémentielle</h1>
<p><a href="Lexers.performance.scan.incremental.htm">Performance</a></p>
<p>
	Cette tâche consiste à réaliser une analyse partielle d'un texte source en utilisant le résultat d'une précédente analyse.<br> 
	<b>Finalité</b>: Optimiser les performances du lexer pour un éditeur de texte.
</p>


<h2>Préambules</h2><section>
	<h3>L'analyse lexicale</h3><section>
		<p>
			L'analyse lexicale retourne une structure (arborescente).<br>
			Chaque éléments de la structure ont les attributs :
		</p>
		<ul>
			<li>index</li>
			<li>ligne de départ</li>
			<li>ligne de fin</li>
		</ul>
	</section>
	<h3>Données de départ</h3><section>
		<ul>
			<li>Résultat d'une analyse lexicale d'un texte</li>
			<li>Texte modifié</li>
			<li>Index du début de la modification dans le texte</li>
			<li>Nombre de caractères effacés</li>
			<li>Nombre de caractères ajoutés</li>
		</ul>
	</section>
	<h3>Etapes générales</h3><section>
		<ol>
			<li>Recherche de l'élément le plus profond à l'index indiquée</li>
			<li>Suppression au moins des éléments inclus dans l'intervalle effacé...</li>
			<li>Initialisation du scanner, détermination:
				<ol>
					<li>de l'index et la ligne courante</li>
					<li>du token fin d'analyse = premier élément suivant les tokens éffacés</li>
					<li>de la pile des ancêtres</li>
				</ol>
			</li>
			<li>Réalisation de l'analyse lexicale incrémentielle</li>
			<li>Mise à jour des valeurs du token fin d'analyse (concernant sa position dans le texte source), 
				ainsi que celles des tokens suivants et des tokens ancêtres.</li>
			<li>Retour du résultat :
				<ul>
					<li>Ligne où débute les modifications</li>
					<li>Ligne où finie les modifications (dans l'ancienne source)</li>
					<li>Décalage de ligne = (nouveau-ancien) "nombre de ligne du texte source"</li>
				</ul>
			</li>
		</ol>
	</section>
</section>

<h2>Principes</h2><section>
	<h3>Recherche d'un élément à un index</h3><section>
		<p>On effectue une recherche dichotomique récursive depuis la racine de la structure lexicales.</p>
	</section>
	<h3>Suppression des éléments</h3><section>
		<p>Au tout début de l'analyse est effacé:</p><ul>
			<li>Le premier élément trouvé à l'index de la modification</li>
			<li>Les éléments à gauche tant qu'ils ne sont pas des espaces.</li>
			<li>Les éléments à droite tant qu'ils ne sont pas des espaces et qu'ils font parties de l'intervalle effacé.</li>
		</ul>
		<p>Lors de la suppression d'un élément, son élément parent est effacé à la place, si celui-ci est :</p><ul>
			<li>une limite de parent <p>
					<div class="sentence">
						<div class="word length1 red"></div>
						<div class="word length4"></div>
						<div class="word length1"></div>
						<div class="word length5"></div>
						<div class="word length1 red"></div>
					</div>
					 ou 
					<div class="sentence">
						<div class="word length2 red"></div>
						<div class="word length4"></div>
						<div class="word length1"></div>
					</div>
				</p>
			</li>
			<li>un enfant d'un élément ayant subit un double scannage <p>
					<div class="sentence red">
						<div class="word length1"></div>
						<div class="word length4 red"></div>
						<div class="word length5"></div>
					</div>
				</p>
			</li>
		</ul>
	</section>
	<h3>Gestion du token fin analyse</h3><section>
		<p>
			Ce token change au <b>token suivant</b> si l'analyse le dépasse.<br>
			Si le lexer trouve un <b>token identique</b> alors :
		</p>
		<ul>
			<li>L'analyse est stoppée, l'élément trouvé est abandonné.</li>
			<li>Les valeurs du token fin d'analyse sont <b>mises à jour</b>, 
				ainsi que celles des tokens suivants et des tokens ancêtres.</li>
		</ul>
		<h4>Tokens identiques ?</h4><section>
			<p>
				On compare un token pas ajouté issu de l'analyse incrémentielle,
				à un token issu de l'analyse précédente.<br>
				Les valeurs de positionnement ne sont évidemment pas encore mise à jour dans l'ancienne analyse.<br>
				Est considéré identique les tokens ayant:
			</p>
			<ul>
				<li>le même nom</li>
				<li>la même valeur</li>
				<li>le même index: 
					on ajoute à l'index du token de l'ancienne analyse, le décalage en nombre caractère.<br>
					Ce nombre est égal au nombre de caractère ajouté moins le nombre de caractère effacé.
				</li>
			</ul>
			<p>Pour finir, on contrôle qu'ils auront bien le même parent.</p>
		</section>
		<h4>Token suivant ?</h4><section>
			<ol>
				<li>L'enfant suivant si il y en a un. 
						<div class="text">
							<div class="word length1"></div>
							<div class="word length1 red"></div>
							<div class="word length2 lime"></div>
							<div class="word length1"></div>
						</div>
					</li>
				<li>Le token suivant le token parent sinon.
						<div class="text">
							<div class="sentence">
								<div class="word length2"></div>
								<div class="word length1 red"></div>
							</div>
							<div class="word length1 lime"></div>
						</div>
					</li>
				<li>... et ainsi de suite.</li>
				<li>sinon il n'y en a pas une fois la racine atteinte.</li>
			</ol>
			<p>On utilise le même principe pour le token précédant.</p>
		</section>
		<h4>Mises à jour ?</h4><section>
			<p>
				Elles dépendent du décalage d'index et de ligne à appliquer,  
				et du <b class="red">token fin analyse</b>.
			</p>
			<ul>
				<li>La seule valeur mise à jour pour les  <b class="yellow">tokens ancêtres</b> au token fin analyse est <b>la ligne de fin</b>.</li>
				<li>Les valeurs mises à jour pour les  <b class="lime">tokens suivants</b> sont <b>l'index, la ligne de départ et de fin</b>.</li>
				<li>Si un token suivant est aussi un token parent, ses enfants sont mises à jour.</li>
			</ul>
			<p>
				<div class="text yellow">
					<div class="word length2"></div>
					<div class="sentence yellow">
						<div class="word length1"></div>
						<div class="word length2 red"></div>
						<div class="sentence lime">
							<div class="word length1 lime"></div>
							<div class="word length5 lime"></div>
							<div class="word length1 lime"></div>
						</div>
						<div class="word length2 lime"></div>
						<div class="word length1 lime"></div>
					</div>
					<div class="word length2 lime"></div>
				</div>
			</p>
		</section>
	</section>
</section>

	</body>
</html>