close

Вход

Забыли?

вход по аккаунту

1231079

код для вставки
,pdfcreator=HAL,pdfproducer=PDFLaTeX,pdfsubject=Computer Science [cs]/Human-Computer
Interaction [cs.HC]
Adaptations et applications de modèles mixtes de
réseaux de neurones à un processus industriel
Georges Schutz
To cite this version:
Georges Schutz. Adaptations et applications de modèles mixtes de réseaux de neurones à un processus
industriel. Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2006. Français.
�tel-00115770�
HAL Id: tel-00115770
https://tel.archives-ouvertes.fr/tel-00115770
Submitted on 23 Nov 2006
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Département de formation doctorale en informatique
UFR STMIA
École doctorale IAEM Lorraine
Adaptations et applications de modèles
mixtes de réseaux de neurones à un
processus industriel
THÈSE
présentée et soutenue publiquement le 5 octobre 2006
pour l’obtention du
Doctorat de l’université Henri Poincaré – Nancy 1
(spécialité informatique)
par
Georges Schutz
Composition du jury
Président :
...
Rapporteurs :
Louis WEHENKEL
Gilles VAUCHER
Claude GODART
Professeur, Université de Liège, Belgique
Professeur, Supélec, Campus de Rennes, France
Professeur, Université Henri Poincaré Nancy 1, France
Examinateurs :
Frédéric ALEXANDRE
Serge GILLÉ
Jean-Claude BAUMERT
Directeur de recherche, INRIA-Lorraine, France
Ingénieur de recherche, CRP Henri Tudor, Luxembourg
Ingénieur de recherche, ProfilARBED Recherche, Luxembourg
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503
Mis en page ave la lasse thloria.
Remer iements
En premier lieu j'aimerais remer ier les deux personnes qui ont en adré e travail :
Frédéri ALEXANDRE, mon dire teur de thèse et responsable de l'équipe Cortex au LORIA de Nan y
et Serge GILLÉ du Centre de Re her he Publi Henri Tudor au Luxembourg et responsable de l'équipe
d'a ueil MODSI. Il m'ont aidé par de nombreuses dis ussions et par beau oup de soutien s ientique et
moral.
Un mer i va également à Jean-Claude BAUMERT, responsable du projet de re her he hez ProlARBED Re her he, pour la ollaboration et les aides au niveau de l'appli ation industrielle.
Je tiens aussi à remer ier les membres du jury : Louis WEHENKEL, Professeur à l'Université de Liège,
Gilles VAUCHER, Professeur à Supéle et Claude GODART, Professeur à l'Université Henri Poin aré
de Nan y.
Même si durant toutes es années de thèse je n'étais que rarement présent à Nan y, je remer ie les
membres de l'équipe Cortex pour leur a ueil haleureux et les dis ussions fru tueuses.
Etant membre de l'équipe de modélisation et de simulation au LTI à Es h sur Alzette, j'étais toujours
épaulé par Serge, Émmanuelle, David, Gaston et Salime. Un grand mer i aussi à Frank, Daniel et Oli.
Pendant de nombreuses dis ussions non pas purement s ientiques, on a passé des moments agréables.
J'aimerais remer ier Jos SCHÄFFERS, dire teur du Laboratoire des Te hnologies Industrielles, pour
m'avoir réservé une pla e au sein de son laboratoire.
Diverses personnes ont ontribué dire tement dans le adre de leur travail de n d'études à ma thèse
et j'aimerais les remer ier : Magalie LEMASSON, David MARCUS et Nata ha SCHAAF.
Je ne veux pas oublier i i le personnel de ProlARBED Re her he et ProlARBED Es h-Belval sans
lequel e travail n'aurait pas été réalisable.
Un grand mer i aussi à Annie MICHAELY, Carine et Gaston SCHUTZ pour leur aide dans le domaine
de la grammaire et de l'orthographie française.
Je remer ie aussi l'État Luxembourgeois pour m'avoir a ordé une bourse formation re her he.
Il est évident que j'ai oublié l'une ou l'autre personne et je les prie de bien vouloir m'en ex user.
i
ii
Je dédie
ette thèse à mes parents Carine et Gaston SCHUTZ, qui ont fait tout leur possible pour me donner
l'opportunité de faire des études,
à ma
onjointe Frutz, qui m'a soutenu pendant
ette période.
iii
iv
Table des matières
Introdu tion
ix
Chapitre 1
Le projet industriel
1.1 Le projet européen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Le rle des partenaires . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 La relation projet-thèse . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Le pro essus industriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 L'installation industrielle . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Les a teurs humains . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Le déroulement standard du pro essus . . . . . . . . . . . . . . . .
1.3 Les données du pro essus . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Le système d'a quisition de données . . . . . . . . . . . . . . . . .
1.3.2 La gestion des données . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Aperçu sur le on ept de ontrle prédi tif basé sur une aide à la dé ision
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 2
. 3
. 3
. 3
. 3
. 8
. 8
. 9
. 10
. 12
. 14
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Chapitre 2
Réexions sur le
onnexionnisme
2.1 Quelques bases . . . . . . . . . . . . . . . . . . .
2.2 La onnaissan e dans le onnexionnisme . . . . .
2.2.1 Le modèle boîte-noire s'explique . . . . .
2.2.2 Catégorisation et lassi ation . . . . . .
2.3 Le temps et le onnexionnisme . . . . . . . . . .
2.3.1 L'appro he spatio-temporelle . . . . . . .
2.3.2 Les réseaux ré urrents . . . . . . . . . . .
2.4 Le ontrle et le onnexionnisme . . . . . . . . .
2.4.1 Le ontrle par apprentissage supervisé .
2.4.2 Le ontrle par modèle inverse . . . . . .
2.4.3 Stru ture de ontrle ave modèle interne
2.5 Con lusion de e hapitre . . . . . . . . . . . . .
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
21
22
23
28
29
30
31
32
32
32
34
Table des matières
Chapitre 3
Analyse de séries temporelles
3.1 Quelques spé i ités des données temporelles . . . . . . . . .
3.1.1 Le odage de données . . . . . . . . . . . . . . . . . .
3.1.2 Indexation de données . . . . . . . . . . . . . . . . . .
3.1.3 Lo alisation de séquen es . . . . . . . . . . . . . . . .
3.2 Un odage adapté aux données . . . . . . . . . . . . . . . . .
3.2.1 Le signal arti iel . . . . . . . . . . . . . . . . . . . .
3.2.2 Extra tion des formes primitives . . . . . . . . . . . .
3.2.3 En odage basé sur les formes primitives . . . . . . . .
3.2.4 Appli ation aux données du pro essus industriel . . .
3.3 Classi ation de séries temporelles de tailles variables . . . .
3.3.1 Parti ularités et problématiques . . . . . . . . . . . .
3.3.2 Mesures de similarité . . . . . . . . . . . . . . . . . . .
3.3.3 Classi ation non-supervisée basée sur des prototypes
3.4 Con lusion du hapitre . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
36
36
38
39
39
40
40
43
46
51
53
55
69
84
4.1 Classi ation d'évolutions en ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Lo alisation de sous-séquen es basées sur la similitude . . . . . . . . . . . . . . . .
4.1.2 L'environnement arti iel de test . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Simulation de la re her he de prototypes dans le ontexte de l'évolution temporelle
4.1.4 Résultats pour l'environnement arti iel . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Appli ation de la méthode au pro essus industriel . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Premier y le ave un omportement quasi optimal . . . . . . . . . . . . . . . . . .
4.2.2 Deuxième y le ave potentiel d'amélioration . . . . . . . . . . . . . . . . . . . . .
4.2.3 Troisième y le à omportement ex eptionnel . . . . . . . . . . . . . . . . . . . . .
4.2.4 L'utilisation des ritères d'optimisation . . . . . . . . . . . . . . . . . . . . . . . .
4.2.5 Quand la bou le se ferme ! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Con lusion du hapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
89
93
95
101
101
103
106
107
112
113
114
Chapitre 4
Un
ontrle prédi tif basé sur une aide à la dé ision
Chapitre 5
Con lusions et perspe tives
Annexes
Annexe A Détails te hniques du système d'a quisition et de gestion de données
A.1 Système d'a quisition sur site
A.2 Gestion de données . . . . . .
A.2.1 Gestion primaire . . .
A.2.2 Gestion se ondaire . .
vi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
119
119
119
120
Annexe B Analyse de l'apprentissage d'une SOM
123
Annexe C Validation d'alphabets
127
C.1
C.2
C.3
C.4
La varian e intra- lasse umulée . . . . .
L'index de Davies et Bouldin . . . . . . .
Exemples arti iels . . . . . . . . . . . . .
Appli ation à la validation des alphabets .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
128
129
130
131
Glossaire
141
Bibliographie
143
vii
Table des matières
viii
Introdu tion
Des analyses internationales réalisées par Tufte [58℄ montrent que 75% des graphiques présentés dans
les périodiques renommés représentent des séries temporelles. Ces graphiques traitent pratiquement tous
les domaines, qu'ils soient de nature s ientique, é onomique ou en ore privée. Les séquen es temporelles
d'informations numériques sont aussi un sujet d'a tualité dans beau oup de domaines de re her he,
entre autres eux de la biologie, de la himie ave omme exemple les réa tions bio- himiques, de la
méde ine (signaux ardiaques). On les retrouve également dans les domaines te hnologiques par exemple
l'automatisation, ou en ore dans les domaines plus fondamentaux tels les mathématiques ou les s ien es
informatiques (traitement d'information).
Indépendamment de l'appli ation industrielle spé ique qui sera analysée dans le ontexte de e travail,
la dimension temporelle est un aspe t primaire de beau oup de pro essus industriels pour qui aussi bien le
ontexte a tuel que l'ordre et l'historique d'événements antérieurs sont apitaux. L'évolution temporelle
et la dimension temporelle en globalité sont des sujets a adémiques permanents, e qui est souligné par
l'étude de Tufte.
Keogh [30℄ soulève les propriétés suivantes omme étant des problématiques spé iques auxquelles il
faut se préparer en abordant le traitement de données temporelles. Elles seront mises en ontexte dans
la suite.
Il faut savoir manipuler de gros volumes de données de façon e a e.
Il donne les exemples suivants : le volume de données enregistré pour une heure d'ECG (éle troardiogramme) est de 1 Gigabyte, l'enregistrement du suivi d'un serveur web standard est de 5
Gigabytes par semaine et la base de données du Spa e Shuttle est de 158 Gigabytes.
La méthode la plus répandue pour aronter ette propriété est la rédu tion de données en utilisant
des odages appropriés. Le dé, dans la rédu tion du volume de données, onsiste à augmenter
l'e a ité du traitement de es dernières, tout en évitant de perdre des informations substantielles
pour des utilisations ultérieures.
Il faut être prêt à aronter le thème de la subje tivité.
L'interprétation de l'aspe t temps est diérente pour haque domaine d'appli ation, pour haque
tâ he on rète et même pour haque individu. Cela né essite une grande exibilité d'adaptation
pour des méthodes qui ont l'ambition d'être génériques. Selon Keogh, 'est une des raisons pour
laquelle des outils ou méthodes peuvent donner d'ex ellents résultats dans un ertain domaine et
en même temps ne pas être utilisables dans un autre ontexte.
Du point de vue s ientique et te hnologique, ela peut poser des problèmes au niveau de l'évaluation
des appro hes, puisque souvent les performan es de diérentes appro hes ne sont pas vraiment
omparables.
Il faut aborder les domaines de l'a quisition et de la gestion de données temporelles.
Fusionner divers formats d'information, analyser des mesures é hantillonnées de manière diérente,
maîtriser des données bruitées ou ontenant des valeurs manquantes voire erronées sont des problématiques lassiques et inévitables dans e domaine. Il faut en être ons ient et savoir gérer e genre
de problèmes qui peuvent avoir des inuen es non-négligeables sur les résultats d'analyses.
Dans e travail, es sujets se retrouvent à diérents niveaux et vont être soulevés dans la suite.
De façon générale, la dimension temporelle est un sujet important dans le domaine onnexionniste,
qui sera spé ialement analysé dans e travail et qui s'intéresse aussi de manière plus fondamentale à ette
dimension. En eet, le système nerveux, qui depuis toujours inspire e domaine, est un système dynamique
ave des pro essus hautement parallélisés pour lequel il est bien onnu que les aspe ts temporels jouent un
ix
Introdu tion
rle important à diérents niveaux du système. Cependant, in orporer ette dimension temporelle dans
des appro hes onnexionnistes n'est pas une tâ he triviale et parmi les diverses appro hes a tuellement
disponibles, ha une a ses avantages et ses désavantages. Les réseaux, dits dynamiques, ou réseaux à
spikes, ne sont pas pris en ompte dans ette étude. L'étude se limite aux appro hes spatiotemporelles
qui sont basées sur la représentation spatiale du temps. Ces réseaux de neurones sont onnus pour leur
robustesse au bruit et leurs propriétés non-linéaires. Il est don important de savoir adapter ette gamme
de modèles à es phénomènes si importants et en ore mal maîtrisés, les séquen es temporelles.
A té de ette dimension temporelle un autre sujet sera parti ulièrement abordé dans e travail. Il
est question de la lassi ation non-supervisée dans le ontexte de l'extra tion de onnaissan es. Dans
notre travail, la lassi ation se retrouve à deux niveaux : le premier se situe au niveau du odage où ette
méthode est utilisée an de réaliser un odage qui s'adapte de façon non-supervisée aux signaux analysés.
A e premier niveau, une méthode bien onnue du domaine onnexionniste est utilisée, il s'agit de la
arte auto-organisatri e (SOM) de Kohonen [36℄. Le deuxième re ours à la lassi ation non-supervisée
se retrouve au niveau de la re her he de omportements typiques dans des séquen es temporelles. Sans
aller trop dans le détail i i, une parti ularité à e deuxième niveau est que les séries temporelles qu'il
s'agit de répertorier peuvent avoir des tailles arbitraires et qu'en plus, une ertaine souplesse temporelle
dans la omparaison des évolutions est indispensable.
Dans le as présent, les données proviennent de mesures du monde réel ee tuées dans un environnement de l'industrie lourde sur lequel nous allons revenir. Or e genre de milieu est souvent hostile au
traitement et au transfert de signaux et entraîne des données bruitées. De plus il est di ile de garantir
la abilité des mesures, puisque des apteurs peuvent ou se dégrader ou mal fon tionner pendant des
périodes de temps arbitraires. A e niveau on peut faire le lien ave la problématique de l'a quisition et
de la gestion de données temporelles évoquée par Keogh.
Une autre di ulté à laquelle on peut être onfronté dans le domaine du traitement de séquen es
temporelles est la variation en taille et en forme de telles séquen es, même si elles représentent des phénomènes similaires. I i la problématique de la subje tivité évoquée par Keogh se retrouve. An d'illustrer
la situation voi i un exemple simple : faire bouillir de l'eau en utilisant un ré haud au gaz. Cet exemple
est utilisé à ause de sa proximité au pro essus analysé dans le ontexte de e travail. Supposons que
les variables mesurées sont d'un té une mesure temporelle (le débit de gaz tout au long du pro essus)
et d'un autre té deux mesures pon tuelles (la température et la quantité d'eau bouillante à la n du
pro essus). Le résultat de e pro essus dépend de plusieurs paramètres : les plus importants peuvent être
la quantité et la température initiale de l'eau qu'il s'agit de ré hauer, la qualité du gaz utilisé et le
type de ré haud ainsi que le ré ipient utilisé. Une température initiale faible et une quantité d'eau plus
importante vont prolonger le pro essus. Un gaz ave une puissan e alorique plus élevée va diminuer la
durée du pro essus. Mais il y en a d'autres omme la omposition de l'eau, la température ambiante ou
en ore la température initiale du ré ipient ainsi que les paramètres aloriques de e dernier. Une eau
moins salée va prolonger le pro essus tandis qu'une température ambiante plus élevée réduit la durée du
pro essus. Le phénomène représenté "faire bouillir de l'eau" est toujours le même mais la durée du pro essus, la onsommation de gaz ainsi que la température et la quantité nale d'eau dépendent fortement des
paramètres. Dans un environnement de type laboratoire, on peut supposer qu'il est possible de ontrler
tous es paramètres an de produire un pro essus plus ou moins semblable et don reprodu tible. Cependant dans un environnement industriel ela n'est que di ilement réalisable ar le fournisseur de l'eau et
elui du gaz sont dépendants du mar hé et en plus la température ambiante dans un hall industriel varie
ave les saisons et ave la météo. Selon les ir onstan es, il est imaginable qu'il n'est même pas possible
d'atteindre la température né essaire pour faire bouillir l'eau.
Surtout, dans un tel ontexte industriel, nous n'avons pas né essairement onnaisan e de l'ensemble
des variables pertinentes ni des lois physiques omplexes qui les relient. Cher her à a quérir et représenter
es variables et dé ouvrir les relations temporelles qui les relient sera don préalable à toute proposition
de fon tionnement.
Dans e travail nous allons nous intéresser à un aspe t spé ique du traitement de es signaux qui
est souvent dé rit ave le terme de fouille de données. Ce terme, même s'il est abusivement utilisé dans
divers ontextes, représente bien de quoi il est question dans e travail.
Nous her hons des méthodes pour aborder les problèmes de fouille de données temporelles an
d'extraire de es données des onnaissan es sur la nature, le omportement et les propriétés du pro essus
x
sous-ja ent qui est la sour e de es données. Nous allons étudier l'appli ation de es méthodes ave un
partenaire industriel en nous basant sur un pro essus industriel relativement omplexe.
Au niveau appli atif, le but est d'aider le partenaire industriel d'un té à mieux omprendre le
omportement de son installation et d'un autre té à utiliser ette onnaissan e an de lui fournir des
outils en vue de pouvoir réduire les oûts de fon tionnement de son installation.
Un des obje tifs de tout travail de thèse est que les méthodes qui seront proposées et appliquées soient
aussi génériques que possible et de e fait puissent avoir un intérêt au-delà du travail et de l'appli ation
utilisée pour analyser et valider les méthodes.
Contexte et positionnement du travail de thèse
Le travail de thèse qui est présenté a été réalisé dans le ontexte d'un projet de re her he industriel
subventionné par la CECA1 , auquel quatre partenaires européens ont parti ipé. Le projet sera dé rit dans
le hapitre 1, mais an de pouvoir positionner e travail, quelques détails du projet sont utiles. Dans la
dénition du projet, quatre obje tifs prin ipaux étaient spé iés : le développement de onnaissan es sur le
omportement d'une installation sidérurgique, la reprodu tibilité du pro essus, l'amélioration du ontrle
et la minimisation de oûts de fon tionnement de l'installation. An d'atteindre es buts, il a été spé ié
que le pro essus sera appro hé par diérentes méthodes en parallèle. Une des méthodes spé iées dans la
dénition du projet était les réseaux de neurones ou plus globalement les appro hes onnexionnistes. C'est
pour ette raison que le Centre de Re her he Publi Henri Tudor (Luxembourg), un des partenaires
du projet, a élaboré un ontrat de sous-traitan e ave l'équipe CORTEX du Laboratoire Lorrain de
Re her he en Informatique et ses Appli ations (LORIA) de Nan y (Fran e). Issu de ette ollaboration
est entre autre le travail de thèse qui est exposé dans e manus rit.
Deux sujets prin ipaux de e travail de thèse dé oulent dire tement des obje tifs et de l'orientation
méthodologique de la partie du projet abordée dans ette étude. Il s'agit du développement de onnaissan es et des appro hes onnexionnistes. Cela oriente e travail vers un domaine spé ique de l'intelligen e
arti ielle qui est ara térisé par les mots lefs omme l'extra tion de onnaissan es, la lassi ation nonsupervisée et le onnexionnisme.
Un troisième sujet qui joue un rle majeur dans e travail dé oule des propriétés du pro essus industriel
qui est analysé dans le adre du projet. En eet, il s'agit d'un pro essus y lique qui se situe au début
d'une haîne de produ tion d'a ier basée sur le re y lage de métaux. Il est question d'un pro essus
de fusion de mitrailles an de produire de l'a ier liquide qui est utilisé dans la suite de la haîne de
produ tion. Des observations ainsi que des dis ussions ave les experts de l'installation indiquent que
le omportement du four dépend fortement de l'évolution temporelle de l'installation dans sa totalité.
Une dépendan e de l'historique à ourt, moyen et même à long terme a été onstatée aussi bien par
le personnel de l'installation que par des analyses réalisées par un des partenaires dans le ontexte du
projet CECA voire dans des analyses préalables sur d'autres installations semblables. Le temps joue de
e fait un rle important dans e travail. Ce sujet va se retrouver dans l'analyse du omportement et de
l'évolution dynamique du pro essus et peut être ara térisé par les mots lefs omme l'analyse de séries
temporelles, l'analyse des aspe ts dynamiques ou l'évolution temporelle d'un pro essus.
Finalement, un obje tif non négligeable pour le partenaire industriel est la reprodu tibilité du proessus et la minimisation des oûts de fon tionnement. Cela onduit vers des aspe ts omme la dénition
d'un omportement similaire voire la similarité entre séries temporelles d'un té et l'optimisation ou
en ore le ontrle et la onduite de pro essus de l'autre.
A es aspe ts plutt s ientiques s'ajoutent des aspe ts d'ordre te hnologique et organisationnel sous
forme de propriétés ou de ontraintes qui sont reliées au pro essus industriel. L'installation est onduite
24h/24 par plusieurs équipes qui se relaient. L'opérateur et les autres membres de son équipe ont pour
obje tif de garantir une produ tion d'a ier liquide an d'alimenter les pro édés en aval de la haîne de
produ tion qui en dépendent. De e fait la aden e, le volume, la qualité et la température de l'a ier
liquide qui doit être produit ne sont pas stables mais dépendent de la produ tion globale et de e fait
aussi des pro essus en aval de la haîne de produ tion. Toute interruption prolongée de la produ tion
1 Communauté
Européenne du Charbon et de l'A ier
xi
Introdu tion
d'a ier liquide a des réper utions sur toute la haîne de produ tion et de e fait représente un oût très
important et est don à éviter à tout prix.
En e qui on erne l'aspe t de ontrle ou de onduite de l'installation, il est important de noter
qu'il n'existe pas de modèle déterministe du pro essus. Il faut noter ependant que, dans le adre du
projet CECA, un autre partenaire était hargé d'adapter un tel modèle au pro essus en question. La
omplexité de e genre de modèle et la paramétrisation qui en dé oule se sont avérées être très di ile.
Le manque d'informations spé iques sur le pro essus et la nature bruitée et peu able des données
existantes ont rendu la tâ he en ore plus omplexe. Ce onstat n'a fait qu'en ourager la re her he de
solutions alternatives, omme elle que représente l'extra tion de onnaissan es à partir de bases de
données.
A tuellement, le suivi et la onduite du pro essus se basent prin ipalement sur la onsommation
en énergie éle trique qui représente l'apport primaire en énergie. L'opérateur, dans la ommande du
pro essus, est guidé par une onsigne statique qui donne de manière s hématisée le niveau de la puissan e
éle trique en fon tion de l'énergie éle trique onsommée tout au long d'un y le de produ tion.
Selon les experts, de nombreuses variables, soit in onnues soit non mesurables de façon able, ont
une inuen e non négligeable sur le omportement du pro essus. Celles- i sont supposées être la ause du
omportement imprévu de l'installation. L'opérateur doit dans es situations agir, voire réagir, tout au
long de l'évolution du y le de produ tion an de stabiliser le pro essus et d'éviter des endommagements
de l'installation. En fon tion de son expérien e, l'opérateur sait plus ou moins bien omment réagir dans
de telles situations. Dans son analyse, le omportement de l'installation et la réa tion du pro essus sur
des hangements de ommandes dépendent en premier lieu de la situation a tuelle et de l'historique à
ourt terme de l'installation omme par exemple la répartition des températures des diérentes zones
de refroidissement, ou en ore l'avan ement et l'évolution dans un y le de produ tion (problèmes préalables, stabilisation ou non de l'une ou l'autre phase de fusion et .). Mais le omportement et la réa tion
dépendent aussi de l'historique à moyen et à long terme de l'installation, omme par exemple la durée
depuis le dernier arrêt de maintenan e, et entre autres des onditions limatiques qui ont une inuen e sur
la mitraille, la matière primaire du pro essus, sto kée à l'air libre. Ainsi, pour être apable de onduire
l'installation, l'opérateur a un modèle interne du pro essus et de l'installation qu'il détient en grande
partie des observations qu'il a pu faire du omportement de l'installation.
Si tel est le as, il doit être possible, en utilisant des méthodes d'extra tion de onnaissan es, de faire
émerger des propriétés on ernant le omportement du pro essus en nous basant sur des observations,
en l'o urren e les mesures réalisées sur l'installation. On voit omment, présenté de ette manière, ela
devient un problème de fouille de données temporelles.
L'hypothèse prin ipale et l'appro he qui en dé oule
Des méthodes de fouille de données temporelles appliquées à des données représentant un omportement d'un pro essus physique devraient avoir la apa ité d'extraire des onnaissan es sur les propriétés
dynamiques et évolutives du pro essus sous-ja ent. En se basant sur es onnaissan es, il est d'un té
envisageable de pouvoir prédire le omportement du pro essus en onnaissant un ertain historique ourant de e dernier ; et de l'autre té, une orrélation des propriétés évolutives ave d'autres propriétés
du pro essus peuvent donner des informations supplémentaires pour l'intera tion ave le pro essus.
L'observation du omportement de l'installation aussi bien que la dis ussion ave les diérents a teurs
humains de l'installation ainsi que l'hypothèse générale formulée i-dessus ont onduit à l'hypothèse
suivante :
Des omportements typiques de l'installation existent. La onsommation globale de l'installation dépend fortement de l'évolution temporelle ave laquelle le pro essus est alimenté en
ressour es. En d'autres mots : il existe une relation entre la onsommation globale du pro essus
et l'évolution temporelle de l'alimentation et le omportement du pro essus.
Cela onduit dire tement à la supposition que, durant l'évolution du pro essus, il existe des instants
déterminants qui inuent sur le résultat global. Même si ela a semblé être évident pour les opérateurs,
peu de démar hes ont été faites jusqu'à présent an d'exploiter e prin ipe.
xii
Basé sur l'hypothèse qu'il existe des omportements typiques de l'installation, nous allons par des
méthodes de fouille de données temporelles extraire es évolutions types du pro essus. Basé sur l'hypothèse
qu'il existe une relation entre la onsommation et l'évolution temporelle, il est envisageable de pouvoir
utiliser la onnaissan e sous forme d'évolutions type an de donner un retour à l'opérateur en vue de
pouvoir utiliser ette information pour améliorer la onduite du four. En nous basant sur le mode utilisé
a tuellement pour la onduite du pro essus, .-à-d. l'opérateur qui suit au mieux une onsigne statique,
une idée d'un ontrle prédi tif basé sur l'aide à la dé ision a été dégagée.
Les démar hes théoriques et appli atives qui sont proposées dans ette thèse essaient de fournir en premier lieu les moyens pour analyser l'hypothèse posée en faisant émerger des données, des omportements
typiques du pro essus et en analysant es omportements par rapport à la onsommation prin ipale. Dans
un se ond volet sera analysée une appro he par laquelle une proposition de s énarios prédi tifs tout au
long de l'évolution du y le de produ tion serait réalisable. Même si une réelle implémentation en ligne des
méthodes n'a pas pu être réalisée dans le adre de ette thèse, il sera montré sur base de quelques exemples
réels qu'en intera tion ave les onnaissan es des opérateurs et les résultats des analyses proposées, une
perspe tive pour une rédu tion de la onsommation en énergie éle trique est envisageable.
La démar he est divisée en deux parties. Une première partie d'analyse, dans laquelle l'hypothèse sera
analysée, et durant laquelle les moyens seront développés dans l'optique d'appro her et de valider ette
hypothèse. Cette partie est basée sur les données provenant de l'installation et développe les méthodes et
outils né essaires pour pouvoir extraire de es données les omportements évolutifs typiques du pro essus.
Dans la deuxième partie il s'agit d'utiliser es évolutions type en vue de proposer à l'opérateur, au fur
et à mesure de l'avan ement d'un y le de produ tion, des s énarios pour la suite du pro essus qui, à
haque instant, prend en ompte l'évolution passée du y le a tuel et qui serait apable de onsidérer
des ritères d'optimisation. L'appro he proposée s'aligne au mode de onduite utilisé a tuellement en
utilisant des s énarios sous forme de onsignes temporelles. Il est prévu que 'est l'opérateur qui ferme la
bou le de ontrle, en agissant sur les paramètres de l'installation en vue de réaliser l'évolution proposée.
La diéren e ave la méthode basée sur une onsigne statique est que la proposition issue de l'appro he
prédi tive pourra s'adapter onstamment à la situation a tuelle en tenant ompte de l'historique du y le
en ours. De plus, le hoix du s énario à suivre pourra se faire sur base de diérents ritères qui pourront
eux aussi hanger durant le y le de produ tion.
Les sujets prin ipaux abordés dans la première partie sont l'analyse de séries temporelles, l'extra tion
de onnaissan es de façon non-supervisée et le odage de données dans le ontexte de la rédu tion du
volume de données, tout en fo alisant les méthodes onnexionnistes. Ave la relation "séries temporelles"
et "extra tion de onnaissan es", les sujets omme la similarité entre séries temporelles et la omparaison
de séries de taille arbitraire vont être abordés.
Durant la deuxième partie les sujets tels que la lo alisation de séquen es dans des séries temporelles
et l'intera tion ave l'a teur humain seront dis utés et des résultats sur base de données réelles seront
présentés. En e qui on erne l'in orporation de ritères en vue d'aider dans le hoix du s énario, des
possibilités seront évoquées sans pour autant dis uter en détail ette question.
Plan du mémoire
Ce mémoire ommen e par un hapitre qui présente le projet de re her he industriel et pose le adre
de e travail de thèse. Dans e même hapitre le pro essus et l'installation industrielle sont présentés. Il ne
s'agit pas seulement d'une des ription du fon tionnement du pro essus et de la mé anique de l'installation,
mais aussi d'une présentation des a teurs humains autour de ette installation, ainsi que des personnes
a tivement intégrées dans ette étude. De plus, à e niveau, le sujet évoqué par Keogh on ernant la
diversité des informations sur le pro essus, ainsi que l'a quisition et la gestion des données mesurées, les
diérent formats, les données bruitées, manquantes ou non valides seront abordées. Pour le le teur e
hapitre est important an de se familiariser ave les propriétés spé iques de l'installation et elles des
données qui seront analysées dans la suite du do ument.
Après la présentation de l'appli ation industrielle et de ses propriétés, le premier hapitre on lut ave
un aperçu plus détaillé du on ept de ontrle prédi tif basé sur l'aide à la dé ision, une des bases de
ette étude. Une illustration s hématisée des deux parties prin ipales de l'appro he est proposée.
xiii
Introdu tion
Le deuxième hapitre est réservé aux le teurs non initiés au domaine du onnexionnisme. Sans avoir
l'ambition de donner un aperçu global et approfondi du domaine, e qui est réalisé beau oup mieux par
de nombreux ouvrages omme par exemple [21℄,[17℄, le hapitre se limite aux aspe ts dire tement liés aux
sujets qui seront abordés dans la suite du manus rit.
Après es deux hapitres de mise en ontexte, les deux hapitres suivants sont onsa rés à l'expli ation
et la mise au point des méthodes qui pourront former une appro he de ontrle prédi tif basée sur l'aide
à la dé ision. Toutes es démar hes seront appliquées en premier lieu à des données arti ielles en vue
d'analyser les propriétés et de valider les méthodes. Ensuite, elles sont appliquées aux données provenant
de l'installation industrielle.
Le troisième hapitre traite la première partie de notre appro he. Les sujets abordés sont l'extra tion
non-supervisée des omportements typiques du pro essus sur base d'analyses de séries temporelles, qui
représentent l'évolution temporelle des y les de produ tion. Au début de e hapitre de plus amples détails seront donnés sur les spé i ités des séries temporelles. Auparavant la lassi ation non-supervisée
des omportements typiques, le sujet du odage aussi évoqué par Keogh, sera abordé dans le but de
la rédu tion de données. Dans ette partie une proposition d'une extension d'un odage lassique, l'approximation par parties onstantes (PAA), sera réalisée. Cette extension propose d'attribuer des formes
ara téristiques à des parties de signal an de onserver plus de détails des parties odées.
La rédu tion du volume de données joue un rle, par e que les temps de al ul des méthodes d'analyse
pour l'extra tion de onnaissan es sont pour la plupart dire tement liés au volume de données qui doit
être traité. Le volume global de données à manipuler dans le adre de e travail est abordable ave une
base de données de plus ou moins 6 Gigabytes de données provenant d'un pro essus industriel, dont
seulement un sous-ensemble est utilisé i i. Notez ependant d'une part, que ette base ne représente
qu'une demi-année de suivi de l'installation et don pas né essairement toutes les onditions de travail
de l'installation. D'autre part, les implémentations des méthodes et les outils ainsi que la plate-forme
utilisée dans le adre de e travail ne sont pas spé ialement optimisés sur le point de vue performan e
de al ul. Il s'agit plutt d'une appro he de prototypage rapide ou d'une démonstration de faisabilité
pour laquelle la performan e de al ul ne représente qu'un aspe t se ondaire. La rédu tion de volume de
données devient don né essaire an d'améliorer les onditions de re her hes et d'analyses.
Basée sur e odage, une méthode de lassi ation non-supervisée apable de prendre en ompte des
séries temporelles de taille arbitraire sera proposée. Cette méthode se base sur une mesure de dissimilarité, qui utilise un algorithme du domaine de la programmation dynamique, le Dynami Time Warping
(DTW). Cet algorithme sera analysé en détail et son utilisation dans le ontexte d'une méthode de lassi ation sera présenté. À e niveau la subje tivité évoquée par Keogh se retrouve dans le hoix et dans
la paramétrisation des méthodes utilisées, mais aussi au niveau de l'interprétation des résultats obtenus.
L'appli ation de la lassi ation aux données du pro essus industriel permet de produire un orpus de
omportements typiques, qui sont né essaires pour la deuxième partie de l'appro he proposée.
Dans le quatrième hapitre, la deuxième partie de l'appro he est abordée. Une proposition pour une
appro he de ontrle prédi tif basée sur une aide à la dé ision est développée. Pour ela, le sujet de la
lassi ation en ligne, qui traite le domaine de la lo alisation de séquen es dans des séries temporelles,
sera abordé. Après la mise au point d'une méthode de lo alisation basée sur la méthode DTW et bornée
d'un té, la thématique de proposition de s énarios appropriés est analysée. Dans e ontexte, la prise en
ompte de ritères d'optimisation et le potentiel de rédu tion de la onsommation globale seront dis utés.
Faute d'implémentation sur le site industriel, ette partie peut être vue omme spé ulative. Mais sur
base de quelques exemples réels, une première illustration du potentiel est réalisée, même si l'analyse du
potentiel réel n'est réalisable que dans le ontexte d'une bou le fermée.
Le inquième hapitre présente les on lusions et les perspe tives de e travail de thèse. Les diérents
résultats et ontributions s ientiques engendrés par e travail sont repris et brièvement dis utés an
d'illustrer les éventuelles appli ations et extensions possibles.
Dans les trois annexes, quelques détails sont donnés on ernant le système d'a quisition et de gestion
de données, l'apprentissage dans le ontexte des artes auto-organisatri es (SOM) et deux méthodes de
validation du odage proposé.
xiv
Chapitre 1
Le projet industriel
Sommaire
1.1 Le projet européen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2 Le pro essus industriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.1.1
1.1.2
Le rle des partenaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La relation projet-thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
L'installation industrielle . . . . . . . . . . .
1.2.1.1 Informations sur l'installation . . .
1.2.1.2 Quelques spé i ités de l'installation
Les a teurs humains . . . . . . . . . . . . . .
Le déroulement standard du pro essus . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Le système d'a quisition de données . . .
La gestion des données . . . . . . . . . . .
1.3.2.1 La gestion primaire de données .
1.3.2.2 La gestion se ondaire de données
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1.2.2
1.2.3
1.3 Les données du pro essus . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1
1.3.2
.
.
.
.
.
.
.
.
3
3
3
3
6
8
8
9
10
12
12
12
1.4 Aperçu sur le on ept de ontrle prédi tif basé sur une aide à la dé ision 14
1
Chapitre 1.
Le projet industriel
La présente thèse s'est déroulée en relation ave un projet européen nan é par la CECA2 . Dans e
hapitre le projet européen est présenté brièvement et le rapport ave le sujet de la thèse sera évoqué.
Le omportement de l'installation industrielle et le déroulement des prin ipaux pro essus seront expliqués. Une ex ellente onnaissan e de l'installation et des pro essus est primordiale an de mener à bien
un tel projet. Cette armation peut être motivée par le besoin de ommuni ation ave les experts de
diérents niveaux, le hoix de méthodes d'analyses ainsi que l'interprétation des résultats obtenus voire
l'argumentation des orientations de la re her he durant le projet.
Les informations sur une installation industrielle sont diverses. Un aperçu sur ette diversité est donné
ave une fo alisation sur l'a quisition et la gestion des données provenant de l'installation. Une partie de
es données formeront la base des analyses ultérieures.
Pour le le teur, e hapitre est intéressant par e qu'il fournit d'importantes informations an de
omprendre la suite de la thèse et les démar hes qui y sont faites. Cependant diverses remarques sur la
manière omment e projet a été abordé semblent lassiques voire de nature générale pour tous projets
de e genre.
Dans la dernière se tion de e hapitre, une fois que le le teur s'est familiarisé ave les spé i ités du
pro essus industriel, le on ept global de l'appro he qui est proposée par ette thèse est présenté.
1.1 Le projet européen
Le projet CECA, 7210-PR-129, s'intitule Improved Control of Ele tri Ar Furna e Operations by
Pro ess Modelling. Le projet a débuté le 1.7.1999 et la n était prévue pour le 30.6.2002. À ause de
diverses raisons le projet a été prolongé d'une année du 1.7.2002 au 30.6.2003. Le rapport nal du projet
était présenté en mai 2004.
L'équipe CORTEX du LORIA3 de Nan y parti ipe à e projet en tant que sous-traitant du CRP Henri
Tudor4 du Luxembourg, partenaire du projet. Les autres partenaires du projet sont : le oordinateur
ProlARBED Re her he5 , ACERALIA6 et le CRM7 .
L'obje tif du projet est le développement des onnaissan es et l'amélioration du ontrle du pro essus
omplet de la produ tion d'a ier liquide dans les fours à ar éle trique, en ombinant trois appro hes de
modélisation des pro essus :
un modèle obje tif lassique de la métallurgie basé sur des bilans de type énergétique, massique et
himique.
un modèle subje tif s'appuyant sur les onnaissan es et expérien es des opérateurs du four an
de mettre au point un s héma omplet d'examens de robustesse du pro essus et d'optimiser les
paramètres de ontrle.
un modèle basé sur des réseaux de neurones et la logique oue utilisant les informations du modèle
subje tif et les données provenant de l'installation an d'extraire et d'apprendre des paramètres
supplémentaires mais importants du pro essus qui ne sont que di ilement ou pas du tout ontrlables.
Les motifs prin ipaux pour aborder les fours à ar éle trique par une appro he de modélisation étaient
de mieux prévoir l'instant d'arrêt d'une harge en tenant ompte du taux de harbon dans l'a ier et la
température du bain, de mieux ontrler le pro essus dans sa globalité en se basant sur les onnaissan es
d'experts et d'apprendre à produire de façon reprodu tible un a ier de qualité à oût minimal.
Au début du projet un four approprié a été séle tionné. Ce four est situé sur le site de ProlARBED
Es h-Belval (pour plus de détails voir hap. 1.2). Les diérents modèles et appro hes sont validés sur e
four.
An de oordonner le projet et de favoriser la ommuni ation, des réunions semestrielles étaient
organisées en alternan e hez les quatre partenaires. Un rapport te hnique sur les avan ements semestriels
de haque partie a ompagnait es réunions. Un rapport te hnique et nan ier par année résumait les
2 Communauté Européenne du Charbon et de l'A ier.
3 Laboratoire Lorrain de Re her he en Informatique et ses Appli ations, http ://www.loria.fr
4 Centre de Re her he Publi Henri Tudor, http ://www.tudor.lu
5 Département de re her he du groupe métallurgique luxembourgeois ProlARBED, http ://www.ar
6 Groupe métallurgique espagnol.
7 Centre de Re her hes Métallurgiques de Belgique.
2
elor.lu
1.2.
Le pro essus industriel
a tivités et une présentation annuelle des travaux du projet devant le onseil C1 8 était imposée par la
CECA.
1.1.1 Le rle des partenaires
ProlARBED Re her he était responsable de la oordination du projet. Ils ont mis au point le système
d'a quisition de données sur le site et font la maintenan e et la mise à jour de e système an de fournir
les données né essaires aux autres partenaires. Ils ont travaillé sur diérentes méthodes d'analyse des
données énergétiques du four, dont un modèle de prédi tion de la n de harge basé sur un ouplage
séquentiel de réseaux de neurones.
Le CRM possède un modèle lassique de la métallurgie apable de modéliser les phénomènes physique
et himique à l'intérieur du four. Le travail du CRM onsistait à adapter e modèle au four ible. Différentes ampagnes de mesures spé iques étaient réalisées an de pouvoir adapter les paramètres de e
modèle.
L'apport du CRP Henri Tudor dans le projet est entre autres l'analyse et l'adaptation de méthodes
basées sur les réseaux de neurones arti iels an d'optimiser le ontrle de l'installation en tenant ompte
des onnaissan es des experts.
1.1.2 La relation projet-thèse
Dans le adre du projet CECA un travail de thèse en informatique à l'université Henri Poin aré a été
déni sur la base d'une ollaboration entre le CRP Henri Tudor et le LORIA. Cette thèse a été nan ée
en majeure partie par une bourse de formation re her he de l'état luxembourgeois.
La partie de l'apport du CRP Henri Tudor en relation ave le domaine des réseaux de neurones est
don fortement liée à e travail de thèse e qui fait que les appro hes et méthodes analysées et proposées
dans ette thèse sont dire tement voire indire tement liées au domaine du onnexionnisme.
1.2 Le pro essus industriel
1.2.1 L'installation industrielle
L'installation industrielle est située sur le site de ProlARBED Es h-Belval qui se trouve au sud du
Luxembourg à la frontière française. Sur e site la produ tion d'a ier a une longue tradition. Déjà au
début du 20ème siè le une produ tion d'a ier était implantée sur e site. On trouvait la haîne lassique
de produ tion d'a ier à partir de minerai de fer .-à-d. une agglomération, des hauts fourneaux, une
a iérie, le sto kage en oquilles, le ré hauement, le laminage et sto kage du produit ni.
Il y a une vingtaine d'années une nouvelle te hnologie est apparue sur le mar hé de la produ tion
d'a ier. Elle remplaçait toute la partie de la produ tion avant le laminage. Cette nouvelle te hnologie de
produ tion d'a ier réalise une appro he de re y lage des mitrailles9. Elle onsiste à fondre la mitraille
dans un four en se basant prin ipalement sur l'énergie éle trique. Les avantages de ette appro he sont
multiples : plus au une dépendan e du minerai de fer, abolition de l'an ienne te hnologie des hautfourneaux et .
Les responsables de la so iété ARBED au Luxembourg ont alors dé idé une migration radi ale de
tous leurs sites de produ tion d'a ier sur ette nouvelle te hnologie.
En 1997 le four à ar éle trique a été mis en servi e sur le site de ProlARBED Es h-Belval, le site
ible de e projet.
1.2.1.1
Informations sur l'installation
Généralement de nombreuses informations existent sur une installation industrielle. Les types d'informations sont en prin ipe très divers et peuvent omprendre entre autres des plans de onstru tion,
s hémas te hniques de parties de l'installation, des onsignes d'utilisation, des onsignes de sé urité, des
8 Réunion annuelle de la CECA où le oordinateur de haque projet présente ses avan ements
9 Un ensemble de fragments métalliques divisés, provenant généralement de diverses ré upérations
3
Chapitre 1.
Le projet industriel
hes de suivi des harges et des données provenant de apteurs autour de l'installation. Le plus souvent
es informations ne sont pas gérées de façon entralisée et des liens entre elles n'existent que pour un
sous-ensemble de es informations. Cette situation n'est pas spé ique à e projet, elle est onnue sous
le terme de données hétérogènes (angl. Disparate Data) et analysée dans [7℄.
Une autre parti ularité de es informations est la forme sous laquelle elles sont a essibles. Un mélange
de hes en papier éventuellement ataloguées dans des lasseurs, de hiers informatiques de formats
divers et des bases de données sont la règle.
A ela viennent s'ajouter de nombreuses onnaissan es des diérents a teurs humains qui n'existent
pas sur un support fa ilement a essible, mais seulement dans les réseaux de neurones appelés erveaux
de es a teurs. Ces informations sont basées sur des observations faites, ou elles sont reliées à des modi ations faites qui ne sont pas né essaiement do umentées.
Dans le adre de e projet, aussi bien les données mesurées que les expérien es du personnel ont une
importan e. Ce deuxième type d'informations est généralement regroupé sous le terme de onnaissan es
d'experts.
Une bonne relation et une ollaboration étroite ave le personnel de l'installation sont primordiales,
au moins au début d'un tel projet, an de rassembler toute information né essaire pour a quérir les
onnaissan es né essaires sur le pro essus.
En e qui on erne l'installation, le tableau 1.1 résume les données prin ipales du four et donne un
premier aperçu de la taille de l'installation.
Four à ourant ontinu
Capa ité du four (t)
155
Diamètre de la uve (m)
7.3
Diamètre de l'éle trode (mm)
762
Nombre d'éle trodes de sole
4
Tension maximale de l'ar (V)
800
Courant maximal (kA)
120
Nombre de brûleurs
5
Puissan e totale des brûleurs (MW)
50
Nombre d'inje teurs de post ombustion 4
Mise en servi e
1997
Tab. 1.1 Cara téristiques prin ipales du four
An de donner une idée de l'installation, les éléments prin ipaux sont visualisés dans le s héma (g.
1.1) reprenant la stru ture générale d'une a iérie du type four à ar éle trique à ourant ontinu omme
'est le as à ProlARBED Es h-Belval.
Au entre de la gure se trouve le four ave à té le bras mobile qui porte et positionne l'éle trode
en graphite an d'apporter l'énergie éle trique dans l'en einte du four. Au-dessus du four à gau he le
panier à mitrailles est prêt pour harger le four. Le hargement se fait en déversant la mitraille dans
le four. En-dessous du four à gau he se trouve la po he qui reprend l'a ier liquide en n de harge au
moment de la vidange et à droite la po he qui reprend l'ex ès de s orie qui oule du four. A droite du
four une personne est représentée an de donner une impression des dimensions de l'installation. Les
tuyaux à gau he du four représentent une partie du système de dépoussiérage et du traitement des gaz
d'é happements (voir Fig.1.5).
Plus de détails sur la stru ture du four sont donnés dans la gure 1.2.
Le four est omposé de trois parties :
La uve : elle représente la partie inférieure du four et héberge les éle trodes de sole qui ferment
le ir uit éle trique. Elle est revêtue d'un réfra taire an de résister aux températures de l'a ier
liquide qu'elle ontient. Au bord de la uve se trouve le trou de oulée qui sert à déverser l'a ier
liquide en n de harge.
Les panneaux : ils forment le ollier latéral entral .-à-d. les parois du four. Ils reposent sur la
uve. Ils sont refroidis à l'eau et ont aussi un rle de support pour diverses armatures omme des
brûleurs à gaz ou des lan es à oxygène et .
4
1.2.
Fig.
Le pro essus industriel
1.1 Stru ture générale d'une a iérie à ar éle trique
Fig.
1.2 Vue détaillée du four
5
Chapitre 1.
Le projet industriel
Le ouver le : il referme le four d'en haut et est également refroidi à l'eau. Par un trou entral dans
le ouver le l'éle trode est introduite dans le four. An de harger le four, le ouver le peut être
soulevé et pivoté sur un té (voir Fig.1.3 et 1.4).
Le four entier ave le bras de l'éle trode et la hambre de post ombustion repose sur une plate-forme
mobile qui peut bas uler autour d'un axe horizontal perpendi ulaire au plan de la gure 1.2 an de pouvoir
déverser l'a ier liquide par le trou de oulée en n de harge. Durant la harge, le trou est refermé par
un bou hon.
La gure 1.3 montre une photo de l'intérieur de l'a iérie de Belval. On voit le four ave le ouver le
ouvert, des ammes et des fumées s'é happent de la uve et sont aspirées par une hotte sous le toit de
l'a iérie (voir Fig.1.5). La gure 1.4 montre un s héma de l'a iérie ave un angle de vue similaire, an de
mieux lo aliser les diérentes parties de l'installation.
Fig.
1.3 L'intérieur de l'a iérie de Belval
Fig.
1.4 S héma de l'installation
Les s hémas te hniques de l'installation onstituent un genre d'information indispensable pour la
ompréhension et l'interprétation des données. Dans le s héma (Fig. 1.5) une vue globale sur les ir uits
de refroidissement et le système de dépoussiérage des fumées est représentée. Plus de détails sur diérents
ir uits omme par exemple les positions et la spé i ité des apteurs de mesures sont repris par d'autres
s hémas.
La gure 1.5 montre bien la omplexité de l'installation et le nombre de paramètres qui ont une
inuen e plus ou moins importante sur le système four à ar éle trique qu'il s'agit d'analyser.
Connaître les détails te hniques de l'installation, le fon tionnement des diérents éléments et les
relations qui existent entre eux est ertainement né essaire pour mener à bien un tel projet de re her he
mais dépasserait le but de ette thèse. Il est plus important pour le le teur, an de erner le problème
posé, de onnaître en ore quelques spé i ités de l'installation.
1.2.1.2
Quelques spé i ités de l'installation
Le pro essus industriel en question se trouve dans un environnement sidérurgique, .-à-d. dans un adre
d'industrie lourde. Il faut savoir que dans un tel environnement tout le système de mesure omprenant
les apteurs de mesure, les âbles et les automates programmables, est mis à une rude épreuve. Des
apteurs défe tueux, non alibrés ou en ore de type divergeant de la spé i ation sont fréquents. On est
don onfronté à des mesures aberrantes, bruitées, in omplètes sans pour autant en être né essairement
ons ient.
Une autre parti ularité on erne la syn hronisation d'informations. Cette tâ he n'est pas triviale ar
les systèmes de mesures sont autonomes et indépendants. La référen e de temps existant sur les diérents
6
1.2.
Fig.
Le pro essus industriel
1.5 S héma du système de refroidissement et du traitement des fumées
systèmes n'est pas syn hronisée et les valeurs peuvent avoir d'importantes divergen es. Ce qui rend la
tâ he en ore plus di ile est que l'a quisition des informations s'ee tue sur diverses é helles de temps.
De plus, le pro essus est in orporé dans une haîne de produ tion d'a ier. Il y a don des pro essus
en amont et en aval qui ont une inuen e de type ontrainte externe sur le pro essus en question. Il n'est
pas rare qu'une panne quelque part dans la haîne de produ tion mène à un arrêt plus ou moins long du
pro essus.
Un aspe t à ne pas oublier est que le pro édé ainsi que l'installation industrielle ne sont pas des
éléments stables dans le temps. Ils subissent au l du temps de petites, moyennes ou même importantes
modi ations, e qui a des réper utions sur le omportement du pro essus.
Il a été onstaté que divers éléments de mesure de l'installation ne fon tionnent pas bien voire même
pas du tout. Suite à des observations faites sur le site, il est intéressant de faire remarquer qu'il existe une
relation dire te entre le mal- ou non-fon tionnement d'éléments de l'installation et la faible importan e
que les a teurs humains leur attribuent. Ainsi, des apteurs jugés peu pertinents ne sont pas maintenus
de la même manière que les apteurs sur lesquels se réfèrent les diérents a teurs.
Dans e ontexte il faut rappeler que le but primaire de ette installation est la produ tion de la matière
première (l'a ier liquide) pour les pro essus en aval de la haîne de produ tion omplète. Les réparations,
les é hanges de matériel défe tueux et les modi ations sont ee tués selon leurs importan es en relation
ave e but primaire. Les interventions urgentes, qui sont indispensables pour le fon tionnement du four,
sont ee tuées immédiatement an de pouvoir ontinuer le pro essus. D'autres interventions en relation
ave un fon tionnement restreint de l'installation sont planiées et réalisées entre deux y les de produ tion (appelés harges). Les travaux de type maintenan e sont reportés sur les arrêts de maintenan es
hebdomadaires voire même bi-annuels pour les travaux d'ampleurs.
Ce fait semble évident, mais il est souvent oublié dans le adre de réexions et de dé isions qui vont
être prises durant un projet de re her he. Pour donner un exemple, supposons que dans le adre d'une
appro he de modélisation pour des raisons de onnaissan es a priori une variable x soit utilisée et
que sa valeur provienne d'un apteur qui est mal maintenu et don peu able. L'utilisation d'une telle
variable peut faire que des méthodes, modèles ou appro hes ne sont pas implémentés, ou que après une
implémentation, ne sont pas utilisés par les opérateurs sur un site de produ tion, puisque la méthode se
révèle être peu able.
7
Chapitre 1.
Le projet industriel
Il est illusoire d'espérer que le fait qu'un modèle se base sur un tel apteur, e dernier deviendrait
pertinent aux yeux des a teurs humains, déjà par e que souvent la relation modèle- apteur n'est que peu
visible pour les a teurs sur site. L'inverse est plutt la réalité : puisque le modèle ne fon tionne pas, il est
jugé non utilisable et il se retrouvera dans la liste des éléments de l'installation ave faible importan e
qui ne sont pas maintenus.
La on lusion de ette observation est qu'il faut éviter de baser des appro hes sur des mesures que
les a teurs humains jugent omme peu pertinentes. Il faut prendre en onsidération toutes es propriétés
dans les analyses et les propositions de méthodes. La robustesse d'une méthode par rapport à des données
bruitées, éronnées ou en ore manquantes apporte dans e as un avantage non négligeable.
1.2.2 Les a teurs humains
Diérents a teurs humains en relation ave l'installation peuvent être identiés. Du té de la so iété
produ tri e, trois groupes d'a teurs peuvent être distingués : il s'agit des opérateurs ave leurs groupes
de travail, des responsables de l'installation sur site et de l'équipe de re her he et de développement
de l'entreprise. Dans le adre du projet de re her he il est possible d'ajouter un quatrième groupe, qui
est externe à la so iété et qui se onstitue des her heurs en harge du projet. Analysons le rle de es
quatre groupes d'a teurs humains.
Le rle de l'opérateur ave son groupe de travail est de onduire le four an de produire l'a ier liquide
pour la oulée ontinue qui est le maillon suivant de la haîne de produ tion. Ils ont la possibilité d'agir
sur le four par diérents moyens. L'opérateur, grâ e à son expérien e, possède un modèle ognitif du
système four à ar éle trique et du pro essus de fusion en parti ulier. Il sait plus ou moins bien prédire
le omportement du four basé sur l'historique du pro essus et les paramètres d'entrée ourants.
Le rle des responsables de l'installation sur site est de planier en même temps la produ tion, la
maintenan e et les modi ations ou améliorations de l'installation. Ils onnaissent le mar hé et peuvent
xer les ritères qu'il s'agit d'optimiser an de produire à oût minimal. De manière générale le mar hé
est en évolution onstante et ave lui en prin ipe aussi les ritères qu'il s'agit d'optimiser.
L'équipe de re her he et de développement en relation ave les responsables sur site essaie de trouver
des moyens et méthodes an d'optimiser le pro essus et d'a quérir également une meilleure onnaissan e des phénomènes qui ontrlent le pro essus ainsi que l'inuen e des diérents paramètres sur son
omportement.
Finalement le groupe des her heurs peut dans e ontexte être onsidéré omme un observateur
externe, non-expert du pro essus, même si sur la durée du projet, quelques onnaissan es ont pu être
regroupées. Ce groupe interagit ave les trois autres a teurs. De nouvelles méthodes et appro hes sont
proposées en ollaboration ave l'équipe de re her he et de développement. Le rle de e groupe est de
favoriser le transfert de onnaissan es et d'apporter de nouveaux éléments venant du monde s ientique,
qui ne sont pas né essairement bien onnus dans le monde de l'industrie.
1.2.3 Le déroulement standard du pro essus
Le pro essus étudié peut être ara térisé par la des ription suivante, montrant le déroulement temporel
standard10 d'une harge. Cette des ription donne un aperçu du fon tionnement du système four à ar
éle trique :
1. Lorsque le four se trouve dans un régime normal (pas d'arrêt prolongé préalable) au départ d'une
harge, il reste un pied de bain d'a ier liquide de la harge pré édente dans la uve. L'éle trode est
sortie du four et le ouver le est fermé.
2. Le premier panier de mitrailles est enfourné. Pour ette opération, le ouver le du four est ouvert,
une grue a hemine un panier ave environ 100 tonnes de mitrailles au dessus du four et le déverse
dans le four.
3. Le ouver le est refermé et des brûleurs à gaz sont a tivés. L'éle trode en graphite est introduite
dans le four à travers l'ouverture dans le ouver le et le ourant éle trique est en len hé. Environ
10 Le terme standard dans e ontexte ara térise le déroulement omme les responsables de l'installation planient la
produ tion d'une harge. La plupart des harges se déroulent globalement selon e s héma.
8
1.3.
Les données du pro essus
20 minutes sont né essaires à l'ar éle trique an de fondre les mitrailles du premier panier à tel
point que le deuxième panier peut être enfourné.
4. Le ourant éle trique est oupé, l'éle trode est ressortie du four et les brûleurs à gaz éteints an
d'ouvrir le ouver le. Un deuxième panier de mitrailles d'environ 70 tonnes est enfourné.
5. Le pro édé est relan é omme pour le premier panier. Durant ette deuxième phase diérents ajouts
( al aire, arbone) peuvent être inje tés dans le four an d'inuen er la omposition de l'a ier et le
omportement du pro essus.
6. Durant la phase nale du pro essus, des lan es à oxygène qui se situent juste au-dessus de l'a ier
en fusion sont a tivées. Le jet au-dessus du bain provoque une oxydation des impuretés, améliore
la formation d'un laitier moussant qui re ouvre le bain d'a ier et garantit une post ombustion des
gaz dans l'en einte du four.
7. Durant ette phase l'ex ès de laitier qui se forme est déversé dans une po he à s ories qui se trouve
à droite en-dessous du four.
8. Finalement l'a ier liquide doit atteindre une température spé ique qui dépend des pro édés en
aval de la haîne de produ tion. Elle est d'environ 1600◦C. Avant de vidanger l'a ier liquide, sa
température est vériée et validée à travers une mesure isolée. En fon tion de la température
mesurée, la vidange peut débuter, le pro essus doit être relan é ou une phase de refroidissement est
entamée.
9. An de vidanger l'a ier liquide, le trou de oulée est ouvert, le four entier est bas ulé sur le té et
l'a ier est déversé dans une po he à a ier posée sous le four. An de garantir la qualité de l'a ier,
il est important d'éviter que des parties de laitier soient déversées dans la po he.
10. A la n de haque oulée, un reste d'a ier liquide et de laitier, appelé pied de bain, est gardé dans
le four.
Une telle harge standard dure en moyenne entre 50 et 70 minutes. En e qui on erne le déroulement
standard il est en ore important à noter qu'il arrive de temps en temps que le robot utilisé pour faire la
mesure de température, en n de harge, tombe en panne. Dans e as, la mesure est ee tuée à la main.
Pour des raisons de sé urité la puissan e éle trique doit être arrêtée durant la mesure manuelle e qui à
une forte inuen e sur le déroulement.
Des observations ainsi que des dis ussions ave les experts de l'installation indiquent que le omportement du four dépend fortement de l'évolution temporelle de l'installation. Une dépendan e de l'historique
à ourt, moyen et même à long terme a été onstatée.
Le ourt terme représente l'é helle de temps intra harge, .-à-d. tout e qui se passe dans le adre
d'une harge. Par exemple l'instant auquel les diérents ajouts sont introduits dans le four, la masse
de es ajouts ou en ore le moment où les lan es à oxygène sont en len hées et ave quel débit elles
travaillent. Mais aussi la durée entre les deux phases de fusion ou elle du hargement de la mitraille.
Le moyen terme représente l'é helle de temps d'une, voire de quelques harges. Il a été observé que
le omportement d'une harge dépend des harges pré édentes à plusieurs niveaux : par exemple
la hauteur du pied de bain11 ou en ore la température de l'a ier liquide avant la vidange inuent
dire tement, ar l'énergie que représente et a ier liquide est portée d'une harge à l'autre.
Le long terme représente l'é helle de temps de quelques jours, de semaines, voire l'inuen e des
saisons (température de l'air et de la mitraille ou en ore l'humidité) sur le pro essus.
L'état général de l'installation, omme par exemple l'usure du réfra taire, l'état de ré hauement du
four ou en ore la qualité de la mitraille inuent sur le omportement de l'installation.
1.3 Les données du pro essus
Dans e hapitre, seules les données reliées à la des ription de l'évolution temporelle du pro essus
sont onsidérées. Les autres types d'information de l'installation dont il était question dans le hapitre
1.2.1 ne sont pas repris i i, ni dans la suite des analyses. Il ne faut pas pour autant oublier que e type
d'informations est utilisé impli itement dans les hoix et réexions tout au long du projet.
11 Volume
d'a ier liquide restant dans la uve après vidange
9
Chapitre 1.
Le projet industriel
Les données relatives à l'évolution temporelle sont regroupées dans les atégories suivantes :
les données dites y liques. Elles proviennent de divers apteurs autour de l'installation qui fournissent en permanen e des valeurs mesurées pour diverses températures, puissan es, débits pour
n'en iter que quelques-unes.
les données dites statiques. Ce sont des données reliées à une harge, omme le poids de la mitraille
enfournée, la masse d'a ier liquide produite par la harge, ou en ore l'identité du personnel de la
tournée de travail, · · ·.
les données dites manuelles. Ce sont des données provenant des opérateurs au poste de ommande
du four. Ils notent sur une he le degré d'a tivité du four à un rythme de 15 min. an d'obtenir
une vue globale (une journée sur une he A4) sur le omportement du four.
Sur ette he, on retrouve outre le degré d'a tivité du four, un dé oupage en harges, le numéro
des harges, les raisons de problèmes éventuels et quelques données de n de harge, omme la
température de l'a ier au moment de la vidange.
An de pouvoir faire une analyse du pro essus, un ertain nombre d'informations sur le pro essus
doivent être disponibles. Un système d'a quisition regroupe les données et les met à disposition. Ce i est
né essaire, ar une analyse de systèmes dynamiques doit disposer de données sur une ertaine période de
temps. I i la diversité de omportement du pro essus qui est dé rit dans l'historique représenté par les
données est importante.
Non seulement l'a quisition des données est importante, mais aussi la gestion des données au sens
large du terme doit être garantie. Ces deux sujets sont abordés i-dessous.
1.3.1 Le système d'a quisition de données
Avant le lan ement du projet, un ertain nombre de données du pro essus ont déjà été enregistrées
dans un système de gestion de base de données (SGBD) SyBase qui tourne sur un système VAX géré
par la se tion informatique de ProlARBED. On y trouve une partie de données y liques et un ertain
nombre de données statiques.
En vue d'une analyse du pro essus plus détaillée, un nombre plus important de variables est né essaire.
En raison de ette né essité et an d'augmenter la exibilité, un deuxième système d'a quisition a été
mis en pla e par ProlARBED Re her he en ollaboration ave le CRP Henri Tudor (voir gure 1.6).
Le nouveau système d'a quisition réalisé sur une plate-forme de type PC industriel n'enregistre que
les données de type y lique. Deux types de données y liques sont distingués :
les données brutes : il est question d'environ 220 variables provenant dire tement de apteurs en
passant par des automates programmables. A part la digitalisation, au une manipulation se ondaire
n'est faite sur es données.
les données al ulées : elles sont al ulées à partir des données brutes. Il s'agit d'environ 90 variables
supplémentaires qui ne sont pas dire tement mesurables omme par exemple des volumes ou des
énergies umulées. Les al uls sont réalisés sur l'ordinateur du système d'a quisition sur la base
d'analyses de référen e du domaine métallurgique faites par Koehle [34℄.
Le temps d'é hantillonnage pour es données a été xé à inq se ondes par les experts de ProlARBED
Re her he estimant qu'un é hantillonnage plus pré is n'est pas né essaire. Ainsi, toutes les inq se ondes
les valeurs de 310 variables sont enregistrées par le système d'a quisition.
Les données de type statique ne sont pas en ore traitées par e nouveau système. Elles sont gérées
dans un SGBD de type SyBase. L'a ès à ette base de données passe par des requêtes SQL.
En e qui on erne les données de type manuel, il n'y a pas longtemps, elles n'étaient pas en ore traitées
de manière éle tronique. Les hes remplies par les opérateurs étaient envoyées par FAX à ProlARBED
Re her he. Depuis peu, es hes sont en odées par les opérateurs dans des hiers MS-Ex el, et elles
peuvent être distribuées automatiquement par ourrier éle tronique.
L'a ès à l'ordinateur du système d'a quisition et au système VAX est possible depuis le réseau
informatique de ProlARBED. Pour des raisons de sé urité un a ès à e réseau de l'extérieur n'est pas
autorisé.
Plus de détails te hniques sur le système d'a quisition sont repris dans l'annexe A.1, des détails sur
l'a ès aux données et leur gestion sont donnés dans la se tion 1.3.2 i-dessous.
10
1.3.
Fig.
Les données du pro essus
1.6 Flux des données provenant de l'installation
11
Chapitre 1.
Le projet industriel
1.3.2 La gestion des données
Toutes les appro hes de modélisation né essitent des données réelles pour adapter leurs paramètres
au pro essus analysé. Souvent les données pour un tel projet sont fournies par un partenaire industriel ou
institutionnel et 'est e dernier qui s'o upe généralement de l'a quisition des données. Indépendemment
de la manière dont la gestion des données est faite par e partenaire il est important pour un projet de
re her he qui est basé sur des données d'organiser et de gérer les données, informations et résultats
qui on ernent le projet de façon adéquate. Une référen e intéressante dans e ontexte est le livre de
M. Bra kett [7℄ qui traite le sujet de omment organiser et gérer les données hétérogènes d'une entreprise
an de proter des informations relationnelles de es diverses sour es.
En e qui on erne la gestion des données en relation ave un projet de re her he les obje tifs suivants
peuvent être distingués :
un sto kage entralisé,
une a essibilité exible et standardisée,
une garantie de ohéren e,
une garantie de reprodu tibilité d'expérien es,
une sauvegarde (ba kup) simpliée,
une garantie de ondentialité envers les partenaires,
une fa ilité de mise en relation de diérents types de données.
Deux niveaux de gestion de données peuvent être distingués : La gestion primaire qui est réalisée par
le partenaire indépendamment du projet, et une gestion se ondaire par le projet de re her he. Dans le
as présent, la gestion primaire est réalisée sur le système d'a quisition par ProlARBED Re her he et
la gestion se ondaire au CRP Henri Tudor.
1.3.2.1
La gestion primaire de données
Sur le système d'a quisition, diérentes méthodes de sto kage ont été réalisées durant e projet.
En premier lieu les données y liques sont sto kées dans des hiers ASCII dans un format simple et
standardisé (CSV). Diérents types de hiers sont enregistrés omprenant des regroupements divers de
données. Une nomen lature spé ique garantit l'uni ité des hiers et un a ès iblé. Les types de hiers
qui nous intéressent le plus dans le adre de e projet sont les hiers bruts où toutes les variables sont
sauvegardées de façon ontinue.
D'autres hiers ne gardent qu'un sous-ensemble des données ou des informations de bilans par harge
dans l'idée de fa iliter leur utilisation.
L'a ès à es hiers est possible en utilisant le proto ole FTP, mais limité au réseau de ProlARBED.
Chaque utilisateur travaille don sur une opie lo ale d'un ou de plusieurs hiers dont il ré upère un
sous-ensemble d'informations qui l'intéresse.
Ce type de gestion primaire des données n'est pas très pratique pour l'utilisateur, ar il est obligé de
s'organiser une propre gestion des données à partir d'un important volume d'informations redondantes,
e qui onsomme inutilement l'espa e de sto kage, est sus eptible de nuire à la transparen e de la gestion
et ne garantit que di ilement la ohéren e des données.
En e qui on erne la sauvegarde des données, les hiers ASCII omprimés, ontenant les données
brutes, sont gravés sur CD et ar hivés hez ProlARBED Re her he.
ProlARBED Re her he, qui a réalisé la gestion primaire des données et qui fait la maintenan e du
système, n'essaie pas d'atteindre stri tement tous les obje tifs mentionnés. Dans l'annexe A.2.1 plus de
détails sont donnés on ernant la gestion primaire de données réalisées sur site.
1.3.2.2
La gestion se ondaire de données
En e qui on erne la gestion de données au CRP Henri Tudor, un des buts était de mettre en oeuvre
un système qui serait sus eptible de garantir les obje tifs ités auparavant. Cela aussi par e que les
projets qui sont traités par l'équipe de modélisation du Centre ont presque toujours une partie de gestion
de données qui pourrait être standardisée.
12
1.3.
Les données du pro essus
La première partie de la gestion se ondaire de données est la ré upération des données du partenaire.
Cette partie traite le sujet de l'a ès, du transfert, du format et de la ondentialité des données. Dans
le as de e projet, le transfert des données est réalisé par des médias portables (voir Fig. 1.6).
La deuxième partie on erne l'in orporation des données numériques ré upérées dans un système de
gestion de données qui a le potentiel de garantir les obje tifs ités auparavant. Dans e as un système
de gestion de base de données (SGBD) MySQL est utilisé.
Un type de bases de données regroupe les diérentes données provenant du pro essus. On trouve les
données de type y liques et statiques qui sont utilisées pour les diverses analyses. Le tableau en annexe
(Tab.A.1) résume les données rassemblées pendant la période du premier dé embre 2000 au sept juillet
2001.
Dans un Centre de re her he plusieurs projets ave diérents partenaires sont gérés. Il est important
de pouvoir donner une garantie aux partenaires en e qui on erne la ondentialité des données qui sont
mises à disposition. Un système de gestion de base de données (SGBD) est prédestiné pour remplir ette
tâ he. Ces SGBD orent un système de gestion du droit d'a ès basé sur un nom d'utilisateur et un mot
de passe qui gère l'a ès aux bases de données voire aux tableaux.
Un autre avantage d'un SGBD est la exibilité d'a ès aux données. Quelques types de méthodes
d'a ès sont représentés dans la gure 1.7.
Fig.
1.7 Méthodes d'a ès aux données au CRP Henri Tudor
Prin ipalement deux types de méthodes sont distingués :
L'a ès dire t au SGBD, en se basant sur les API oerts par e dernier. Cette méthode est généralement la plus rapide du point de vue onnexion et transfert de données. Elle est en général la plus
ri he du point de vue fon tionnalité ar elle met à disposition toutes les possibilités et propriétés
oertes par le SGBD.
L'a ès indire t, en passant par une passerelle orant un proto ole standardisé pour la ommuni ation ave un SGBD. Dans la gure 1.7 le proto ole standard ODBC est utilisé omme représentant
de e type de ommuni ation. Le grand avantage est que la plupart des SGBD sont ompatibles
ave es standards, e qui rend l'appli ation indépendante d'un SGBD parti ulier. Si pour une
raison ou une autre il faut hanger le SGBD toutes les appli ations sont réutilisables sans au une
modi ation.
Cependant souvent les standards ne dénissent qu'un sous-ensemble ommun des propriétés oertes
par les SGBD. De plus le fait d'implémenter un proto ole standardisé implique automatiquement
un ertain surplus au niveau du proto ole, e qui engendre une rédu tion de la performan e du té
du SGBD.
Un autre aspe t de la gestion des données est la gestion des résultats d'analyse. Dans e ontexte il est
important de rappeler qu'an de pouvoir reproduire les expérien es, il est indispensable de sauvegarder
tous les paramètres des expérien es.
La mise en pla e du système d'a quisition, de la gestion primaire et se ondaire des données provenant
de l'installation industrielle a été indispensable an d'entamer une phase d'analyse basée sur des exemples.
Etre apable d'a éder de façon stru turée et reprodu tible à des données et en même temps pouvoir
augmenter au fur et à mesure le orpus de données représente une bonne base pour tout type d'analyse
13
Chapitre 1.
Le projet industriel
basée sur des exemples. Une telle partie de gestion de données est souvent oubliée ou sous-estimée dans
la plani ation de projets de re her hes.
1.4 Aperçu sur le on ept de ontrle prédi tif basé sur une aide
à la dé ision
Avant de regarder en détail les méthodes utilisées pour l'analyse de données temporelles et avant de
détailler les propositions qui sont faites dans ette thèse, on ernant une appro he de ontrle prédi tif
basée sur une aide à la dé ision, les idées globales de ette appro he sont introduites dans ette se tion
transitoire. Le but de ette se tion est de familiariser le le teur ave e on ept an de mieux préparer
l'argumentation et les dé isions qui seront prises dans les hapitres suivants. Elle souligne aussi la stru ture
et le hoix des hapitres 3 et 4, ar l'appro he peut être divisée en deux parties distin tes. Dans et aperçu
les deux parties sont présentées dans l'ordre inverse des hapitres de la thèse par e qu'il a été onstaté que
et ordre fa ilite la ompréhension de l'appro he globale. L'ordre de la suite du do ument est stru turé
diéremment, par e que les éléments qui se su èdent se onstruisent les uns sur les autres.
Commençons par le but global posé par le partenaire industriel, qui onsiste en premier lieu à trouver
un moyen pour réduire les oûts de produ tion, mais aussi à mieux omprendre le omportement du
pro essus. Dans e projet l'unité four à ar éle trique de la haîne de produ tion omplète est visée. Une
onstatation déjà évoquée dans le hapitre 1.2.3 est que le omportement du pro essus dépend fortement
de son historique. De plus, l'expérien e montre qu'il existe des régularités dans le omportement du
système four à ar éle trique. Une partie des paramètres qui ont une inuen e sur e omportement
sont onnus, mais la façon dont ils inuent n'est que très mal perçue.
Aujourd'hui l'opérateur a des onsignes en forme de prols d'évolutions s hématisés globalement pour
une harge. Ces prols ont été élaborés par le fournisseur de l'installation et adaptés par les responsables
de l'installation sur site selon leurs besoins et expertises. Des observations ont montré que souvent il n'est
pas possible pour l'opérateur de suivre es onsignes à ause de divers paramètres qui inuent sur le
omportement de l'installation. Les opérateurs réagissent alors intuitivement (selon un modèle interne)
de manière à ontrler plus ou moins bien la situation.
Il serait avantageux de onnaître les types de omportement que peut avoir le pro essus et de pouvoir
informer l'opérateur à l'avan e an qu'il puisse éventuellement éviter des modes de omportement qui
sont onnus pour générer d'importants oûts de produ tion. L'hypothèse est que par une telle intera tion
il est possible de hanger la distribution de onsommation globale de manière à réduire les oûts de
produ tion (voir gure 1.8).
Dans la suite de ette se tion une telle appro he de ontrle prédi tif basé sur une aide à la dé ision
va être proposée. L'appro he proposée se divise en deux parties :
la partie du ontrle en ligne.
Dans ette partie la situation a tuelle du pro essus ave un ertain historique est évaluée an de
proposer une mar he à suivre en vue de nir la harge en ours, tout en intégrant la apa ité de
tenir ompte d'un ertain nombre de ritères qu'il s'agit d'optimiser.
la partie analyse évolutive du pro essus.
Cette partie fournit les outils et méthodes élémentaires sur lesquels repose la partie de ontrle
en ligne. Un nombre représentatif de données du pro essus est analysé dans l'obje tif d'extraire
les omportements-types du pro essus et d'être apable de pouvoir les mettre en relation ave les
ritères d'optimisation.
Il s'agit de faire émerger des prototypes de omportement temporel du pro essus en se basant sur
les données mesurées.
Cette appro he de ontrle a été hoisie après avoir onstaté par des analyses préliminaires, des
observations sur site et des dis ussions ave les diérents a teurs, qu'il doit y avoir une relation entre le
omportement temporel du pro essus et les ritères qu'il s'agit d'optimiser. La gure 1.9 résume l'appro he
de ontrle prédi tif proposée par ette thèse.
An d'expliquer la démar he, posons la situation suivante s hématisée dans la gure 1.9 : Un nouveau
y le de produ tion à ommen é il y a environ 12 min. La phase de fusion du premier panier est en ours.
14
1.4.
Fig.
Aperçu sur le
on ept de
ontrle prédi tif basé sur une aide à la dé ision
1.8 Prin ipe et hypothèse an d'engendrer une baisse de onsommation.
Fig.
1.9 Con ept du ontrle prédi tif en ligne
15
Chapitre 1.
Le projet industriel
Le graphe de la puissan e éle trique montre l'évolution de ette première partie du pro essus du début de
la harge jusqu'à l'instant a tuel. Cette partie dé rit l'historique à ourt terme .-à-d. l'évolution onnue
de ette harge. Elle ne représente qu'une partie de l'évolution omplète de la harge qui n'est pas en ore
onnue à et instant. Après odage du signal qui sera expliqué dans la deuxième partie de l'appro he, e
début de harge est représenté par une sous-séquen e appelée sous-mot. Ce terme vient du fait qu'une
évolution omplète d'une harge représentée dans sa forme odée est appelée un mot (voir Fig. 1.10).
An de pouvoir faire une proposition pour la mar he à suivre en vue de naliser la harge en ours,
tout en gardant la possibilité de tenir ompte d'un ertain nombre de ritères, quelques suppositions sont
faites :
Première supposition : il existe une lassi ation des évolutions temporelles des harges omplètes
réalisées par l'installation et haque lasse peut être représentée par une évolution type.
Deuxième supposition : il est possible de trouver un sous-ensemble de lasses d'évolutions qui sont
pro hes de la partie onnue (sous-mot) de l'évolution de la harge en ours.
Troisième supposition : il existe une relation entre les ritères à optimiser et les lasses d'évolutions.
Ces trois suppositions reètent qu'une ertaine onnaissan e a pu être extraite des données analysées.
Le détail sera analysé dans la deuxième partie de l'appro he.
Ave es trois suppositions, il est possible de proposer à l'opérateur à tout moment de l'évolution
d'une harge (sous-mot) un ou plusieurs s énarios (suggestions) de la mar he à suivre pour onduire
le four, an de terminer la harge en ours en tenant ompte des ritères qu'il s'agit d'optimiser.
Le on ept de ontrle prédi tif tel qu'il est proposé i i pourrait aussi appartenir à la lasse des
appro hes d'aide à la dé ision. Ce i par e que le ontrle est lassiquement une opération autonome se
référant à des mesures du pro essus et à un modèle du pro essus réel. De plus, le ontrle agit de façon
autonome sur les paramètres d'entrée du pro essus an d'inuen er son omportement.
Le terme ontrle a été adopté pour souligner la bou le fermée de l'appro he. Dans le on ept
proposé, la bou le est fermée par l'opérateur qui premièrement hoisi la proposition qu'il va suivre et
deuxièmement agit sur les paramètres de l'installation an de réaliser ette proposition. Les s énarios
proposés s'adaptent en permanen e au omportement du pro essus. Si l'opérateur dé ide de onduire le
four autrement ou si, en raison d'un événement inattendu, il est obligé de hanger de pro édure, ette
appro he est apable de déte ter le hangement d'évolution, de le prendre en ompte et de faire une
proposition adaptée pour la suite du pro essus.
Au début d'un y le de produ tion, l'impa t de la proposition sur l'optimisation est plus important
par e que la majeure partie du y le est ouverte et peut en ore être inuen ée. Par ontre la déte tion
d'une lasse d'évolution adéquate est moins évidente quand la partie onnue du y le (sous-mot) est
ourte. Cela s'inverse ave l'avan ement du pro essus. Ave l'augmentation de la partie onnue du y le,
la déte tion de lasse d'évolution adéquate se pré ise, ependant la marge d'inuen e sur la suite de
l'évolution de la harge se réduit et ave elle le potentiel d'une éventuelle amélioration.
Ce on ept de ontrle prédi tif se base sur les trois suppositions faites auparavant. La dernière supposition arme qu'il existe une relation entre les ritères qu'il s'agit d'optimiser et les lasses d'évolutions.
En d'autres termes il existe une relation entre l'évolution d'un y le de produ tion et es ritères. Non
seulement les experts de l'installation soulignent l'existen e de ette relation mais d'autres analyses réalisées dans le adre du projet de re her he CECA soulignent l'existen e d'une telle relation [2℄. Faute de
posséder au départ du projet les moyens de fournir plus de garantie sur l'existen e de la relation, ette
supposition est onsidérée omme étant démontrée pour la suite de e travail.
Les deux autres suppositions ne sont pas indépendantes. La première supposition doit être garantie
avant d'aborder la deuxième qui se base sur l'existen e d'une lassi ation. An d'aborder le sujet de la
lassi ation, une deuxième partie de l'appro he est proposée, la partie analyse évolutive du pro essus
qui va fournir les moyens pour parvenir aux besoins des deux premières suppositions. La gure 1.10 donne
une vue globale de ette deuxième partie.
L'analyse évolutive du pro essus est divisée en deux étapes :
1. L'étape du odage des signaux.
Le but de ette étape est d'obtenir une forme odée du signal analysé qui réduit le volume de données
à manipuler sans pour autant perdre des informations pertinentes. La méthode de odage propose
une extention d'une méthode onnue (PAA) et est brièvement présentée i i. Elle est onstituée de
16
1.4.
Fig.
Aperçu sur le
on ept de
ontrle prédi tif basé sur une aide à la dé ision
1.10 Le odage et l'analyse du omportement du pro essus
deux phases :
(a) La phase d'extra tion de formes primitives qui omposent le signal analysé (1a g. 1.10).
Le but de ette phase est d'analyser un é hantillon représentatif du signal an d'en tirer les
formes les plus ara téristiques. Dans la gure e sont les formes identiées par les lettres A,
B, C et D. Un ensemble de telles formes primitives est appelé un alphabet.
(b) La phase d'en odage des signaux (1b g. 1.10).
Après la réation d'un alphabet, le signal de tous les y les de produ tion du orpus analysé
est en odé en se basant sur es formes primitives e qui produit une suite d'identiants de
formes pour haque y le. Une telle suite est appelée un mot.
2. L'étape de la lassi ation d'évolutions (2 g 1.10).
Cette étape se base sur une représentation en mots des y les de produ tion après le odage. Dans
ette deuxième étape il s'agit de regrouper les harges qui ont une évolution temporelle semblable
dans des lasses d'évolution, e qui revient à regrouper les mots qui sont similaires.
En globalité, le résultat de la partie analyse évolutive du pro essus est un lassi ateur pour les y les
de produ tion qui se base sur la similarité de leur l'évolution temporelle. Chaque lasse est représentée
par un prototype qui sera appelé dans la suite : un prototype d'évolution ou une évolution type. Dans
ette deuxième partie divers sujets sont abordés avant de pouvoir réaliser un tel lassi ateur.
An de progresser dans la démar he vers la possibilité de proposer à l'opérateur un ou plusieurs
s énarios, le hapitre 2 va présenter et dis uter la relation entre les appro hes onnexionnistes et les
prin ipaux sujets de ette thèse à savoir l'extra tion de onnaissan es, les données temporelles et les
appro hes de ontrle.
Dans le hapitre 3 les diérentes étapes respe tivement phases évoquées i-dessus seront détaillées,
ommençant par une analyse globale des spé i ités de données temporelles, et suivi de la méthode utilisée
pour le odage ave l'extra tion des formes ara téristiques du signal analysé et l'en odage des signaux.
Le odage se base sur une méthode de lassi ation par des artes auto-organisatri es. Le hapitre nit
ave une se tion sur la lassi ation de séries temporelles ave en parti ulier le sujet de la similarité et les
17
Chapitre 1.
Le projet industriel
séquen es de taille variable. Une méthode appelée Dynami Time Warping (DTW) issue du domaine de
la programmation dynamique sera utilisée en tant que mesure de distan es pour alimenter une appro he
de lassi ation non-supervisée basée sur des prototypes. Les lasses d'évolutions qui regroupent des
y les de produ tions ( harges) sont produites et fournissent la base pour le hapitre suivant.
De plus e hapitre fournit les méthodes et informations de base pour la résolution de la deuxième
supposition, à savoir la possibilité de trouver un sous-ensemble de lasses d'évolutions pro hes en ne
onnaissant qu'une première partie de l'évolution d'une harge.
C'est dans le hapitre 4 que e sujet de la lassi ation en ligne sera abordé an de pouvoir en déduire
des propositions d'évolutions pour l'opérateur. La méthode proposée réalise une lo alisation d'une sousséquen e temporelle en se basant sur la mesure de similarité utilisée auparavant.
Les sujets relatifs à l'utilisation des ritères d'optimisation et au ontrle en bou le fermée ne sont
malheureusement pas on rètement dis utés par défaut d'implémentation sur le site. Cependant les sujets
sont eeurés à la n de e hapitre.
18
Chapitre 2
Réexions sur le
onnexionnisme
Sommaire
2.1 Quelques bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 La onnaissan e dans le onnexionnisme . . . . . . . . . . . . . . . . . . . .
20
21
2.3 Le temps et le onnexionnisme . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.4 Le ontrle et le onnexionnisme . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.5 Con lusion de e hapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.2.1
2.2.2
Le modèle boîte-noire s'explique . . . . . . . . . . . . . . . .
Catégorisation et lassi ation . . . . . . . . . . . . . . . . .
2.2.2.1 Dénition de l'environnement mathématique . . . .
2.2.2.2 Les mesures lassiques pour l'optimisation . . . . .
2.2.2.3 Appro hes où un seul prototype est onsidéré . . . .
2.2.2.4 Appro hes ave une stru ture de réseau dynamique
2.2.2.5 Les artes auto-organisatri es de Kohonen . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2.3.1
2.3.2
L'appro he spatio-temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Les réseaux ré urrents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1
2.4.2
2.4.3
Le ontrle par apprentissage supervisé . . . . . . . . . . . . . . . . . . . . . .
Le ontrle par modèle inverse . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stru ture de ontrle ave modèle interne . . . . . . . . . . . . . . . . . . . . .
19
22
23
24
25
25
26
26
29
30
32
32
32
Chapitre 2.
Réexions sur le
onnexionnisme
Ce travail propose des appro hes onnexionnistes, an de fournir des outils qui peuvent aider dans
l'analyse de pro essus omplexes et ainsi raner la ompréhension des phénomènes sous-ja ents qui
inuent sur le omportement du pro essus analysé.
Beau oup de pro essus industriels sont partiellement automatisés. En eet, souvent des parties bien
dénies d'un pro essus global, elles qui sont plus ou moins bien maîtrisées et autonomes, sont ontrlées
en automatique. Cette automatisation partielle se base sur diverses mesures réalisées autour de l'installation. An de gérer le pro essus global, le plus souvent, un groupe d'opérateurs humains surveille
l'ensemble depuis un poste de ontrle. En fon tion du degré d'automatisation, les opérateurs interagissent de manière plus ou moins dire te ave le pro essus an de garantir le bon fon tionnement de
l'installation.
L'opérateur est onfronté à un nombre d'informations important qui ont souvent diérents niveaux
d'abstra tion, omme par exemple des mesures provenant dire tement de apteurs de l'installation, ou
des informations plus abstraites ou plus globales issues de parties du pro essus automatisé, voire d'autres
informations globales provenant d'autres unités de la haîne de produ tion. Il doit surveiller es informations et en tirer des on lusions en vue de réagir de façon appropriée.
C'est dans e ontexte que des appro hes avan ées du domaine de l'analyse de données et de la
modélisation peuvent intervenir, an d'aider l'opérateur dans ses hoix. Les appro hes onnexionnistes
sont onnues pour leur fa ulté d'analyse non-supervisée, et l'extra tion de onnaissan es qui en dé oule,
leur propriétés d'analyse non-linéaire ainsi que la fa ulté de traiter des informations omplexes et de
pouvoir les représenter dans diérents niveaux d'abstra tion, sans oublier leur robustesse par rapport
aux données bruitées.
Ce hapitre propose quelques bases du domaine onnexionniste, survole la relation entre onnaissan es
et onnexionnisme, introduit les séries temporelles et plus spé ialement la représentation du temps dans
les appro hes onnexionnistes, et analyse le domaine du ontrle sous l'angle du onnexionnisme.
2.1 Quelques bases
Un nombre important d'ouvrages existe où les bases du onnexionnisme sont représentées sous différents angles tels que les relations mathématiques [20℄, ou méthodologiques [21℄. D'autres sont basés
sur des aspe ts pédagogiques bien pré is omme des expli ations détaillées d'implémentations ave des
exemples de programmes en Matlab ou la on eption de réseaux [17℄. Un travail qui donne un aperçu
sur un grand nombre de domaines qui sont abordés par les appro hes onnexionnistes, est la thèse de
Laurent Bougrain [6℄.
Il n'est pas le devoir ni l'obje tif de ette thèse d'ajouter quoi que e soit à es ouvrages. Cependant
an de ompléter le adre du travail, les aspe ts du onnexionnisme en relation ave les domaines abordés
i i seront ré apitulés dans e hapitre. Cela aussi en vue de montrer quelques faiblesses qui existent a tuellement dans es domaines et auxquelles e travail a l'ambition d'apporter des idées voire des propositions
primaires.
Le onnexionnisme tel qu'il est perçu dans e travail représente un al ul distribué où les unités lo ales
détiennent des informations primaires. La fon tionnalité de es unités est normalement assez limitée mais
peut avoir des aspe ts de non-linéarités. La fon tionnalité globale résulte de l'intera tion entre es unités
qui sont onne tées entre elles.
Les premières idées de telles stru tures arti ielles sont issues d'un travail de ollaboration entre le
neurophysiologiste Warren M Cullo h et le mathémati ien Walter Pitts [47℄ en 1943. Ils se sont inspirés
de la stru ture du erveau humain où les unités (neurones) sont omposées d'un noyau ayant des entrées
et des sorties par lesquelles ils sont inter onne tés entre eux. C'est la raison pour laquelle on parle
de onnexionnisme, de réseaux onnexionnistes, de réseaux de neurones arti iels et du domaine de
l'intelligen e arti ielle.
Un aspe t qui a une inuen e importante sur la fon tionnalité globale d'un réseau onnexionniste est
la topologie du réseau .-à-d. la stru ture qui est représentée par les unités et leurs onnexions. Souvent
les neurones sont regroupés dans des ou hes. Pour haque ou he la propagation de l'information est
onsidérée omme étant instantanée. Deux atégories prin ipales sont distinguées si on se limite à la
stru ture du réseau :
20
2.2.
La
onnaissan e dans le
onnexionnisme
Réseaux feed-forward : Pour e type de topologie, le ux d'information est unidire tionnel et va des
entrées du réseau vers sa sortie. Les onnexions entre unités reprennent la même stru ture, il n'existe
pas de onnexion latérale entre unités d'une même ou he ni de onnexions entre une ou he et la
ou he pré édente. On parle généralement de per eptrons ou per eptrons multi ou hes.
Réseaux ré urrents : Ce type de topologie peut entre autres ontenir des onnexions ré ursives. Les
y les qui sont formés par es onnexions peuvent être lo aux en ae tant uniquement des unités d'une même ou he ou globaux en onne tant des unités d'autres ou hes. Il est question de
réseaux du genre : Hopeld[24℄, Jordan[28℄ ou Elman[12℄. Même les artes auto-organisatri es de
Kohonen[37℄ qui sont souvent répertoriés dans une atégorie propre peuvent être vue omme un réseau ré urrent à ause du voisinage qui peut être interprété omme une ré ursion lo ale. Ce dernier
type de topologie sera analysé plus en détails par après ( hap. 2.2.2) et aura plus de poids dans la
suite de e travail de thèse.
Un autre aspe t d'une grande importan e qui est asso ié ave les méthodes onnexionnistes est la
fa ulté d'apprentissage sur base d'exemples. C'est e genre d'aspe t qui est à la base de l'intérêt que
portent aujourd'hui aussi bien le domaine s ientique que le domaine industriel envers es méthodes. On
distingue trois formes d'apprentissage :
l'apprentissage supervisé : e type d'apprentissage se base sur le fait qu'un orpus existe qui ontient
la relation entre observations et résultats. Prenons omme exemple une appro he de lassi ation
simple, un nombre d'images a he ou bien un triangle ou bien un er le. En montrant l'image
on pré ise à haque fois de quelle forme il s'agit, la forme et l'étiquette asso iée sont données. Le
résultat souhaité de la lassi ation est onnu pour le orpus d'apprentissage et le réseau est guidé
durant son apprentissage.
l'apprentissage non-supervisé : e type d'apprentissage est utilisable si le orpus ne omprend que des
observations sans résultats. Il est possible d'extraire du orpus des observations typiques. Reprenons
l'exemple pré édent ave le orpus qui ne ontient que les images de triangles et de er les. Il est
possible d'apprendre que deux diérentes formes sont présentes dans le orpus et il est possible de
ressortir un représentant de es deux formes. Puisque dans e ontexte le résultat (la atégorie)
n'est pas onnu au préalable on parle d'apprentissage non-supervisé.
l'apprentissage semi-supervisé : e type d'apprentissage est un mélange entre les deux pré édents.
C'est le genre d'apprentissage le plus répandu hez l'humain. En reprenant l'exemple pré édent, un
enfant joue ave des artes qui représentent les images d'un té et les étiquettes de l'autre té.
Le but est de mettre ensemble les artes des images ave les bonnes étiquettes. De temps en temps
la mère regarde et lui donne une ré ompense pour haque bonne asso iation. La ré ompense fait
en sorte que la bonne relation est plus attra tive et qu'elle sera apprise.
Les paramètres prin ipaux d'un réseau onnexionniste sont la topologie des ou hes, le nombre de
ou hes, le nombre de neurones par ou he et les types de fon tionnalités des unités.
Après et aperçu sur les bases des réseaux onnexionnistes, le vo abulaire utilisé dans e domaine a
été introduit. La suite de e hapitre va plus spé ialement traiter les propriétés que es stru tures ont
dans le domaine des onnaissan es et du traitement des aspe ts temporels.
2.2 La onnaissan e dans le onnexionnisme
Avant de rentrer dans des détails sur la relation entre la onnaissan e et les appro hes onnexionnistes,
il est important de bien dénir le terme onnaissan e, les lasses de onnaissan es qui sont onsidérées et
les formes sous lesquelles une onnaissan e peut apparaître. Diérents points de vue sur e sujet existent
et peuvent mener vers des problèmes de ommuni ation et de ompréhension.
Une dénition générique du terme onnaissan e a été proposée par Fis hler et Firs hein en 1987 [14℄ :
Knowledge refers to stored information or models used by a person or ma hine to interpret,
predi t, and appropriately respond to the outside world.
Selon ette dénition la base de la onnaissan e est don onstituée des informations préexistantes ou
des modèles onnus. Fis hler et Firs hein distinguent de plus entre deux lasses de onnaissan es :
Les informations préliminaires :
21
Chapitre 2.
Réexions sur le
onnexionnisme
e sont des faits onnus du monde externe. Des exemples peuvent être : des méthodes mathématiques, un domaine théorique omme la thermodynamique, des s hémas d'une installation ou en ore
des royan es personnelles ou olle tives.
Les observations du monde externe :
elles peuvent être réalisées à travers des méthodes de mesures dire tes ou indire tes ou venir d'observations personnelles. En général, les onnaissan es provenant d'observations ne sont pas dire tement
a essibles. La plupart du temps, des analyses détaillées sont né essaires.
Ensuite ils arment que les onnaissan es regroupées dans une même lasse peuvent apparaître sous
diverses formes :
La onnaissan e sous forme d'un modèle numérique.
Un modèle numérique peut d'un té être expli able, si la relation entre ses entrées et ses sorties
sont dé rites de façon expli ite par des fon tions mathématiques. D'un autre té un modèle est non
expli able, si es relations n'existent pas sous une forme expli ite. On parle dans e as de modèles
boîtes noires.
La onnaissan e sous une forme symbolique.
En général les onnaissan es expertes peuvent être attribuées à la lasse des observations du monde
externe. Si elles existent de façon expli ite elles apparaissent sous une forme symbolique.
Ce i ne donne qu'un vague aperçu du sujet qui est étudié de façon s ientique par les s ien es ognitives. Déjà la dénition du terme s ien es ognitives est déli ate et sour e de nombreux débats. La
ognition est un synonyme de onnaissan e et en tant que telle, pas un a quis gé. C'est pourquoi on
utilise souvent le terme de pro essus ognitif [29℄. Dans e terme sont regroupées deux notions, elle de
pro essus qui réfère au mé anisme a tif et organisé dans le temps et elle de la ognition .-à-d. de la
onnaissan e.
Ce n'est pas l'objet de ette thèse de reuser en détails e sujet mais an de positionner e travail
quelques relations seront évoquées.
Dans le adre de ette thèse, et sans obje tif universel, la dénition suivante de Jean-Daniel Kant [29℄
pour le terme de pro essus ognitif est adoptée :
Un pro essus
ognitif est un pro essus de traitement d'informations, où l'information est de
nature variée : signaux sensoriels ou moteurs, symboles d'un langage,
ou
royan es personnelles
olle tives, et . Ces traitements sont utilisés par un sujet dans un but donné :
réaliser
ertaines
apa ités fondamentales et
ara téristiques de l'esprit humain
elui de
omme le
langage, le raisonnement, la per eption, la dé ision, la plani ation, et .
Le domaine de Intelligen e Arti ielle (IA) distingue essentiellement deux types de modèles informatiques [13℄ : On a d'un té les modèles du type symbolique. Ils se basent entre autres sur des systèmes
à base de onnaissan e, des systèmes multi-agents ou en ore des systèmes à objets. De l'autre té on
trouve les modèles du type réseaux onnexionnistes qui ont déjà été évoqués.
Les modèles du type symbolique, omme par exemple les systèmes experts, sont adaptés de fa to au
traitement des onnaissan es sous une forme symbolique. Par ontre le traitement de données réelles et
ontinues omme elles que fournissent des apteurs de mesure leur pose des problèmes.
Les modèles du type réseaux onnexionnistes sont parti ulièrement adaptés au traitement de données
réelles, à la réalisation du passage du ontinu au dis ret et à faire émerger des stru tures omme 'est
le as dans la re onnaissan e de formes (la atégorisation per eptive). Cependant leur habilité dans le
traitement de données symboliques et dis rètes est limitée.
Un avantage des modèles onnexionnistes est leurs apa ités multiples dans le domaine de l'apprentissage à partir d'exemples. Posé dans le ontexte de la s ien e ognitive, les modèles onnexionnistes ont le
potentiel de réation ou d'extra tion de onnaissan es en se basant sur des observations du type mesures.
2.2.1 Le modèle boîte-noire s'explique
Dans le domaine de la modélisation et de l'identi ation de systèmes, les modèles boîte-noire sont
bien onnus. Il est question d'une appro he qui se base sur des informations d'entrée et de sortie d'un
système an de onstruire un modèle du système qui implémente la relation entrée sortie. L'utilisateur
22
2.2.
La
onnaissan e dans le
onnexionnisme
d'un tel modèle sait identier les entrées et sorties qui sont utilisées, mais il ne onnaît pas les relations
internes du modèle.
Ce genre de méthode est ouramment appliqué dans le domaine industriel. Dans le domaine du
onnexionnisme la stru ture par ex ellen e pour l'implémentation de modèles boîte-noire est le per eptron
multi ou hes (MLP). Il a été démontré qu'un per eptron à une ou he a hée est apable de réaliser toute
fon tion ontinue et multivariée [9℄, [25℄. Globalement un MLP est apable de réaliser sur la base d'un
apprentissage supervisé des modèles de boîte-noire très omplexes qui réalisent un traitement non-linéaire
multivarié à sorties multiples.
En faisant référen e à la dénition de Fis hler et Firs hein, ette tâ he peut déjà être mise en relation
ave la réation de onnaissan es, ar le modèle qui est réé est apable de donner une réponse sur le
omportement d'un système dans des ir onstan es données.
Il est souvent di ile de se ontenter de e niveau d'abstra tion de la onnaissan e, par e qu'elle
n'explique pas les relations internes qui onstituent un tel modèle boîte-noire. L'utilisateur aimerait se
servir de ette onnaissan e an de pouvoir tirer des on lusions sur le pro essus sous-ja ent dé rit par
un tel modèle.
En prin ipe tous les paramètres internes du modèle onnexionniste sont onnus, mais le nombre élevé
de onnexions et les relations non-linéaires multiples sont un obsta le quasi infran hissable.
Néanmoins pour les réseaux onnexionnistes du type per eptron des méthodes ont été développées
ave la apa ité de répondre en partie à es besoins. Deux groupes peuvent être distingués :
Les passerelles neuro-symboliques [39℄.
Le but de es appro hes est de réaliser une interfa e entre des modèles onnexionnistes et des
modèles symboliques an de pouvoir onne ter les deux modèles et les utiliser ha un pour ses
ompéten es.
Issue de es travaux est la possibilité de réer une base de règles dé rivant un réseau onnexionniste
parti ulier (après apprentissage). On retrouve de telles appro hes aussi dans le domaine de la logique
oue ombinée aux réseaux onnexionnistes [8℄.
La onstru tion dynamique de réseaux onnexionnistes [6℄.
Le but primaire de es appro hes est de savoir ombien de neurones et quelles onnexions sont
né essaires pour un problème donné. I i deux appro hes existent : On ommen e par un réseau de
grande taille et on réalise un élagage an de réduire la omplexité [19℄, [41℄, ou on ommen e par
le bas ave un minimum d'unités et on ajoute au fur et à mesure de l'apprentissage des unités an
de raner le réseau [15℄.
Une autre retombée de es appro hes est de pouvoir analyser quelles sont les relations pertinentes
d'un système qui est représenté par un tel modèle.
Les modèles boîte-noire implémentent en gros une régression de fon tions qui, dans le ontexte des
réseaux onnexionnistes, peut avoir des ara téristiques très omplexes. A té de e domaine d'appli ation, un autre domaine ave une importan e similaire est la atégorisation ou en ore la lassi ation. Les
réseaux onnexionnistes ont une pla e indis utable dans e domaine.
2.2.2 Catégorisation et lassi ation
Dans le domaine des s ien es ognitives, on utilise le terme de atégorisation pour le regroupement
d'objets de même nature dans une lasse. Un des buts de la atégorisation est d'assurer la transition
du ontinu au dis ret an d'améliorer l'adaptation à l'environnement. Aussi dans la représentation de
onnaissan es la atégorisation joue un rle non négligeable. Le pro essus de formation de atégories est
dire tement asso ié à l'apprentissage.
Le terme de lassi ation réfère à la détermination de la lasse d'appartenan e d'un objet donné.
La lassi ation intervient dans le pro essus de raisonnement et de prise de dé ision. Deux a tivités
ognitives sont distinguées : le hoix qui intervient dans la séle tion d'un objet appartenant à la même
lasse qu'un autre objet, sans se préo uper des ara téristiques de la lasse et le jugement où la séle tion
d'un objet se fait par le fait d'appartenir à une atégorie spé ique.
Dans le domaine du onnexionnisme les deux tâ hes sont onnues. Cependant la terminologie utilisée
dans le onnexionnisme est légèrement diérente en e qui on erne la atégorisation. La atégorisation est
dire tement liée à la phase d'apprentissage par laquelle passe la onstru tion d'un réseau onnexionniste.
23
Chapitre 2.
Réexions sur le
onnexionnisme
C'est pourquoi deux types de atégorisations existent pour le onnexionnisme et ils se distinguent au niveau de l'apprentissage : il est question de la lassi ation supervisée et de la lassi ation non-supervisée.
Notons qu'il est question de atégorisation, même si le terme lassi ation est utilisé.
Le terme de "` lassi ation supervisée"' est utilisé quand il s'agit d'un apprentissage supervisé. Au
préalable, un orpus de données existe, qui ontient des exemples de ara téristiques ave les lasses
auxquelles ils appartiennent. Dans e as le réseau apprend la relation qui existe entre ara téristiques et
lasse.
Le terme de lassi ation non-supervisée est utilisé quand un apprentissage non-supervisé est utilisé. Il
s'agit dans e as de regrouper des exemples qui ont des ara téristiques similaires sans savoir au préalable
quelles sont les lasses qui existent. Dans le ontexte de ette étude 'est e type de regroupement qui va
jouer un rle important et il sera analysé plus en détail dans la suite.
Berned Fritzke, dans [15℄ regroupe et analyse diverses méthodes utilisées pour la lassi ation nonsupervisée en se référant au mé anisme d'apprentissage ommun, qu'il regroupe sous le terme d'apprentissage ompétitif. Pour toute personne intéressée à e sujet e papier est fortement onseillé.
Dans la suite de e travail ertains aspe ts de es méthodes vont revenir et être analysés plus en
détails. Il est don important de donner au le teur un résumé des méthodes les plus utilisées an de le
familiariser ave le sujet.
2.2.2.1
Dénition de l'environnement mathématique
Les méthodes analysées par Fritzke se limitent à un ertain type en matière de lassi ations qui est
déni dans l'environnement mathématique i-dessous. D'autres domaines proposent d'autres appro hes,
mais pour le adre de e travail ils ne seront pas onsidérés.
Le but global de toutes es méthodes de lassi ation non-supervisée est de distribuer un nombre N
de ve teurs de référen e, aussi onnus sous le nom de prototypes, dans l'espa e analysé.
A = {c1 , c2 , · · · , cN }
(2.1)
wc ∈ Rn
(2.2)
La distribution des prototypes doit reéter d'une manière ou d'une autre la probabilité de distribution
des observations qu'il s'agit d'analyser.
Entre es prototypes peut exister une relation de voisinage qui généralement est représentée par un
ensemble de onnexions.
C ⊂A×A
(2.3)
Nc = {i ∈ A|(c, i) ∈ C}
(2.4)
De e fait les voisins topologiques peuvent être trouvés par la relation suivante.
Les observations sont représentées par un orpus d'exemples.
ave ξi ∈ Rn
(2.5)
Ce i dé rit l'environnement ommun pour toutes les méthodes analysées par Fritzke. Une autre appro he ommune de es méthodes est la notion de prototypes gagnants. Pour une observation donnée ξ
le prototype gagnant s(ξ) est elui ave le ve teur de référen e le plus pro he de l'observation.
D = {ξ1 , · · · , ξM },
s(ξ) = arg min d(ξ − wc )
(2.6)
Le plus souvent la métrique eu lidienne est utilisée pour dénir la distan e entre les deux ve teurs.
Si les i plus pro hes prototypes sont utilisés la notation sera si (ξ) ou tout simplement si .
Toutes les observations pour lesquelles un prototype est gagnant omposent un sous-ensemble qui est
représenté par la relation suivante.
c∈A
Rc = {ξ ∈ D|s(ξ) = c}
24
(2.7)
2.2.
La
onnaissan e dans le
onnexionnisme
Un tel sous-ensemble est aussi appelé un ensemble de Voronoi. Fritzke dans son papier fait référen e à
deux on epts du domaine de la géométrie algorithmique qui sont étroitement liés aux méthodes dis utées
i i. Il est question des diagrammes de Voronoi et de la triangulation de Delaunay. Ce sujet ne sera pas
approfondi i i, le le teur intéressé est renvoyé au papier de Fritzke [15℄.
2.2.2.2
Les mesures
lassiques pour l'optimisation
An de positionner les prototypes dépendant des observations, deux méthodes prin ipales sont analysées par Fritzke : la minimisation de l'erreur et la maximisation de l'entropie.
La méthode qui est utilisée le plus souvent est de minimiser l'erreur de distorsion globale représentée
par la formulation suivante.
E(D, A) = 1/|D|
X X
c∈A ξ∈Rc
kξ − wc k2
(2.8)
Il s'agit de pla er les prototypes de telle façon qu'ils représentent au mieux la distribution de l'ensemble
des observations.
Si le but est de distribuer les prototypes de façon à e que ha un ait la même probabilité d'être
séle tionné omme gagnant, il faut pour une observation aléatoire ξ que
P (s(ξ) = c) =
1
|A|
(2.9)
Si on onsidère l'opération d'attribution d'une observation ξ au prototype le plus pro he c omme
une opération aléatoire qui attribue x ∈ A à une variable aléatoire X , la relation (2.9) est obtenue en
maximisant l'entropie.
H(X) = −
X
P (x)log(P (x)) = E(log(
x∈A
1
)
P (x)
(2.10)
Ces deux appro hes ne peuvent normalement ne pas être atteintes en même temps, sauf éventuellement
dans le as où les observations sont uniformément distribuées, e qui n'est généralement pas le as.
2.2.2.3
Appro hes où un seul prototype est
onsidéré
En e qui on erne les algorithmes, Fritzke distingue entre deux types d'appro hes. Pour le premier
type d'appro hes, pour une observation donnée un seul prototype est gagnant et sera modié dans la
phase d'apprentissage. Le deuxième type d'appro hes omporte plusieurs as et va être dis uté ensuite.
Pour la première appro he, on distingue deux méthodes d'adaptation des prototypes : la méthode
bat h et la méthode en ligne.
La méthode bat h onsidère l'ensemble des observations avant d'adapter les prototypes, e qui est
seulement faisable si toutes les observations sont disponibles au départ. La méthode en ligne réalise pour
haque observation une adaptation du prototype gagnant et est de e fait utilisable aussi dans le as où
les observations apparaissent su essivement et ne peuvent être sto kées.
La méthode bat h est aussi appelée LBG (generalized Lloyd algorithme) [43℄. L'algorithme répète
itérativement le positionnement des prototypes omme moyenne arithmétique de leur sous-ensemble de
Voronoi respe tif.
wc =
1 X
ξ
|Rc |
(2.11)
ξ∈Rc
Un problème général de ette méthode est le as des prototypes dits morts. Ces prototypes ne sont
jamais gagnants et de e fait ils n'interviennent pas dans la distribution.
Pour la méthode en ligne une autre appro he est adoptée. Elle onsiste à bouger le prototype gagnant
vers l'observation qui lui est attribuée.
∆ws = ǫ(ξ − ws )
(2.12)
25
Chapitre 2.
Réexions sur le
onnexionnisme
ǫ est appelé le taux d'apprentissage qui détermine de ombien le prototype sera bougé. De nombreuses
appro hes existent an de xer le taux d'apprentissage. Le plus souvent le taux est diminué ave le nombre
d'itérations an de stabiliser la position vers la n de l'apprentissage.
La méthode la plus utilisée pour e type d'appro hes est onnue sous le nom de K -means. Cependant
diérentes implémentations de ette méthode existent sous e même nom [56℄. Celle à laquelle e travail
se réfère utilise un taux d'apprentissage spé ique pour haque prototype, qui est diminué ave le nombre
de fois que le prototype est séle tionné omme gagnant.
2.2.2.4
Appro hes ave
une stru ture de réseau dynamique
La méthode la plus onnue pour les réseaux adaptatifs est l'appro he appelée Growing Neural Gas
[15℄ qui ombine deux appro hes lassiques, Neural Gas [46℄ et la méthode d'apprentissage ompétitif de
Hebb. La méthode ommen e par un nombre restreint de prototypes auxquels s'ajoutent des prototypes
durant l'apprentissage. Ils sont ajoutés près des prototypes qui représentent les plus grandes erreurs
lo ales.
Par un mé anisme basé sur l'âge des onnexions entre les prototypes qui n'ont pas été modiés, la
topologie du réseau est modiée en enlevant des onnexions trop vieilles. En même temps, des prototypes
qui n'ont plus de onnexions sont éliminés.
L'adaptation des prototypes est réalisée selon (2.12) pour le prototype gagnant ave un taux d'apprentissage spé ique pour le gagnant. En même temps les voisins topologiques sont adaptés ave un
autre taux d'apprentissage. Ces taux d'apprentissage restent xes durant tout l'apprentissage.
Le résultat est un réseau pour lequel aussi bien la topologie que le nombre de prototypes sont adaptés
aux observations.
Deux autres méthodes existent, qui sont similaires à elle de Growing Neural Gas. Growing Cell
Stru tures dière en gros seulement par le fait que les onnexions entre les unités doivent toujours former
des ellules de taille k. Les unités représentent les noeuds de es ellules. Des ellules en forme de triangle
sont obtenues pour k = 3. L'ajout de prototypes est réalisé en inter alant une nouvelle unité à l'endroit de
la plus longue onnexion. Cette onnexion est réformée par des onnexions à la nouvelle unité. Growing
Grid utilise une stru ture en grille re tangulaire et peut être omparé aux artes auto-organisatri es qui
sont traitées dans la partie suivante.
2.2.2.5
Les
artes auto-organisatri es de Kohonen
Les artes auto-organisatri es ont été proposées par Kohonen [37℄ qui s'était inspiré des travaux de
Willshaw and Von der Malsburg [60℄. Elles sont aussi ouramment appelées SOM (Self-organizing Maps).
Ce type de réseau sera présenté un peu plus en détail par e que ette appro he sera utilisée plus tard.
La topologie de e réseau est dénie au départ et reste in hangée durant l'apprentissage. Elle représente
le plus souvent une grille en deux dimensions (une ou trois dimensions sont possibles). Pour l'expli ation,
le as lassique de deux dimensions sera adopté ave m = m1 · m2 le nombre de prototypes sur la grille
de taille [m1 × m2]. La lo alisation du prototype sur la grille est donnée par ai,j , don aux oordonnées
[i, j] de la grille 2D (g. 2.1).
Ce qui peut réer onfusion est que le ve teur représentatif du prototype, .-à-d. le ve teur des poids
(w~ k ) qui onne te le prototype k du réseau au ve teur d'entrée (~x), a la dimension du ve teur d'entrée n
omme pour les méthodes pré édentes. Ave k ∈ 1 · · · m étant le numéro de référen e du prototype.
L'espa e topologique est quasi indépendant de l'espa e d'entrée dans lequel se trouvent les observations. La gure 2.1 montre la diéren e entre es deux espa es.
Cette séparation des espa es se retrouve aussi dans la notion de voisinage qui est dénie par l'espa e
de la topologie. Normalement la distan e de Manhattan est utilisée pour dénir le voisinage.
pour r = ak,m et s = ai,j
(2.13)
Dans le as spé ial où l'espa e des observations est aussi de dimension deux, il est possible de représenter la topologie et la position du ve teur de référen e dans un même repère. Ce as est souvent utilisé
pour l'expli ation de la méthode d'adaptation des prototypes pour l'apprentissage. Notons ependant que
la séparation de l'espa e topologique et l'espa e d'entrées reste vraie.
d(r, s) = |i − k| + |j − m|
26
2.2.
La
onnaissan e dans le
onnexionnisme
2.1 Carte auto-organisatri e de Kohonen (SOM) 2D ave le ve teur d'entrée ξ~ = {x1 , · · · , xn } et
les ve teurs de référen e représentés par w~ k = {w1,k , · · · , wn,k }
Fig.
Cette séparation des espa es est la sour e de la propriété de rédu tion de omplexité en gardant une
information de topologie, e qui est intéressant pour la représentation d'observations multidimensionnelles
dans un espa e de deux dimensions. Deux observations attribuées à deux prototypes qui sont voisins sur la
arte sont voisines dans l'espa e d'entrée. Le ontraire n'est pas vrai : deux observations qui sont attribuées
à deux prototypes qui ne sont pas voisins peuvent ependant être voisines dans l'espa e d'entrée.
En e qui on erne l'adaptation des prototypes, le prototype gagnant pour une observation donnée
est adapté, ainsi que son voisinage, en utilisant une forme légèrement modiée de elle utilisée au (2.12).
(2.14)
Ave ǫ le taux d'apprentissage, hrs (t) le niveau d'adaptation pour un prototype quel onque r de la
grille en sa hant que s est le prototype gagnant (g. 2.2(a)).
∆wr = ǫhrs (t)(ξ − wr )
hrs (t) = exp
−d(r, s)2
2σ(t)2
(a)
(2.15)
(b)
2.2 L'adaptation des prototypes pour la SOM :
(a) La fon tion qui dénit le niveau d'adaptation dépendant du voisinage ;
(b) L'eet de voisinage sur l'adaptation des prototypes
Fig.
Ave σ(t) la varian e de la Gaussienne (2.15) qui normalement est modiée ave l'avan ement de
l'apprentissage.
27
Chapitre 2.
Réexions sur le
onnexionnisme
σ(t) = σi (σf /σi )t/tmax
(2.16)
étant la valeur initiale et σf la valeur nale de la varian e.
La gure 2.2(b) montre le résultat dans le as spé ial de l'espa e d'entrée à deux dimensions, où
les prototypes sont uniformément distribués dans l'espa e d'entrée. Le er le noir montre la position de
l'observation donnée pour laquelle le prototype rouge est le gagnant. Supposons que la fon tion hrs (t)
soit positive pour un voisinage d(r, s) ≤ 2, négative pour 2 < d(r, s) ≤ 3 et nulle pour le reste.
Les prototypes jaunes se trouvent dans le voisinage positif et sont attirés par l'observation et les
prototypes bleus dans le voisinage négatif et repoussés par l'observation. Tous les autres prototypes ne
sont pas modiés. A noter que seuls les ve teurs représentatifs des prototypes sont modiés, pas les liens
de voisinage.
Normalement l'apprentissage ommen e ave un voisinage large an de positionner la arte entière
dans l'espa e réellement o upé par les observations. Ave l'avan ement de l'apprentissage, les prototypes
se spé ialisent de plus en plus an de représenter un regroupement d'observations spé iques. Ainsi en n
d'apprentissage les ve teurs représentatifs de la arte représentent la distribution des observations dans
le orpus utilisé pour l'apprentissage.
Ave la présentation des artes auto-organisatri es de Kohonen la partie onnaissan e et onnexionnisme est terminée. Un autre domaine du onnexionnisme qui joue un rle important pour les études
faites dans le adre de ette thèse est le temps et la onsidération des eets temporels dans les appro hes
onnexionnistes.
σi
2.3 Le temps et le onnexionnisme
Le temps est un élément prin ipal de notre univers. Il est onsidéré omme la quatrième dimension.
Un grand nombre de domaines qui sont analysés traitent dire tement ou indire tement de phénomènes
qui varient dans le temps omme par exemple la vision, la parole, le traitement de signaux et le ontrle.
Le temps joue aussi un rle non négligeable dans toutes les appro hes d'apprentissage.
Le temps est en prin ipe un phénomène ontinu mais peut par des méthodes d'é hantillonnage aussi
apparaître sous une forme dis rète. Indépendamment de la forme d'apparition du temps il représente une
suite d'apparitions ordonnées où l'ordre est un des aspe ts les plus importants.
An d'utiliser pour la suite des appro hes temporelles, la terminologie utilisée dans le ontexte de
l'identi ation de système ette dernière est introduite. Le modèle lassique pour appro her un système
dynamique est représenté dans la gure 2.3
Fig.
2.3 Représentation lassique d'un système
Ave x(t) les entrées mesurables du système, y(t) la sortie du système et v(t) les perturbations non
mesurables du système. G est appelé la fon tion de transfert du système. Pour un système
(2.17)
Dans la théorie du ontrle, souvent une simpli ations est faite, dans laquelle est supposé que les
perturbations, qui sont généralement onsidérées omme in onnues, peuvent être ajoutées à la sortie du
système (2.18).
y(t) = G(x(t), v(t))
y(t) = G(x(t)) + ṽ(t)
28
(2.18)
2.3.
Le temps et le
onnexionnisme
L'avantage de ette simpli ation est que la fon tion de transfert ne dépend que des entrées x(t).
Pour l'appro he onnexionniste, la question prin ipale est omment il est possible d'in orporer la notion de temps dans la stru ture des réseaux onnexionnistes. En prin ipe, deux méthodes sont distinguées
[21℄ :
L'in orporation impli ite. Dans ette appro he le temps est représenté par une proposition sans
exister de façon formelle dans le réseau. Par exemple pour un signal é hantillonné uniformément
il est possible de montrer au réseau onnexionniste diérents pas de temps en même temps sur
diérentes entrées. On parle dans e as aussi de représentation spatio-temporelle, par e que la
stru ture temporelle du signal est représentée dans une forme spatiale à l'entrée du réseau.
L'in orporation expli ite. Dans e as le temps obtient une représentation on rète dans la stru ture
du réseau onnexionniste. Deux appro hes omplètement diérentes sont a tuellement onnues : la
première, qui existe depuis une vingtaine d'années, utilise la ré ursion an d'in orporer de manière
expli ite une omposente de mémoire temporelle (un historique) qui est appelé ontexte, et la
deuxième, qui est plus ré ente, se base sur des modèles plus pro hes du neurone biologique en
modélisant la dynamique du ux d'informations à l'intérieur du réseau neuronal.
Les réseaux dynamiques en ore appelés réseaux à spikes (spiking neurons) sont relativement ré ents
et jusqu'à présent pas en ore bien maîtrisés. Ce type de réseaux ne sera pas présenté i i.
2.3.1 L'appro he spatio-temporelle
Les appro hes spatio-temporelles se basent prin ipalement sur des représentations du temps dans une
forme dis rète. Une ertaine fenêtre représentant une séquen e donnée de pas de temps est présentée à
un instant donné en entrée d'un réseau onnexionniste. L'instant d'après la fenêtre est dé alée d'un pas
de temps. Pour le réseau l'information du temps est spatiale et le réseau traite ette information omme
un ve teur d'entrée multidimensionnel.
Le fondement mathématique pour ette appro he vient du domaine de l'identi ation de système par
réponse impulsionnelle [44℄. Un outil utilisé pour dé rire des systèmes à temps dis ret est la transformation en z. Pour une séquen e temporelle {x(t)} qui peut théoriquement aller à l'inni dans le passé, la
transformation en z est dénie par :
X(z) =
ave z−1
x(t − 1).
inf
X
x(t)z −t
(2.19)
t=− inf
l'opérateur qui réalise un dé alage unitaire dans le temps. C.-à-d. appliquer z−1 à x(t) donne
Appliquons {x(t)} à un système représenté par sa réponse impulsionnelle h(t). La réponse du système
est représentée par la somme de la onvolution.
y(t) =
inf
X
k=− inf
h(k)x(t − k)
(2.20)
Après une transformation en z la onvolution temporelle est transformée en multipli ation dans z.
Y (z) = H(z)X(z)
(2.21)
Où H(z) est la fon tion de transfert du système.
Une des stru tures de réseau qui s'appuie sur ette théorie est onnue sous le nom de TLFN (Time
Lagged Feedforward Network) (g. 2.4) [21℄. Ce type de réseau a l'avantage d'utiliser la stru ture d'un
réseau aux propriétés d'apprentissage bien onnues et maîtrisées : le per eptron multi ou hes (MLP)[23℄.
L'avantage de ette appro he est que ontrairement aux appro hes lassiques les réponses impulsionnelles sont représentées par un modèle non-linéaire et qu'un apprentissage sur base d'exemples est
possible.
Une stru ture qui représente une appro he similaire mais pour laquelle aussi à l'intérieur du réseau
(pour les ou hes a hées) un tel dé alage spatio-temporel est réalisé est appelée Time Delayed Neural
Networks (TDNN) [21℄, [20℄, [11℄.
29
Chapitre 2.
Réexions sur le
onnexionnisme
Fig.
2.4 Stru ture du réseau TLFN
Une autre appro he est de représenter le omportement temporel en forme de arte de séquen es
d'indi es spatiaux et de regrouper es artes dans des atégories. Cette appro he est appelée Temporal
Organization Map (TOM) [11℄ et se base sur des modèles de la olonne orti ale du erveau.
2.3.2 Les réseaux ré urrents
La dénition d'un réseau ré urent est qu'il ontient au moins une onnexion entre un neurone et son
prédé esseur ou entre deux neurones d'une même ou he. L'idée de base est que ette ré ursion intègre
un ertain ontexte, une mémorisation du passé et ave ela une forme expli ite du temps. En général e
genre de réseaux ne sont pas ouramment utilisés à ause de la di ulté de bien maîtriser le omportement
de telles stru tures.
Il existe ependant deux types de réseaux ré urrents qui sont pro hes de la stru ture des MLP. Ces
types de réseaux ré urrents sont vus omme une extension des réseaux feed-forward [23℄ qui ajoutent au
ve teur d'entrées un ve teur de ontexte interne du réseau. Ce ontexte représente un ertain historique
de l'a tivation du réseau. Les deux types se distinguent par le genre de ontexte qui est représenté. La
gure 2.5 représente un s héma de prin ipe des deux stru tures.
(a)
Fig.
(b)
2.5 Deux types de réseaux ré urrents : (a) Le réseau de Jordan ; (b) Le réseau d'Elman.
Pour les deux réseaux, x(t) représente le ve teur d'entrées. Il peut représenter une appro he multiva30
2.4.
Le
ontrle et le
onnexionnisme
riable ou une stru ture de TLFN, ou les deux ombinées. La sortie du réseau y(t) peut aussi représenter
une sortie multiple. La partie c(t) représente le ontexte.
Le réseau de Jordan [28℄ (g. 2.5(a)) présenté en 1986 utilise deux types de ré ursions : la première, qui
opie l'information de sortie dans une ou he de ontexte qui pourra être utilisée pour la pro haine entrée.
La deuxième ré ursion est aussi appelée auto-ré ursion et opie l'information de ontexte sur elle-même
ave un ertain poids α. Cela garantit de manière expli ite qu'un ertain historique du ontexte reste dans
la mémoire du réseau. Ave ette stru ture l'information de ontexte pour un instant t est dénie par la
formule (2.22). A ause de l'auto-ré ursion ette formule est ré ursive et peut être développée (2.23).
c(t)
c(t)
c(t)
c(t)
= y(t − 1) + α · c(t − 1)
= y(t − 1) + α(y(t − 2) + αc(t − 2))
= y(t − 1) + αy(t − 2) + α2 c(t − 2)
= y(t − 1) + αy(t − 2) + α2 y(t − 3) + · · · + αn c(t − n)
(2.22)
(2.23)
Ave α < 1 l'histoire du ontexte perd de la valeur ave le temps. La sortie la plus ré ente est don
prise en ompte plus fortement.
Le réseau d'Elman [12℄ (g. 2.5(b)) n'utilise qu'un seul type de ré ursion. Il opie l'information ontenue dans la ou he a hée h(t − 1) sur la ou he de ontexte. Pour un instant donné ela représente :
c(t) = h(t − 1)
Cela a l'air d'être moins omplexe mais 'est trompeur ar :
(2.24)
(2.25)
où F () est en général une fon tion non-linéaire. De plus le ontexte pré édent est pris en ompte pour
le al ul de l'a tivation de la ou he a hée.
Dans le réseau de Jordan la sortie désirée est généralement une grandeur qui peut être interprétée.
Le réseau d'Elman utilise la ou he a hée pour la ré ursion. Cette ou he représente généralement une
stru ture omplexe qui résulte de l'apprentissage et qui représente un odage interne du réseau qui peut
di ilement être interprété.
En général on dit que e genre de réseaux implémente une mémoire à ourt, voire très ourt terme.
Ces quelques appro hes représentent diérentes te hniques pour prendre en ompte les eets temporels
dans les systèmes onnexionnistes. Dans des ontextes bien pré is il a été montré que es appro hes
donnent des résultats appré iables. Cependant dans le adre de ette étude deux aspe ts sont importants :
la possibilité de représenter un système très omplexe, et la prévision sur le long terme. Ces deux aspe ts
ensemble font que les méthodes présentées ne sont pas dire tement utilisables.
h(t − 1) = F (x(t − 1); c(t − 1))
2.4 Le ontrle et le onnexionnisme
Dans le ontexte de pro essus industriels le ontrle est une tâ he lassique. Ce domaine est analysé
et dis uté depuis longtemps dans le monde s ientique. Un grand nombre de fondements mathématiques
existent sur le ontrle. Dans l'industrie les tâ hes de ontrle sont aujourd'hui en ore dominées par les
appro hes lassiques et souvent linéaires.
Il est lair que e domaine a été appro hé par des méthodes onnexionnistes ave le but de pouvoir
utiliser des modèles non-linéaires, an de pouvoir améliorer le ontrle des systèmes qui sont souvent de
nature non-linéaire. Néanmoins, le domaine du ontrle ne joue qu'un rle se ondaire dans le monde du
onnexionnisme.
Cette se tion va donner un aperçu sur quelques appro hes onnexionnistes dans le domaine du ontrle
[26℄, [50℄. S'il est question d'un réseau onnexionniste, il est souvent question d'un réseau MLP ou des
variantes qui ont été présentées dans le hapitre 2.3. L'a ronyme qui sera utilisé pour un tel réseau est
ANN (Arti ial Neural Network).
31
Chapitre 2.
Réexions sur le
onnexionnisme
2.4.1 Le ontrle par apprentissage supervisé
Le ontrle par apprentissage supervisé se base sur le fait que la tâ he de ontrle est déjà réalisée par
un autre ontrle. L'apprentissage supervisé du réseau onnexionniste est réalisé sur la base des entrées
et sorties de e ontrleur préexistant. La gure 2.6 montre la stru ture qui est utilisée.
Fig.
2.6 Contrle par apprentissage supervisé
Les intérêts de e type d'appro he sont :
le transfert de onnaissan e d'experts. Le système peut apprendre e qu'un expert, ou un système
existant fait réellement, e qui peut être diérent de e qui est é rit ou en ore de e que l'expert
explique.
La tâ he de ontrle peut en suite éventuellement être réalisée à une vitesse plus élevée.
Il est possible de prendre en ompte d'autres informations en parallèle aux entrées et sorties d'un
ontrle existant. Cela est en ore plus intéressant si le ontrle est réellement fait par un opérateur.
2.4.2 Le ontrle par modèle inverse
Cette appro he onsiste à apprendre le système inverse d'un pro essus et à utiliser e réseau omme
unité de ontrle. L'avantage est que l'opérateur peut spé ier les onsignes dans l'espa e de sortie du
pro essus. La gure 2.7 montre les deux phases de l'appro he.
Souvent ette appro he n'est pas simple ar diverses manipulations des entrées d'un pro essus peuvent
onduire à un même résultat, e qui fait que le modèle inverse du pro essus n'est pas bien déni.
C'est une méthode intéressante pour les situations où au une unité de ontrle n'existe. Le orpus
d'apprentissage peut être onstruit en utilisant diérents types d'a tivation du pro essus et en enregistrant
les sorties.
2.4.3 Stru ture de ontrle ave modèle interne
Cette appro he utilise un modèle inverse du pro essus pour l'unité de ontrle et un modèle dire te du
pro essus pour une tâ he de prédi tion. Par le retour de l'erreur de prédi tion, une appro he de ontrle
adaptative est possible. La gure 2.8 montre le s héma de ette appro he.
Le modèle du pro essus est appris par les appro hes lassiques d'identi ation de système, en utilisant
un réseau du type TLFN ou ré urrent an d'intégrer une appro he de prédi tion. D'autres appro hes de
ontrle prédi tif utilisent la rétro-propagation de l'erreur en passant par le modèle du pro essus an de
onnaître l'erreur au niveau de la sortie de l'unité de ontrle.
32
2.4.
(a)
Le
ontrle et le
onnexionnisme
(b)
Fig. 2.7 Le ontrle par modèle inverse :
(a) Pour l'apprentissage le pro essus est utilisé de façon inverse ;
(b) Après l'apprentissage le réseau est utilisé omme unité de ontrle.
Fig.
2.8 Contrle basé sur un modèle interne et un modèle inverse.
33
Chapitre 2.
Réexions sur le
onnexionnisme
2.5 Con lusion de e hapitre
Dans e hapitre le langage du domaine onnexionniste est introduit et quelques méthodes de base
du domaine sont évoquées. Une grande partie du hapitre traite la relation entre le onnexionnisme et
les onnaissan es. Les appro hes qui existent pour la représentation ou l'extra tion de onnaissan es sont
itées et un point fort est mis sur le sujet de la atégorisation par le biais de la lassi ation non-supervisée
du domaine onnexionniste. Le rle du temps et les moyens pour onsidérer les aspe ts temporels par
les appro hes onnexionnistes sont survolés. Finalement quelques appro hes du domaine du ontrle sont
abordées.
Ce hapitre avait pour but de fournir toutes les bases né essaires an de pouvoir suivre les démar hes
qui sont faites dans les hapitres suivants.
34
Chapitre 3
Analyse de séries temporelles
Sommaire
3.1 Quelques spé i ités des données temporelles . . . . . . . . . . . . . . . . .
3.1.1
3.1.2
3.1.3
Le odage de données . . . . . . . .
3.1.1.1 Transformée de Fourier . .
3.1.1.2 Le odage en ondelettes . .
3.1.1.3 Approximation par parties
Indexation de données . . . . . . . .
Lo alisation de séquen es . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
onstantes (PAA)
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Le signal arti iel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Extra tion des formes primitives . . . . . . . . . . . . . . . . . . . . .
En odage basé sur les formes primitives . . . . . . . . . . . . . . . . .
3.2.3.1 Possibilité d'extension pour une appro he multivariable . . .
3.2.3.2 Comparaison ave les odages PAA et PLA . . . . . . . . . .
Appli ation aux données du pro essus industriel . . . . . . . . . . . .
3.2.4.1 Les formes qui omposent le signal de la puissan e éle trique
3.2.4.2 Appli ation du odage aux données du four . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Parti ularités et problématiques . . . . . . . . . . . . . . . . . . . . . .
3.3.1.1 La similarité, un sujet non trivial . . . . . . . . . . . . . . . .
3.3.1.2 Taille variable des séquen es . . . . . . . . . . . . . . . . . . .
Mesures de similarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2.1 Les bases de la distan e DTW . . . . . . . . . . . . . . . . . .
3.3.2.2 La distan e DTW appliquée à la lassi ation . . . . . . . . .
3.3.2.3 Optimisation du al ul DTW . . . . . . . . . . . . . . . . . . .
3.3.2.4 La distan e DTW appliquée aux données du four . . . . . . . .
Classi ation non-supervisée basée sur des prototypes . . . . . . . . . .
3.3.3.1 La méthode basée sur un apprentissage ompétitif. . . . . . . .
3.3.3.2 Mappage DTW . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3.3 Apprentissage basé sur le mappage DTW . . . . . . . . . . . .
3.3.3.4 Classi ation non-supervisée appliquée au pro essus industriel
3.3.3.5 Création de prototypes d'évolution pour le pro essus industriel
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3.2 Un odage adapté aux données . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1
3.2.2
3.2.3
3.2.4
3.3 Classi ation de séries temporelles de tailles variables . . . . . . . . . . . .
3.3.1
3.3.2
3.3.3
3.4 Con lusion du hapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
36
36
37
37
38
38
39
39
40
40
43
45
46
46
46
48
51
53
53
55
55
57
61
64
66
69
69
72
74
81
83
84
Chapitre 3.
Analyse de séries temporelles
Le temps est partout, et ha un est quotidiennement onfronté à des séries temporelles. Cha un
mesure des hoses : son propre poids le matin, la température de l'extérieur, la vitesse de la voiture, la
tension artérielle, le ours des a tions à la bourse, le nombre de visites sur un site web et . et toutes es
mesures, qui sont prises à un instant donné, hangent ave le temps.
C'est pourquoi de nombreuses re her hes sur le traitement et l'analyse de séries temporelles existent.
Cependant elles sont souvent spé iques à un domaine, et les méthodes utilisées dans un domaine ne sont
pas né essairement adaptées aux autres domaines, et des fois elles y sont même in onnues.
Ce hapitre va traiter en premier lieu quelques spé i ités des données temporelles an de préparer le
terrain et de familiariser le le teur ave le langage spé ique. Ensuite un odage basé sur une extra tion
des formes primitives qui ompose le signal analysé et qui de e fait s'adapte aux signaux analysés sera
présenté (voir 1a Fig.1.10). Dans la dernière se tion une méthode de lassi ation non-supervisée apable
de traiter des séries de taille quel onque basée sur une mesure de similarité est proposée (voir 1b Fig1.10).
Toutes les démar hes seront a ompagnées d'exemples simples an de les illustrer. A la n de haque
se tion, l'appro he est appliquée aux données de l'installation industrielle an, de onstruire au fur et à
mesure les outils pour la réalisation d'une appro he de ontrle prédi tif basé sur l'aide à la dé ision telle
que introduite dans le hapitre 1.4.
3.1 Quelques spé i ités des données temporelles
En général, le volume de données à manipuler dans le domaine de l'analyse de séries temporelles est
important. An de simplier le traitement de es données et de limiter les temps de al ul d'analyses,
une des premières appro hes est la rédu tion e a e de données.
Le domaine de la rédu tion de données est un domaine de re her he à part entière ave beau oup de
fa ettes. Le but primaire est de réduire au maximum le volume de données sans pour autant perdre des
informations importantes. Dénir e qui a de l'importan e dans un é hantillon de données est une tâ he
non triviale et elle est fortement orrélée à la sour e qui est représentée par es données et au domaine
d'appli ation. Dans ertains domaines, omme la ompression de hiers informatiques, au une perte de
données ne peut être a eptée, dans d'autres domaines, omme par exemple la ompression de musique ou
d'images, un ertain niveau de perte peut être a epté au détriment de la qualité du son respe tivement
de l'image. Pour ertaines appli ations une extra tion de quelques ara téristiques sut au besoin d'une
analyse ultérieure, omme par exemple, les points ara téristiques du signal ardiaque.
Une autre tâ he importante dans le traitement de données temporelles est l'indexation. Elle est dire tement liée à la propriété de la taille des données. Retrouver dans un pool de données temporelles les
séquen es temporelles ave des propriétés spé iques est seulement réalisable dans un temps raisonnable
s'il existe une indexation adéquate.
Une tâ he très liée aux séries temporelles est la lo alisation d'une séquen e donnée dans un ux de
données temporelles. C'est-à-dire, quels sont les instants où la séquen e donnée ressemble bien à une
partie du ux analysé.
3.1.1 Le odage de données
Dans le domaine du traitement du signal, les signaux à manipuler apparaissent à la base, dans la
plupart des as, sous une forme analogique. Des appro hes de traitement des signaux analogiques existent,
mais elles ne font pas l'objet de ette thèse. An de pouvoir manipuler les signaux sur base d'ordinateur,
la première étape onsiste à digitaliser les signaux analogiques. Déjà ette première étape, qui est aussi
appelée é hantillonnage des signaux analogiques, est une forme de odage qui dans les appli ations réelles
est souvent une sour e de perte d'informations. L'é hantillonnage de signaux est un sujet omplexe en
soi. En général les fréquen es de grandeurs physiques représentant un phénomène omplexe ne sont pas
onnues. An d'éviter une perte d'information au niveau de e odage primaire, selon le théorème de
Shannon (théorie de l'information), la fréquen e d'é hantillonnage minimale devrait être le double de
la fréquen e maximale qui apparaît dans la grandeur physique mesurée [40℄, [49℄. An de garantir ette
ontrainte pour des mesures réelles, un ltrage analogue adapté à l'a quisition de données et aux analyses
36
3.1.
Quelques spé i ités des données temporelles
prévues serait né essaire. Il faut ependant souligner qu'un tel ltrage réalise un lissage des signaux et
de e fait enlève la partie des hautes fréquen es (perte d'information potentielle).
Ce travail se base sur un é hantillonnage uniforme ave un temps d'é hantillonnage onstant. Pour
ette forme d'é hantillonnage, il est important d'adapter le temps d'é hantillonnage aux problèmes posés. D'un té, il faut éviter des pertes d'informations indispensables à l'analyse, e qui mène vers une
fréquen e d'é hantillonnage élevée, de l'autre té, le volume de données généré par la digitalisation
augmente ave la fréquen e d'é hantillonnage.
La digitalisation est normalement lo alisée dans la partie de l'a quisition de données qui est souvent
imposée par un système déjà en pla e. Il est important de onnaître les paramètres du système d'a quisition et de la digitalisation an de pouvoir interpréter l'allure des signaux, leurs évolutions et les résultats
d'analyses basés sur es signaux. L'inertie d'un apteur, un ltrage du signal analogique, la méthode
d'é hantillonnage ou un ltrage digital du système d'a quisition, pour n'en iter que quelques-uns, ont
une forte inuen e sur l'allure des données et don for ément aussi sur les résultats d'analyses.
Après l'a quisition et ave elle- i la digitalisation des signaux, le odage proprement dit est utilisé
dans beau oup de domaines à des ns de rédu tion de données. Mais la rédu tion de données n'est pas
la seule nalité du odage. Le odage peut aussi être utilisé à des ns de représentation de données sur
diérents niveaux d'abstra tion. Une représentation ma ros opique de données peut par exemple faire
émerger des aspe ts globaux qui se noient dans les détails des données brutes. Une autre nalité d'un
odage peut être de fournir des propriétés spé iques au niveau de l'indexation ou/et de la lo alisation.
La relation forte qui existe entre le type de odage utilisé et le domaine d'appli ation est la ause
primaire du nombre important et de la diversité des méthodes et appro hes qui existent dans e domaine.
Il est impossible et voire inutile de les énumérer toutes. Seules les méthodes les plus onnues et qui forment
une appro he généraliste et don utilisable dans tous les domaines sont brièvement présentées i i.
3.1.1.1
Transformée de Fourier
Un odage lassique dans le traitement de signaux temporels est la transformée de Fourier (TF). Il
s'agit de transformer le signal temporel dans le domaine fréquentiel (3.1) et vi e-versa (3.2).
F (s) =
Z
+∞
f (x) e−isx dx
−∞
f (x) =
1
2π
Z
+∞
−∞
F (w) eiwx dw
(3.1)
(3.2)
En prin ipe on représente un signal temporel par un spe tre de fréquen es. Pour haque fréquen e les
oe ients expriment l'importan e de ette fréquen e dans le signal d'origine. A e stade au une rédu tion
de données n'est faite, seule la représentation a été hangée. An de réduire la dimension, une possibilité
est de séle tionner seulement les oe ients qui dépassent un ertain seuil. Il est possible de re onstituer
le signal à partir de es oe ients séle tionnés en relation ave les fréquen es orrespondantes, mais ave
une ertaine perte d'information.
Un avantage de e odage est que de nombreuses études autour de ette méthode ont été faites, et il
existe des algorithmes de onversion performants.
Un désavantage de e odage est que le hoix des oe ients se fait dans la représentation fréquentielle
dans laquelle au un lien ave le domaine temporel n'est visible. L'information de lo alisation d'événements
sur l'axe du temps est perdue.
Une méthode qui se base sur la TF et qui garde une ertaine information temporelle est la STFT
(Short-Time Fourier Transformation). Elle onsiste à balayer le signal ave une fenêtre de taille xe et
d'en extraire les fréquen es [1℄.
3.1.1.2
Le
odage en ondelettes
Le odage basé sur des ondelettes est une appro he qui onserve l'information temporelle des fréquen es. De plus, elle intègre la possibilité de oder aussi bien de petites parties à haute fréquen e que
de grandes plages ave des omportements quasi statiques [38℄.
37
Chapitre 3.
Analyse de séries temporelles
La méthode des ondelettes onsiste à représenter un signal par une superposition de séries temporelles
appelées les ondelettes. Chaque ondelette est onstruite à partir d'une onde de base, en utilisant des
ompressions linéaires et des translations qui utilisent des paramètres respe tifs a = 2j et b = 2j k, e qui
orrespond à des o taves.
Le odage en ondelettes ontient normalement des oe ients pour la représentation à haute résolution
et en parallèle des oe ients pour une représentation à faible pré ision.
3.1.1.3
Approximation par parties
onstantes (PAA)
La méthode d'approximation par parties onstantes (angl. Pie ewise Aggregat Approximation, PAA)
a été introduite indépendamment par deux auteurs [32℄, [63℄. L'appro he est intéressante, par e qu'elle
est simple, intuitive et ompétitive par rapport à d'autres appro hes plus omplexes. I i la méthode va
brièvement être présentée, par e qu'elle représente les idées de bases du odage adapté qui sera proposé
au hapitre 3.2.
An de réduire le nombre de données, la méthode propose simplement de rempla er des segments du
signal par des plages de valeurs onstantes. Pour ela, un signal est divisé dans des segments équidistants,
qui sont simplement rempla és par leur valeur moyenne lo ale.
En prin ipe ela ne représente rien d'autre qu'un deuxième é hantillonnage en utilisant la moyenne.
Il a été prouvé que, pour deux séquen es Q et S , la distan e Eu lidienne entre leurs odages PAA,
représente une borne inférieure de la distan e Eu lidienne des séquen es réelles [32℄.
Pour ette raison e odage simple peut être utilisé pour réaliser une indexation de séquen es an
d'a élérer les re her hes de séquen es.
Deux variantes de ette appro he existent :
PLA (angl. Pie e-wise Linear Approximation) : ontrairement à la méthode PAA qui se sert de
la moyenne pour le odage de la sous-séquen e, ette appro he utilise une régression linéaire. Cela
augmente la ressemblan e entre le signal original et la reprodu tion sur base du odage. Mais en
même temps ela divise par deux le taux de rédu tion pour une même taille de sous-séquen es ar
pour la régression linéaire deux paramètres sont né essaires.
APCA (angl. Adaptive Pie e-wise Constant Approximation) : Cette appro he dière de son prédéesseur par l'utilisation de plages à valeurs moyennes qui ne sont pas équidistantes [33℄. L'avantage
est que des segments quasi-stationnaires peuvent être représentés par une seule valeur, et que pour
des parties hautement dynamiques un plus grand nombre de segments peut être utilisé, e qui
améliore onsidérablement la qualité d'approximation, sans pour autant diminuer le fa teur de
rédu tion.
Ces types de odages sont expli itement dédiés à des n d'indexation pour a élérer la re her he de
séquen es dans les bases de données de grandes tailles. Mais toute appro he générique est utilisable à
d'autres ns.
3.1.2 Indexation de données
Le but primaire d'une indexation peut être expliqué par un exemple. Supposons que vous faites une
re her he dans une base de données qui représente des mesures de température de l'air ambiant, que la
base soit organisée par journées (ave quelques mesures par journée) et que les mesures ne soient pas
prises régulièrement. Il en résulte que ni les instants de mesures ni le nombre de mesures par journée
soient xes. Supposons ensuite, que vous êtes intéressés à onnaître les jours auxquels la diéren e entre
la température maximale et minimale dépasse un ertain seuil et pour lesquels la température moyenne
de la journée soit dans une plage donnée.
En prin ipe ela ne pose pas de problèmes, ar toutes les informations existent dans la base de données.
Mais le temps qu'il faut pour al uler la diéren e min-max et la moyenne pour haque journée, an de
la omparer à la requête, augmente ave la taille de la base de données.
Or, si vous voulez onnaître les jours auxquels la valeur minimale dépasse un ertain seuil et auxquels
la moyenne soit plus grande que x, il faut re ommen er l'opération.
An d'éviter de devoir refaire es al uls à haque fois, il est possible de dénir un ertain nombre
d'indi es, omme par exemple les valeurs statistiques de base (moyenne, min, max, varian e, et .), et de
38
3.2.
Un
odage adapté aux données
les al uler pour l'ensemble des jours dans la base. Pour haque nouvelle entrée, es indi es sont re al ulés
et mis à jour.
Ces indi es représentent un odage spé ique pour es données et la re her he d'informations devient
beau oup plus rapide. Souvent les ritères d'une requête ne sont pas aussi expli ites que dans l'exemple :
vous voulez par exemple trouver les jours auxquels l'évolution de la température est semblable à elle
d'une journée x.
Ave la omplexité des ritères de requêtes, la relation entre ritères et indi es devient plus omplexe
et souvent l'utilisateur veut formuler sa requête au niveau des ritères. Cela engendre que la dénition
des indi es dépend du domaine d'appli ation et doit répondre à un ertain nombre de ritères. Les deux
ritères prin ipaux sont : éviter de déte ter sur base de l'index des exemples qui ne répondent pas aux
ritères initiaux d'une requête (false alarms), et éviter de ne pas déte ter des exemples qui répondent aux
ritères initiaux (false dismissals). Se tromper selon l'un ou l'autre ritère n'a pas la même signi ation
selon l'appli ation.
3.1.3 Lo alisation de séquen es
Dans le as de la lo alisation, le but est de trouver dans une séquen e C les endroits pour lesquels un
ensemble de onditions soit vérié. Reprenons l'exemple pré édent de la température. Vous voulez savoir,
par exemple, à quelle date d'une année x la température minimale a été atteinte.
En prin ipe, il est possible de par ourir l'ensemble des mesures d'une année, an de trouver la valeur
minimale et de se rappeler les dates pour lesquelles ette valeur a été atteinte.
Une requête plus omplexe pourrait être de trouver les instants pour lesquels la température a huté
de x dans un intervalle de temps donné.
Il est en ore plus di ile de trouver les endroits pour lesquels on retrouve une évolution similaire à
une ertaine évolution représentant par exemple deux heures de mesures.
Sans aller dans les détails, un ertain nombre de problèmes peut être ren ontré : des données bruitées,
des é hantillonnages diérents ou en ore des données manquantes.
Dans e domaine aussi, l'indexation peut avoir des eets bénéques pour réduire la durée de telles
requêtes. Supposant l'existen e d'un index basé sur les valeurs statistiques de base pour la journée, la
semaine et le mois, la re her he de la date ave la température minimale de l'année se limite à her her
le mois de l'année en question ave le tmin le plus petit (12 possibilités) puis la semaine de e mois ave
ette valeur (4 à 5 possibilités) et nalement la journée qui orrespond à ette valeur (7 possibilités). Cela
réduit la re her he à un maximum de 24 omparaisons.
3.2 Un odage adapté aux données
Dans ette se tion un odage, qui prend en ompte les spé i ités des signaux qui sont analysés et
qui s'adapte de e fait aux données qu'il s'agit de oder, est proposé. Il s'agit d'une appro he qui se base
sur les méthodes PAA et PLA en ajoutant une omposante de forme. Ce travail se retrouve aussi dans
les publi ations suivantes [42℄, [54℄.
Le but du odage est la rédu tion des données, sans pour autant perdre les informations pertinentes du
signal et de garder la relation évènement et instant temporel. Ce qui est pertinent dans un signal dépend
du traitement et de l'appli ation que va utiliser e odage. Dans e ontexte le but est de pouvoir faire
une analyse du omportement dynamique du pro essus, qui est représenté par les données, en analysant
l'évolution des signaux dans le temps. Le odage utilisé doit don en tenir ompte.
Le prin ipe du odage adapté a déjà été abordé dans le hapitre 1.4 où les idées de base sont illustrées
dans la gure 1.10. La partie reliée au odage est reprise par la gure 3.1.
Le odage adapté est omposé de deux phases12 :
1a) La première phase onsiste à extraire, d'un é hantillon représentatif de signaux qu'il s'agit de
oder, les formes primitives .-à-d. les formes les plus ara téristiques qui omposent es signaux.
Un ensemble de formes extraites est appelé un alphabet. Il est possible de onstruire diérents
alphabets qui se distinguent par les paramètres utilisés durant l'extra tion.
12 La
numérotation des phases orrespond à elle utilisée dans les gures 1.10 et 3.1
39
Chapitre 3.
Analyse de séries temporelles
Fig.
3.1 Première partie de l'analyse évolutive : le odage adapté aux signaux
1b) La deuxième phase onsiste à en oder les signaux en se basant sur les alphabets de formes
primitives. Les signaux odés sont représentés par une suite de formes primitives qui sera appelée
un mot.
Les se tions suivantes vont détailler es deux phases et expliquer les méthodes et algorithmes utilisés.
An de pouvoir valider les méthodes, les expli ations sont a ompagnées de résultats basés sur un signal
arti iel. Le hapitre lturera par les résultats obtenus par l'appli ation des méthodes aux signaux réels
du four à ar éle trique.
3.2.1 Le signal arti iel
Le signal arti iel utilisé pour la validation des méthodes doit d'un té représenter les spé i ités du
signal provenant du four en vue de l'appli ation nale, d'un autre té il doit être entièrement expli able
an de pouvoir dis uter les résultats.
Le signal se base sur la fon tion de f (x) = sin(1/x) ave x =∈ [1 ∗ 10−6 , 0.05] . An de produire les
données temporelles, un é hantillonnage ave un intervalle xe ts = 1.4285 ∗ 10−4 est utilisé (voir gure
3.2).
Le signal obtenu ontient une première partie ave une allure sto hastique (bruitée) où la fréquen e
de f (x) est élevée, e qui est un résultat de l'utilisation d'un é hantillonnage à taille xe ave une
fréquen e d'é hantillonnage inférieure à la fréquen e de ette partie, et une deuxième partie périodique
ave fréquen e variable pour laquelle la fréquen e d'é hantillonnage est adaptée. Ces deux parties, ave le
passage ontinu entre les deux, représentent un grand nombre de spé i ités qui ont été retrouvées dans
les signaux provenant du four.
3.2.2 Extra tion des formes primitives
La te hnique qui est utilisée pour l'extra tion des formes primitives qui omposent le signal est illustrée
dans la gure 3.3. La gure montre un signal uni-variable quel onque, an de simplier l'expli ation de
la te hnique. Notez qu'en prin ipe la méthode est utilisable aussi pour des appro hes multivariables.
Il s'agit d'une appro he non-supervisée pour laquelle il est important que les é hantillons du signal
qui sont utilisés pour l'extra tion de formes primitives, appelées le orpus d'apprentissage, soient représentatifs et qu'ils omportent les formes les plus ara téristiques.
An d'extraire des formes d'une ertaine taille .-à-d. d'un ertain nombre d'é hantillons, une fenêtre
ave une largeur de ette taille balaie de façon aléatoire l'ensemble du orpus d'apprentissage. Les se tions
du signal ainsi séle tionnées forment un nouveau orpus ou plutt un autre format du même orpus. Ce
nouveau format représente toutes les allures de ourbes ayant la taille de la fenêtre.
40
3.2.
Fig.
Un
odage adapté aux données
3.2 Le signal arti iel utilisé pour la validation des méthodes.
Fig.
3.3 Te hnique d'extra tion des formes primitives
41
Chapitre 3.
Analyse de séries temporelles
L'intérêt majeur de ette étude repose sur l'analyse de l'évolution temporelle et par onséquent sur
les formes primitives du signal. An d'éviter l'inuen e d'autres aspe ts omme par exemple la position
en abs isse d'une forme ou l'amplitude de la dernière, haque se tion séle tionnée par la fenêtre est
normalisée de façon entrée réduite (3.3). Cette normalisation enlève la moyenne de la se tion et réduit
sa varian e à 1.
X∗ =
(X − mean(X))
std(X)
(3.3)
Les allures des ourbes ainsi normalisées forment le orpus d'entrée d'un lassi ateur non-supervisé
qui va regrouper les formes pro hes dans des lasses. Le prototype de haque lasse est le représentant
de la lasse et représente en quelque sorte une moyenne des éléments regroupés dans la lasse. Dans le
ontexte de e projet, le prototype représente une allure moyenne .-à-d. la forme qui représente au mieux
les allures de la lasse. Cette forme est dénie omme une forme primitive du signal analysé. En spé iant
le nombre de lasses à produire par le lassi ateur, le nombre de formes primitives à extraire du signal
est xé.
En prin ipe tout type de lassi ateur apable de regrouper de façon non-supervisée des ve teurs de
taille xe peut être utilisé. Dans ette étude la lassi ation est assurée par un réseau de neurones de la
famille des artes auto-organisatri es qui a été introduit par Kohonen en 1978 [36℄ (SOM). Les raisons
prin ipales pour lesquelles la SOM a été retenue omme lassi ateur sont :
la fa ilité d'extension en vue d'une appro he multivariable,
la relation de voisinage entre lasses. Les artes auto-organisatri es assurent une topologie entre les
lasses. Les lasses voisines sur la arte sont en même temps les plus pro hes en e qui on erne
leurs distan es.
le fait que le projet de re her he industriel CECA spé ie une orientation onnexionniste.
La SOM produit, de manière non-supervisée, une artographie des é hantillons présentés en entrée
du réseau (voir hap. 2.2.2.5). Plusieurs méthodes existent pour extraire d'une telle arte les formes
primitives. La méthode utilisée i i onsiste à spé ier une topologie unidimensionnelle de la arte et à
utiliser une unité de la arte pour haque lasse à obtenir. Chaque unité de la SOM représente, après
l'apprentissage, le prototype d'une lasse et don une forme primitive du orpus d'apprentissage.
An d'obtenir des lasses bien distin tes tout en gardant la propriété de voisinage, l'apprentissage de
la arte doit suivre un heminement en quatre phases :
1. La arte est initialisée de façon linéaire sur le domaine ouvert par le orpus d'apprentissage séle tionné.
2. An de positionner la arte au entre du nuage formé par les é hantillons du orpus, la première
phase de l'apprentissage est réalisée ave un taux d'apprentissage et une relation de voisinage élevés.
3. Durant la deuxième phase d'apprentissage, les unités de la arte s'adaptent à la distribution qui
existe dans le orpus d'apprentissage tout en garantissant la relation de voisinage entre les unités.
Le taux d'apprentissage et le voisinage sont diminués ave l'avan ement de l'apprentissage. A la n
de ette deuxième phase le voisinage se limite aux unités voisines dire tes.
4. La dernière phase d'apprentissage est une phase de ranement où les unités de la SOM sont
ensées se positionner dans les entres respe tifs des luster. Il est don né essaire de relâ her les
for es d'attra tion entre les unités dues au voisinage. Le taux d'apprentissage reste faible durant
ette phase.
Plus de détails sur les motivations de e heminement à et endroit n'aideraient pas à la ompréhension
de la méthode et sont pour ette raison repris dans l'annexe B.
La gure 3.4 montre un résultat de ette méthode en utilisant six unités SOM et une fenêtre de taille
sept (sept é hantillons du signal). Les diérentes lasses sont représentées par leur prototype en ligne
grasse pointillée. Les membres des lasses, .-à-d. les se tions normalisées du signal attribuées à haque
lasse, sont représentés en lignes nes olorées.
Par ette méthode il est possible d'extraire, de façon non-supervisée, les formes primitives dont est
onstitué le signal analysé.
42
3.2.
Fig.
Un
odage adapté aux données
3.4 Prototype et membres de lasses
L'ensemble des formes primitives obtenu ave une taille de fenêtre donnée est appelé un alphabet, à
ause de l'utilisation de es formes pour le odage des signaux. Chaque forme primitive est en onséquen e
appelée une lettre.
Un avantage de la normalisation des se tions séle tionnées avant le lassi ateur est le fait que la taille
de l'alphabet représentant au mieux les formes primitives du signal peut rester petite, ar la position
et l'étendue de la forme sont enlevées.
Les paramètres prin ipaux de ette méthode sont la taille de la fenêtre utilisée, 'est-à-dire la taille
des formes primitives (lettres) et le nombre de lasses à produire par le lassi ateur, 'est-à-dire le
nombre de lettres, e qui représente la taille de l'alphabet.
Il n'est pas trivial de xer es paramètres an d'obtenir un ou plusieurs alphabets représentatifs.
La tâ he peut être omparée à la validation du nombre idéal de lasses à utiliser pour une lassi ation,
mais i i ave une dimension en plus à onsidérer pour l'optimisation. Car non seulement le nombre de
lasses, mais aussi la taille des lettres qui représentent au mieux le signal, doivent être xées. Il est
possible de onstater que dans l'exemple donné dans la gure 3.4, quelques lasses sont relativement
ompa tes (1,4,5), pour d'autres par ontre (2,3,6), la varian e de formes à l'intérieur de la lasse est plus
importante. Comme pour toute appro he de validation de lassi ation, il s'agit de trouver le plus petit
nombre de lasses, tout en gardant les lasses les plus ompa tes possibles.
Deux appro hes de validation ont été analysées : l'une basée sur la varian e intra- lasse umulée et
l'autre est basée sur l'index de Davies et Bouldin [10℄. Les détails des appro hes sont repris dans l'annexe
C.
3.2.3 En odage basé sur les formes primitives
Ce hapitre reprend la deuxième phase du odage adapté, .-à-d. l'en odage des signaux (1b g. 1.10 ou
3.1). Il s'agit d'en oder les signaux en se basant sur les alphabets, qui ont été produits au hapitre 3.2.2.
La méthode utilisée est illustrée par la gure 3.5.
L'obje tif est de trouver une suite de lettres, .-à-d. de formes primitives, qui représente au mieux
le signal analysé. Pour ela, une fenêtre de taille xe balaie le signal, omme pré édemment durant
l'extra tion des formes primitives, mais ette fois- i, de manière onsé utive, sans re ouvrement, an de
produire une suite ontinue non redondante de se tions du signal.
43
Chapitre 3.
Analyse de séries temporelles
Fig.
3.5 Méthode d'en odage des signaux
Chaque se tion est normalisée de façon entrée réduite (voir 3.3), an de pouvoir omparer sa forme
primitive aux lettres de l'alphabet. La lettre orrespondant le mieux à haque se tion est re her hée
dans l'alphabet séle tionné. Les valeurs de la normalisation, la moyenne et la varian e, sont onservées
et forment ensemble ave la lettre un triplet qui sut à reproduire une approximation de la se tion
originale du signal.
La re her he de la lettre la plus représentative est réalisée par la même arte auto-organisatri e
(SOM) qui représente l'alphabet. La arte est dans ette phase utilisée en tant que simple lassi ateur.
Dans ette phase plus au un apprentissage n'est réalisé. La SOM attribue haque se tion montrée en
entrée du réseau à la lasse (lettre) qui lui ressemble le plus.
Finalement, le signal est représenté par une suite de triplets qui onstitue un mot représentant le
odage du signal. Chaque triplet [C, µ, σ] ontient un nombre entier, se référant à la lasse (lettre), et
deux valeurs réelles pour la moyenne et la varian e de la normalisation lo ale.
En se basant sur les alphabets produits dans le hapitre pré édent, e odage est appliqué au
signal arti iel. Le tableau 3.1 montre une partie du mot du signal arti iel. La ligne C(i) représente
l'identiant (l'index) de la lettre qui orrespond au mieux à la partie du signal. La forme primitive
orrespondante peut être reprise de l'alphabet qui est montré dans la gure 3.4. Les lignes µ(i) et σ(i)
représentent les valeurs de la normalisation, la moyenne et la varian e de la se tion du signal.
i
C(i)
µ(i)
σ(i)
1
2
3
4
···
···
···
···
49
50
3
2
5
3
2
5
0.0979 -0.0547 0.2548 0.2348
0.9783 0.9632
0.6837 0.6153 0.6561 0.7879
0.0233 0.0311
Tab. 3.1 Exemple de triplet du odage du signal arti iel
An de valider la méthode, le signal odé est re onstruit en se basant sur l'alphabet utilisé pour le
odage et omparé au signal original (voir gure 3.6). La reprodu tion du signal passe par une on aténation de formes approximées des se tions du signal. La forme approximée d'une se tion est le résultat
de la pro édure inverse du odage, .-à-d. la dénormalisation de la forme primitive issue de l'alphabet
qui a été attribuée à la se tion en se basant sur les valeurs de normalisation lo ale (3.4).
~x(i) = (~x∗C(i) ∗ σ(i)) + µ(i)
44
(3.4)
3.2.
Un
odage adapté aux données
Ave ~x∗C(i) la forme primitive C(i) de l'alphabet.
Par exemple pour i = 3 (voir tab. 3.1) la forme primitive numéro 5 de la gure 3.4 est utilisée.
Cette forme 5 est dans e as réduite en taille par la multipli ation ave σ(3) = 0.6561 et positionnée
sur l'axe des y par l'addition de µ(3) = 0.2548. La gure 3.6(a) montre les détails de la re onstru tion
pour les positions i = 3 et i = 4 en représentant le signal d'origine, les deux formes primitives les formes
dénormalisées (re onstruites) et le lien entre les deux parties re onstruites qui résulte du fait que le odage
a été réalisé sans re ouvrement.
(a)
(b)
3.6 Re onstru tion du signal arti iel après le odage : (a) Détail de la re onstru tion pour les
position i = 3, i = 4 ; (b) Comparaison du signal original ave le signal re onstruit.
Fig.
Il est lairement visible dans la gure 3.6(b) que la première partie du signal arti iel est re onstruite
ave un taux d'erreur plus important que la deuxième partie. Cette onstatation s'explique par la propriété
de ltrage lo al de la méthode. En fait, la lettre, .-à-d. la forme primitive qu'elle représente, qui est
produite durant la première phase, .-à-d. l'extra tion des formes primitives, est soumise à des ontraintes
représentées par les propriétés de l'alphabet :
la taille xe des séquen es analysées et
le nombre restreint de lettres à produire.
Chaque lettre de l'alphabet représente une forme moyenne des se tions normalisées qui sont regroupées dans la lasse (voir 3.4). Cette forme moyenne représente une forme ltrée (lissée) des se tions
regroupées dans la lasse.
En réduisant la taille des lettres, la qualité du signal reproduit augmente, mais l'avantage d'un odage
ompa t se perd. Ce i est également valable pour l'augmentation du nombre de lettres de l'alphabet. Ces
deux possibilités sont détaillées dans le hapitre 3.2.4 sur l'appli ation de la méthode aux données du
four.
En vue d'une analyse du omportement ma ros opique du pro essus sous-ja ent, la rédu tion de la
taille l'emporte sur la qualité de la reprodu tibilité du signal.
3.2.3.1
Possibilité d'extension pour une appro he multivariable
Dans e travail, un seul signal est analysé an de limiter la omplexité en vue de l'analyse des
méthodes proposées. Mais toutes les méthodes sont réalisées dans l'optique d'une extension à une appro he
multivariable. Dans le as d'un odage multivariable, les deux éléments de normalisation lo ale du triplet
45
Chapitre 3.
Analyse de séries temporelles
deviennent des ve teurs. Il reste un nombre entier pour la lettre et deux ve teurs de valeurs réelles de
taille identique pour les valeurs de normalisation (moyenne et varian e) des formes pour haque variable
en odée. Dans e as la lettre d'un alphabet ontient un ensemble de formes, une pour haque variable
qui est prise en ompte pour le odage. Ces formes sont apprises ensemble an d'in orporer les relations
intra-variables. Si par exemple la variable v1 a souvent une ourbure positive quand la variable v2 reste
onstante, ette propriété sera apprise durant la phase d'extra tion de formes. Ave le nombre de variables
la possibilité de formes multi-dimensionnelles augmente et il faudra prévoir un alphabet de plus grande
taille. Dans le as d'une appro he multié helle plusieurs odages sont réalisés pour un même signal.
3.2.3.2
Comparaison ave
les
odages PAA et PLA
Il est relativement fa ile de omparer l'appro he proposée aux méthodes PAA ou PLA, pour lesquelles
des séquen es d'un signal sont approximées par une valeur onstante (PAA) ou par une régression linéaire
(PLA). La gure 3.7 montre trois diérents niveaux de re onstru tion du signal d'origine possibles sur
base du odage proposé, qui peuvent être attribués aux odages PAA et PLA. Les niveaux sont :
1. si seulement la moyenne µ(i) du triplet est utilisée le odage PAA est réalisé,
2. si au niveau de la moyenne une régression linéaire de la forme est re onstruite un odage omparable
à elui du PLA est réalisé,
3. si la re onstru tion omplète, en utilisant la forme dénormalisée, est faite le odage adapté est
réalisé.
Le odage proposé, qui pourra être appelé PPA (Pie ewise Pattern Approximation), ajoute la notion
de forme (pattern) et améliore de e fait l'approximation au signal original. Dans le odage proposé les
formes sont issues d'une SOM et don obtenues de façon non-supervisée en e basant sur le signal analysé.
La gure 3.7 montre une omparaison des trois méthodes de odage utilisant la même taille de fenêtre
à haque fois. Cela représente en même temps les diérents niveaux de re onstru tion possible en e basant
sur le odage PPA. La valeur "`mse"' donne l'erreur quadratique moyenne réalisée par la re onstru tion
pour le signal arti iel (voir l'équation 3.5).
Les méthodes basées sur les ondelettes peuvent aussi être omparées à la méthode présentée i i. La
méthode PPA utilise omme fon tion de base des formes primitives du signal analysé pour l'approximation
des séquen es. De par leur nature, es formes sont probablement mieux adaptées pour appro her l'allure
du signal. Mais une réelle omparaison n'a pas été analysée dans le adre de e travail.
3.2.4 Appli ation aux données du pro essus industriel
Pour tout le do ument, le signal de la puissan e éle trique est utilisé an d'illustrer l'appli ation des
méthodes. La base de donnée utilisée pour la gestion des données provenant de l'installation ontient
presque 3.3 millions d'é hantillons de mesures pour ette variable (tab. A.1). Cela représente en tout
2566 y les de produ tions. Des analyses préliminaires, réalisées dans le adre du projet CECA, qui n'ont
pas été reprises dans e do ument, montrent que 2471 de es y les sont réellement utilisables [45℄, [16℄.
En premier lieu l'extra tion de formes qui omposent e signal de la puissan e éle trique est illustrée,
e qui va produire divers alphabets de diérentes é helles qui vont être utilisés pour le odage et les
phases suivantes de l'analyse globale. Dans une deuxième partie les résultats du odage seront analysés.
3.2.4.1
Les formes qui
omposent le signal de la puissan e éle trique
Dans e ontexte il est important de pré iser que l'appro he d'apprentissage par méthode bat h ne
doit pas utiliser tout le orpus à ause de la validation du résultat qui doit être réalisée sur un orpus non
utilisé pour l'apprentissage. C'est pourquoi itérativement diérentes parties du orpus ont été utilisées
tout au long de l'apprentissage de la arte SOM. En tout 50% du orpus ont été utilisés et la séle tion
des parties s'est faite de façon aléatoire.
Con ernant la produ tion des alphabets, quelques réexions de prin ipe peuvent être faites on ernant
les deux paramètres prin ipaux qui dénissent haque alphabet. Il est question de la taille des formes
(taille de fenêtre) et du nombre de formes .-à-d. de la taille de l'alphabet.
46
3.2.
Fig.
Un
odage adapté aux données
3.7 Niveau de re onstru tion basé sur le odage
47
Chapitre 3.
Analyse de séries temporelles
Le tableau 3.2 montre un aperçu de la mémoire utilisée après odage pour un y le donné, qui en
forme originale né essite 6296 [Bytes℄. Deux tailles de fenêtre sont analysées pour haque fois quatre
tailles d'alphabet.
taille
mémoire pour l'al- mémoire pour le o- mémoire
totale
alpha phabet [Bytes℄
dage [Bytes℄
d'un y le [Bytes℄
taille fenêtre 4
1920
312
2232
60
9
4320
312
4632
16
7680
312
8002
25
12000
312
12312
taille fenêtre 4
384
1560
1944
12
9
864
1560
2424
16
1536
1560
3096
25
2400
1560
3960
Tab. 3.2 Rédu tion de mémoire en relation ave les paramètres de l'alphabet
Notez que la mémoire né essaire pour l'alphabet est utilisée une seule fois pour tous les signaux odés,
et la mémoire utilisée pour le odage est utilisée pour haque y le qui sera odé. La mémoire appelée
totale dans le tableau est la somme de l'alphabet et du odage. Puisque l'alphabet est réutilisé pour
haque odage, sa mémoire peut être ignorée dans le as d'un grand nombre de y les odés.
Si le but est la rédu tion de taille pour un grand nombre de données, il est intéressant de travailler
ave des fenêtres de grande taille.
Durant les analyses un grand nombre d'alphabets a été produit, et en partie analysé et vérié par des
méthodes de validations (Annexe C). Pour l'illustration des résultats qui sont obtenus par les méthodes,
il est plutt gênant de prendre en ompte un nombre trop important de diérentes réalisations. Dans
la suite du do ument seul inq alphabets diérents vont être utilisés, an de limiter la omplexité des
représentations. Le plus souvent, les illustrations se basent seulement sur un ou deux de es alphabets.
Le tableau 3.3 montre les paramètres prin ipaux pour les inq alphabets utilisés. A0 a été ajouté
aux alphabets séle tionnés dans l'annexe C pour des raisons de représentation ar seulement 4 formes
primitives de faible taille sont utilisées. Cependant et alphabet n'est pas optimal selon les ritères de
validation.
Nom taille fenêtre taille alpha
A0
12
4
A1
6
12
A2
24
5
42
6
A3
A4
60
6
Tab. 3.3 Alphabets utilisés ave leurs paramètres
La gure 3.8 montre les 12 formes de l'alphabet A1 et les six formes de A4. La représentation est
un peu trompeuse, puisque une arte SOM unidimensionnelle est utilisée, et que de e fait il faudrait
représenter les formes en ligne l'une après l'autre, an de mieux voir la relation qui existe entre elles.
Le but des alphabets est d'être utilisés pour le odage. Il est don plus intéressant de dis uter de la
qualité des alphabets après l'appli ation du odage.
3.2.4.2
Appli ation du
odage aux données du four
Pour l'analyse le orpus omplet des 2471 y les a été odé par la méthode présentée. Représenter le
odage brut n'a au une valeur et omme pour tout odage, il est di ile pour l'utilisateur d'en tirer des
informations. C'est pourquoi quelques méthodes ont été développées.
Une première appro he est d'analyser, pour un ou plusieurs y les séle tionnés aléatoirement, de quelle
manière un alphabet ou plutt les formes d'un alphabet sont utilisées. La gure 3.9 montre quelques
48
3.2.
(a)
Un
odage adapté aux données
(b)
3.8 Exemples des alphabets utilisés : (a) les douze formes de l'alphabet A1 ; (b) les six formes de
l'alphabet A4
Fig.
graphiques pour un y le en utilisant l'alphabet A0
La distribution de formes utilisées montre si oui ou non toutes les formes sont utilisées de façon
équivalente ou si éventuellement il existe des formes qui sont peu utilisées pour le odage. Puisque un
alphabet représente les prototypes d'une lassi ation non-supervisée, ela donne une information sur le
fait s'il existe des lasses d'évènements rares.
Le diagramme représentant la forme prototype ainsi que les formes du signal attribuées donne une
information visuelle sur la ompa ité des lasses. De plus, ela montre le volume de ltrage qui est réalisé
par l'alphabet. Dans l'exemple (g.3.9) où l'alphabet A0 est utilisé pour simplier l'illustration, la
varian e intra- lasse semble plus importante que la varian e inter- lasses. Cela montre que et alphabet
n'est probablement pas un premier hoix pour une appli ation on rète.
Ces deux informations donnent une impression sur la qualité de l'alphabet. D'autres méthodes automatiques sont dis utées dans l'annexe C qui traite la validation d'alphabets.
Les distributions de la moyenne et de la varian e donnent une impression sur les déformations des
formes primitives qui sont né essaires an de représenter au mieux le signal d'origine. Pour le y le
analysé la moyenne se trouve sur deux plages, une relativement petite et une autour de 90. La varian e
est davantage distribuée ave une valeur maximale près de 50. Que la varian e ne représente que environ
la moitié de la moyenne résulte du fait que le signal analysé est stri tement positif.
Une deuxième appro he est la re onstru tion du signal original sur base du odage et le al ul de
l'erreur entre les deux signaux. La gure 3.10 montre la re onstru tion pour le même y le qui a été
analysé auparavant (g 3.9).
La mesure d'erreur qui est utilisée, la MSE (3.5) (angl. mean square error), représente la moyenne de
l'erreur quadratique.
M SE
=
1 X
(yi − ŷi )2
N
(3.5)
Ave ŷi la valeur de la re onstru tion pour la position i et N le nombre de points.
En regardant la re onstru tion réalisée en se basant sur le odage adapté, notez que les dis ontinuités
et l'allure globale sont relativement bien reproduites.
An de omparer le résultat, la moyenne ottante (MF) (une méthode onnue dans le domaine du
ltrage), est utilisée. Le nombre de points utilisés pour la moyenne ottante orrespond à la taille de la
fenêtre qui est utilisée pour le odage adapté. L'erreur de ette appro he est plus petite, e qui veut dire
49
Chapitre 3.
Analyse de séries temporelles
Fig.
Fig.
50
3.9 Analyse omment sont utilisées les formes d'un alphabet (A0)
3.10 Re onstru tion du signal et omparaison ave une appro he de moyenne ottante.
3.3.
Classi ation de séries temporelles de tailles variables
que l'approximation qui est faite par le ltrage de la moyenne ottante est plus pro he du signal original
que elle basée sur le odage PPA.
N'oublions pas qu'un alphabet ave seulement quatre formes est utilisé, et que ontrairement à l'appro he de la moyenne ottante, les formes sont onsé utives sans re ouvrement. Analysons le omportement de l'erreur en augmentant le nombre de formes pour une taille de fenêtre xe. La gure 3.11 montre
e omportement pour les alphabets de référen e.
Fig.
3.11 Analyse du omportement de l'erreur ave la taille de l'alphabet.
Cela montre qu'en augmentant le nombre de formes la re onstru tion du signal s'améliore, et que la
qualité dépasse elle de la moyenne ottante. L'allure du omportement de l'erreur montre aussi que le
gain de qualité de re onstru tion diminue ave le nombre de formes. Il ne sert don à rien d'utiliser un
très grand nombre de formes.
La gure 3.12 montre une partie de la re onstru tion du y le Nr. 7 (voir g.3.10) ave des détails en
utilisant deux des alphabets de référen e (voir tab.3.3).
Il est lairement visible que le odage basé sur l'alphabet A2, ave une taille de fenêtre plus grande,
réalise un ltrage plus important (qualité de reprodu tion plus faible) que le odage basé sur A1. Par
ontre les dis ontinuités sont relativement bien re onstruites dans les deux as.
Il ne faut pas non plus oublier que le but prin ipal de notre appro he n'est pas de oder au mieux un
signal, mais de réduire la taille des données qui sont à manipuler pour les phases suivantes de l'analyse
sans perdre les informations pertinentes tels que les instants d'en len hement du four par exemple. Le but
prin ipal de ette étude est de réaliser une atégorisation des y les de produ tion selon leur évolution
temporelle. Regardé de e point de vue, il est intéressant d'analyser le odage ave le résultat de la
lassi ation non-supervisée qui se base sur e odage adapté. Cependant ette analyse aurait dépassé le
adre de ette thèse.
3.3 Classi ation de séries temporelles de tailles variables
La deuxième et dernière partie de l'analyse évolutive (voir 2. g 1.10) onsiste à regrouper des évolutions du pro essus qui se ressemblent dans des lasses d'évolutions [55℄. Dans la gure 3.13 ette partie
a été isolée de l'appro he globale an de fo aliser le sujet de e hapitre.
Il s'agit en fait d'une lassi ation non-supervisée de séries temporelles selon leur évolution. Après le
odage, l'évolution du pro essus est représentée par les mots .-à-d. des séquen es de triplets. Ce odage
est l'information en entrée pour la réalisation du lassi ateur.
La lassi ation non-supervisée est une tâ he lassique du domaine de l'analyse de données et des
extra tions de onnaissan es. Il existe un grand nombre de méthodes pour la réalisation de ette tâ he
51
Chapitre 3.
Analyse de séries temporelles
Fig.
Fig.
52
3.12 Partie du signal exemple re onstruit par A1 et A2
3.13 Deuxième partie de l'analyse évolutive : regroupement des harges selon leur évolution.
3.3.
Classi ation de séries temporelles de tailles variables
dans des as typiques. Un aperçu d'une partie de es méthodes a été donné dans le hapitre 2.2.2.
Dans le ontexte du projet industriel, les séquen es qu'il s'agit de lassier de façon non-supervisée,
représentent des évolutions temporelles des y les de produ tion (voir hap. 1.2). Inuen és par divers
paramètres, il a été onstaté que les y les montrent une variation importante on ernant leur durée. Une
autre onstatation est qu'un ertain nombre d'événements revient dans haque y le de produ tion. Mais
le moment de leur apparition varie dans le temps à l'é helle du y le. Les analyses qui soulignent ette
onstatation ne sont pas reprises dans e do ument, mais le le teur intéressé est renvoyé au rapport nal
du projet CECA [2℄.
Cette parti ularité se retrouve dans d'autres domaines omme par exemple les signaux ardio-vas ulaires
ou la onsommation énergétique urbaine pour n'en iter que deux. Deux problématiques diéren ient l'appli ation du as typique :
1. La dénition de similarité entre deux séquen es temporelles représentant des évolutions n'est pas
triviale. Ce i mène vers une analyse de la similarité et du al ul d'une mesure de dissimilarité à
utiliser an de pouvoir l'adapter au domaine analysé.
2. Les y les qu'il s'agit de regrouper peuvent avoir des variations importantes dans leur durée. Ce
qui veut dire que les séquen es qui sont à lassier n'ont pas la même taille et qu'il faut en tenir
ompte.
Ces parti ularités sont détaillées dans e hapitre et les outils pour les aborder vont être dé rits.
3.3.1 Parti ularités et problématiques
Dans e sous- hapitre les deux parti ularités évoquées auparavant, à savoir la similarité ave la dénition d'une mesure de dissimilarité et les séquen es de taille variable qu'il s'agit de lassier de façon
non-supervisée, sont expliquées. La problématique qui en dé oule est dis utée.
3.3.1.1
La similarité, un sujet non trivial
Quelle est la dénition de la similarité ? Les di tionnaires utilisent ommunément les termes suivants
ave des dénitions relativement semblables :
Similaire (adj.) Se dit de hoses qui peuvent, d'une ertaine façon, être assimilées les unes aux autres.
Syn. : analogue, semblable.
Similitude (n.f.) Ressemblan e plus ou moins parfaite entre deux ou plusieurs hoses. Syn. : analogie,
identité, anité.
An d'entamer le sujet, la gure 3.14 montre deux images qui font apparaître toute la problématique.
Ces deux images ont une forte ressemblan e. Diérentes propriétés sont très pro hes omme par
exemple la palette des ouleurs, les grandes lignes des formes représentées telles que les ontours, les
positions des yeux, du nez et de la bou he. Cependant il s'agit bien de deux sujets omplètement diérents.
La similarité est di ile à dénir, mais l'humain la réalise (se rend ompte) quand il la voit [30℄. En
fait la réelle nature de la similarité est une question plutt philosophique.
Dans la suite de ette analyse une appro he plus pragmatique et mathématique sera entamée, sans
pour autant perdre de vue l'aspe t subje tif du sujet. Il est important de pouvoir adapter les méthodes
à la problématique on rète du sujet analysé en se référant à des avis d'experts.
Dénissons pour ommen er trois séquen es temporelles U (t), V (t), W (t) relativement simples (voir
g. 3.15(a)). Les séquen es ont toutes la même durée et elles sont é hantillonnées ave le même intervalle
d'é hantillonnage xe. Les deux premières séquen es, U (t) et V (t), représentent un signal ave un réneau
d'amplitude unitaire d'une durée de deux pas de temps, mais ommençant à diérents instants de la
séquen e. La dernière séquen e, W (t), reste nulle sur toute la durée.
An de pouvoir déduire, de façon automatique, lesquelles de es trois séquen es se ressemblent le plus,
il est né essaire d'être en mesure de pouvoir al uler une valeur pour la dissimilarité entre les séquen es.
La métrique qui est utilisée le plus souvent dans le ontexte d'un al ul de dissimilarité se base sur la
distan e eu lidienne. La gure 3.15 montre le résultat obtenu ave ette mesure sous forme de tableau
(g. 3.15(b)) et sous forme de regroupement hiérar hique (g. 3.15( )).
53
Chapitre 3.
Analyse de séries temporelles
Fig.
3.14 Deux images similaires ou non ?
D(U, V )
D(U, W )
D(V, W )
Distan e eu lidienne
√2
√2
2
(b)
(a)
Fig. 3.15 Similarité entre trois séquen es simples :
(a) Les séquen es : U, V, W ;
(b) Les distan es eu lidiennes entre haque paire ;
( ) Regroupement par arbre hiérar hique.
54
()
3.3.
Classi ation de séries temporelles de tailles variables
Dans et exemple simple qui utilise la distan e eu lidienne omme mesure de dissimilarité, le signal
est plus pro he de U (t) et de V (t) que ne le sont es derniers entre eux. Ce résultat peut aussi-bien
être orre t que faux. Sans au une information supplémentaire sur l'origine des signaux ou sur le genre
de similarité qui est re her hé, e résultat ne peut être dis uté davantage, e qui montre que le ontexte
joue un rle fondamental.
Supposons le ontexte suivant : les signaux représentent le signal d'un déte teur de présen e infrarouge
dans un bureau. L'é hantillonnage est fait sur des plages de 3 heures ommençant à minuit et représente
le maximum du signal durant la période d'é hantillonnage. Dans e as, U (t) représente une journée
durant laquelle une personne était présente entre 12 :00 et 18 :00, V (t) une journée ave une présen e
entre 6 :00 et 12 :00 et W (t) une journée ou personne n'était dans le bureau. Si maintenant le ritère de
l'analyse est l'o upation du bureau, le résultat obtenu ave la distan e eu lidienne est dis utable, ar il
faudrait plutt regrouper les signaux U (t) et V (t) qui ont dans e as une évolution plus pro he, puisque
durant les deux journées il y avait présen e dans le bureau, même si 'était à diérents moment de la
journée.
Ces deux exemples, (g. 3.14) et (g. 3.15), montrent que le sujet de la similarité est fortement relié au
domaine analysé et que la dénition d'une mesure de dissimilarité adaptée à ette analyse est un fa teur
lef.
W (t)
3.3.1.2
Taille variable des séquen es
Dans l'exemple pré édent (g. 3.15) les séquen es avaient toutes la même taille. Dans le domaine
de l'analyse de séries temporelles ette propriété n'est pas toujours donnée. La gure 3.16 représente un
exemple simple qui illustre la problématique. Elle montre la séquen e U (t), déjà introduite pré édemment,
ave une légère variation U (t) qui ne se diéren ie de la première séquen e que par un ajout de deux
é hantillons à valeur nulle.
′
Fig.
3.16 Similarité entre deux séquen es simples de taille diérente
Le al ul de ressemblan e basé sur la distan e eu lidienne, omme utilisé pré édemment, est impossible.
Une première possibilité pragmatique serait de faire une normalisation sur l'axe de temps an d'uniformiser les y les sur une même taille. Deux remarques peuvent être faites à e sujet :
la normalisation est une opération linéaire de ompression sur l'axe de temps. Le résultat serait un
dé alage et une déformation du réneau dans le temps ave la problématique dis utée auparavant.
la normalisation sur l'axe de temps engendrerait un al ul d'interpolation an de garantir un é hantillonnage omparable. Une interpolation entraînerait une déformation du réneau.
3.3.2 Mesures de similarité
Dans le hapitre 3.3.1 la di ulté de dénir la similarité a été dis utée brièvement. La base de toute
dis ussion sur le sujet est la dénition d'une mesure de la similarité. Une telle mesure est dire tement
reliée à la dis ussion des propriétés des mesures de distan es. Ce hapitre traite du sujet de la mesure de
55
Chapitre 3.
Analyse de séries temporelles
similarité respe tivement de dissimilarité dans le ontexte de trouver un moyen de regrouper les séquen es
temporelles selon leur évolution.
Commençons par la dénition de la mesure de distan e (dissimilitude) telle qu'elle est omprise i i :
Soit O1 et O2 deux objets de l'univers des objets possibles. La distan e entre les deux est donnée par :
D(O1 , O2 ).
Pour qu'une telle distan e soit utilisable pour la omparaison, elle devrait avoir les propriétés suivantes : elle doit garantir la symétrie (3.6), elle doit garantir la similarité ave elle-même (3.7), elle doit
être dénie positive (3.8) et elle doit vérier l'inégalité triangulaire (3.9).
(3.6)
D(A, A) = 0
(3.7)
D(A, B) > 0
∀A 6= B
(3.8)
D(A, B) ≤ D(A, C) + D(B, C)
(3.9)
Cependant parfois la propriété de l'inégalité triangulaire (3.9) ontredit l'intuition humaine. Keogh
dans [30℄ ite l'exemple suivant : le heval (CH) et l'homme (H) sont très diérents, mais ils partagent des
ara téristiques ave le entaure (CE). Ave une ertaine mesure de distan e appropriée à e problème et
qui vérie l'inégalité triangulaire, nous devrions obtenir la relation suivante.
D(A, B)
= D(B, A)
D(CH, H) ≤ D(CH, CE) + D(CE, H)
Ce qui aurait pour signi ation que le heval et l'homme ne sont pas tellement diérents. De e fait,
l'inégalité triangulaire est une propriété dis utable dans le ontexte de la similarité.
La mesure la plus utilisée dans le domaine d'analyses de séries temporelles est la distan e eu lidienne.
Elle est un as parti ulier de la métrique de Minkowski (3.10) que l'on obtient pour p = 2.
v
uN
uX
p
D(A, B) = t
|Ai − Bi |p
(3.10)
i=1
Analysons la distan e eu lidienne dans le ontexte de séries temporelles. Les deux séquen es A et
sont, dans e as, des séries ave N é hantillons. La distan e eu lidienne Deucl (A, B) représente en
quelque sorte le umul des distan es lo ales (Ai − Bi )2 pour tous les é hantillons i = 1 7→ N . Cela réalise
un alignement linéaire dans le temps (voir 3.17(a))
Cet alignement gé dans le temps est une ontrainte forte et empê he une souplesse qui est né essaire
pour l'analyse de la similarité de séries temporelles. Reprenons les exemples U (t), V (t) et W (t) (g.
3.15(a)) et analysons-les plus en détail. Entre U (t) − W (t) et respe tivement V (t) − W (t) le al ul de
distan e se limite à une diéren e en deux endroits sur la séquen e, ave ha une une distan e lo ale de
valeur 1 à l'endroit du réneau. Pour la distan e U (t) − V (t) (g. 3.17(a)), les deux réneaux se su èdent
et il existe quatre endroits pour lesquels la distan e lo ale a la valeur 1.
An de garantir une appro he de similarité pour les évolutions temporelles, plus de souplesse pour
l'alignement sur l'axe des temps serait préférable. La gure 3.17(b) montre une telle appro he ave une
ompression de U (en ouleur bleue) avant le réneau, et un étirement de U (en ouleur verte) derrière le
réneau, an d'aligner les réneaux sur l'axe des temps (en ouleur rouge). Dépendant du oût d'une telle
transformation non-linéaire sur l'axe des temps, les séquen es U (t) et V (t) se ressemblent plus ou moins.
Pour une telle méthode une omparaison de séries de taille diérente tel que U et U ′ ne représenterait
pas d'obsta le.
Maintenant, omment et à quel endroit réaliser es transformations non-linéaires, n'est pas une tâ he
triviale. Une méthode qui autorise de telles manipulations est onnue sous le nom anglais de Dynami
Time Warping (DTW) et réalise un heminement temporel dynamique tout en al ulant une valeur
de dissimilarité entre deux séquen es. Dans la suite de e hapitre les bases de ette mesure vont être
développées. Elles sont suivies de quelques adaptations et des méthodes de al uls qui sont utilisées.
Toute ette partie est illustrée par des exemples basés sur des séquen es arti ielles an de simplier la
ompréhension.
B
56
3.3.
Classi ation de séries temporelles de tailles variables
(a)
(b)
Fig. 3.17 (a) Alignement linéaire sur l'axe de temps ;
(b) Alignement non-linéaire ave possibilité de ompression ou extension sur l'axe de temps
3.3.2.1
Les bases de la distan e DTW
Dans ette se tion les bases de la méthode du Dynami Time Warping (DTW) sont détaillées. Cette
méthode est issue du domaine de la programmation dynamique formulé par Bellman en 1957 [3℄. Surtout
dans le domaine de la parole la programmation dynamique a beau oup été utilisée [4℄ ; [59℄ ; [52℄. Le terme
de Dynami Time Warping vient probablement aussi du domaine de la parole ave Myers et Rabiner
en 1981 [48℄. La méthode DTW est utilisée dans diverses appro hes [61℄ et a été ombinée ave d'autres
méthodes omme les modèles de Markov a hés[57℄ ou les Ondelettes[38℄. Plus tard ette méthode est
aussi appliquée dans des ontextes plus génériques de l'analyse de séries temporelles ave Berndt, Cliord
en 1994 [5℄ et d'autres [62℄ ; [35℄ ; [35℄.
Cette se tion ommen e ave la dénition de la méthode DTW, les propriétés et l'algorithme dans
sa forme ré ursive. Cette première partie est suivie d'une expli ation détaillée sur base d'un exemple
simple. Commençons par la dénition mathématique de la méthode DTW. Dans la suite du do ument la
valeur de dissimilarité obtenue par la méthode DTW sera appelée distan e DTW, même si ette mesure
ne garantit pas l'inégalité triangulaire qui est spé iée dans la dénition d'une distan e.
Soit S(t) une série temporelle multivariée de taille n dénit par l'équation (3.11).
S = {~s(t)|1 ≤ t ≤ n}
(3.11)
Ave ~s(i) le ve teur de ara téristiques lo ales à l'instant t = i.
Deux séries de e type, S1 et S2 de tailles n1 et n2 quel onques, peuvent être omparées ave la
méthode DTW si :
leurs ve teurs de ara téristiques s~1 (t) et s~2 (t) ont le même nombre et les mêmes types de omposantes,
il existe une mesure de dissimilarité entre les ve teurs de ara téristiques (3.13).
La distan e DTW entre es deux séries est donnée par Ddtw (S1 (n1 ), S2 (n2 )) en se référant à la
dénition (3.12) qui est une formulation ré ursive.



 Ddtw (S1 (i − 1), S2 (j))
Ddtw (S1 (i), S2 (j − 1))
Ddtw (S1 (i), S2 (j)) = d(i, j) + min


Ddtw (S1 (i − 1), S2 (j − 1))
(3.12)
Ave la distan e lo ale entre les ve teurs de ara téristiques :
d(i, j) = d(s~1 (i), s~2 (j))
et ave les onditions de bord (3.14) et le ritère d'arrêt de la ré ursion (3.15).
(3.13)
57
Chapitre 3.
Analyse de séries temporelles
(3.14)
(3.15)
An d'aborder la distan e DTW de façon plus intuitive et visuelle, un exemple simple est introduit
pour illustrer les démar hes. Deux séquen es ourtes et de taille diérente sont utilisées. An de simplier
l'expli ation, le ve teur de ara téristiques est réduit à un s alaire de valeurs numériques, soit un nombre
entier qui représente l'amplitude de la séquen e à haque instant (voir g. 3.18).
Ddtw (∅, S2 (j))
Ddtw (∅, ∅)
= Ddtw (S1 (i), ∅) = ∞
= 0
(a)
Fig.
(b)
3.18 (a) Q(t) une séquen e à 5 points, (b) C(t) une séquen e à 4 points.
En premier lieu une matri e de la taille de Q(t) sur la taille de C(t) ([5x4℄) est onstruite. Elle est
remplie ave les distan es lo ales d(i, j) entre les s alaires des séquen es pour toutes les positions de la
matri e (lo al distan e matrix - LDM). Dans le as de et exemple, la distan e eu lidienne peut être
utilisée, e qui revient à prendre la valeur absolue de la diéren e des s alaires (3.16).
(3.16)
Une interprétation des distan es lo ales dans l'espa e des séquen es est illustrée dans la gure 3.19(a).
Par exemple d(4, 1) = 1 réalise une omparaison entre deux points des séquen es relativement éloignée
sur l'axe du temps.
d(i, j) = |q(i) − c(j)|
(a)
(b)
3.19 Cal ul de la matri e des distan es lo ales :
(a) Les deux séquen es sur le même système d'axes ave quelques exemples (diérentes ouleurs) d'éléments omparés ave leurs positions dans la LDM ;
(b) La matri e des distan es lo ales (LDM)
Fig.
58
3.3.
Classi ation de séries temporelles de tailles variables
La méthode DTW onsiste à trouver le minimum de la distan e umulée des heminements possibles
à travers ette matri e en garantissant les propriétés suivantes :
Les onditions de bord sont : les premier et dernier éléments des séquen es sont alignés. Le point
(0,0) est le point de départ et (5,4) est le point d'arrivée de tous les hemins autorisés.
La ontinuité du heminement : haque point des deux séquen es doit être utilisé au moins une fois.
Un saut dans le temps n'est pas autorisé.
La monotonie du heminement : il est impossible de retourner dans le temps, un arrêt provisoire
est autorisé.
Les onditions de ontinuité et de monotonie sont garanties par la restri tion à trois possibilités
d'avan ement pour le heminement : horizontal (j − 1 7→ j ), verti al (i − 1 7→ i) et en diagonale (i − 1 7→
i; j − 1 7→ j ) (voir g. 3.20). Ces onditions sont reprises dans l'équation (3.12).
Fig.
3.20 Le prin ipe de la distan e DTW
En se basant sur la matri e LDM il est fa ile de onstruire la matri e globale des distan es umulées
(angl. global distan e matrix (GDM)) de façon in rémentale en ommençant au point de départ des deux
séquen es (0,0) et en avançant ligne par ligne ou olonne par olonne. La valeur nale au point (5,4)
représente la distan e DTW entre les deux séquen es (Ddtw (Q, C) = 2).
La gure 3.21 montre les deux matri es, LDM et GDM pour et exemple. Dans la GDM le hemin
qui minimise la distan e globale est tra é en vert. Une deuxième représentation de la GDM en 3D (g.
3.21(d)) montre que le hemin passe dans la vallée de la surfa e qui est onstruite par les valeurs de la
GDM.
À partir de e hemin, l'alignement non-linéaire dans l'espa e du temps, réalisé par le al ul, peut
être représenté (voir g. 3.21( )).
Le hemin qui donne le minimum de la distan e umulée est trouvé par rétro-propagation après la
onstru tion de la matri e GDM. Deux possibilités existent :
Sauvegarder pour haque ase de la matri e la dire tion qui a onduit au minimum. En ommençant
au point nal (5,4) ette information onduit à la onstru tion du hemin qui minimise la distan e
globale.
Commen er au point nal et avan er en her hant pour haque position la dire tion qui réalise la
plus petite diéren e.
Ces deux possibilités ne donnent pas né essairement le même résultat. Dans e travail la première solution
est retenue.
Un avan ement du hemin en diagonale représente un avan ement d'un pas de temps dans les deux
séquen es (alignement uniforme). Un avan ement horizontal ou verti al du hemin représente un étirement
respe tivement une ompression d'une des séquen es.
59
Chapitre 3.
Analyse de séries temporelles
(a)
()
(b)
(d)
3.21 Cal ul et alignement DTW pour l'exemple :
(a) Rappel de la matri e des distan es lo ales ;
(b) GDM : la matri e globale des distan es umulées ave le hemin qui minimise ette distan e ;
( ) L'alignement non linéaire des deux séquen es ;
(d) Représentation 3D de la GDM ave le hemin par ouru.
Fig.
60
3.3.
Classi ation de séries temporelles de tailles variables
Dans l'exemple un avan ement verti al du point (3,3) au point (4,3) est réalisé. La gure 3.21( )
représente et avan ement par la ompression des points t = 3 et t = 4 de la séquen e Q sur un seul point
t = 3 de C . Comme auparavant ette ompression est représentée par la ligne en ouleur bleue. Après la
ompression, le hemin avan e de nouveau en diagonale, e qui représente un alignement uniforme dans le
temps. Dans la gure 3.21( ) et alignement est en rouge lair pour indiquer qu'il s'agit d'un alignement
uniforme, mais qu'il ne représente plus l'alignement initial qui est en rouge fon é.
Ave ette distan e DTW il est don possible de omparer des séquen es de taille quel onque ave une
souplesse dans l'alignement temporel. Pour revenir sur les trois séquen es U (t), V (t) et W (t) (g. 3.15(a)),
il est possible de réaliser un regroupement qui ette fois- i est basé sur la distan e DTW. Le tableau 3.4
montre le résultat des distan es roisées et les ompare au résultat basé sur la distan e eu lidienne.
D(U, V )
D(U, W )
D(V, W )
Dist. eu l. Dist. DTW
2
√2
4
√2
2
4
3.4 Comparaison de la distan e eu lidienne et de la distan e DTW sur les séquen es U (t), V (t)
et W (t)
Tab.
En utilisant la distan e DTW, les séquen es U (t) et V (t) sont regroupées en premier lieu, e qui reète
davantage l'appro he de similarité basée sur l'évolution temporelle qui est sujet de e travail.
La dénition et les bases de la distan e DTW ont été expliquées et a ompagnées d'un exemple
simple. En vue d'une appli ation de la méthode DTW à des problèmes réels omme : la lassi ation des
séquen es de grandes tailles, des données bruitées, le temps de al ul et les données multivariées, pour ne
nommer que les plus importants pour la lassi ation non-supervisée des y les de produ tion du four à
ar éle trique, quelques analyses plus approfondies de la méthode sont né essaires.
3.3.2.2
La distan e DTW appliquée à la
lassi ation
Toute appro he de lassi ation se base sur une mesure de similarité voire de dissimilarité, e qui est
le plus souvent représenté par une mesure de distan e entre les éléments analysés. Ce hapitre dis ute
l'adéquation de la distan e DTW dans e domaine. An de simplier la dis ussion et en même temps
d'avan er vers l'appli ation industrielle un orpus de mots simples, basé sur l'ensemble des lettres
{A, B}, est onstruit (voir tab. 3.5).
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Mot
AAAAA
AAABA
AABAA
ABAAA
AAAAAAAAAA
AAAAAABBAA
AAAABBAAAA
AABBAAAAAA
AABAAAABAA
ABABA
AABBAABBAA
Tab.
Remarque
5 lettres identiques
5 lettres ave un B à diérentes positions
10 lettres identiques
10 lettres ave 2 B onsé utifs à diérentes positions
2 lettres B séparées, une au début et une à la n
variante de 9. ave un dédoublement des lettres B
3.5 Les mots utilisés dans l'analyse de lassi ation
Le orpus se ompose de mots à deux tailles diérentes (5 et 10 lettres) ave en majorité des lettres
An d'analyser le omportement du al ul de dissimilarité, des lettres B sont ajoutées et dépla ées de
façon stru turée à l'intérieur de la séquen e à diérents endroits.
A.
61
Chapitre 3.
Analyse de séries temporelles
Il reste à dénir une distan e lo ale pour e type de séquen e. L'appro he la plus simple onsiste à
dire que la valeur de dissimilarité entre les deux lettres A et B est de 1 et à spé ier que elle entre
deux lettres identiques est de 0.
La gure 3.22 montre le résultat obtenu par une lassi ation par arbre hiérar hique en utilisant la
distan e DTW telle que dénie au hapitre 3.3.2.1. Pour l'arbre hiérar hique, l'algorithme qui est utilisé
i i représente un regroupement de deux ou plusieurs éléments par la plus petite distan e entre eux.
Fig.
3.22 Classi ation hiérar hique basée sur la distan e DTW
La méthode a bien regroupé les séquen es sans lettre B . Les séquen es ave une seule apparition de
la lettre B sont regroupées. Même les séquen es où deux B onsé utifs n'apparaissent qu'une seule fois,
e qui ressemble fortement aux séquen es ave un B , se retrouvent dans la même lasse. Finalement une
troisième lasse est réée où sont regroupées les séquen es où la lettre B apparaît à deux endroits dans la
séquen e, en in luant la séquen e 11 (variante de la séquen e 9) où la lettre B est dédoublée haque fois.
En prin ipe e résultat semble satisfaisant, étant donné que pour le regroupement la taille de la
séquen e ne joue pas de rle. Seule la forme importe pour la réation des lasses. Mais même si le
regroupement est satisfaisant, l'organisation interne des lasses donne à réé hir. La distan e entre tous
les mots internes à une lasse ont la valeur zéro. Cependant, même si les mots 2,3 et 4 se ressemblent, il
y a une plus grande diéren e entre 2 et 4 qu'entre 2 et 3. Sans parler des mots 6 et 4 par exemple où la
diéren e subje tive est en ore plus importante.
Il est évident, et ela a déjà été évoqué dans le hapitre 3.3.1, que la similarité est un sujet non
trivial ave toujours une part de subje tivité. De e fait, il serait intéressant pour l'utilisateur s'il pouvait
inuen er l'algorithme, an de l'adapter à ses besoins. Un premier paramètre est la dénition de la
distan e lo ale entre les ve teurs de ara téristiques. Mais ette mesure n'a pas d'inuen e dire te sur
le mé anisme global de la re her he du hemin minimisant la distan e umulée et don sur l'allignement
réalisé par le DTW.
Une appro he intéressante a été proposée par Stuart N. Wrigley [61℄ appliquée dans le domaine de la
re onnaissan e de la parole. Elle se base sur le fait que l'algorithme DTW de base a une préféren e pour
le hemin diagonal. En eet, partant de (i, j) pour atteindre le point (i + 1, j + 1), aller en diagonale ne
représente qu'une seule opération. Pour utiliser un autre hemin selon les règles du DTW, deux opérations
sont né essaires, e qui augmente la somme umulée d'un fa teur de deux, si les distan es lo ales sont
identiques. Stuart propose de e fait de alibrer ette opération et d'ajouter une pénalité fa ultative pour
les diérentes dire tions. Basée sur la dénition du DTW (3.12) ette modi ation est exprimée dans
l'équation (3.17).



 ph + Ddtw (S1 (i − 1), S2 (j))
pv + Ddtw (S1 (i), S2 (j − 1))
Ddtw (S1 (i), S2 (j)) = d(i, j) + min


2 ∗ Ddtw (S1 (i − 1), S2 (j − 1))
(3.17)
Pour la paramétrisation des trois dire tions, il sut de spé ier deux paramètres de pénalisation.
62
3.3.
Classi ation de séries temporelles de tailles variables
Cette modi ation donne à l'utilisateur la possibilité d'inuen er le omportement global de la re her he
du hemin minimal. Une pénalisation de l'étirement ou de la ompression a une inuen e sur la valeur
de la distan e DTW entre deux séquen es, et inue de e fait dire tement sur la lassi ation qui en est
déduite. La gure 3.23 montre l'inuen e du paramètre pénalité sur le résultat de la lassi ation en se
basant sur le orpus des mots (tab. 3.5) et en spé iant que ph = pv.
(a)
(b)
()
(d)
3.23 Inuen e de la pénalité dire tionnelle du DTW sur la lassi ation (i i ph = pv) : (a) pas de
pénalité ph = pv = 0 ; (b) faible pénalité ph = pv = 0.2 ; ( ) pénalité moyenne ph = pv = 0.4 ; (d) forte
pénalité ph = pv = 0.6.
Fig.
Pour ette analyse les pénalités horizontale et verti ale sont syn hrones, et l'ajustement des trois
dire tions est utilisé. Ave l'augmentation de la pénalité la distan e DTW entre les mots augmente et
le regroupement est modié. Au début les mots similaires restent regroupés. La pénalité ph = pv = 0.2
représente le même regroupement si l'arbre est oupé au niveau de la distan e de 1.2. Mais à l'intérieur
de haque lasse des sous-regroupements se réent. Ave la pénalité, la longueur des mots prend de plus
en plus d'importan e. A la n il y a la longueur des mots qui l'emporte sur la forme. Cela montre que
e paramètre inue bien sur le omportement du mé anisme global de la re her he du hemin minimal
et modie la distan e DTW globale entre des séquen es analysées.
Cette analyse soulève une question supplémentaire : la distan e umulée entre deux mots ourts est
par prin ipe plus petite que elle entre deux mots longs, qui ont une dissimilarité semblable, par e que le
63
Chapitre 3.
Analyse de séries temporelles
hemin est plus ourt. An de pouvoir omparer les distan es entre de tels mots de diérente taille une
normalisation de la distan e DTW s'impose.
Il y a plusieurs possibilités pour faire une telle normalisation. I i deux variantes sont analysées :
Normaliser par la
p diagonale de la GDM : La matri e des distan es umulées (GDM) est divisée
par la valeur n21 + n22 où n1 , n2 sont les tailles des séquen es omparées. Cette méthode se base sur
le fait que le hemin dire t entre deux séquen es est la diagonale. Si deux séquen es se ressemblent
le hemin minimal ne dévie que faiblement de la diagonale.
Normalisation par la séquen e la plus longue : I i la matri e GDM est divisée par la valeur max(n1 , n2 ).
La philosophie de ette appro he est que, pour une séquen e (longue), toute omparaison devrait
être traitée de manière omparable.
Ces deux appro hes sont omparées dans la gure 3.24 en n'utilisant que quatre mots séle tionnés du
orpus d'exemples (tab. 3.5). Puisque l'eet des diérentes normalisations n'est visible que si la pénalité
dière de zéro, la pénalité est xée à ph = pv = 0.7.
Il est visible que les deux normalisations ont un eet sur le regroupement réalisé. La normalisation
utilisant la taille du plus long mot regroupe les mots ave un ou deux B et eux sans la lettre B
ontrairement à la normalisation par la diagonale qui regroupe les mots de même taille. Le regroupement
selon le ontenu et non né essairement par la taille orrespond plutt à l'appro he de similarité telle
qu'elle est omprise dans e travail puisque les y les de produ tion peuvent avoir diérentes durées et
des évènements omme le hargement ou l'en len hement de la lan e à oxygène peuvent apparaître à des
instants variables durant un y le (voir hap. 1.2.3).
Ces deux extensions du al ul de la distan e DTW, à savoir la pénalité des dire tions durant le
heminement et la normalisation de la distan e umulée par la taille des séquen es analysées, ajoute
des paramètres à la méthode. Ils peuvent d'un té être utilisés an d'adapter le al ul DTW à la
subje tivité de l'utilisateur. De l'autre té, ave le nombre de paramètres la omplexité augmente, ar
ajuster les paramètres est généralement une tâ he qui n'est pas triviale. Elle est souvent en relation ave
une optimisation globale d'une méthode dans une appli ation on rète.
3.3.2.3
Optimisation du
al ul DTW
Le al ul de la distan e DTW est relativement oûteux en temps de al ul. Tout d'abord une matri e
des distan es lo ales de taille [n1 × n2 ] doit être al ulée. Dans un deuxième passage la même matri e est
par ourue an de minimiser la distan e umulée. Comparée au al ul de la distan e eu lidienne, qui est de
l'ordre O(n) pour des séquen es de taille n, la distan e DTW est en O(n2 ) pour les mêmes séquen es. Ce
point ne se fait pas remarquer dans des problèmes de la taille des exemples traités dans e hapitre. Mais
pour la lassi ation non-supervisée des y les de produ tion du four à ar éle trique ou pour d'autres
problèmes de grandeur nature, e point ne peut être négligé, ar le temps de al ul pour la distan e DTW
augmente au arré ave la taille des séquen es analysées.
Même si e point n'est pas un sujet primaire de ette thèse, il est important de pointer vers plusieurs
travaux qui existent sur le sujet ave en gros les appro hes suivantes :
limiter les al uls sur une zone de la matri e omplète [52℄, [5℄,
utiliser des méthodes de rédu tion de données an de ra our ir les séquen es à manipuler (voir
hap. 3.1.1),
utiliser autant que possible un al ul estimatif rapide qui est basé sur des limites inférieures [62℄,
[35℄, [31℄.
Le travail le plus ré ent est elui de Keogh [31℄. Il montre entre autres qu'une indexation basée sur la
distan e DTW est possible, même si la distan e DTW ne garantit pas l'inégalité triangulaire. Le fait de
pouvoir indexer des séquen es augmente, de façon importante, la rapidité d'une re her he de similarité
entre une séquen e donnée ave d'autres déjà indexées.
Dans le ontexte de e travail nous nous sommes limités à la méthode de rédu tion des données en
utilisant le odage adapté aux données qui a été introduit dans le hapitre 3.2. En e qui on erne la
lassi ation non-supervisée des séquen es, une méthode basée sur des prototypes est utilisée an d'éviter
le al ul de toutes les ombinaisons, omme 'est le as ave la lassi ation par arbre hiérar hique.
Finalement, dans le projet, la phase de réation du lassi ateur est une phase préliminaire pour laquelle
64
3.3.
Classi ation de séries temporelles de tailles variables
(a)
(b)
()
3.24 Méthode de normalisation de DDT W par la taille des séquen es : (a) Pas de normalisation
an d'avoir une référen e ; (b) DTW, normalisé sur la diagonale ; ( ) DTW, normalisé par la taille du
plus long mot.
Fig.
65
Chapitre 3.
Analyse de séries temporelles
le temps de al ul n'a pas une importan e aussi grande qu'il ne l'a dans la phase du ontrle en ligne.
Dans la phase du ontrle une simple attribution d'une séquen e à une lasse est né essaire, et ela est
beau oup moins oûteux.
3.3.2.4
La distan e DTW appliquée aux données du four
Jusqu'à présent la distan e DTW a été appliquée à des exemples simples et exemplaires, de petite
taille ave des valeurs entières. Diérentes propriétés de la distan e ont été démontrées sur base de es
exemples. Quittons maintenant e domaine synthétique et propre, et regardons omment les propriétés
se omportent sur les données du four, qui sont des valeurs réelles et bruitées.
Dans le hapitre pré édent le odage a été proposé omme mesure pour la rédu tion de la taille des
données à manipuler. Le odage adapté, introduit au hapitre 3.2, est omposé d'une suite de triplets
ave un identiant pour la lettre représentant la forme, et deux valeurs réelles pour la moyenne et la
varian e lo ale attribuée à la forme.
Dans la dénition de la distan e DTW, équations (3.12) - (3.15), les séquen es S sont spé iées
omme une suite de ve teurs de ara téristiques. Ce i souligne la apa ité d'une analyse multivariée, s'il
est possible de dénir une métrique pour la dissimilarité lo ale entre de tels ve teurs, e qui en général
devrait être possible.
Chaque triplet du odage adapté représente un ve teur de trois ara téristiques. An de pouvoir
appliquer la distan e DTW, il est né essaire de dénir une mesure de distan e lo ale, .-à-d. une mesure
de dissimilarité entre deux de es triplets.
Une dénition simple et en analogie ave la distan e lo ale utilisée dans les exemples serait la distan e
eu lidienne entre deux triplets. En prin ipe ela serait possible, ar les ara téristiques sont toutes de
nature numérique. Mais le plus important dans la dénition de la distan e lo ale est qu'elle reète aussi
la nature des données. Dans le as présent la première ara téristique représente une forme, la deuxième
l'amplitude à laquelle ette forme se trouvait dans le signal original, et la dernière l'étendue de la forme.
La gure 3.25 représente deux ve teurs de ara téristiques tirés de deux y les de produ tion. Le odage
représenté est basé sur l'alphabet A0 du odage ave 4 lettres {A, B, C, D} représentées dans le ve teur
de ara téristiques par leur index (identiant) dans l'alphabet.
Fig. 3.25 Exemple de deux ve teurs ara téristiques ave une information de distribution des omposantes
A té des deux ve teurs les diagrammes boîte à mousta he (angl. Box and Whisker plot) représentent la distribution de ha une des trois ara téristiques pour un é hantillon représentatif de 500
y les odés (20%). Les diagrammes montrent que les trois ara téristiques ont des domaines de valeurs
diérentes : la ligne rouge représente la médiane, et la boîte indique la limite supérieure du premier et
troisième quartile.
Une simple appli ation de la distan e eu lidienne à es ve teurs de ara téristiques serait fortement
biaisée par la moyenne qui, pour le signal analysé de la puissan e éle trique, a les valeurs les plus importantes dans la plupart des as.
Une solution est de faire une normalisation entrée réduite des éléments du ve teur sur base d'un
é hantillon représentatif de y les odés.
Une question doit être soulevée dans e ontexte : est- e que ela a un sens de al uler la diéren e
entre les index des lettres de l'alphabet ? Pour y répondre il faut revoir la méthode utilisée pour la
réation des alphabets. La réation d'un alphabet est basée sur une artographie réalisée par une SOM
66
3.3.
Classi ation de séries temporelles de tailles variables
(voir hap. 3.2.2). L'avantage de ette méthode, et 'était une des raisons du hoix de la méthode, est
la relation topologique entre les éléments de la arte. Ce qui veut dire que la distan e D(A, B) entre la
forme A et B qui sont voisins sur la arte est plus petite que D(A, C) où A et C ne le sont pas. Un al ul
de diéren e entre les index est don légitime dans le ontexte de donner une information de dissimilarité
entre les diérentes formes.
L'appro he de la distan e eu lidienne basée sur des ve teurs de ara téristiques normalisés de façon
entrée réduite a été la première réalisation qui a déjà donné des résultats en ourageants.
Mais les analyses faites sur l'apprentissage et la paramétrisation de la SOM (annexe B) ont onduit à
la dénition (3.18) de la distan e lo ale. L'équation utilise les notations du hapitre 3.2.3 pour le odage
et elles du hapitre 3.3.2.1 pour la distan e lo ale.
(3.18)
Les variables σ̃, µ̃ indiquent les formes normalisées (3.3) des éléments moyennes et varian es du
triplet de odage.
Deucl (C1 (i), C2 (j)) représente la distan e eu lidienne entre les formes orrespondant aux index dans
les ve teurs ara téristiques.
Cette dénition est un ompromis entre temps de al ul et pré ision. En fait la distan e lo ale réelle,
basée sur une métrique eu lidienne, serait obtenue en re onstruisant la partie du signal pour les deux
triplets en dénormalisant haque triplet (3.4) et en al ulant la distan e eu lidienne entre es parties
lo ales, ou mieux en ore, en al ulant une valeur de dissimilarité lo ale sur base d'une distan e DTW
an de garder une souplesse dans l'alignement même au niveau du odage. Réaliser un tel al ul pour
haque distan e lo ale serait très oûteux en temps de al ul.
Dans la dénition (3.18) la distan e eu lidienne entre les lettres de l'alphabet peut être al ulée
au préalable et a édée par simple indexation durant le al ul de la distan e lo ale (lookup table).
Il est possible de faire remarquer que l'équation (3.18) réalise une pondération uniforme des éléments
normalisés du triplet. Cela représente un hoix impli ite d'une paramétrisation qui n'est pas analysé selon
son adéquation en e qui on erne la tâ he de omparaison des y les de produ tion. Une telle analyse
pourrait fournir davantage de possibilités an d'ajuster la méthode à la subje tivité de l'utilisateur.
En e qui on erne le al ul de la distan e umulée, la formule modiée du DTW (3.17) ave pénalisation est utilisée. Les paramètres de pénalisation ph, pv ont la même valeur par e que, dans e ontexte,
un heminement symétrique est souhaité. En e qui on erne la valeur de la pénalisation, des analyses
ont montré qu'il est plus intuitif pour l'utilisateur d'orienter la pénalisation aux valeurs des distan es
lo ales et que ette appro he donne de bons résultats. Un exemple souligne ette armation.
Dans l'exemple des arbres hiérar hiques (voir hap. 3.3.2.2) des pénalités entre 0 et 0.6 ont été
analysées. Dans et exemple la distan e lo ale, qui est représentée par la distan e entre les lettres A, B ,
a été dénie à la valeur 1. C'est pourquoi des valeurs de pénalité < 1/3 qui sont ajoutées à la distan e
umulée, ont déjà une inuen e sur la distan e DTW.
Pour les données du four, l'exemple de la gure 3.25 peut être utilisé. En se basant sur l'alphabet
A0 de quatre lettres ayant une taille de 12 pas de temps pour la forme, et en se basant sur les valeurs
normalisées, la distan e lo ale a la valeur suivante :
d(s~1 (i), s~2 (j)) =
d(i, j) =
p
p
Deucl (C1 (i), C2 (j))2 + (µ̃1 (i) − µ̃2 (j))2 + (σ̃1 (i) − σ̃2 (j))2
1.0054 + (−1.0648 − 0.8627)2 + (0.9139 − 0.3598)2 = 5.0277
Une pénalité entre [0, 1] sur ette valeur a moins d'inuen e. Donner une autre valeur xe, omme par
exemple 3 ou 6, est di ile à gérer, par e que les valeurs de la distan e lo ale dépendent de l'alphabet
utilisé, même si les valeurs de moyenne et de varian e ainsi que les formes des alphabets sont normalisées.
Une méthode qui donne de bons résultats et qui s'adapte automatiquement aux séquen es analysées
est de prendre un multiple de la médiane des valeurs de la matri e des distan es lo ales (3.19) et (3.20).
(3.19)
ph = mph ∗ median(LDM)
pv = mpv ∗ median(LDM)
(3.20)
Ave ph et pv les variables de l'équation (3.17) et mph et mpv les nouveaux paramètres pour
l'utilisateur.
67
Chapitre 3.
Analyse de séries temporelles
La gure 3.26 montre le résultat d'un al ul de distan e DTW entre deux y les de produ tion ( y le
9 et 10) en se basant sur le odage réalisé ave l'alphabet A2.
(a)
(b)
3.26 Distan e DTW entre deux y les de produ tion : (a) re onstru tion des signaux à partir du
odage ; (b) la matri e globale des distan es umulées ave le hemin minimal.
Fig.
Après l'adaptation de la distan e DTW aux données du four il est possible de ontinuer ave la tâ he
de réaliser un lassi ateur pour les y les de produ tions, qui se base sur l'évolution temporelle. Ave
e al ul de distan e une lassi ation par arbre hiérar hique est réalisée pour quatre y les basés sur le
odage ave A2. La gure 3.27(a) montre la re onstru tion des quatre y les.
(a)
(b)
Fig. 3.27 Classi ation hiérar hique de quatre y les de produ tion basée sur la distan e DTW :
(a) re onstru tion des quatre signaux à partir du odage A2 ; (b) Dendrogramme du résultat de la
lassi ation basée sur la distan e DTW.
Basé sur la distan e DTW entre tous es y les la gure 3.27(b) montre la lassi ation hiérar hique
réalisée en forme de dendrogramme. Pour le al ul des distan es DTW une pénalité symétrique de mpv =
mph = 0.9 est utilisée. Le résultat de ette lassi ation est satisfaisant, ar un expert du domaine aurait
regroupé les y les de la même manière.
Cependant la lassi ation par arbre hiérar hique n'est pas utilisable pour la tâ he d'extra tion de
lasses d'évolutions du pro essus, puisque le nombre de y les qui doit être utilisé an d'avoir un orpus
68
3.3.
Classi ation de séries temporelles de tailles variables
représentatif est trop important pour une telle méthode. La se tion suivante va se onsa rer à une méthode
de lassi ation qui se base sur des prototypes.
3.3.3 Classi ation non-supervisée basée sur des prototypes
La méthode de lassi ation basée sur les arbres hiérar hiques, qui a été utilisée dans les exemples de
la se tion pré édente 3.3.2.2 ne peut pas être utilisée sur un grand nombre d'é hantillons, ar le temps
de al ul de ette méthode augmente de façon polynomiale ave le nombre d'é hantillons puisqu'une
ombinatoire omplète entre les é hantillons est né essaire. Le temps de al ul élevé de la distan e DTW
aggrave en ore la situation.
Une deuxième méthode qui n'est pas seulement bien onnue dans le domaine du onnexionnisme, en
rapport ave la lassi ation, se base sur des prototypes et utilise un apprentissage basé sur la ompétition
(voir g 3.28). Un aperçu des prin ipes de la méthode et de quelques variantes a été donné au hapitre
2.2.2. Ce genre de méthodes a l'avantage d'augmenter sa omplexité de façon linéaire ave le nombre
d'é hantillons pour un nombre xe de prototypes. Un in onvénient par rapport aux arbres hiérar hiques
est que la hiérar hie omplète n'est pas onnue après l'apprentissage.
3.28 Prin ipe de la lassi ation non-supervisée basée sur des prototypes et un apprentissage
ompétitif
Fig.
C'est e genre d'appro hes qui sera utilisé an de onstruire de façon non-supervisée un lassi ateur
qui regroupe les y les de produ tion selon leur évolution.
La suite de ette se tion donne les détails de l'appro he qui est utilisée et explique les outils né essaires
pour l'apprentissage ompétitif dans le ontexte des évolutions temporelles. Comme dans les se tions
pré édentes, les expli ations sont soutenues par des exemples simples. Finalement la se tion va se terminer
ave l'appli ation de la méthode aux données de l'installation industrielle.
3.3.3.1
La méthode basée sur un apprentissage
ompétitif.
Dans le ontexte de e travail, une innovation est d'avoir proposé une extension permettant de regrouper des séquen es temporelles de taille quel onque. Nous présentons ette extension i-dessous.
An de limiter la omplexité et de se fo aliser sur le sujet de la similarité, une méthode relativement
simple, omparée au variantes listées au hapitre 2.2.2, est utilisée. Il s'agit d'une méthode pro he de la
méthode des k-means ou en ore de l'agrégation autour d'un entre mobile. Comme toutes les appro hes
qui se basent sur des prototypes ave un apprentissage ompétitif, il s'agit d'une appro he itérative
omposée des phases suivantes :
1. initialisation des prototypes,
M = {M1 , M2 , · · · , Mn }
(3.21)
69
Chapitre 3.
Analyse de séries temporelles
2. séle tion aléatoire d'une séquen e Si du orpus d'apprentissage,
S = {S1 , S2 , · · · , St }
(3.22)
MbSi = bmu(Si ) = arg min (Ddtw (Si , Mj ))
(3.23)
ave Si tel que spé ié par l'équation (3.11)
3. re her he du prototype gagnant (BMU, angl. Best Mapping Unit)(min. de Ddtw ) en se basant sur
la distan e DTW selon les équations (3.17), (3.13)-(3.15), (3.18) et (3.19)-(3.20),
j∈M
4. itération de 2 - 3 pour tout le orpus d'apprentissage,
5. apprentissage .-à-d. adaptation des prototypes Mj vers les séquen es qui lui sont attribuées Sj (t),
Mj (t + 1) = f (Mj (t), αr (t), Sj (t))
(3.24)
6. itération des points 2 - 5 pour un nombre xe d'épo hs.
Les phases 3 et 5 de et algorithme sont les plus intéressantes dans le ontexte de e travail, ar 'est
dans la re her he du BMU et dans l'apprentissage des prototypes que la similarité joue un rle.
An de trouver le prototype gagnant (BMU) (3.23), 'est à dire le prototype qui ressemble le plus à
la séquen e séle tionnée, la distan e DTW est utilisée. Elle a été introduite et dis utée dans la se tion
3.3.2. Un ve teur de distan es DTW est al ulé. Ce ve teur ontient la distan e DTW entre la séquen e
Si analysée et tous les prototypes Mj ∈ M. Le prototype gagnant (BMU) est elui qui réalise la plus
petite distan e DTW.
Dans la inquième phase toutes les séquen es attribuées aux prototypes Mj (t) .-à-d. les Sj (t) ainsi que
la distan e DTW respe tive réalisée sont utilisées pour l'apprentissage des prototypes. L'apprentissage se
fait après que tout le orpus d'apprentissage ait été analysé et les séquen es soient attribuées au prototype
le plus pro he. Cette appro he est aussi onnue sous le nom de mode bat h.
La phase d'apprentissage des prototypes soulève un nouveau problème. Comment adapter les prototypes aux séquen es qui lui sont attribuées an d'obtenir un prototype représentatif pour des séquen es
similaires, tout en assurant une onvergen e de l'appro he vers une lassi ation où les lasses sont ompa tes et bien éloignées les unes des autres ?
Dans la gure 3.28 l'adaptation d'un prototype est dé rite selon une loi globale d'apprentissage (3.24).
A une epo h donnée t la modi ation du prototype M (t + 1) est une fon tion du prototype a tuel M (t),
d'un taux d'apprentissage αr (t) et des séquen es qui lui sont attribuées Sj (t).
Pour la dénition de la loi d'apprentissage il est possible de se baser sur une forme lassique du
domaine de l'apprentissage non-supervisé qui se base sur la règle de Hebb [22℄. L'idée prin ipale était de
reprendre l'apprentissage qui est utilisé pour les SOM [37℄ (3.25), qui est bien onnu et dont il existe des
analyses sur les propriétés de l'apprentissage, omme par exemple la onvergen e de la méthode.
(3.25)
Ave wj le ve teur des poids, η le taux d'apprentissage, x le ve teur d'entrées et hj,i(x) la fon tion de
voisinage du neurone gagnant i(x) pour le neurone j .
An de mieux omprendre la parti ularité du ontexte de e travail et l'argumentation de la suite
de e hapitre, analysons quelques instants ette loi d'apprentissage et posons-la dans son ontexte. Les
artes auto-organisatri es (SOM) (g. 3.29) ont déjà été dis utées ( hap. 2.2.2). I i la relation entre le
ve teur des poids de haque neurone de la arte et le ve teur d'entrée est mise en question. Chaque
neurone est onne té à haque élément du ve teur d'entrée et possède de e fait une représentation dans
l'espa e d'entrée. Le but de l'apprentissage est de positionner les neurones dans l'espa e d'entrée an
qu'ils représentent la topologie des entrées qui sont dans le orpus d'apprentissage. Cette relation entre
l'espa e d'entrée et la représentation des neurones (ve teur des poids) est la base de bon nombre de
méthodes lassiques basées sur des prototypes utilisant un apprentissage non-supervisé.
Analysons le ontexte de e travail dans ette optique. La séquen e est représentée par une suite de
ve teurs de ara téristiques. An de simplier la réexion, supposons que e ve teur soit réduit à un
wj (n + 1) = wj (n) + η(n)hj,i(x) (n)(x − wj (n))
70
3.3.
Classi ation de séries temporelles de tailles variables
Fig. 3.29 Carte auto-organisatri e de Kohonen (SOM) 2D ave le ve teur d'entrée x et les ve teurs des
poids wi
s alaire, omme 'était le as des exemples qui pré èdent e hapitre. La séquen e devient une suite de
s alaires, un ve teur, qui représente le ve teur d'entrée du lassi ateur. La taille de e ve teur donne
la dimension de l'espa e d'entrée. Une séquen e et un prototype peuvent avoir des tailles diérentes e
qui veut dire qu'ils représentent des ve teurs d'entrées dans diérents espa es Si ∈ Rn et Mj ∈ Rm ave
n 6= m. Notez en plus que les prototypes Mi ∀i 6= j ne vont généralement pas avoir la même taille.
La loi d'apprentissage (3.25) de la SOM qui utilise une diéren e ve torielle entre x le ve teur d'entrée
et wj le ve teur des poids du neurone j n'est pas utilisable tel quel.
En regardant plus en détail la méthode de al ul du DTW ( hap. 3.3.2.1), il est remarqué que la
méthode ne fournit pas seulement une valeur de dissimilarité entre deux séquen es, elle produit aussi un
heminement dans la matri e des distan es umulées qui onduit à la distan e DTW. Dans le ontexte
de la lassi ation non-supervisée, e heminement est utilisable an de réaliser une mise à é helle nonlinéaire dans le temps entre la séquen e et le prototype. Ce mé anisme sera appelé dans la suite du
do ument le mappage DTW et il est expliqué dans le hapitre 3.3.3.2. Considérons i i seulement que
après le mappage DTW la séquen e et le prototype ont la même taille, ils sont don dans le même espa e,
et les opérations de diéren e ve torielle ou autres sont possibles.
Dans le ontexte de l'apprentissage des prototypes, il est important de dire que le mappage DTW
peut se faire dans les deux dire tions : la séquen e peut être mappée vers le prototype ou inversement, le
prototype peut être mappé vers la séquen e. Cette parti ularité sera analysée dans la se tion du mappage
DTW.
Les propriétés de e mappage et de l'impa t d'une tel distortion non-linéaire sur l'algorithme de la
lassi ation n'est pas onnue. An de garder l'appro he aussi simple que possible, la partie du voisinage
de l'apprentissage n'est pas onsidérée dans le adre de e travail, e qui fa ilite l'analyse des mé anismes
en relation ave le al ul DTW. An d'enlever le voisinage de (3.25), la fon tion de voisinage suivante
peut être dénie.
(3.26)
hk,i(x) (n) = 0
∀k 6= j
(3.27)
Après reformulation, adaptation à la nomen lature utilisée pour les prototypes et l'utilisation de la
méthode bat h, une loi d'apprentissage relativement simple (3.28) est obtenue.
hj,i(x) (n)
=
1
(3.28)
Ave S̄M (t) la séquen e moyenne des séquen es Sj (t) qui sont attribuées à l'instant t au prototype
Mj . Cette séquen e moyenne est obtenue ave l'aide du mappage DTW.
Cette loi d'apprentissage est omparable à elle utilisée par la méthode souvent utilisée et bien do umentée des entres mobiles ou des k-means, sauf qu'i i un seul taux d'apprentissage est utilisé pour
Mj (t + 1) = (1 − αr (t))Mj (t) + αr (t)S̄Mj (t)
j
71
Chapitre 3.
Analyse de séries temporelles
tous les prototypes. Après analyse de ette méthode d'apprentissage, l'in orporation du voisinage an de
mener vers une méthode SOM utilisant le DTW omme mesure de dissimilarité est faisable sans trop de
modi ations. Cependant ette démar he n'a pas été réalisée dans le adre de e travail.
3.3.3.2
Mappage DTW
Reprenons l'exemple simple utilisé durant l'introdu tion des bases du al ul DTW (g. 3.21), et
analysons plus en détail le hemin qui est par ouru dans la matri e des distan es umulées.
(a)
(b)
Fig. 3.30 Relation entre heminement et alignement DTW :
(a) GDM ave le hemin qui minimise la distan e umulée ;
(b) L'alignement non linéaire des deux séquen es.
La gure 3.30 montre la GDM et l'alignement qui est fait par le al ul DTW. Les points 2 et 3 de Q(t)
sont omparés à un seul point (2) de C(t). En omprimant es deux points de Q(t) sur un seul, la taille
de la séquen e résultante Q′ (t) est identique à elle de C(t) (voir 3.31(a)). Par ette opération une mise à
é helle de deux séquen es est réalisable en appliquant, de façon non-linéaire, une ompression à l'endroit
où l'impa t (le oût) pour la similarité est minimal. Notez que l'opération peut aussi se faire dans le sens
inverse. Pour l'exemple ela voudrait dire mettre la séquen e C(t) à l'é helle de Q(t) (voir 3.31(b)). Pour
e faire un étirement du point 2 de C(t) sur deux points est demandé. Les lignes en pointillés représentent
à haque fois la séquen e mappée dans le repère de l'autre séquen e.
(a)
(b)
Fig. 3.31 Mappage DTW : Une mise à é helle bi-dire tionnelle :
(a) mappage de Q(t) à l'é helle de C(t) ;
(b) mappage de C(t) à l'é helle de Q(t).
D'un té, pour réaliser une ompression, des points d'une séquen e sont éliminés, e qui représente une
perte d'information, même si elle se fait à un endroit de la séquen e où l'impa t est minimisé. De l'autre
72
3.3.
Classi ation de séries temporelles de tailles variables
té, pour l'étirement, des points sont ajoutés à la séquen e. Dans e as il y a réation d'information.
Plusieurs possibilités de réalisation existent pour les deux a tions. Dans les exemples de ette se tion
la ompression est réalisée par un simple enlèvement des points de la séquen e. Pour l'étirement un
dédoublement du point est utilisé. Ce sujet est dis uté plus en détail dans la se tion 3.3.3.3.
Une remarque s'impose pour éviter la onfusion durant la suite des dis ussions : s'il est question de
ompression ou d'étirement, il faut toujours une séquen e de référen e. La ompression de deux points
sur un seul pour une séquen e Q(t), expliquée auparavant, peut aussi être vue omme un étirement d'un
point sur deux par l'autre séquen e C(t).
Un exemple légèrement plus omplexe (g. 3.32) montre que les deux opérations ( ompression et
étirement) apparaissent généralement en même temps. Ce i devient en ore plus visible dans la partie
appli ation aux données du four.
Fig.
3.32 Exemple de mappage ave ompression et étirement
Cette se tion du mappage nit ave un exemple qui démontre l'eet qu'a la pénalité du heminement
sur le mappage DTW. L'exemple de la gure 3.32 utilise une pénalité de mph = mpv = 0.6. Le mappage
réalisé pour le même exemple ave une pénalité de mph = mpv = 1 est illustré dans la gure 3.33.
Fig.
3.33 Inuen e de la pénalité sur le mappage DTW
Ave une pénalité plus importante, un hemin plus dire t dans la matri e des distan es umulées
en résulte. Au niveau des signaux après le mappage ela se manifeste par un plus faible alignement du
73
Chapitre 3.
Analyse de séries temporelles
deuxième réneau des deux séquen es.
Cette valeur joue don bien le rle d'un paramètre an d'adapter le omportement du mappage aux
besoins subje tifs du domaine analysé.
3.3.3.3
Apprentissage basé sur le mappage DTW
Le mappage DTW qui a été introduit dans la se tion 3.3.3.2 est une méthode ave laquelle il est
possible de réaliser une mise à é helle de deux séquen es. L'équation (3.28) dé rit la loi d'apprentissage
utilisée pour la modi ation in rémentale des prototypes an d'obtenir des prototypes représentatifs
pour les lasses de séquen es. Dans ette relation S̄M (t) représente une séquen e moyenne des séquen es
attribuées au prototype Mj à l'itération t.
An de pouvoir implémenter ette loi d'apprentissage, S̄M (t) doit avoir la même taille que Mj (t). En
utilisant le mappage DTW il est possible de produire :
les séquen es mappées
j
j
la séquen e moyenne
′
Sk,j
= MAPdtw (Sk , Mj ) ∀Sk ∈ Sj (t)
′
S̄Mj (t) = mean(Sk,j
)
(3.29)
(3.30)
Dépendant du odage utilisé pour les séquen es, la moyenne doit être spé iée expli itement. Ave
l'alphabet {A, B} par exemple seules les deux formes sont possibles, et la moyenne doit être ajustée à
l'une ou l'autre. Pour le odage adapté, utilisé pour les données du four, la situation est moins simple
en ore et sera dis utée plus loin dans ette se tion.
An d'analyser et d'illustrer le omportement de la méthode, le orpus des mots de l'exemple utilisé
pour la lassi ation hiérar hique (tab. 3.5) est réutilisé. En vue d'appro her ave et exemple les séquen es réelles de l'installation industrielle, une forme de quatre points est attribuée à haque lettre de
l'alphabet {A,B} (g. 3.34( )). En ajoutant une moyenne et une varian e au ve teur des ara téristiques,
un odage tel qu'il est utilisé pour les séquen es de l'installation industrielle est réalisé (g. 3.34(a)).
La gure 3.34 représente deux des séquen es qui seront utilisées dans et exemple. Le ode des séquen es S2 et S11 est repris par les deux tableaux 3.34(a) et 3.34(b). Dans le ode de S11 trois valeurs sont
soulignées, par e qu'elles déviennent légèrement des valeurs de moyenne ou de la varian e utilisées pour
les autres séquen es. La motivation de ette variation est une meilleure démonstration des propriétés de
la méthode.
An de montrer la forme réelle des deux séquen es, elles sont dé odées et illustrées dans la gure 3.34(d). Cet exemple dispose don d'un orpus de onze séquen es (g. 3.35) ayant un odage similaire
au odage adapté ( hap. 3.2).
Selon l'algorithme (voir hap. 3.3.3.1), la première phase onsiste à initialiser des prototypes. Le but
est de pouvoir omparer le résultat obtenu i i ave elui qui était obtenu pour le orpus de base en
utilisant la lassi ation hiérar hique (g.3.22, 3.23(b)). En regardant ette lassi ation hiérar hique
sur le niveau global, trois lasses étaient obtenues. Cet exemple va don utiliser trois prototypes an
d'apprendre trois regroupements. Ils sont initialisés en se basant sur un savoir préalable :
Deux tailles de séquen es sont omprises dans le orpus : un odage de 5 formes, et un odage de
10 formes.
Les séquen es qui existent dans le orpus sont ou bien des séquen es uniformes ou bien elles
ontiennent un ou deux réneaux.
An d'avoir une diéren e de taille ave les séquen es et une diéren e de taille entre les prototypes,
deux prototypes ave une taille de sept formes et un autre ave une taille de huit formes sont utilisés.
Con ernant l'évolution, un prototype uniforme (n'utilisant que des formes du type {A}), un prototype
ave un réneau entral utilisant la forme {B} et un prototype ave deux réneaux symétriques sont
réalisés. La gure 3.36 montre les prototypes initiaux.
Notez que pour les prototypes, ni la position (moyenne) ni l'étendue (varian e) des formes, telles
qu'elles existent dans les séquen es, ne sont reprises. Le but de et exemple est d'analyser la modi ation
des prototypes ave l'avan ement de l'apprentissage.
74
3.3.
C(i)
µ(i)
σ(i)
Classi ation de séries temporelles de tailles variables
A
A
A
B
A
0.5 0.5 0.5 -0.5 0.5
0.577 0.577 0.577 0.577 0.577
(a)
C(i)
µ(i)
σ(i)
A
A
B
0.5 0.55 -0.5
0.577 0.577 0.577
()
B
-0.5
0.635
A
A
B
B
A
A
0.5 0.5 -0.5 -0.5 0.5 0.5
0.577 0.577 0.52 0.577 0.577 0.577
(b)
(d)
Fig. 3.34 Un exemple du orpus ave les formes primitives de l'alphabet :
(a) Code de la séquen e Nr. 2 du orpus ;
(b) Code de la séquen e Nr. 11 du orpus ;
( ) L'alphabet des formes primitives utilisé pour et exemple ;
(d) Deux séquen es re onstruites sur base du odage et de l'alphabet.
Fig.
3.35 Corpus des séquen es utilisées dans l'exemple
75
Chapitre 3.
Analyse de séries temporelles
Fig.
3.36 Prototypes initiaux utilisés dans l'exemple
Remarquez que déjà pour ette première attribution (voir tab. 3.6), le même regroupement que elui
réalisé par la lassi ation hiérar hique (g.3.23(b)) est réalisé. Notez que le but primaire de ette analyse
est l'adaptation des prototypes et non le résultat de la lassi ation qui en dé oule. Les prototypes étaient
initialisés de manière à favoriser l'obtention de e résultat.
La pro haine étape dans l'algorithme regroupe la séle tion aléatoire d'une séquen e et la re her he du
BMU en utilisant la distan e DTW. En e qui on erne le al ul de la distan e DTW, la méthode telle
qu'elle est dé rite dans la se tion 3.3.2.4 est reprise, puisque le odage utilisé est semblable à elui des
données de l'installation.
Il est important de noter que tout al ul doit se faire sur la base du odage an de réduire les temps
de al ul. Revenir sur la forme dé odée des séquen es réduirait l'eet de ompression du odage relatif
au temps de al ul.
Pour et exemple une pénalité mph = mpv = 1 est utilisée (3.19, 3.20) ave la forme modiée de la
distan e DTW (3.17). Pour la distan e lo ale la forme (3.18) est utilisée.
Après avoir par ouru tout le orpus des séquen es, haque séquen e est attribuée à un prototype et
la distan e DTW ainsi que le heminement pour haque séquen e sont onnus. Le tableau 3.6 montre
l'attribution des séquen es pour les prototypes initiaux Sj (0) ∀j = 1 · · · 3 ave la distan e DTW entre
séquen e et prototype gagnant.
M1 (0)
S1 ;
S5
S2 ;
S3 ;
M2 (0)
S4 ;
S6 ;
S7 ;
S8
S9 ;
M3 (0)
S10 ;
S11
0.78 ; 0.81 0.78 ; 0.78 ; 0.78 ; 0.89 ; 0.81 ; 0.89 0.76 ; 0.82 ; 0.77
Tab. 3.6 Attribution des séquen es aux prototypes initiaux ave leur distan e DTW ave le prototype
La pro haine phase de l'algorithme est la phase d'apprentissage. Dans ette phase les prototypes sont
modiés an de mieux représenter les séquen es qui leur sont attribuées. Dans la loi d'apprentissage (3.28)
le taux d'apprentissage αr (t) est une fon tion du temps .-à-d. du y le d'apprentissage. Pour et exemple
le taux d'apprentissage dé roit de façon linéaire de 0.5 vers 0.01 ave le temps. 20 y les d'apprentissage
76
3.3.
Classi ation de séries temporelles de tailles variables
(epo hs) sont réalisés pour et exemple.
Avant de pouvoir al uler les nouveaux prototypes, les séquen es attribuées à haque prototype sont
mappées vers e prototype. Pour et exemple, la méthode dé rite auparavant ( hap. 3.3.3.2), ave enlèvement et dédoublement pour la ompression respe tivement l'extension, est utilisée. La gure 3.37 montre
′
qui sont attribuées au prototype M3 ainsi que le prototype. Notez que à
les séquen es mappées Sk,3
l'origine les séquen es S9 et S11 sont des séquen es à 10 triplets et que S10 est une séquen e à 5 triplets,
qui sont toutes mappées dans l'espa e du prototype M3 qui a une taille de 8 triplets.
Fig.
3.37 Séquen es mappées, attribuées au prototype M3 à l'instant t = 0
La séquen e S11′ est la seule des exemples qui diverge légèrement des autres séquen es mappées, par e
qu'elle a de petites variations de la moyenne et de la varian e à trois endroits omme dé rit auparavant.
A part ela le mappage réalise un alignement au prototype parfait.
Une moyenne de es séquen es mappées est utilisée, an de al uler le prototype qui sera utilisé pour
la pro haine itération. En e qui on erne le al ul de la moyenne des séquen es, il faut analyser le odage
utilisé. Une réexion semblable à elle utilisée dans le ontexte de la distan e lo ale (3.18) a mené vers
l'appro he suivante, qui est un ompromis entre exa titude et temps de al ul. Pour haque triplet ~sk,j (i)
′
des séquen es mappées Sk,j
la moyenne est al ulée omme :
round(mean(Ck,j (i)))
mean(~sk,j (i)) =  mean(µk,j (i)) 
(3.31)
mean(σk,j (i))
Prendre l'arrondi de la moyenne des identiants des formes de l'alphabet est expli able à ause du fait
qu'il y a une topologie entre les formes qui vient de la arte SOM utilisée pour la réation de l'alphabet.
Puisque dans l'exemple uniquement deux formes existent, la même appro he est possible et sera utilisée
i i.
Cependant pour le al ul de la dissimilarité lo ale appliqué aux données de l'installation, qui sera
analysé dans le hapitre 3.3.3.4, une distan e eu lidienne entre les formes primitives est utilisée. Une
forme moyenne en utilisant les formes Ck,j (i) est alors al ulée. An d'obtenir de nouveau un identiant
pour le odage, une lassi ation sur base de l'alphabet, omme durant le odage, est utilisée.
La loi d'apprentissage (3.28) est aussi une moyenne pondérée entre la séquen e moyenne et le prototype
pré édent, e qui est fa ile à implémenter par la même appro he (3.31).
La gure 3.38 montre la moyenne S̄M (0), le prototype initial M3 (0) ave le nouveau prototype M3 (1)
après la première epo h. Dans la moyenne, la perturbation provenant de la séquen e S11 est en ore
légèrement présente. Cette perturbation est aussi reprise par le prototype modié. La même appro he est
réalisée pour les deux autres prototypes. Ces nouveaux prototypes Mj (1) seront utilisés pour le al ul de
l'attribution des séquen es pour la deuxième itération.


3
77
Chapitre 3.
Analyse de séries temporelles
Fig.
3.38 Exemple d'une séquen e moyenne et de la modi ation du prototype
Pour et exemple seulement 20 y les d'apprentissage sont utilisés. Chaque y le se déroule omme
expliqué auparavant. An de pouvoir analyser l'apprentissage, la moyenne de l'erreur entre les séquen es
et le prototype attribué est al ulée à haque étape. La gure 3.39(a) montre le omportement de ette
erreur au long de l'apprentissage. Le deuxième diagramme de la gure montre l'évolution de la varian e
des distan es entre les séquen es et leurs prototypes respe tifs. Le tableau 3.39(b) montre l'attribution
des séquen es aux lasses après la phase d'apprentissage. Ce tableau reprend aussi la distan e DTW après
l'apprentissage. L'attribution n'a pas hangé depuis le début de l'apprentissage. Cela est expli able par le
fait que pour et exemple simple les prototypes étaient initialisés de façon à représenter les regroupements
naux.
An de montrer de quelle façon les prototypes ont été modiés par l'apprentissage, la gure 3.40
montre les trois prototypes initiaux et naux.
Cet exemple montre que la méthode est bien apable d'apprendre de façon non-supervisée le regroupement de séquen es en se basant sur une métrique de similarité. Elle réalise don bien une lassi ation
non-supervisée qui fournit en même temps des représentants des lasses, ar les prototypes sont similaires
aux séquen es de haque lasse. Le regroupement qui est réalisé orrespond à la lassi ation hiérar hique
qui a été réalisée dans le hapitre 3.3.2.2, ave l'avantage de l'apprentissage on urrentiel et non-supervisé,
qui se base sur des prototypes et l'avantage du temps de al ul, qui n'augmente que de façon linéaire ave
le nombre de séquen es dans le orpus d'apprentissage.
Cet exemple soulève ependant aussi quelques questions :
La modi ation des prototypes qui est utilisée i i ne hange pas la taille du prototype. Est- e qu'il
ne serait pas intéressant de pouvoir adapter de façon non-supervisée la taille des prototypes, an
qu'elle s'adapte au besoin. Car il n'est pas évident de bien initialiser les prototypes en forme et en
taille.
De plus, xer le nombre de prototypes qui est à utiliser an d'obtenir un lassi ateur performant
n'est pas une tâ he triviale.
L'appro he de mappage qui onsiste à ouper ou dédoubler des points de la séquen e pourrait
être modiée an de garder une tra e de la partie enlevée ou de lisser la partie ajoutée suivant
l'entourage.
Ces points n'ont pas pu être abordés on rètement dans le adre de ette étude, mais sont des sujets
importants pour des études futures.
Étant donné que dans et exemple le odage est similaire au odage adapté qui est utilisé pour les
séquen es des y les de produ tions, la méthode est dire tement utilisable sur les données de l'installation
industrielle.
78
3.3.
Classi ation de séries temporelles de tailles variables
(a)
M1 (20)
S1 ;
S5
S2 ;
S3 ;
M2 (20)
S4 ;
S6 ;
S7 ;
S8
S9 ;
M3 (20)
S10 ;
S11
1.45 ; 1.49 1.45 ; 1.45 ; 1.45 ; 1.65 ; 1.49 ; 1.65 5.76 ; 12.69 ; 25.98
(b)
Fig. 3.39 Le résultat de l'apprentissage des prototypes :
(a) Évolution de l'erreur moyenne durant l'apprentissage ;
(b) L'attribution des séquen es aux prototypes après l'apprentissage ( lassi ation). La distan e DTW
est x ∗ 10−3
79
Chapitre 3.
Analyse de séries temporelles
Fig.
80
3.40 Comparaison des prototypes initiaux aux prototypes naux.
3.3.
3.3.3.4
Classi ation de séries temporelles de tailles variables
Classi ation non-supervisée appliquée au pro essus industriel
La méthode de lassi ation non-supervisée a donné un résultat satisfaisant sur un orpus de test, il
est de e fait relativement probable que la méthode soit apable de produire un résultat pour les données
du four, ar en plus les odages utilisés sont similaires. Mais omment peut-on être sûr que le résultat
qui sera produit aura une redevan e réaliste ?
An de pouvoir valider la lassi ation, qui dans e as se base sur une mesure de similarité, l'idée était
de demander les avis à des groupes d'experts humains, qui onnaissent plus ou moins bien l'installation
et le pro essus. Faire analyser par des experts le résultat d'une lassi ation non-supervisée, établi par la
méthode proposée, ne nous semblait pas approprié, pour des raisons d'obje tivité. Les groupes d'experts
ne doivent pas être inuen és par un résultat qui leur est proposé an d'éviter une validation biaisée.
C'est pourquoi, une autre appro he, qui nous a semblé plus obje tive, a été employée.
Chaque groupe d'experts a manuellement regroupé des y les d'évolution. Pour avoir des onditions
relativement équivalentes sans trop user du temps des experts, un orpus de référen es omprenant
20 y les de produ tions séle tionnés aléatoirement a été onstruit. An de représenter l'évolution du
pro essus de façon omparable à elle employée pour le lassi ateur arti iel, le signal de la puissan e
éle trique de haque y le a été imprimé sur des artes (une arte représentant un y le) et un numéro
de référen e allant de 1 à 20 leur a été attribué.
Basé sur la réprésentation graphique, deux groupes d'experts ont été invités à regrouper les y les dans
quatre atégories. Le premier groupe était un groupe de deux personnes de ProlARBED Re her he qui
onnaissent bien le pro essus et qui ont travaillé sur le projet CECA. Le deuxième groupe se omposait
de deux personnes du CRP Henri Tudor impliquées dans le projet.
Finalement la même tâ he a été attribuée à la méthode de lassi ation non-supervisée basée sur la
distan e DTW (UdtwC, angl. Unsupervised DTW-based Clustering). Pour et exemple l'alphabet A2 a
été utilisé. Cet alphabet représente un ompromis entre la qualité de re onstru tion des signaux basés
sur le odage et le temps de al ul pour la distan e DTW qui augmente ave le nombre de triplets dans
le odage. L'initialisation des prototypes d'évolutions a été faite en utilisant quatre y les d'évolution du
orpus de référen e (1,2,4,20). Ils ont été séle tionnés de façon à assurer une ertaine varian e dans les
évolutions des prototypes. Le orpus d'apprentissage était représenté par 150 y les utilisables de la base
de données et omprenant les 20 y les de référen e.
L'apprentissage a été réalisé en deux phases :
une première phase ave un taux d'apprentissage élevé (allant de 0.9 à 0.2 de façon exponentielle)
sur 10 epo hs. Durant ette phase, la moitié (les y les les plus pro hes du prototype) des y les
attribués à un prototype a été utilisée pour l'adaptation du prototype. Une pénalité symétrique
(mph = mpv = 1) a été utilisée. Cette phase est utilisée an de positionner les prototypes sans être
inuen é par des y les outlier.
une deuxième phase ave un taux plus faible (allant de 0.6 à 0.05 de façon exponentielle) sur 20
epo hs. Durant ette phase, tous les y les attribués à un prototype sont utilisés pour l'apprentissage. La pénalité n'a pas été hangée (mph = mpv = 1).
La gure 3.41(a) montre le prototype M1 dans sa forme initiale et après les deux phases d'apprentissage. La phase de fusion du deuxième panier est fortement modiée après l'apprentissage. Lo alement,
d'importantes modi ations sont visibles. D'autres parties, omme la fusion du premier panier (premier
réneau) et la partie de hargement du deuxième panier ainsi que le début de la deuxième phase de fusion,
ne montrent que de légères modi ations. Par ontre, la oupure de ourant durant la fusion du deuxième
panier est presque omplètement enlevée.
La gure 3.41(b) représente l'évolution de l'apprentissage sur les 30 epo hs. Pour haque epo h un
diagramme boîte à mousta he montre la distribution des distan es DTW entre les signaux et les prototypes attribués respe tifs (distan es intra lasses toutes lasses onfondues). Le trait verti al entre l'epo h
10 et 11 indique graphiquement le hangement entre les deux phases de l'apprentissage.
Le trait rouge à l'intérieur de haque boîte indique la médiane de la distribution. La diminution de
ette valeur ave l'avan ement de l'apprentissage illustre que les prototypes sont modiés de manière à
mieux représenter le orpus d'apprentissage. La taille des mousta hes (traits noirs verti aux partant de
haque boîte, limités par un petit trait horizontal) est un indi ateur de la dispersion des lasses. Ave
l'avan ement de l'apprentissage ette dispersion est réduite, et ela spé ialement durant la deuxième
81
Chapitre 3.
Analyse de séries temporelles
(a)
(b)
3.41 Résultat de l'apprentissage des prototypes sur les données du four :
(a) Exemple d'adaptation d'un prototype sur base du prototype M1 après 30 epo hs d'apprentissage ;
(b) Évolution des distan es DTW intra- lasses, toutes lasses onfondues, représentée par des diagrammes
boîte à mousta he pour haque epo h de l'apprentissage.
Fig.
phase e qui s'explique par le fait que, durant ette phase, tous les y les attribués à un prototype sont
onsidérés pour l'adaptation de es derniers.
Les roix rouges à l'extérieur des limites des mousta hes sont onsidérées omme outliers de la distribution des distan es DTW. Pour la première epo h le diagramme montre une roix à la distan e zéro, e
qui s'explique ave la séle tion des prototypes étant membres du orpus d'apprentissage.
Le résultat de ette expérien e est représenté dans un tableau omparatif (tab. 3.7) des regroupements,
réalisés par les diérents experts et par la méthode non-supervisée UdtwC basée sur la distan e DTW
et le odage par l'alphabet A2 des signaux. An de al uler le regroupement réalisé par ette méthode,
une lassi ation sur base des quatre prototypes obtenus auparavant est ee tuée pour les 20 y les de
référen e, en se basant sur la distan e DTW. La lassi ation UdtwC est représentée dans le tableau
pour deux valeurs du paramètre mphv (mph = mpv) an de montrer son inuen e sur le résultat de la
lassi ation.
Classe 1
Classe 2
Classe 3
Classe 4
Group
PARE
1 6 13 20
7 9 12 15 16 2 8 10 14 17 3 4 5 11
CRPHT
11 4 5 8 10 14 1 7
17 18 19
UdtwC
6 13 16 20
2 79
1 3 8 11 14 4 5 10 12
mphv=0.1
15 17 18 19
UdtwC
13 20
3 4 5 9 10 2 8 11 14 16 1 6 7 15
mphv=1.4
12
18 19
17
Tab. 3.7 Comparaison des résultats obtenus par les quatre diérentes atégorisations
6 13 20
2 3
18 19
9
12 15 16
Les y les en gras sont lassés de la même façon par les deux groupes d'experts et sont par après aussi
mis en éviden e pour les modèles UdtwC. Les y les soulignés sont regroupés de façon identique pour le
groupe ProlARBED Re her he et un des modèles UdtwC, et nalement les numéraux en adrés sont
identiques pour le groupe CRP Henri Tudor et un des modèles UdtwC.
Pour la Classe 1 la situation semble relativement laire pour les y les 13 et 20 et notamment le
y le 6, même si pour UdtwC ave mphv = 1.4 e y le ne se retrouve plus dans ette lasse. Aussi pour
82
3.3.
Classi ation de séries temporelles de tailles variables
la Classe 3 un ertain nombre de y les s'y retrouvent dans tout les as (8, 14, 18 et 19). Pour la Classe
2 une similarité est observable au moins entre les deux groupes d'experts. La méthode UdtwC ne réussit
pas à regrouper es y les. Pour la Classe 4 au une orrespondan e entre les deux groupes d'experts
n'est visible. Remarquer ependant que pour mphv = 0.1 davantage de similarités ave le groupe PARE
est visible, et que ave mphv = 1.4 la orrespondan e ave le groupe CRPHT est supérieure. Cela souligne
le fait que e paramètre pourra être utilisé an d'adapter la méthode à la subje tivité de l'expert humain.
Dans e ontexte il faut remarquer que un seul test a été réalisé, et que pour la méthode UdtwC
l'initialisation des prototypes pour l'apprentissage joue un rle important. Plusieurs essais ave diérentes
initialisations auraient éventuellement pu améliorer le résultat. Mais n'oublions pas que séle tionner 20
y les parmi 2471 ne orrespond pas vraiment à une bonne représentativité. Il est don fortement possible
que les 150 y les utilisés pour l'apprentissage ne reètent pas la distribution de es 20 y les de référen e.
De plus, il a fallu de nombreuses dis ussions, entre les deux personnes du groupe CRP Henri Tudor,
avant de dé ider quels y les vont être mis ensemble an d'aboutir à quatre atégories.
Le résultat reète la problématique de la subje tivité en relation ave la similarité, e qui a déjà été
soulevé antérieurement. De plus, les experts de ProlARBED Re her he ont fait remarquer qu'il n'est
pas évident d'analyser un y le en se basant seulement sur la puissan e éle trique. Il y a des phénomènes
qui ne sont pas dire tement visibles dans le signal de la puissan e éle trique, mais qui ont une inuen e
sur le omportement du pro essus. Ils sont représentés par d'autres mesures. Les experts ont supposé
qu'un résultat moins ambigu pourrait être espéré, si es informations étaient ajoutées à la représentation
des y les de produ tion.
Ave la lassi ation non-supervisée des y les de produ tion basée sur la similarité des évolutions, la
phase de l'analyse (g. 1.10) est terminée. Pour la suite de ette étude, un ertain nombre de prototypes
d'évolutions utilisant diérents alphabets est né essaire.
3.3.3.5
Création de prototypes d'évolution pour le pro essus industriel
An de produire des prototypes d'évolution pour le pro essus industriel, la lassi ation UdtwC,
qui était employée pour la réation des lasses du orpus de référen es, est appliquée à un ensemble
représentatif de y les de produ tion, qui est odé dans les quatre alphabets de référen e (voir tab.3.3).
Un ensemble de 16 prototypes est onstruit. La produ tion de e pool de prototypes a été réalisée en
inq phases :
Dans la phase d'initialisation les quatre alphabets sont traités indépendants les uns des autres.
La pro édure est la même pour haque alphabet. La bou le d'apprentissage ommen e par une
séle tion aléatoire de neuf y les de produ tion de la base de données. Sur base d'un orpus d'apprentissage réduit (50 y les de produ tions) un apprentissage ourt (10 epo hs) est réalisé ave un
taux d'apprentissage allant de 0.8 à 0.3, et une pénalité symétrique de 0.9.
La qualité du lustering est mesurée sur base de l'erreur moyenne du orpus après l'apprentissage.
La bou le est répétée ave une nouvelle séle tion aléatoire de neuf y les, jusqu'à e que, pendant la
durée de 10 bou les, plus au une amélioration n'a été onstatée. Les quatre meilleures réalisations
sont gardées pour haque alphabet.
La deuxième phase onsiste à analyser et à séle tionner les huit meilleurs prototypes pour haque
alphabets. Les ritères de séle tions sont : le taux d'utilisation des prototypes pour le orpus d'apprentissage et la similarité entre les prototypes, en utilisant la distan e DTW et la lassi ation
hiérar hique (g. 3.27). Il a été essayé que les prototypes séle tionnés soient représentatifs et qu'en
même temps ils ouvrent une grande diversité de omportements du pro essus.
Durant la troisième phase les prototypes séle tionnés subissent un deuxième apprentissage ave un
orpus plus important (300 y les) et une durée d'apprentissage plus longue (20 epo hs). Le taux
d'apprentissage va de 0.7 à 0.3, et la pénalité reste in hangée à 0.9. De nouveau haque alphabet
est traité indépendamment des autres.
Après et apprentissage, une dernière séle tion des prototypes est faite, en ne gardant que quatre
prototypes par alphabet, e qui fait en tout un orpus de 16 prototypes. Les ritères de séle tion
sont les mêmes que pré édemment.
Dans la dernière phase un troisième apprentissage est réalisé, en utilisant un orpus d'apprentissage
de 250 y les et une durée de 30 epo hs. Le taux d'apprentissage va de 0.4 à 0.01, et une pénalité
83
Chapitre 3.
Analyse de séries temporelles
symétrique de 1.1 est utilisée. I i les prototypes des quatre alphabets sont appris ensemble, e qui
fait qu'une ertaine situation de on urren e entre les alphabets est réalisée. Il faut noter, que
durant ette phase les prototypes basés sur l'alphabet A1 ne sont pas séle tionnés omme BMU au
même taux que les prototypes issus des autres alphabets.
La gure 3.42 montre les 16 prototypes qui vont être utilisés dans la suite de l'étude.
3.4 Con lusion du hapitre
Dans e hapitre l'analyse de séries temporelles est abordée dans le ontexte d'une appro he pré ise, à
savoir l'analyse des évolutions temporelles du pro essus industriel présenté dans le hapitre 1. La nalité
de l'analyse est la produ tion d'un lassi ateur qui est utilisable pour la deuxième étape de l'appro he
globale, le ontrle prédi tif basé sur une aide à la dé ision.
Après un aperçu sur les spé i ités du traitement de séries temporelles, un nouveau odage, appelé
odage adapté, a été présenté. Celui- i se base sur une analyse des formes primitives qui omposent le
signal analysé. Une appro he onnexionniste non-supervisée (SOM) est utilisée pour extraire es formes
primitives d'un orpus représentatif du signal en question. Par ette méthode inq alphabets ont été
produits, dont le premier ave le but d'être simple, an de pouvoir l'utiliser pour l'expli ation de la
méthode et la dis ussion des résultats. Les quatre autres alphabets, qui représentent diérentes tailles
et nombre de formes, sont utilisés pour le odage du orpus entier de y les dans la base de données
du projet. Le odage a été omparé à trois autres méthodes, à savoir la moyenne ottante (qui est une
appro he de ltrage), l'approximation par se tions onstantes (PAA) et l'approximation par se tions
linéaires (PLA)(qui sont des méthodes de odages).
Sans avoir l'ambition d'être exhaustif il a été montré, sur base d'exemples, que le odage adapté
ontient dans son ode les deux méthodes (PAA, PLA) et que la qualité de l'approximation réalisée par
le odage adapté dépasse elle de es deux méthodes.
La deuxième partie du hapitre traite la question du regroupement des y les de produ tion selon
leur évolution temporelle, en se basant sur le odage adapté. Dans ette partie les sujets prin ipaux sont
la similarité et les méthodes exploitables qui peuvent regrouper des y les de produ tion dont l'évolution
est semblable. En béné iant des propriétés de la méthode DTW (Dynami Time Warping) il a été
montré qu'une lassi ation non-supervisée, basée sur un apprentissage on urrentiel, est réalisable. Les
propriétés de la méthode DTW sont : l'alignement non-linéaire sur l'axe du temps, la possibilité de
paramétriser la distan e DTW (an de orrespondre à la subje tivité individuelle selon l'appli ation)
et le mappage DTW (par lequel il est possible de transférer des séquen es d'un espa e temporel vers
un autre). Une méthode d'apprentissage on urrentiel simple a été employée pour assurer la maîtrise
de l'ensemble. Il est ependant fa ilement possible d'utiliser un autre algorithme qui va probablement
améliorer l'ensemble de ette lassi ation.
Basée sur un environnement arti iel, ette lassi ation, appelée UdtwC (Unsupervised DTW-based
Clustering), a été analysée, et une validation qualitative a été présentée.
Basée sur une expérien e utilisant un orpus de référen e de y les de produ tion, la méthode UdtwC
a été omparée à deux résultats de lassi ations manuelles réalisées indépendamment par deux groupes
d'experts. Le résultat de ette omparaison satisfait nos espéran es.
Finalement un orpus de 16 prototypes d'évolution, qui va être utilisé dans la suite de l'étude, a été
produit.
84
3.4.
Fig.
Con lusion du
hapitre
3.42 Les 16 prototypes d'évolutions
85
Chapitre 3.
86
Analyse de séries temporelles
Chapitre 4
Un
ontrle prédi tif basé sur une aide
à la dé ision
Sommaire
4.1 Classi ation d'évolutions en ligne . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1
4.1.2
89
4.1.4
Lo alisation de sous-séquen es basées sur la similitude . . . . . . . . . . . . . . 89
L'environnement arti iel de test . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.1.2.1 L'alphabet arti iel utilisé . . . . . . . . . . . . . . . . . . . . . . . . 93
4.1.2.2 Les séquen es types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.1.2.3 Les séquen es d'évolutions . . . . . . . . . . . . . . . . . . . . . . . . 94
Simulation de la re her he de prototypes dans le ontexte de l'évolution temporelle 95
4.1.3.1 Simuler l'évolution temporelle . . . . . . . . . . . . . . . . . . . . . . 96
4.1.3.2 Re her he des lo alisations les plus pro hes . . . . . . . . . . . . . . . 96
4.1.3.3 Graphiques d'analyse pour l'évolution de la lo alisation . . . . . . . . 99
Résultats pour l'environnement arti iel . . . . . . . . . . . . . . . . . . . . . . 101
4.2.1
4.2.2
4.2.3
4.2.4
4.2.5
Premier y le ave un omportement quasi optimal
Deuxième y le ave potentiel d'amélioration . . .
Troisième y le à omportement ex eptionnel . . .
L'utilisation des ritères d'optimisation . . . . . .
Quand la bou le se ferme ! . . . . . . . . . . . . . .
4.1.3
4.2 Appli ation de la méthode au pro essus industriel . . . . . . . . . . . . . . 101
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
106
107
112
113
4.3 Con lusion du hapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
87
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Un des buts du travail est d'analyser les possibilités an d'utiliser les onnaissan es extraites par des
méthodes de fouille de données temporelles, dans l'optique d'améliorer la onduite de l'installation et par
e biais d'aider l'industriel dans la démar he de rédu tion du oûts de produ tion. Une hypothèse posée
dans e travail et soutenue par les experts onsiste à dire qu'il existe une relation entre le omportement
temporel de l'installation et sa onsommation en énergie. Ce qui revient à dire qu'il serait possible de
garantir une faible onsommation, si l'on arrivait à manipuler le pro essus de telle manière que son
évolution orresponde au mieux à une évolution qui est onnue pour sa faible onsommation.
La plupart des appro hes de ontrle se basent sur un modèle plus ou moins on ret du pro essus. Sans
aller dans les détails, es appro hes essayent en gros de trouver les paramètres du modèle qui minimisent
une ertaine fon tion de oût, en se basant sur des données provenant de l'installation. Une fois es
paramètres trouvés, le pro essus est ontrlé selon e modèle.
Dans le projet CECA un des partenaires travaille sur une telle méthode ave un modèle du pro essus.
Ce modèle prend en ompte des phénomènes mé aniques, himiques, physiques et thermodynamiques. La
omplexité de e modèle est relativement importante et de e fait il est di ile de le paramétriser. Souvent
les installations industrielles ne fournissent pas les données né essaires pour pouvoir xer orre tement
les paramètres d'un tel modèle. Des données fortement bruitées voire même erronnées n'améliorent pas
le pro essus de paramétrisation.
L'appro he de ontrle proposée i i a brièvement été introduite dans le hapitre 1.4 et la gure 4.1
reprend le on ept.
Fig.
4.1 Le ontrle prédi tif en ligne
Cette appro he se base sur une analyse du omportement temporel et la relation entre e omportement et les onsommations. L'analyse du omportement temporel du pro essus est en premier lieu
dé ouplée de la onsommation. Cette analyse a été dé rite dans le hapitre pré édent ( hap. 3) et a produit de façon non-supervisée des lasses d'évolutions représentées par des prototypes de omportement
du pro essus analysé (voir g. 3.42). Dans e hapitre des méthodes de ouplage seront proposées, ave
lesquelles il sera possible de onsidérer des ritères d'optimisation, an de pouvoir proposer à l'industriel
des s énarios ave un potentiel d'amélioration de la onsommation globale.
A haque instant de l'évolution d'un y le de produ tion une ou plusieurs propositions peuvent être
fournies à l'opérateur. Ces propositions peuvent être vues omme une aide à la dé ision pour l'opérateur
qui, en manipulant les paramètres du pro essus, ferme la bou le de ontrle.
Ce hapitre va aborder les diérentes phases de ette appro he de ontrle prédi tif illustrées dans la
gure 4.1 [53℄. La première phase onsiste dans la re her he des évolutions types similaires, en se basant
88
4.1.
Classi ation d'évolutions en ligne
sur un début de séquen e, .-à-d. la partie onnue d'un y le de produ tion en ours. Cette phase est
suivie de l'élaboration de méthodes pour la séle tion du meilleur s énario. Ces méthodes sont basées sur
la relation qui existe entre les évolutions types et les ritères qu'il s'agit d'optimiser. Puisque une réelle
implémentation des méthodes sur l'installation industrielle n'était pas possible dans le adre du projet
CECA, ette analyse se limite à analyser des possibilités théoriques d'une telle appro he. La dernière
phase onsiste à établir plusieurs propositions alternatives qui pourraient être données à l'opérateur an
de le guider dans ses dé isions. Le hapitre nit ave une dis ussion de ette méthode dans le ontexte
du ontrle prédi tif, où en réalité l'opérateur humain interviendrait pour fermer la bou le.
Comme dans le hapitre pré édent les démar hes sont a ompagnées d'exemples arti iels, an de
mieux illustrer les méthodes et les résultats obtenus, avant d'appliquer les méthodes aux données du
pro essus industriel.
4.1 Classi ation d'évolutions en ligne
La première phase du ontrle prédi tif onsiste à re her her dans les évolutions types elles qui
ressemblent le plus au début de séquen e qui dé rit l'évolution du y le en ours. Cela orrespond, dans
le domaine d'analyses de séries temporelles, à la lo alisation de sous-séquen es. Le but de la lo alisation
est de trouver dans une séquen e donnée S la ou les parties Pi de ette séquen e qui ressemblent le plus
à une sous-séquen e Q. Dans le ontexte de e travail, la similarité joue de nouveau un rle important
dans ette lo alisation. Ce qui veut dire que ni la taille ni la forme des parties Pj ne sont né essairement
identiques à Q. Une ertaine souplesse dans les deux propriétés taille et forme est né essaire.
Pour ela, la métrique pour mesurer la dissimilarité utilisée sera la distan e DTW qui a été introduite
dans le hapitre 3.3.2.
Une propriété spé ique au ontexte de e travail est que le début de la partie Pj re her hée doit
s'aligner ave le début de la séquen e S , e qui simplie onsidérablement la tâ he. Ce i vient du fait
que la séquen e S représente une évolution type, .-à-d. un y le de produ tion omplet, et que la sousséquen e Q dé rit le début d'un y le de produ tion.
An de pouvoir proter de la propriété de rédu tion de données oertes par le odage adapté, tous les
al uls doivent se faire sur les séquen es (respe tivement sous-séquen es) odées. Le signal provenant de
l'installation est don en premier lieu odé au fur et à mesure de l'avan ement du pro essus, en utilisant
la méthode présentée dans la se tion 3.2.
Dans la suite de ette se tion, la problématique et la méthode de base pour la lo alisation sont
expliquées. Sur base d'un orpus de séquen es arti ielles, les propriétés de ette méthode sont analysées.
4.1.1 Lo alisation de sous-séquen es basées sur la similitude
Dans la partie de lassi ation non-supervisée ( hap. 3.3.3) la distan e DTW est utilisée omme mesure
de dissimilarité. L'utilisation de ette mesure pour la lo alisation est analysée en raison des expérien es
positives en relation ave la similarité, et an d'éviter le plus possible de devoir maintenir et maîtriser
trop de méthodes diérentes. Les détails du al ul DTW sont donnés dans le hapitre 3.3.2.
Une des onditions de base de la méthode DTW est que les deux séquen es sont omparées dans leur
totalité. En d'autres mots, aussi bien le début (3.14) que la n (3.15) des séquen es doivent s'aligner (voir
aussi forme ré ursive du DTW (3.12)).
Dans le ontexte de la lo alisation, ette ondition exige un regard plus détaillé de la méthode, ar
le but de la lo alisation de sous-séquen es est spé ialement de trouver une partie à l'intérieur d'une
séquen e qui est similaire à la totalité d'une autre séquen e (sous-séquen e) ( hap. 3.1.3). An d'illustrer
la problématique dans le ontexte de ette étude, deux séquen es test relativement simples sont données
et analysées.
Soit Q(t) la sous-séquen e (4.1) de taille M = 11 et S(t) la séquen e (4.2) de taille N = 29.
Q(t) = {0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0}
S(t) = {0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0}
(4.1)
(4.2)
89
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Leur représentation graphique (g. 4.2) montre qu'entre les deux séquen es il existe une diéren e
de taille et de forme importante. Revenons au ontexte de l'étude et omparons la sous-séquen e Q(t)
ave le début de la séquen e S(t). En prenant en ompte l'aspe t de similarité, la diéren e n'est pas très
importante, elle se limite aux trois pas de temps pendant lesquels le palier à valeur nulle au début de la
sous-séquen e Q(t) est plus long que elui de S(t). Le réneau au début de Q(t) a la même taille que elui
du début de S(t). Remarquez que tous les réneaux des S(t) ont la même taille, e qui va inuen er le
al ul de similarité.
Fig.
4.2 Les deux séquen es test S(t) et Q(t) pour analyser la lo alisation DTW
Appliquons maintenant le al ul DTW entre les deux séquen es et analysons le résultat de l'alignement
qui est réalisé (g. 4.3).
4.3 Résultat de la lo alisation en utilisant la méthode DTW de base en représentant l'alignement
réalisé
Rappelons que le al ul DTW her he l'alignement qui minimise la distan e globale umulée entre les
deux séquen es en alignant haque fois le début et la n. En prenant la séquen e S(t) omme référen e,
la méthode doit de e fait étirer la sous-séquen e Q(t) à la taille de S(t) en ajoutant des points à Q(t)
aux endroits les moins oûteux pour l'ensemble. Si Q(t) est pris omme séquen e de référen e pour la
des ription, e qui peut paraître étrange, mais e qui peut simplier la ompréhension, 'est S(t) qui
est omprimée à la taille de Q(t) en oupant des parties de S(t) aux endroits les moins oûteux pour
l'ensemble.
Les paramètres utilisés pour le DTW sont les suivants : une métrique eu lidienne pour de la distan e
Fig.
90
4.1.
Classi ation d'évolutions en ligne
lo ale, une normalisation par la diagonale est réalisée, et une pénalité symétrique mph = mpv = 0.7.
En l'o urren e, dans l'exemple, la première partie de S(t) est omprimée sur un point. Considérant la
similarité et la omparaison manuelle, plusieurs alignements qui donnent le même résultat sont possibles,
puisque les réneaux de S(t) ont tous la même taille et sont don similaires à Q(t). L'implémentation de
l'algorithme DTW qui est utilisée fait en sorte que l'alignement est onstruit par rétroa tion en venant
des points naux des deux séquen es. La gure 4.4 montre la matri e des distan es umulées (GDM)
pour e al ul ave le hemin qui est utilisé. La même GDM montre aussi d'autres vallées qui suraient
au heminement de la similarité.
Fig.
4.4 La matri e de distan e globale GDM en illustration 3D
Puisque la méthode DTW n'est don pas dire tement utilisable pour la lo alisation, une première
appro he plutt pragmatique serait de omparer la sous-séquen e Q(t) ave toutes les parties Pj (t)
possibles de la séquen e S(t) et de séle tionner elle qui produit la distan e minimale. Cette appro he est
très oûteuse, puisque déjà le al ul DTW en soi né essite d'importantes ressour es.
Dans le ontexte de e travail où une omparaison est faite entre le début d'un y le de produ tion et
les évolutions prototypes, il est possible de se limiter aux parties qui ommen ent au début de la séquen e.
Une lo alisation globale partout dans la séquen e n'est don pas né essaire, e qui limite le nombre de
al uls DTW à réaliser à N − 1 ave N étant la taille de la séquen e S(t).
Mais, analysons plus en détail les al uls du DTW. Après la onstru tion de la matri e des distan es
lo ales (LDM), la matri e des distan es umulées est onstruite en al ulant itérativement pour toute
position i, j de la matri e la distan e umulée pour e point Ddtw (S(i), Q(j)) (3.12). Cette formulation
n'admet que trois dire tions an d'arriver au point i, j : les hemins diagonal, horizontal et verti al. Cette
ontrainte de base de la méthode DTW assure que pour haque point i, j seule la sous-matri e [0, 0 − i, j]
est prise en ompte. Cela veut dire que pour haque position i, j de la matri e, il est possible d'établir
le heminement optimal an d'arriver à e point en utilisant la rétro-propagation des hoix lo aux du
heminement.
Considérons le ontexte de la lo alisation telle qu'elle est omprise dans e travail, où haque partie
Pi (t) de S(t) doit débuter au point initial de S(t) et où la sous-séquen e Q(t) est onsidérée dans son
ensemble. Il sut de e fait de al uler la distan e DTW entre les deux séquen es S(t) et Q(t). La dernière
olonne de la GDM pour j = M , ave M étant la taille de Q(t), ontient don les distan es DTW de
toutes les parties Pi (t) ommençant à la ra ine de S(t) (g. 4.5).
Il faut noter que la normalisation de la distan e DTW ( hap. 3.3.2.2), qui est faite pour la position
[N, M ], fausserait le résultat, puisque dépendant de la méthode de normalisation, la valeur de normalisation est diérente pour haque Pi (t). La valeur des distan es DTW dans la gure 4.5 en tient ompte,
ar la normalisation est adaptée à haque Pi (t).
91
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Fig.
4.5 Dernière olonne de GDM (j = M ) : Ddtw (Pi (t), Q(t))∀i = 1 · · · N
Le minimum de ette ourbe (i = ı̂) désigne la partie Pı̂ (t) de la séquen e S(t) qui minimise la distan e
DTW et de e fait représente la partie ommençant à la ra ine de S(t) la plus semblable à la sous-séquen e
Q(t).
En partant de ette position [ı̂, M ] pour la onstru tion du heminement, le hemin optimal qui spé ie
l'alignement entre la sous-séquen e et la partie la plus similaire peut être onstruit (g. 4.6).
(a)
(b)
4.6 Résultat Pı̂ (t) de la re her he de la partie la plus similaire à Q(t) qui ommen e à la ra ine de la
séquen e S(t) : (a) Cheminement de la lo alisation dans la GDM (3D) ; (b) alignement de la lo alisation
Fig.
La méthode présentée i i, qui sera appelée la lo alisation DTW-LB13 , retrouve don bien la partie
d'une séquen e, ommençant à la ra ine, qui est similaire, au sens de la distan e DTW, à une sousséquen e donnée. De plus la méthode ne né essite presque au un al ul supplémentaire à elui du al ul
DTW entre la sous-séquen e et la séquen e omplète. An d'analyser la méthode plus en détail, la se tion
suivante va introduire un environnement de test ave des séquen es arti ielles.
13 DTW
92
bornée à gau he ; Angl. : Dynami Time Warping Left Bounded
4.1.
Classi ation d'évolutions en ligne
4.1.2 L'environnement arti iel de test
Un environnement arti iel en vue d'analyser une méthode a d'un té l'avantage que et environnement est maîtrisé, e qui est important pour la validation d'une méthode. D'un autre té, il est important
que et environnement reète le plus possible la situation réelle, an de valider la méthode dans le bon
ontexte. C'est la raison pour laquelle l'environnement de test qui est onstruit utilise le même type
de odage qui est utilisé pour les données du pro essus industriel (une suite de triplets omprenant une
forme issue d'un alphabet, une moyenne et une varian e). La méthode est don omparable à elle utilisée
pré édemment ( hap. 3.3.3.3) sauf que ette fois- i, un ertain nombre de paramètres, omme la taille de
séquen es, les moyennes et varian es des triplets, sont xés de façon aléatoire.
Deux orpus seront onstruits : un premier qui représente les évolutions types (prototypes) et un
deuxième qui représente les y les de produ tion. Puisqu'il est question de séquen es arti ielles qui ne
se basent pas sur un pro essus physique réel, la terminologie utilisée dans e hapitre sera : les séquen es
types pour les prototypes, et les séquen es d'évolution pour les y les de produ tion.
La onstru tion des séquen es d'évolution est faite en utilisant des parties des séquen es types an
d'assurer une relation entre elles. Le but du test est d'analyser la méthode de lo alisation DTW-LB dans
sa apa ité à déte ter les séquen es types espérées.
Le but de et environnement de test n'est pas de produire une validation quantitative (statistique) de
la méthode, mais d'analyser le omportement qualitatif dans des situations bien pré ises.
4.1.2.1
L'alphabet arti iel utilisé
An de garder aussi simple que possible l'environnement de test, l'alphabet ne omporte que trois
formes linéaires simples (g. 4.7).
4.7 Les trois formes qui omposent l'alphabet de l'environnement de test
La suite des formes vérie une ertaine topologie, .-à-d. une relation hiérar hique basée sur la distan e
entre les formes, qui existe aussi dans les alphabets qui sont extraits par une SOM des données de
l'installation d(F 1, F 2) ≤ d(F 1, F 3) ≥ d(F 2, F 3). Les formes sont normalisées, e qui veut dire que la
moyenne est nulle et que la varian e a la valeur un (sauf pour la forme 2).
Notez que les formes ont une taille (longueur) de deux, e qui représente deux points sur l'axe des
temps. Une séquen e odée par 3 triplets par exemple représente dans la forme dé odée une suite de six
points sur l'axe des temps. Ce i est important pour la suite des analyses.
Fig.
4.1.2.2
Les séquen es types
La onstru tion des séquen es types repose sur les paramètres aléatoires suivants :
1. la longueur de la séquen e type : .-à-d. le nombre de triplets utilisés en limitant la variation entre
15 et 24.
2. l'ordre des formes utilisées.
3. La moyenne pour haque triplet en limitant les valeurs à l'intervalle [-5,5℄.
4. la varian e pour haque triplet dans l'intervalle [-3,3℄ (forme 2, toujours nulle).
L'environnement arti iel sera omposé de trois séquen es types M = {M1 , M2 , M3 }. Leur taille,
qui était dénie de façon aléatoire, est respe tivement 24, 20 et 21 triplets. La gure 4.8 montre leurs
représentations en forme dé odée ave une é helle des temps ommune.
93
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Fig.
4.8 Les trois séquen es types de l'environnement test
Les ouleurs utilisées, rouge pour M1 , vert pour M2 et bleu pour M3 , sont utilisées tout au long des
analyses dans les diérents diagrammes pour référer aux séquen es types.
4.1.2.3
Les séquen es d'évolutions
Les séquen es d'évolutions représentent diérents omportements temporels d'un pro essus T =
Comme déjà évoqué auparavant, la onstru tion des séquen es d'évolutions se
base sur les séquen es types an de onstruire de façon arti ielle une relation bien dénie entre les
séquen es d'évolutions et les séquen es types. Ce i est important en vue d'analyser la méthode de loalisation DTW-LB dans le ontexte de la détermination des séquen es types les plus pro hes durant
l'avan ement de l'évolution.
Trois méthodes pour la réation de séquen es d'évolutions ont été mises au point. Elles sont présentées
i i, et le raisonnement qui est derrière haque méthode est expliqué. De haque méthode un ertain
nombre de séquen es d'évolutions a été produit pour onstruire un orpus de séquen es d'évolutions.
Comme au une validation quantitative n'est faite, le nombre de séquen es pour haque groupe est xé à
quatre exemplaires. Le but est de s'assurer que la méthode représente bien les propriétés de similarité et
de lo alisation dans des ontextes spé iques.
1. Un groupe de séquen es d'évolutions est obtenu par déformation d'une seule séquen e type. La déformation onsiste à étirer ou omprimer des parties de la séquen e type en utilisant le dédoublement
ou enlèvement de triplets.
Le but de e type de séquen es dans le orpus est d'analyser l'inuen e que peut avoir le mé anisme
du mappage DTW sur la lo alisation DTW-LB.
2. Un autre groupe de séquen es d'évolutions est obtenu en mettant bout à bout des parties de
diérentes séquen es types.
I i le but est d'analyser la apa ité de déte tion de la séquen e type dépendant du ontenu de l'évolution. Un hangement de la sour e (séquen e type) durant l'évolution doit être déte té. Cela simule
un hangement que peut avoir le omportement du pro essus industriel à ause d'un hangement
de l'environnement industriel ou d'un hoix stratégique de l'opérateur.
{T1 (t); T2 (t); · · · Ts (t)}.
94
4.1.
Classi ation d'évolutions en ligne
3. Un dernier groupe de séquen es d'évolutions est obtenu en mettant une séquen e type à l'é helle
d'une autre en utilisant le mappage DTW.
Le but ette fois- i est d'analyser l'inuen e de la similarité entre séquen es types (la proximité de
lasses de séquen es) sur la lo alisation DTW-LB et en même temps d'analyser l'importan e de la
taille des séquen es types sur ette lo alisation.
La notion d'aléatoire est aussi utilisée dans la produ tion des séquen es d'évolutions selon es trois
méthodes, dans le hoix des parties qui sont modiées et pour le nombre de modi ations.
Il est inutile, et ela n'apporte pas d'information, de montrer tout le orpus de séquen es d'évolutions
qui est utilisé. Pour la démonstration et la dis ussion de la méthode un exemple représentatif est utilisé.
Finalement les autres résultats seront dis utés en blo .
An de familiariser le le teur ave la notation, un exemple du deuxième groupe de séquen es d'évolution est montré.
T6 (t) = {M1 (1 − 3); M2 (4 − 12); M3 (11 − 21)}
(4.3)
L'exemple T6 (t) est obtenu en prenant les trois premiers éléments de M1 , suivi des éléments 4 à 12 de
et enn les éléments 11 à 21 de M3 et omprend en tout don 23 triplets.
La représentation dé odée de ette séquen e d'évolution (g. 4.9) représente les parties issues des
diérentes évolutions types dans leur ouleur respe tive. Les éléments noirs soulignent la onnexion entre
les parties.
M2 ,
Fig.
4.9 Un exemple de séquen e d'évolution : T6 (t)
Rappelons que le but de e groupe de séquen es d'évolutions est d'analyser si la méthode de lo alisation
DTW-LB est apable de retrouver les séquen es types qui sont asso iées.
L'ensemble de es éléments, .-à-d. l'alphabet, les trois séquen es types et le orpus de séquen es
d'évolutions forme l'environnement arti iel. Cet environnement est onstruit en utilisant des paramètres
aléatoires. La reprodu tibilité des analyses est ependant garantie en xant et environnement après sa
produ tion.
4.1.3 Simulation de la re her he de prototypes dans le ontexte de l'évolution
temporelle
Cette se tion dé rit la démar he utilisée an de simuler une évolution temporelle en se basant sur
l'environnement arti iel ( hap. 4.1.2). Elle analyse la méthode de lo alisation DTW-LB ( hap. 4.1.1)
dans sa apa ité de re her her la séquen e type la plus similaire pour un stade d'évolution donné, e qui
représente la première phase du ontrle prédi tif d'aide à la dé ision (g. 4.1). En même temps des outils
pour la proposition de s énarios sont analysés.
Diérentes représentations graphiques seront utilisées pour l'analyse de la lo alisation DTW-LB dans
le ontexte de l'évolution temporelle. Ces types de représentations sont utilisés dans la suite du do ument
pour l'analyse et l'appli ation de ette méthode au pro essus industriel. De plus, elles sont utilisées dans
le ontexte de la proposition de s énarios.
95
Chapitre 4.
4.1.3.1
Un
ontrle prédi tif basé sur une aide à la dé ision
Simuler l'évolution temporelle
An de simuler une évolution temporelle en se basant sur le orpus des séquen es d'évolutions T
haque séquen e d'évolution Ti (t) est représentée par une su ession de stades d'évolutions Ti,p (t) qui
ommen ent tous à la ra ine t = 0, allant jusqu'à t = p ave p = 1 · · · Ni , pour Ni la taille de la séquen e
d'évolution Ti (t).
Chaque Ti (t) produit une évolution temporelle, qui est omposée de Ni stades d'évolutions représentant des sous-séquen es de l'évolution omplète. Ti,2 (t) par exemple omprend les deux premiers triplets
de Ti (t), Ti,3 (t) les trois premiers triplets et .
Prenons omme exemple la séquen e S(t) (eq. (4.2)) et posons T1 (t) = S(t). L'évolution temporelle
qui en dé oule est représentée par l'équation (4.4)
T1,1 (t)
T1,2 (t)
T1,3 (t)
..
.
T1,28 (t)
T1,29 (t)
4.1.3.2
= {0}
= {0, 0}
= {0, 0, 1}
(4.4)
= {0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0}
= {0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0}
Re her he des lo alisations les plus pro hes
Le but est de trouver la séquen e type, ou plutt la partie d'une des séquen es types qui ressemble
le plus à un stade d'évolution donné. C'est pourquoi à haque stade de l'évolution Ti,p (t) d'une séquen e
d'évolution Ti (t), la lo alisation DTW-LB est al ulée pour toutes les séquen es types Mj (t) ∈ M.
Dans le ontexte de l'environnement arti iel pour un stade d'évolution donné Ti,p (t), trois ourbes
de distan e DTW du type (g. 4.5) en résultent. La séquen e type qui réalise la distan e DTW minimale
globale sur l'ensemble des ourbes représente elle qui est la plus similaire du point de vue lo alisation
DTW-LB. L'index de e minimum (k̂ = k) spé ie la taille de la partie de la séquen e type Mj (t) qui est
onsidérée. Cette partie est notée Mj,k̂ .
Il serait possible de se ontenter de e résultat. Mais, puisque la lo alisation traite aussi le sujet
subje tif qu'est la similarité, il est plus prudent de ne pas se ontenter du premier minimum, mais
d'utiliser les q premiers minima. Notez que es minima peuvent provenir d'une seule séquen e type,
omme ils peuvent être distribués sur les séquen es types. Cela dépend uniquement des valeurs de distan e
DTW-LB qui sont réalisées pour les diérentes séquen es types.
Dans la suite de ette se tion, seuls les trois premiers minima sont analysés (q = 3).
An de montrer un exemple de ette méthode, la séquen e d'évolution T6 (t) (g. 4.9) est utilisée dans
le huitième stade d'évolution T6,8 (t) (4.5).
(4.5)
La gure 4.10 montre les trois ourbes de distan es DTW pour toutes les parties des séquen es types
M1 , M2 et M3 .
Quelques détails des trois premiers minima qui sont réalisés sont repris dans le tableau 4.1 :
séquen e type index de loonsidérée
alisation k̂ Ddtw Référen e
M1
5
2.231 M1,5
8
2.319 M2,8
M2
M1
6
2.328 M1,6
Tab. 4.1 Détails sur les trois premiers minima de la lo alisation DTW-LB
T6,8 (t) = {M1 (1 − 3); M2 (4 − 8)}
96
4.1.
Fig.
Classi ation d'évolutions en ligne
4.10 Courbes de distan es DTW entre T6,8 (t) et toutes les parties M1 , M2 , M3
Ce i veut dire que pour le premier minimum par exemple, la séquen e type M1 est séle tionnée et que
le minimum se trouve à l'indi e inq de la ourbe (k̂1 = 5). La lo alisation DTW-LB utilise don les inq
premiers triplets de M1 (M1,5 ) et la distan e DTW réalisée est de 2.231. Pour le deuxième minimum,
'est M2 la séquen e type gagnante, ave huit triplets( k̂2 = 8), la même taille que le stade d'évolution
T6,8 (t). Finalement pour le troisième minimum, de nouveau la séquen e type M1 est séle tionnée, mais
ave six triplets et une distan e plus élevée ette fois- i.
An d'analyser plus en détail le résultat de es trois minima, la gure 4.11 montre la mise à é helle
des trois premiers minima ave le stade d'évolution T6,8 (t), .-à-d. la lo alisation DTW-LB ave T6,8 (t)
pour les parties des séquen es types M1,5 , M2,8 , et M1,6 en utilisant le mappage DTW vers l'espa e T6,8 (t)
à haque fois. L'information de mappage pour es parties peut dire tement être extraite du résultat du
al ul DTW sans al ul supplémentaire, en traçant le heminement en rétro-propagation, en partant au
point [p, k̂] de la GDM.
Fig.
4.11 Lo alisation DTW-LB pour le stade d'évolution T6,8 (t) ave les séquen es types M1 , M2 , M3
Rappelons que T6,8 (t) représente les huit premiers triplets de T6 (t), et que de e fait il omprend les
trois premiers triplets de M1 et les triplets 4 à 8 de M2 (4.5). Ce fait est bien reété par la lo alisation
DTW-LB, puisque M1,5 et M1,6 ouvrent bien les trois premiers triplets de T6,8 (t) (t = 0 · · · 5) et M2,8
ouvre la partie des triplets quatre à huit (t = 6 · · · 15). L'alignement réalisé par la lo alisation DTW-LB
reprend don bien les parties respe tives.
En utilisant ette méthode il est possible de trouver pour haque stade d'évolution les q meilleures
lo alisations DTW-LB et d'en déterminer les parties de séquen es types qui ressemblent le plus à es
stades d'évolutions. Comme la partie Mj,k̂ est similaire au stade d'évolution analysé Ti,p (t) et que Mj (t)
représente une séquen e type, ette information peut être utilisée an de prévoir la suite de l'évolution.
Il sut de retirer la partie utilisée pour la lo alisation DTW-LB et de proposer le reste de la séquen e
type omme prédi tion.
Analysons le premier minimum de l'exemple T6,8 (t). M1,5 est la partie utilisée pour la lo alisation
DTW-LB. Le reste de ette séquen e type est M1 (t) pour t = 6 · · · 24 qui sera noté M1,5+ (t). L'avantage
97
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
d'un environnement arti iel est le fait que le reste de la séquen e d'évolution T6 (t) est onnu et qu'il
est possible de omparer la prédi tion à l'évolution réelle. La gure 4.12 montre T6,8 (t), M1,5+ (t), la
prédi tion, .-à-d. le reste de la séquen e type et le reste de la séquen e d'évolution T6,8+ (t).
Fig.
4.12 Première prédi tion au stade d'évolution T6,8 (t)
Le résultat semble désastreux à première vue. Mais analysons plus en détail e résultat. T6,8 (t) omporte trois triplets de M1 et quatre de M2 . Le reste de la séquen e d'évolution T6,8+ (t) ne ontient plus
au un élément de M1 . Il reste seulement des éléments venant de M2 et M3 . Pour la lo alisation, seule
la première partie de la séquen e d'évolution est utilisée. Le huitième stade d'évolution, qui est analysé
i i, est l'instant pour lequel pour la première fois les éléments venant de M2 prédominent eux venant
de M1 . Cela est reété par le fait que le deuxième minimum est représenté par M2,8 et don la séquen e
type M2 .
La gure 4.13 représente la prédi tion M2,8+ faite pour e deuxième minimum.
Fig.
4.13 Deuxième prédi tion au stade d'évolution T6,8 (t)
Les premiers éléments de ette deuxième prédi tion ouvrent bien la suite de la séquen e d'évolution
jusqu'à l'instant t = 23 .-à-d. le 12ème triplet de T6 . À e moment il y a le deuxième hangement
dans la séquen e d'évolution. Les éléments qui suivent sont M3 (11 − 21), e qui ne orrespond plus à la
proposition faite par M2,8+ .
Cet exemple montre bien que la lo alisation DTW-LB se base sur la similarité, et qu'il est important
d'en tenir ompte dans l'analyse des résultats qui sont produits par ette appro he.
Il ne faut pas oublier que pour et environnement arti iel de séquen es d'évolution, il existe une
relation entre les séquen es d'évolution et les séquen es types ( hap. 4.1.2.3) e qui est bien déte té
par la lo alisation DTW-LB (g. 4.11). Mais il n'existe au une relation entre les trois séquen es types
( hap. 4.1.2.2). C'est la raison pour laquelle les prédi tions faites pour et environnement ne peuvent
pas représenter de vraies prédi tions. Dans le adre du pro essus industriel les séquen es types dé rivent
diérents omportements du pro essus, mais la base est toujours la même installation physique, et il
existe don de manière impli ite une relation entre es séquen es types.
Jusqu'i i un stade d'évolution spé ique a été analysé, et le résultat obtenu est expli able. An
d'analyser l'évolution de la lo alisation DTW-LB ave l'avan ement du stade d'évolution et de pouvoir
représenter les résultats dans une forme ompa te, des représentations graphiques ont été élaborées [53℄.
Elles sont présentées dans la pro haine partie de e hapitre.
98
4.1.
4.1.3.3
Classi ation d'évolutions en ligne
Graphiques d'analyse pour l'évolution de la lo alisation
Chaque séquen e d'évolution Ti (t) produit Ni stades d'évolution pour lesquels les q meilleures lo alisations DTW-LB sont al ulées. Il n'est pas pratique d'analyser en détail toutes les évolutions pour tout
le orpus de séquen es d'évolutions en se basant sur les représentations utilisées dans la se tion 4.1.3.2. Il
était né essaire d'élaborer des graphiques standards an de mieux pouvoir analyser les diérents résultats.
Deux types prin ipaux de graphiques peuvent être distingués :
Le graphique global : il donne un aperçu global sur l'évolution de la lo alisation DTW-LB pour l'ensemble des stades d'évolutions d'une séquen e d'évolution donnée (g. 4.14).
Le graphique lo al : il montre des détails de la lo alisation pour un stage d'évolution donné et un
minimum spé ique (g. 4.15).
An de donner un exemple d'un graphique global, de nouveau la séquen e d'évolution T6 (t), déjà bien
onnue, est utilisée. Le graphique global (g 4.14) est omposé de deux sous-graphiques :
Fig.
4.14 Graphique global de la séquen e d'évolution T6 (t)
1. En haut les distan es DTW réalisées pour les q = 3 meilleures lo alisations DTW-LB de haque
stade d'évolution sont représentées en diagramme blo . Les traits verti aux séparent les stades
d'évolutions. La ouleur du blo fait référen e à la séquen e type utilisée.
Cela donne un rapide aperçu global sur les séquen es types qui sont utilisées et la qualité de similarité
des lo alisations DTW-LB pour toute l'évolution temporelle.
Pour l'exemple donné e graphique montre que la suite des séquen es types déte tées reprend bien
les éléments qui omposent la séquen e d'évolution
T6 (t) = {M1 (1 − 3); M2 (4 − 12); M3 (11 − 21)}.
La déte tion est seulement dé alée dans le temps. Mais aux instants de hangement p = 3 et p = 12
un minimum de la distan e DTW peut être onstaté.
2. En bas la diéren e entre le nombre d'éléments k̂ utilisés pour la lo alisation DTW-LB et la taille
p du stade d'évolution est représentée pour haque stade d'évolution.
Si le point se trouve en-dessous de la ligne de base, la taille de la partie de la séquen e type
utilisée pour la lo alisation DTW-LB est plus petite que la taille du stade d'évolution. La partie
99
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
de la séquen e type est don étirée an de représenter au mieux le stade d'évolution. Si le point se
trouve au-dessus, 'est l'inverse, et la partie de l'évolution type est omprimée pour la lo alisation
DTW-LB.
Ce graphique donne un aperçu sur les phénomènes de ompression et d'étirement globaux ave le
stade d'évolution. Cela est d'un té un indi ateur utilisable an d'ajuster les paramètres de pénalité
du al ul DTW. De l'autre té, 'est un indi ateur pour l'adéquation des parties de séquen es types
qui sont utilisées.
Pour donner un exemple, le stade d'évolution 5 a un omportement extraordinaire pour les deuxièmes
et troisièmes minima, puisqu'une importante ompression de dix respe tivement neuf triplets est
né essaire pour la lo alisation. Cela indique que le oût de la ompression n'est pas assez élevé (trop
faible pénalité), ou bien les séquen es types sont très éloignées les unes des autres. Dans e as 'est
plutt la pénalité, qui était 0.5 pour les dire tions horizontale et verti ale, qui est en ause.
Le deuxième type de graphiques regroupe les illustrations qui étaient utilisées durant l'analyse de la
lo alisation du stade d'évolution exemplaire T6,8 (t). Il représente toutes les informations pour un stade
d'évolution et un minimum spé ique. Comme exemple ette fois- i T6,21 le stade d'évolution 21 de la
séquen e d'évolution est représenté.
Fig.
4.15 Première prédi tion au stade d'évolution T6,21 (t)
Le graphique lo al se ompose de trois sous-graphiques, et les représentations sont toutes dans la
forme dé odée ave la séquen e type qui est représentée dans la ouleur respe tive.
1. En haut, le stade d'évolution est représenté ave la séquen e type orrespondant au minimum
analysé. Les deux parties de la séquen e type, elle utilisée pour la lo alisation et le reste qui sera
utilisé pour la prédi tion, sont montrées.
Le titre de e graphique résume les informations sur le stade d'évolution, le minimum qui est analysé,
la partie de la séquen e type qui est utilisée pour la lo alisation DTW-LB, et la valeur de la distan e
DTW réalisée pour la lo alisation.
2. Au milieu, le mappage DTW de la lo alisation DTW-LB est représenté. Cela indique la qualité
de similarité qui résulte de la lo alisation. En lien ave le premier sous-graphique, les parties de
ompression et d'étirement de la partie de la séquen e type peuvent être déte tées.
100
4.2.
Appli ation de la méthode au pro essus industriel
L'exemple montre que la dernière partie de la lo alisation re ouvre exa tement elle du stade d'évolution qui est issu de l'évolution en question M3 , e qui montre que la lo alisation arrive bien a
mettre ensemble les parties orrespondantes.
3. En bas, la prédi tion est omparée au reste de la séquen e d'évolution. Pour e stade d'évolution
la prédi tion est à 100%. Ce i résulte du fait que ette fois- i le reste de la séquen e d'évolution ne
ontient plus de hangement d'appartenan e.
Il faut noter que premièrement la déte tion de la séquen e type appropriée doit fon tionner, et
que en plus la lo alisation DTW-LB doit positionner orre tement la sous-séquen e pour que la
prédi tion soit orre te.
Ave es deux types de graphiques un grand nombre d'informations sur le omportement de la loalisation DTW-LB dans le ontexte de l'évolution temporelle est donné. Naturellement il est toujours
possible d'analyser plus en détail les al uls qui sont faits, si un résultat n'est pas expli able sur base de
es graphiques.
Ces types de graphiques sont aussi utilisables pour le retour d'une proposition à l'opérateur. Le
graphique global illustre tout l'historique de l'évolution, qui dans e as se onstruit ave l'avan ement
du stade d'évolution. Le graphique lo al donne l'information a tuelle et la prédi tion, respe tivement
la proposition d'évolution pour la suite du pro essus. L'opérateur aurait la possibilité de onsulter les
meilleures lo alisations ave la proposition respe tive.
4.1.4 Résultats pour l'environnement arti iel
Les détails des analyses basées sur l'environnement arti iel ne sont pas tous repris dans e do ument,
ar ela dépasserait le ontexte de e travail. Dans ette se tion, seuls les prin ipaux résultats qui sont
obtenus par la méthode pour les trois groupes de séquen es d'évolution, sont listés.
Globalement les résultats obtenus sur le orpus des séquen es d'évolutions sont très positifs. Au un
résultat in ompréhensible ou en ontradi tion ave e qui était attendu n'a été onstaté. Au ontraire,
les résultats étaient en général en adéquation ave les espéran es.
Lorsqu'une séquen e type a été utilisée dire tement omme séquen e d'évolution (pas de groupe), la
méthode a bien séle tionné ette séquen e type pour la lo alisation DTW-LB et le mappage DTW et
la prédi tion est toujours à 100%. Cela semble peut-être évident, mais e test était fait an de voir le
omportement des q meilleures lo alisations dans e as spé ial.
Lorsque les séquen es d'évolutions sont obtenues par étirement ou ompression des séquen es types
(premier groupe), l'appro he a toujours déte té la séquen e type en question, ave une lo alisation DTWLB et un mappage à 100%. Dans e as, la prédi tion ne peut pas être optimale, ar un étirement ou une
ompression future dans la séquen e d'évolution n'existent pas dans la séquen e type.
Lorsque les séquen es d'évolutions étaient omposées de parties de diérentes séquen es types non
déformées (deuxième groupe et exemple T6 utilisé pour l'expli ation), la méthode a bien su repérer les
diérentes parties qui ont omposé la séquen e d'évolution (les lo alisations DTW-LB séle tionnent les
parties de la séquen e type dans le même ordre). De plus, la prédi tion est quasiment toujours pla ée au
bon endroit, e qui démontre la qualité de la lo alisation.
Lors de la mise à l'é helle d'une séquen e type vers une autre, en donnant plus de poids à une séquen e
type qu'à une autre (troisième groupe), les résultats obtenus sont eux qui étaient attendus.
La on lusion des analyses faites sur l'environnement arti iel est que ette méthode semble être au
point pour être appliquée aux données qui proviennent de l'installation industrielle.
4.2 Appli ation de la méthode au pro essus industriel
La méthode de ontrle prédi tif telle qu'elle a été présentée auparavant ( hap. 4.1) pour un environnement arti iel, est dire tement appli able aux données du pro essus. Car le même type de odage
est utilisé, et dans le hapitre 3.3.3.4 des prototypes d'évolution ont été produits. Ils sont omparables
aux séquen es types de l'environnement arti iel sauf que ette fois- i un ontexte physique .-à.-d. un
pro essus réel existe. Et il sera montré que les propositions ont un réel ara tère de prédi tion.
101
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Une diéren e en omparaison ave l'analyse basée sur l'environnement arti iel est que le odage des
y les de produ tion est fait en utilisant diérents alphabets ( hap. 3.2.4). Les prototypes d'évolutions
(g. 3.42) produits auparavant utilisent les quatre alphabets de référen es (quatre prototypes pour haque
alphabet). Ces prototypes sont réalisés dans une appro he de lassi ation non-supervisée et reètent de
e fait les omportements du pro essus. Pour l'analyse du omportement temporel et le ontrle en ligne,
les diérents odages sont mis en on urren e, puisque haque prototype, indépendamment de son odage,
ontribue de façon équivalente à la re her he des minima pour la lo alisation DTW-LB. Les q meilleures
lo alisations peuvent don être issues de diérents odages basés sur des alphabets diérents. La mise en
÷uvre de ette on urren e est relativement simple ar la lo alisation DTW-LB se base sur la forme odée
du signal. Chaque prototype qui vient ave son odage spé ique, est omparé à la partie du y le de
produ tion en utilisant le odage propre au prototype. Il en résulte pour haque prototype une ourbe de
distan e DTW (dernière olonne de la GDM) du genre présenté dans la gure 4.5. En mettant ensemble
es ourbes (voir g. 4.10 et g.4.18) an de trouver les q premiers minima, tous les prototypes sont en
on urren e, et ave eux les diérents odages.
Une autre appro he, qui ne sera pas approfondie dans le adre de e travail, serait d'utiliser les
diérents odages, an de réaliser une proposition pour l'opérateur ave diérents niveaux de granularité.
Pour ela haque prototype d'évolution devrait exister dans les diérents odages. Cela implique que la
méthode utilisée pour la réation des prototypes de omportement soit adaptée à ette parti ularité.
Le orpus de y les de produ tion utilisables (2471 y les) est en partie (≈25%) déjà exploité pour
la lassi ation non-supervisée, .-à-d. l'extra tion des prototypes d'évolution. Puisque ette analyse n'a
pas réellement pu être réalisée en ligne, mais est faite sur base d'un orpus enregistré, la simulation
d'évolution temporelle ( hap. 4.1.3.1) est utilisée, an de pouvoir appliquer la lo alisation DTW-LB dans
le adre d'une évolution temporelle. Il serait biaisé d'utiliser les y les de produ tion déjà utilisés pour la
lassi ation dans le ontexte du ontrle prédi tif. La séle tion des exemples qui seront utilisés dans e
hapitre est réalisée dans la partie du orpus non utilisée dans des phases pré édentes.
Trois y les exemplaires sont utilisés an de dis uter les résultats qui sont obtenus par ette méthode :
un premier y le de produ tion qui, selon l'avis des experts, est quasiment optimal, un deuxième y le
ave une température de oulée trop élevée, don ave un éventuel potentiel d'optimisation, et un troisième y le ave une évolution plutt ex eptionnelle qui est dû à une panne, an de montrer le pouvoir
d'adaptation de la lo alisation DTW-LB. Chaque exemple ommen e par la représentation du y le ave
le signal original et les re onstru tions pour les quatre alphabets de référen e, une ourte spé i ation du
y le et le graphique global de l'évolution temporelle.
An d'éviter de sur harger le graphique global qui représente tous les stades d'évolutions analysés
et de garder le plus lairement possible les résultats de ette analyse, un nombre restreint de stades
d'évolutions et un nombre xe de minima de lo alisations DTW-LB sont produits :
toutes les 5 min. (300 s) une analyse du stade d'évolution est réalisée. Cette taille représente en
même temps la taille de la plus grande forme dans les alphabets de référen es. Notez que le plus petit
multipli ateur ommun on ernant la taille des alphabets de référen e est 840, e qui orrespond à
une durée de 70 min. (4200s) et dépasse la durée moyenne des y les de produ tions. Cela implique
que dépendant du prototype, une ertaine partie de l'évolution ne sera pas prise en ompte par la
lo alisation DTW-LB.
pour haque stade d'évolution, les six meilleures lo alisations DTW-LB (q = 6) sont analysées et
représentées dans le graphique global an de donner un aperçu sur l'évolution temporelle des y les
analysés. Pour la lo alisation DTW-LB une pénalité symétrique mphv = 0.9 est utilisée par défaut.
Dans tous les graphiques de e hapitre l'unité de l'axe de temps est donnée en se ondes. An d'illustrer
des détails, quelques analyses lo ales (lo alisation DTW-LB, mappage et prédi tions) sont faites en as
de besoin ou d'intérêt.
Deux types de diagrammes sont ajoutés au graphique global tel qu'il était présenté dans la se tion 4.1.3.3. Les deux diagrammes se basent sur le fait que l'évolution est simulée et que les y les de
produ tion sont onnus dans leur globalité. Le premier de es diagrammes (en troisième position vertiale) représente la distan e DTW entre la proposition et la n réelle du y le à haque stade d'évolution,
le deuxième (en dernière position verti ale) donne une estimation du gain en énergie éle trique en relation ave la proposition omparée à la onsommation réelle du y le. Cette estimation de gain d'énergie
éle trique est basée sur une intégration de la proposition (puissan e éle trique) qui est ajoutée à la
102
4.2.
Appli ation de la méthode au pro essus industriel
onsommation au stade d'évolution et omparée à la onsommation totale du y le analysé.
Con ernant l'estimation du gain en énergie éle trique, quelques remarques sont à onsidérer dans
l'utilisation de ette information :
les prototypes d'évolution représentent des moyennes sur base de la similarité (méthode DTW) où
des ompressions et étirements non-linéaires sur l'axe du temps sont possibles. Ces adaptations ne
sont pas sans eet sur le al ul estimatif de l'énergie éle trique qui se base sur la proposition .-à-d.
la partie restante après la lo alisation DTW-LB.
puisque durant l'apprentissage non-supervisé des prototypes d'évolution, la taille des prototypes
n'est pas adaptée, seule la forme est apprise. L'initialisation des prototypes, et plus spé ialement
la taille des prototypes initiaux, importe de e fait dire tement sur le al ul estimatif de l'énergie
éle trique.
Les informations de gain sont don à onsidérer ave pré aution et doivent être soutenues par d'autres
informations. Notamment l'information de distortion temporelle qui est donnée par le deuxième diagramme du graphique global (g.4.14) est à prendre en ompte ave l'information de gain en énergie
éle trique.
Ces deux diagrammes ajoutés ne sont pas utilisables dans un ontexte en ligne, puisque la n réelle du
y le en ours est alors in onnue. Ils n'ont de e fait qu'un intérêt pour l'interprétation des résultats dans
le ontexte d'une analyse évolutive sur base de y les de produ tion enregistrés. Cependant une prévision
estimative de la onsommation totale en énergie éle trique d'un y le en ours est réalisable sur base des
propositions et pourra être utilisée par l'opérateur an d'orienter le hoix de la proposition à retenir.
4.2.1 Premier y le ave un omportement quasi optimal
Ce y le de produ tion est référen é par le numéro 1987, la onsommation globale d'énergie éle trique
est de 56.6 [MWh℄ et une température de oulée de 1626C a été mesurée. L'évolution de e y le (voir
g 4.16) est quasiment optimale et la onsommation en énergie éle trique est un peu en-dessous de la
moyenne. La température de oulée orrespond à la norme pour l'installation analysée et le ontexte de
la haîne de produ tion. Seule la durée entre la dernière oupure de la puissan e éle trique et la n de la
harge est plus longue que d'habitude.
4.16 Ex. 1 - Nr-Ref. 1987 : Représentation du signal original ave les re onstru tions basées sur
les quatres odages
Fig.
103
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Pour un tel omportement peu d'améliorations sont envisageables. L'analyse de l'évolution temporelle
de e y le est faite an de montrer le omportement de la lo alisation DTW-LB sur un y le de produ tion
réelle, de valider la méthode et d'illustrer quelques spé i ités de nomen lature dans les diagrammes
utilisés.
La gure 4.17 montre le graphique global de l'analyse de l'évolution temporelle de e premier y le
de produ tion.
Fig.
4.17 Ex. 1 - Nr-Ref. 1987 : Le graphique global pour les 11 stades d'évolution
Le premier diagramme représente pour haque stade d'évolution les six meilleures lo alisations DTWLB ave la distan e DTW réalisée. Noter que pour les quatre premiers stades d'évolution (300s - 1200s)
les six meilleures lo alisations DTW-LB sont réalisées pour six prototypes diérents à haque fois, et que
au une ompression voire étirement n'étaient né essaires (deuxième diagramme). Les prototypes utilisés
(5,10,12,13,15,16) utilisent trois odages diérents (A2,A3,A4), e qui souligne que les odages sont dans
une situation de on urren e pour une même lo alisation DTW-LB.
A partir du stade d'évolution inq (1500s) seulement 3 prototypes persistent pour la lo alisation
DTW-LB, et ils sont utilisés plusieurs fois ave des parties de taille diérentes. Les stades d'évolutions
de sept à dix (2100s - 3000s) illustrent ela par le prototype 10 qui est utilisé trois fois à haque stade
d'évolution. Le deuxième diagramme indique qu'à haque fois le prototype est en premier lieu utilisé
ave la taille de l'évolution (k − p = 0). En deuxième lieu la partie utilisée du prototype a une taille
supérieure à elle de l'évolution (k − p = 210(> 0)), e qui orrespond à une ompression de la partie
prototype utilisée. Et nalement, en troisième lieu, la partie utilisée du prototype est inférieure à elle
de l'évolution (k − p = −210(< 0)), e qui orrespond à un étirement de la partie utilisée. La gure 4.18
montre la lo alisation DTW-LB au stade d'évolution huit (2400s) pour tous les prototypes, ave en détail
104
4.2.
Appli ation de la méthode au pro essus industriel
la séle tion des six meilleurs résultats.
Fig.
4.18 Ex. 1 - Nr-Ref. 1987 : Lo alisation DTW-LB pour le stade d'évolution huit (2400s)
Notez que pour e graphique l'index de lo alisation est donné en se ondes et ne représente pas l'indi e
de la GDM qui serait diérent pour haque alphabet. Cette forme de représentation a été hoisie an de
mieux voir la relation temporelle de la lo alisation des diérents odages.
La nomen lature pour les meilleures lo alisations qui est utilisée ultérieurement dans les graphiques
lo aux dière légèrement
de elle utilisée pour l'environnement arti iel, et sera don expliquée i i.
Exemple : Mqnp,k̂[+]
q indique le numéro de la lo alisation DTW-LB,
np numéro du prototype utilisé,
k̂ la taille du prototype, en se ondes, utilisée pour la réalisation de la lo alisation DTW-LB,
[+] indique, si présent, que la partie restante (proposition) du prototype est représentée. Dans le as où
elle n'est pas présente, il s'agit de la partie utilisée pour la lo alisation qui est onsidérée.
Dans et exemple T1789,2400 le stade d'évolution indique que 2400 se ondes du signal sont utilisées.
Pour la première lo alisation (M110,2310 ) le prototype 10, qui utilise l'alphabet A3, est séle tionné, mais
seulement 2310 se ondes sont utilisées. Cela vient du fait que pour A3 la taille des formes est de 42
é hantillons à 5s de temps d'é hantillonnage, e qui résulte dans une taille de 42 ∗ 5 = 210s par élément
du ode. Le multiple le plus pro he du stade d'évolution est 2310, e qui limite la partie utilisable pour la
lo alisation DTW-LB pour e prototype à 2310 se ondes. Il en résulte que pour ette lo alisation DTWLB, pas de ompression ni d'étirement ne sont né essaires. Pour la lo alisation numéro inq (M55,2520 )
le prototype 5, qui utilise l'alphabet A2, est séle tionné ave 2520 se ondes qui sont utilisées pour la
lo alisation. A2 utilise une taille de 24 é hantillons pour la forme, e qui représente 24 ∗ 5 = 120s par
élément du ode. L'entièreté du stade d'évolution est don utilisée pour ette lo alisation, puisque 2400
est un multiple entier de 120. Cependant pour la lo alisation 2520 se ondes du prototype sont utilisées,
e qui implique qu'une ompression de la taille d'un élément du ode est réalisée pour ette lo alisation.
Ce qui est aussi intéressant à faire remarquer est que le prototype 10 se retrouve dans tous les stades
d'évolutions, et qu'à partir du inquième stade d'évolution, e prototype reste la meilleure lo alisation
jusqu'à la phase nale. Cela montre que la lo alisation et la prédi tion vont bien ensemble, et que le y le
évolue réellement selon ette évolution prototype.
105
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Ce qui peut être intéressant dans e ontexte, 'est de voir quelle est la proposition issue de la première
lo alisation après que le y le tourne depuis 5 min. Le prototype 5 est gagnant (l'alphabet A2 est don
utilisé).
Fig.
4.19 Ex. 1 - Nr-Ref. 1987 : Analyse lo ale après les premières 5 min du y le de produ tion.
La proposition est pro he de l'évolution qui va réellement suivre. Cela onrme l'armation prédite
que la proposition ne peut être adéquate que si le système dé rit par les séquen es est un système physique
réel.
Le faible potentiel d'amélioration de et exemple est aussi repris par le dernier diagramme du graphique
global (voir g.4.18), représentant l'estimation de gain en énergie éle trique. La plupart des lo alisations
DTW-LB ne proposent pas de gain pertinent, voire de faibles valeurs positives.
Seulement pour quelques instants dans l'évolution (stade d'évolution 5 - 9), une estimation positive
(≈5[MWh℄) peut être onstatée. Il s'agit à haque fois de la deuxième lo alisation du prototype 10 voire
du prototype 5. Comparons les propositions ave l'information de mappage dans le deuxième diagramme.
Pour toutes es lo alisations une ompression de la partie prototype utilisée pour la lo alisation peut
être onstatée. De plus es propositions sont à haque fois au préalable déjà utilisées sans ompression.
Cela indique que la proposition est né essairement plus ourte, et l'intégration pour l'estimation du gain
résulte dans une onsommation globale plus petite. Dans es onditions, il est possible que la proposition
qui en dé oule reète une évolution qui n'est pas apable de réaliser la ontrainte de la température de
oulée. Ce i montre qu'il est important de pouvoir interpréter les résultats d'une lo alisation et d'utiliser
es informations pour le hoix de la proposition qui sera utilisée pour la onduite de l'installation.
Ave e résultat positif pour un y le d'évolution quasi optimal, analysons maintenant un y le pour
lequel les experts estiment qu'il existe un potentiel d'amélioration.
4.2.2 Deuxième y le ave potentiel d'amélioration
Ce y le de produ tion est référen é par le numéro 41, la onsommation globale d'énergie éle trique
est de 61.1 [MWh℄ et une température de oulée de 1674C a été mesurée.
La onsommation en énergie est légèrement au-dessus de la moyenne et ne donne don pas l'impression
d'un potentiel d'amélioration important. Cependant la température de oulée est nettement plus élevée
106
4.2.
Appli ation de la méthode au pro essus industriel
que la norme. En évitant ette sur haue de l'a ier liquide, une rédu tion de la onsommation d'énergie
éle trique aurait été possible. Ce y le de produ tion omprend don un ertain potentiel d'optimisation.
La gure 4.20 montre l'évolution temporelle de e y le. A première vue, seulement une phase perturbée au début de la deuxième phase de fusion ave une embou hure au milieu de la phase peut être
observée.
4.20 Ex. 2 - Nr-Ref. 41 : Représentation du signal original ave les re onstru tions basées sur les
quatres odages
Fig.
La gure 4.21 montre le graphique global ave les stades d'évolutions pour e deuxième exemple.
En premier lieu il faut onstater que, à partir du stade d'évolution quatre, uniquement des ompressions et pas d'étirement sont utilisés pour la lo alisation DTW-LB, e qui indique que la première partie
de l'évolution du y le est plus ourte que ette même partie dans les prototypes séle tionnés par la
lo alisation DTW-LB. De plus, sur presque toute l'évolution une estimation de gain positive peut être
onstatée ave ette fois un niveau de gain légèrement plus élevé.
Analysons don plus en détail le stade d'évolution trois qui est en ore avant la partie de ompression permanente. Les six lo alisations se basent sur diérents prototypes (10,15,12,16,13,5) utilisant les
alphabets (A2,A3,A4). Notez que e sont les mêmes qui étaient utilisés dans le premier exemple durant
la première phase. Cependant la distan e DTW pour la première lo alisation DTW-LB est onsidérablement plus petite que elle des inq autres lo alisations. Au une ompression ni étirement n'existe pour les
six lo alisations de e stade d'évolution. Analysons le dernier diagramme qui indique les gains en énergie
éle trique estimés pour e stade d'évolution. Seulement les lo alisations 1 et 6 basées sur les prototypes
10 (A3) et 5 (A2) proposent un gain notable. La gure 4.22 montre les trois diagrammes du graphique
lo al de la première lo alisation, et le diagramme de proposition de la sixième lo alisation.
Les deux propositions sont similaires, mais issues de deux prototypes diérents. Dans les deux as la
proposition suggère de prolonger légèrement la première phase de fusion et d'arrêter la deuxième phase de
fusion plus tt, ave dans les deux as, une estimation de gain d'énergie éle trique. Notez que le y le nit
ave une température de oulée trop élevée, et arrêter la fusion plus tt pourrait éviter ette température
trop élevée.
Notez que e genre de y le est bien suivi par l'appro he, et les propositions faites sont ompréhensibles, expli ables, et elles reètent le potentiel d'amélioration bien réel dans e y le.
4.2.3 Troisième y le à omportement ex eptionnel
Ce y le de produ tion est référen é par le numéro 42, la onsommation globale d'énergie éle trique
est de 60.2 [MWh℄ et une température de oulée de 1658C a été mesurée.
107
Chapitre 4.
Un
Fig.
108
ontrle prédi tif basé sur une aide à la dé ision
4.21 Ex. 2 - Nr-Ref. 41 : Graphique global pour les 11 stades d'évolution
4.2.
Appli ation de la méthode au pro essus industriel
(a)
(b)
4.22 Ex. 2 - Nr-Ref. 41 : Graphique lo al du 3ème stade d'évolution (900 [s℄) :
(a) détails de la première lo alisation ;
(b) diagramme de proposition de la sixième lo alisation.
Fig.
109
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
La onsommation en énergie est moyenne, et la température de oulée un peu au-dessus de la moyenne.
Ce y le ne représente don pas des valeurs ex eptionnelles, mais le omportement temporel de e y le
est hors du ommun (voir g.4.23) et pour ela intéressant an de démontrer le potentiel d'adaptation
de la méthode proposée.
4.23 Ex. 3 - Nr-Ref. 42 : Représentation du signal original ave les re onstru tions basées sur les
quatres odages
Fig.
Le y le a une évolution hors du ommun, par e que la durée entre la première et la deuxième phase
de fusion est ex essivement longue (presque 30 min). Dans les données manuelles de ette harge qui
ontiennent des informations supplémentaires fournies par l'opérateur, il est noté que l'éle trode s'était
brisée et qu'un pointage d'un nouvel élément graphite était né essaire, e qui explique la durée anormale
de ette période. Notez aussi que diérentes oupures de ourant peuvent être observées durant la première
phase de fusion, e qui laisse penser que déjà à et instant quelques problèmes ont été ren ontrés. De
plus, une oupure peut être observée à la n de la deuxième phase de fusion. Cela peut venir d'une
mesure manuelle de la température du bain qui né essite une telle oupure. Une telle mesure manuelle est
né essaire si le robot qui ee tue normalement ette mesure est en panne. Pour des auses de sé urité,
les mesures manuelles de la température du bain ne sont autorisées que quand le four est hors tension.
Le graphique global (g. 4.24) montre que presque tout au long de l'évolution un gain serait possible,
e qui est normal si l'on onsidère la perte d'énergie durant la phase d'attente. Une autre onstatation
est que déjà au stade d'évolution deux (600s), au début de la première phase de fusion, le niveau de
la distan e DTW obtenu pour la lo alisation DTW-LB est nettement plus élevé que dans les exemples
pré édents. Cela reète les problèmes ( oupures de ourant) dans ette phase.
Ce qui est plus intéressant pour e travail est omment la lo alisation DTW-LB gère la situation. Le
graphique global montre que la lo alisation s'adapte en utilisant un étirement à partir du stade d'évolution
six (1800s) quand la durée entre les deux phases de fusion devient plus longue que d'habitude.
Analysons plus en détail diérentes propositions le long de l'évolution. La gure 4.25 montre le dernier
diagramme ave les premières propositions pour les stades d'évolution trois (900s) avant la oupure, sept
(2100) durant la oupure et neuf (2700s) après la oupure.
La proposition au stade d'évolution trois (900s) est standard, puisque à et instant pas d'anomalies
majeures ne sont apparues. De plus elle propose de prolonger la première phase de fusion. L'in ident,
brise d'éle trode n'est pas prévisible et l'opérateur n'a pas d'autre hoix que d'arrêter immédiatement le
pro essus en ours pour rempla er l'éle trode an de pouvoir ontinuer le pro essus. Au stade d'évolution
sept (2100s) la proposition suggère de lan er la deuxième phase de fusion an d'être onforme à une des
évolutions prototypes. En supposant que les travaux de réparation ne sont pas en ore a hevés à et
instant, l'opérateur ne peut pas appliquer ette proposition. Au stade d'évolution neuf (2700) la fusion
du deuxième panier a été lan ée et la lo alisation en tient ompte en étirant la plage à puissan e nulle
110
4.2.
Fig.
Appli ation de la méthode au pro essus industriel
4.24 Ex. 3 - Nr-Ref. 42 : Le graphique global pour les 16 stades d'évolution
111
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
Fig. 4.25 Ex. 3 - Nr-Ref. 42 : Analyse de l'évolution des premières propositions à 900s, 2100s et 2700s
du y le de produ tion
et réalise une proposition adéquate. La méthode est apable de se syn hroniser même dans des as de
omportement peu habituels. La proposition qui résulte de la lo alisation DTW-LB ne se base que sur
la similarité entre les parties d'évolutions, et de e fait ne tient pas ompte de pertes de haleur durant
la phase d'attente. Cela explique pourquoi un arrêt avan é est proposé, qui dans le ontexte de e y le
spé ique donnerait probablement une température de oulée trop faible.
4.2.4 L'utilisation des ritères d'optimisation
Ces trois exemples montrent bien que la méthode de lo alisation DTW-LB est apable de lo aliser
des parties d'évolutions d'un y le de produ tion en ours et de déte ter un ou plusieurs prototypes
d'évolutions qui sont similaires ave e qui peut être observé à e stade d'évolution.
L'adaptation de la lo alisation selon le stade d'évolution est bien visible dans les exemples deux et
trois. Un tel omportement est possible puisque le al ul DTW est apable de réaliser des déformations
non-linéaires sur l'axe des temps. Même des situations spé iales ave des étirements importants n'inuent
que peu sur la lo alisation du reste de la séquen e.
Les propositions qui sont réalisées semblent être appropriées. Il est dans e ontexte important de
noter qu'il est indispensable de ne pas se limiter à un seul hoix, puisque la lo alisation DTW-LB ne juge
que selon des ritères de similarités au niveau de l'évolution, et que ela peut résulter dans des évolutions
non réalisables en ajoutant les ontraintes du pro essus physique qui, elles, ne sont pas prises en ompte
dans l'analyse de lo alisation.
Remarquez aussi que les 16 évolutions prototypes qui sont issues de la lassi ation non-supervisée
reprennent plus ou moins bien des évolutions, voire le omportement ara téristique du pro essus. Cette
onstatation montre que des prototypes basés sur des alphabets onsidérés omme moins appropriés par la
validation des alphabets (Annexe C) peuvent ependant être utilisés dans le ontexte global. Néanmoins
les prototypes 1 jusqu'à 4, qui utilisent l'alphabet A1 apparaissent plus rarement (voir g. 4.21 et g. 4.24)
dans la lo alisation DTW-LB. Dans la validation, et alphabet est onsidéré omme peu approprié. Sans
ignorer le fait que ette onstatation ne se base que sur quelques exemples analysés durant ette étude qui
n'ont pas né essairement une pertinen e statistique, une question peut être soulevée : ne faudrait-il pas
valider des éléments d'une appro he globale, omme i i les alphabets et la lassi ation non-supervisée
112
4.2.
Appli ation de la méthode au pro essus industriel
des évolutions temporelles, dans leur ontexte global, qui est i i l'adéquation de proposition d'évolution
pour l'opérateur. Il est évident qu'une telle validation n'est pas triviale et que des validations soi-disant
lo ales, omme la validation des alphabets, peuvent aider dans la démar he.
Finalement es exemples montrent que, an de pouvoir dé ider si l'une ou l'autre proposition est
valable, plusieurs informations doivent être onsidérées ensemble, et une bonne onnaissan e du pro essus
est utile, an d'interpréter les réa tions de la méthode, ainsi que les propositions qui sont faites. Ce i
nous amène vers un sujet qui n'était pas en ore dis uté jusqu'i i, on ernant l'utilisation des ritères qu'il
s'agit d'optimiser.
Les analyses et méthodes pré édentes fournissent un moyen de séle tionner des évolutions prototypes
qui ressemblent plus ou moins bien à l'évolution qui est en ours. Dans les exemples les six premières
lo alisations DTW-LB sont listées. Dans la partie théorique il a été dit que le nombre des lo alisations est
un paramètre qui peut être spé ié par l'utilisateur. Il a aussi été relevé et montré que les lo alisations
peuvent être issues de plusieurs évolutions prototypes.
L'idée prin ipale est d'utiliser les ritères qu'il s'agit d'optimiser an de séle tionner les propositions
selon es ritères. Une première appro he de ette vue a été introduite pré édemment ave l'information
de gain en énergie éle trique. La notion de gain n'est naturellement pas dire tement utilisable, puisque
la onsommation nale du y le en ours n'est pas en ore onnue. Mais une autre appro he est possible
en se basant sur des estimations de onsommation des prototypes.
L'idée est de favoriser dans toutes les q lo alisations DTW-LB qui ne reposent que sur la similarité
d'évolution, les évolutions prototypes pour lesquelles la onsommation répond aux ritères donnés.
En théorie, plusieurs ritères diérents seraient possibles, omme par exemple la onsommation en
gaz naturel (par les brûleurs), le volume de harbon (inje té durant le pro édé) ou la onsommation en
oxygène pour n'en iter que quelques-uns. Tous es apports inuent sur le oût de produ tion, ils sont
don sujets à optimisation.
Cependant, toute l'étude a été réalisée sur base d'un seul type de signal (une seule variable), la
puissan e éle trique. Le prototype d'évolution est un représentant de la atégorie de y les qui ont une
évolution semblable en se limitant à la dimension de la puissan e éle trique.
Deux appro hes sont possibles dans e ontexte :
Les évolutions prototypes peuvent être utilisées an de faire une lassi ation d'un grand nombre de
y les de produ tion. S'il existe une orrélation entre l'évolution du pro essus et la onsommation,
ette lassi ation devrait faire émerger ette relation.
S'il y a relation, il serait possible de partir du prototype d'évolution, de favoriser les propositions
pour lesquelles les prototypes sous-ja ents remplissent le ritère posé.
Réaliser une appro he multivariable en séle tionnant les variables à partir desquelles une estimation
de onsommation est possible pour les ritères en question.
Dans la on lusion e sujet sera repris et quelques réexions et perspe tives seront élaborées.
Déjà maintenant une optimisation selon un ritère (l'énergie éle trique) serait possible en se basant
sur l'estimation de la onsommation de l'énergie éle trique pour les prototypes.
Toute opération d'optimisation d'un pro essus né essite une possibilité de retour sur le pro essus
en question. Sans pouvoir inuen er le pro essus analysé, une amélioration est impossible. Il faut don
fermer la bou le du ontrle.
4.2.5 Quand la bou le se ferme !
An de le formuler lairement, la méthode proposée se base sur des données d'un pro essus réel, et
toutes les analyses et méthodes ont été réalisées ave l'idée d'une réalisation sur le site. Cependant le
projet CECA s'est terminé avant qu'une implémentation sur le site de ProlARBED Es h-Belval n'ait
pu être réalisée.
Aujourd'hui l'opérateur se réfère à un atalogue de quelques onsignes qu'il est sensé utiliser, dépendant de diérentes onditions de l'installation. Ces onsignes dénissent des plages de la puissan e
éle trique pour un y le de produ tion omplet, en se basant sur l'énergie éle trique onsommée pour
reéter l'avan ement du pro essus.
En parallèle, l'opérateur a une onnaissan e propre et un modèle interne du omportement de l'installation. Il n'est pas possible de onduire l'installation en suivant stri tement la onsigne à ause d'un grand
113
Chapitre 4.
Un
ontrle prédi tif basé sur une aide à la dé ision
nombre d'événements inattendus et imprévisibles qui se produisent tout au long de l'évolution. L'opérateur se base alors sur son modèle interne pour réagir à es perturbations en manipulant les paramètres
de l'installation en vue de stabiliser le pro essus.
L'idée était de donner à l'opérateur une proposition de s énarios an de l'aider dans la tâ he de
minimiser les oûts de produ tion. Les informations qui étaient prévues pour ela sont : les q meilleures
propositions de l'évolution future du y le a tuellement en ours, les estimations de onsommations pour
es propositions, et éventuellement, basé sur le graphique global, un graphique sur lequel l'opérateur
pourrait suivre l'avan ement des lo alisations et propositions depuis le début du y le.
Sur base de es informations, l'opérateur pourrait dé ider de suivre l'une ou l'autre proposition.
Comparé à la onsigne s hématisée et xe dont dispose l'opérateur aujourd'hui, le s énario proposé est
une onsigne qui s'adapte et évolue ave l'évolution du y le de produ tion. De plus, l'estimation de
la onsommation ainsi que le suivi du pro essus global pourraient enri hir les informations qui existent
aujourd'hui.
Tel que illustré dans le s héma de l'appro he de ontrle prédi tif (voir g.1.9) 'est l'opérateur qui
est prévu pour fermer la bou le de ontrle en agissant sur les paramètres an de suivre la proposition
retenue.
4.3 Con lusion du hapitre
Dans e hapitre la phase de ontrle en ligne a été développée. Elle se base sur la lassi ation nonsupervisée des évolutions du pro essus réalisée dans le hapitre 3. An de pouvoir faire une proposition
de s énarios qui est en adéquation ave l'avan ement du y le de produ tion, il est né essaire de trouver
les prototypes d'évolutions, dont le début est similaire à elui du y le en ours. Il faut pour ela pouvoir
lo aliser une sous-séquen e (la partie onnue du y le en ours) dans une séquen e (le prototype qui
représente un y le de produ tion omplet) en se basant sur la similarité.
L'appro he qui a été développée repose sur la méthode déjà utilisée pour la lassi ation nonsupervisée basée sur la similarité, à savoir la méthode DTW. Puisque pour les deux séquen es le début
du y le est ommun, la lo alisation est bornée de e té (DTW-LB).
Étant donné que la subje tivité de la similarité joue un rle et que la lo alisation se base seulement
sur une partie d'une évolution omplète, plusieurs s énarios sont possibles. Cela a été pris en ompte par
le fait de pouvoir spé ier le nombre de lo alisations DTW-LB qui va être al ulé et desquelles résulte le
même nombre de propositions.
Puisque une implémentation de l'appro he sur le site de produ tion n'était pas réalisable dans le adre
du projet CECA, une validation de l'appro he globale a été impossible. Cependant, sur base d'exemples,
il a été possible de démontrer en partie le potentiel de la méthode dans le domaine de la exibilité
d'adaptation et relatif à une estimation d'optimisation de la onsommation en énergie éle trique.
Il aurait naturellement été intéressant de voir omment le pro essus réel, voire l'opérateur sur site,
réagit sur les propositions issues des prototypes d'évolutions, qui sont réés par une appro he de fouille
de données temporelles ave des données provenant de l'installation en se basant sur une méthode nonsupervisée d'extra tion de onnaissan es. De plus il serait intéressant de onnaître le potentiel réel d'optimisation par une telle appro he une fois que la bou le serait fermée.
Cependant, puisque l'étude frle le domaine de la s ien e ognitive, il est toujours possible que la
bou le se ferme sur un autre niveau : ar dans le adre de ette étude, diérentes analyses ont été
réalisées sur base des données du pro essus. Cela a réé des onnaissan es supplémentaires qui peuvent
inuen er les réexions que se feront les personnes qui ont parti ipé au projet. Du point de vue d'une
appro he de la s ien e ognitive la bou le est fermée par e biais. Cependant, le temps de réponse d'un
tel système ognitif sur la onsommation du pro essus de produ tion ontient un important potentiel
d'amélioration.
114
Chapitre 5
Con lusions et perspe tives
Les travaux de re her he présentés dans ette thèse tournent autour de trois sujets majeurs : la fouille
de données temporelles, la similarité et les appro hes onnexionnistes dans le domaine de l'extra tion
de onnaissan es par la lassi ation non-supervisée. Les re her hes étaient réalisées dans le adre d'un
projet de re her he CECA réunissant plusieurs partenaires autour d'une même problématique, ha un
ave une appro he propre à lui. Un pro essus réel, à savoir un four à ar éle trique, qui est un élément de
la haîne de produ tion de l'a ier, a fourni le ontexte appli atif de e travail. Suite à e adre projet, une
ertaine optique a orienté les démar hes de e travail de thèse vers le sujet d'extra tion de onnaissan es
et les méthodes onnexionnistes. C'est le ontexte de l'appli ation industrielle qui a fait émerger deux
hypothèses qui ont guidé tous les travaux de re her he.
La première hypothèse se base sur des observations du pro essus et des dis ussions ave les experts de
l'installation industrielle. Elle onsiste dans l'armation qu'il existe une relation entre la onsommation
globale du pro essus et l'évolution temporelle ave laquelle le pro essus est alimenté en énergie. Même
si ette hypothèse a été dressée dans le adre de e projet spé ique, il est légitime de supposer qu'elle
peut être valable pour un bon nombre de pro essus industriels, et qu'elle peut être étendue à d'autres
éléments que l'apport en énergie. Cette première hypothèse a fourni le but prin ipal de e travail dans le
domaine appli atif qui onsistait à développer une méthode prédi tive, an de guider l'opérateur dans la
onduite du pro essus tout en visant la rédu tion de la onsommation en énergie.
La deuxième hypothèse se base aussi sur les observations du pro essus et arme que, si la relation
de la première hypothèse existe, une ertaine souplesse dans l'analyse de l'évolution temporelle doit
être garantie, ar des événements peuvent être dé alés dans le temps, voire des phases avoir des durées
variables, sans que pour autant ela ait un impa t important sur le omportement global du pro essus.
Cela a mené vers les domaines de la similarité et des séries temporelles, deux sujets de re her hes à
part entière. Cher her la similarité de séries temporelles tout en gardant une souplesse dans l'alignement
temporel est un sujet de re her he ouvert. Dans e travail, le sujet a été abordé ave une orientation
onnexionniste, ave omme résultat une méthode de lassi ation non-supervisée de séries temporelles
de taille arbitraires, et une méthode de odage qui s'adapte de façon non-supervisée au signaux qui sont
analysés.
Revenons sur la première hypothèse et les résultats appli atifs issus de e travail. Durant tout e travail
il a été montré qu'il est possible de formuler une proposition de s énarios prédi tifs sur base d'analyses
des évolutions temporelles du pro essus. En outre, sur base d'une estimation de la onsommation en
énergie éle trique des s énarios proposés, un premier moyen est présenté, qui est utilisable an de guider
l'opérateur dans le hoix du s énario en vue de réduire la onsommation globale du pro essus. Dans
la dernière partie du travail, quelques y les de produ tion exemplaires mettent en éviden e de façon
qualitative le potentiel d'optimisation de l'appro he. D'autres exemples traités durant les analyses, qui ne
sont pas exposés dans e manus rit, onrment e potentiel. De plus, il a été montré dans un des exemples
qu'un autre ritère, notamment la température de oulée, qui n'est pas expli itement représentée par le
signal analysé, aurait pu être amélioré. Cela souligne la relation qui existe entre l'évolution temporelle
du y le de produ tion et les ritères d'optimisation.
Cependant une réelle preuve de la première hypothèse n'a pas pu être établie, par e qu'une implémen115
Chapitre 5.
Con lusions et perspe tives
tation de l'appro he sur le site de produ tion n'était pas réalisable dans le adre du projet de re her he
CECA. Même si diérents y les analysés onrment l'hypothèse, seul le ontexte du pro essus réel ave
la fermeture de la bou le par l'opérateur peut démontrer la réelle inuen e de l'appro he sur le pro essus,
et en apporter la preuve.
Con luons qu'il existe des indi es réels qui reètent la relation entre l'évolution temporelle et la
onsommation globale et qu'une appro he basée sur l'analyse de ette évolution a le potentiel de produire
des propositions d'évolutions qui peuvent améliorer la onsommation globale. Sans oublier que ette
relation est basée sur des onnaissan es des experts de l'installation.
Ces résultats du domaine de l'appli ation industrielle ne sont pas les seuls résultats des travaux réalisés
dans le adre de ette thèse. Car avant de pouvoir faire une proposition de s énarios, diérents sujets
ont dû être résolus. Tout d'abord une lo alisation de sous-séquen es temporelles est né essaire. An de
réaliser une lo alisation qui tient ompte des propriétés du domaine temporel, une méthode a été mise
au point, qui repose sur une mesure de similarité. La méthode de lo alisation a été appelée lo alisation
DTW-LB, par e que : premièrement la distan e DTW a été utilisée omme mesure de similarité, et
deuxièmement la lo alisation est bornée d'un té (du té gau he qui représente le début des séquen es
left bounded). Cette lo alisation DTW-LB permet une lassi ation d'un y le de produ tion dès le
début de son évolution. Ce sont l'attribution à un sous-ensemble de lasses d'évolutions, la lo alisation
DTW-LB et le prototype d'évolution des lasses, qui permettent l'établissement d'une proposition de
s énarios.
Cette lo alisation DTW-LB a la propriété de trouver la partie d'une séquen e qui ressemble le plus
à une sous-séquen e donnée, tout en garantissant une souplesse dans l'alignement temporel. Elle a été
développée dans le ontexte de e travail, analysée sur des données arti ielles et appliquée aux données
de l'installation. Cependant elle peut être utilisée pour toutes sortes de séquen es, temporelles ou autres,
pour lesquelles une souplesse de l'alignement peut être intéressante. Bien entendu d'autres méthodes ave
des propriétés similaires existent, et il serait intéressant de les omparer à la lo alisation DTW-LB.
Cependant, en général les méthodes de lo alisation ne sont pas bornées, e qui est une propriété qui n'est
pour l'instant pas ouverte par la méthode proposée. Mais il est fortement probable que la ondition
LB (left bounded) qui a été utilisée et qui est indisponsable dans le ontexte de e travail, peut être
surmontée.
Un autre sujet qui a dû être résolu, an de pouvoir réaliser une proposition de s énarios, est l'établissement des lasses et prototypes d'évolutions, sur lesquels reposent la lo alisation DTW-LB et nalement
la proposition de s énarios. Dans la se tion 3.3 de ette thèse, un lassi ateur non-supervisé, qui est
basé sur une mesure de similarité, et qui est apable de traiter des séquen es de taille arbitraire, a été
développé. La mesure de similarité utilisée est la distan e DTW, et elle réalise un alignement souple, qui
est apable d'a omplir des ompressions et étirements non-linéaires sur l'axe des temps. L'introdu tion
de paramètres assure que ette mesure peut être adaptée à la subje tivité qui est liée à la similarité et
aux domaines d'appli ations.
La lassi ation non-supervisée utilise une appro he basée sur des prototypes. Les prototypes initiaux utilisés pour l'apprentissage non-supervisé jouent, omme pour la plupart des appro hes basées sur
des prototypes, un rle important. Durant la phase d'apprentissage, les prototypes sont modiés, an
de représenter au mieux les lasses d'évolutions qui existent dans le orpus d'apprentissage. Cependant
l'implémentation de ette modi ation est a tuellement limitée à l'ajustement des amplitudes. La taille,
.-à-d. la longueur des prototypes, e qui représente la durée d'un y le de produ tion, reste in hangée. Cela né essite une initialisation représentative qui dépend des évolutions ontenues dans le orpus
d'apprentissage, même si l'alignement souple sur l'axe des temps ompense et impa t.
Un apprentissage non-supervisé de la taille des prototypes, en même temps que sa forme, serait
intéressant, an d'améliorer la représentation d'une lasse par son prototype, puisque en général les
lasses produites par ette méthode ontiennent ha une des séquen es de diverses tailles.
L'implémentation a tuelle de l'apprentissage des prototypes se base sur un algorithme de mappage
onstruit sur le al ul DTW, an de ramener les séquen es d'évolutions dans l'espa e du prototype. Ce
mappage est réalisé de manière pragmatique, et onsiste à ouper (enlever) les parties qui sont omprimées,
et à dédoubler une valeur existante pour l'étirement. Une appro he plus souple, qui analyse plus en détail
la partie omprimée, respe tivement le voisinage de la partie étirée serait envisageable. Une telle démar he
ouvrirait à première vue deux perspe tives : une première dans la souplesse de l'intervention réalisée, et
116
une deuxième qui résulterait dans la possibilité de réer un espa e intermédiaire entre prototype et
séquen es mappées ave la possibilité d'adapter la taille des prototypes durant l'apprentissage.
Une fois que les séquen es qui sont attribuées à une lasse sont mappées vers l'espa e du prototype,
la modi ation de e dernier est réalisée selon une appro he similaire à l'algorithme des K -means respe tivement des entres mobiles. De nouveau il s'agit d'une réalisation préliminaire de la lassi ation
non-supervisée, dans l'optique d'utiliser des méthodes onnexionnistes dans le futur. Il est fa ilement
imaginable d'étendre la méthode implémentée, en utilisant des appro hes de onstru tion dynamiques
de réseaux omme le Growing Neural Gaz ou des appro hes de artographies omme les artes autoorganisatri es SOM, e qui pourrait apporter des avantages dans le domaine de la onvergen e, ou
réaliser une topologie des prototypes, respe tivement adapter de façon non-supervisée le nombre de prototypes qui sont utilisés pour représenter au mieux la diversité du orpus analysé.
Notons en ore que ette lassi ation non-supervisée représente un moyen d'indexation des y les de
produ tion sur base de leur l'évolution temporelle. Cette propriété n'est pas puisée dans le adre de e
travail, mais pourait fa iliter la re her he de y les similaires en vue d'analyses et de re her hes futures.
Ces méthodes de lassi ation non-supervisée et de lassi ation en ligne utilisant la lo alisation de
sous-séquen es, se basent sur le al ul du DTW dont le temps de al ul est d'ordre O(n2 ) par rapport à
la taille des séquen es. Cette propriété a onduit vers un autre domaine dans le traitement des données
temporelles, notamment la rédu tion du volume de données. Dans la se tion 3.2 une méthode nonsupervisée de odage est proposée. Elle se base sur une forme de odage bien onnue, l'approximation par
parties onstantes (PAA), à laquelle est ajoutée une omposante de forme, qui est extraite de manière
non-supervisée du signal analysé. Ce odage a été appelé PPA (approximation par parties de formes).
Une parti ularité de e odage est que les odages PAA et PLA, qui utilisent des parties onstantes
respe tivement linéaires pour l'approximation, y sont intégrés. Un dé it de ette étude est l'absen e
d'une omparaison fondée de e odage ave d'autres types de odage, mais la diversité de sujets abordés
s'opposait à ette démar he.
Con ernant es types de odage utilisant des se tions de taille onstante, une variante intéressante a
ré emment été proposée (APCA) [33℄, qui onsiste à utiliser des se tions de taille variable, et qui de e
fait adapte la pré ision du odage à la omplexité du signal. Cela semble une appro he parti ulièrement
intéressante, et une première démar he pour le odage PPA pourrait être réalisée sans trop de modi ations, en autorisant l'utilisation de formes issues de diérents alphabets dans la phase d'en odage.
Cela produirait en même temps une appro he on urrentielle entre les formes des alphabets, et pourrait
éventuellement être utilisé en tant que validation du odage an de produire un alphabet global qui
ontiendrait des formes de diérentes tailles. Une autre appro he pourrait s'inspirer de la réalisation qui
est utilisée dans APCA, à savoir la fusion onsé utive des plages voisines, qui minimise l'augmentation
de l'erreur d'approximation. Une méthode pour réer la forme primitive d'une plage fusionnée devrait
être réalisée.
Toujours dans le ontexte du odage, la réalisation d'une appro he multivariable a été évoquée plusieurs fois déjà. Tous les outils utilisés pour le odage se basent sur des méthodes qui ont le potentiel
né essaire pour ette extension. Il surait, sans vouloir avan er que ela serait trivial, de réaliser une gestion du ode (triplet) pour le as multivariable, et d'adapter le al ul de distan e lo ale dans l'algorithme
DTW, an d'étendre le odage à une appro he multivariable.
Il faut, dans un adre plus global de l'appro he proposée, rappeler que la méthode de lassi ation
non-supervisée d'évolutions temporelles repose sur des exemples (des observations, des mesures). Dans
le ontexte du pro essus industriel ela mène à la on lusion, que seuls les y les de produ tion qui
ont réellement été réalisés et qui sont sto kés dans la base de données peuvent être pris en ompte pour
l'extra tion de prototypes d'évolutions. En théorie, e i veut dire que l'optimisation maximale qui pourrait
être espérée, serait la produ tion onstante du meilleur résultat produit dans le passé (voir g. 1.8). Il ne
sera don pas possible, en se basant sur ette méthode, de trouver une évolution innovatri e qui pourra
baisser la onsommation en-dessous de e meilleur résultat. Cependant la nouvelle onnaissan e et la
relation entre évolution et onsommation pourra aider les experts dans leurs analyses et fournir un moyen
pour faire des extrapolations en vue de trouver de nouveaux s énarios.
Notez aussi qu'i i l'évolution du pro essus a été attribuée au signal de la puissan e éle trique. Une
question qui a été soulevée par les experts de ProlARBED Re her he durant la réalisation manuelle de
la atégorisation de y les est : Qu'est- e qui dénit le omportement d'un pro essus ? Pour les experts il
117
Chapitre 5.
Con lusions et perspe tives
est lair qu'un seul signal ne peut pas représenter la omplexité du omportement de toute l'installation.
Cependant, ombien de signaux faut-il prendre en ompte pour bien représenter une évolution temporelle,
et quels sont les signaux les plus pertinents an de représenter le omportement, tout en minimisant
le nombre de données à traiter ? De quelle manière une validation du omportement représentée par
es signaux pourrait-elle être réalisée ? Des questions qui ouvrent un espa e pour d'autres projets de
re her he.
Dire tement ra ordée aux questions pré édentes est la problématique qui a déjà été soulevée : omment et ave quels ritères une optimisation globale des alphabets (taille et nombre de formes), des
prototypes de la lassi ation (nombre et taille de prototypes) et des paramètres de la distan e DTW
(pénalité) est-elle réalisable ? Une appro he pourra être l'in orporation des méthodes dynamiques dans la
onstru tion du lassi ateur non-supervisé tel que "Growing Neural Gaz" ou "Growing Grid" e qui ont
déjà été évoquées auparavant. L'optimisation est un domaine vaste et de nombreuses méthodes existent
aussi pour des as très omplexes. Il est don envisageable que pour es questions des solutions peuvent
être trouvées.
Globalement e travail de thèse a produit diérents outils plus ou moins génériques et utilisables dans
le domaine du traitement de données temporelles et appli ables pour l'extra tion de onnaissan es de
telles données, tout en tenant ompte du fait que les phénomènes temporels ne sont pas rigides et qu'une
ertaine souplesse dans es démar hes est une propriété non négligeable. La somme de es outils a permis
une réation de onnaissan es en forme d'évolution type pour les y les de produ tions qui jusqu'à présent
n'ont pas en ore été analysés de ette façon.
Dans le adre d'un projet de re her he appliquée, le CRP Henri Tudor va essayer d'utiliser ette
appro he d'extra tion de onnaissan es et de prédi tion dans un tout autre domaine que elui analysé i i.
Il s'agit d'analyser le omportement d'une station d'épuration d'eaux usées qui représente un pro essus
ontinu. Pour de telles installations, il est important de pouvoir prévoir le omportement de la station
et de son environnement. Cela pourra se faire sur base de mesures du omportement du pro essus en
dénissant des y les naturels omme la journée, la semaine et . Dans e ontexte l'extention multivariable
est onsidérée omme un des travaux les plus importants, et elle sera probablement réalisée durant e
projet.
Cette étude a abordé deux sujets omplexes, à savoir la similarité et le traitement du temps dans le
onnexionnisme. Quelques outils ont été développés an de résoudre les demandes et questions qui se
sont posées durant e travail. Même si de part et d'autres des implémentations sont loin ou ne frlent que
légerement le domaine du onnexionnisme, es travaux ouvrent la possibilité d'une in orporation dans des
appro hes de e domaine. Ave e travail de nouvelles questions se sont posées. Pour quelques-unes, des
premières pistes ont pu être proposées, et il est probable que de premières démar hes vont être réalisées
dans le adre des projets futurs, tandis que d'autres seront rendues à la ommunauté s ientique.
118
Annexe A
Détails te hniques du système
d'a quisition et de gestion de données
Dans ette annexe sont regroupés les détails te hniques du système d'a quisition mis en pla e sur le
site de ProlARBED Es h-Belval ave les détails on ernant la gestion de données du té CRP Henri
Tudor.
A.1 Système d'a quisition sur site
L'expérien e que ProlARBED Re her he a faite ave l'implémentation de systèmes d'a quisition sur
d'autres sites a onduit à un système basé sur une plate-forme de type PC industriel (Pentium III sous
Mi rosoft Windows NT 4) utilisant le réseau Ethernet Industriel 14 qui était déjà en pla e sur le site de
ProlARBED Es h-Belval.
Les signaux de tous les apteurs sont ré upérés et digitalisés par une infrastru ture de bas niveau
représentée par des automates programmables, en l'o urren e essentiellement des systèmes S5 et S7 de
Siemens. La ommuni ation entre l'ordinateur du système d'a quisition et les automates programmables
est réalisée à l'aide d'une arte de ommuni ation (PCI2000ETH) de la rme Appli omr. Cette arte,
équipée de son propre pro esseur, garantit d'un té le transfert de données via Ethernet Industriel à
partir des automates programmables. De l'autre té la ommuni ation ave les appli ations du système
d'a quisition est réalisée sur la base d'un serveur OPC Appli omr utilisant l'API a tiveX Appli omr.
Les appli ations du système d'a quisition réalisé par ProlARBED Re her he se basent sur l'environnement professionnel INPRISE Borland Delphi 5.
Les données de type statique sont gérées dans un SGBD SyBase sur un système VAX. L'a ès à
ette base de données passe par des requêtes SQL et l'interfa e standard ODBC. Le logi iel utilisé hez
ProlARBED est MS-A ess.
Le SGBD SyBase ontient aussi une partie de données de type y lique. L'é hantillonnage se fait dans
e as ave un intervalle de trois se ondes mais les données ne sont gardées que pendant une ourte durée
an de limiter les ressour es né essaires.
A.2 Gestion de données
A.2.1 Gestion primaire
Sur le système d'a quisition sur le site de produ tion les données sont sto kées dans des hiers
ASCII dans un format similaire au standard CSV (Comma Separated Value). Les valeurs sont ependant
délimitées par tabulateurs e qui est le type utilisé par défaut dans le logi iel MS-Ex el. Pour des raisons
de gestion et de manipulation de hier, quatre hiers sont réés par jour ontenant six heures de données
14 Nouveau
nom du système de ommuni ation de Siemens onnu sous l'an ien nom SINEC H1
119
Annexe A. Détails te hniques du système d'a quisition et de gestion de données
ha un. Ces hiers sont omprimés an d'augmenter la apa ité de sto kage sur le système d'a quisition
et pour a élérer le transfert des hiers par le réseau informatique.
Parallèlement d'autres types de hiers sont réés an de simplier l'a ès et de fa iliter l'utilisation
aux données pour des analyses de diérents niveaux qui sont réalisées par les diérents a teurs humains.
On y trouve des hiers qui ne gardent que les données quand l'installation est sous puissan e, ou des
informations de bilans par harge pour n'en iter que quelques-uns. Pour e projet es hiers ne jouent
qu'un rle se ondaire.
Ave l'avan ement du projet et pour diverses raisons, d'autres formes de mise à disposition des données
ont été adoptées, notamment la gestion d'un ertain nombre de données par un système de gestion de
base de données (SGBD) installé sur le système d'a quisition. Le serveur MySQL pour la plate-forme
MS-Windows est utilisé et tourne sur le système d'a quisition.
Une des raisons était la exibilité d'a ès aux données produites par les analyses réalisés sur le système
d'a quisition. Entre autres la visualisation en ligne de résultats de es analyses sur les postes de travail
des opérateurs dans la salle de ontrle est réalisée en utilisant et a ès.
Une autre raison était la né essité de dé oupler le pro essus d'a quisition du maniement de données du
pro essus de traitement et de l'analyse de données qui oexistent sur le même système. Pour ette raison
la base de données omporte un ve teur omplet de données y liques, brutes et al ulées, qui est mis
à jour par intervalle d'é hantillonnage. Ainsi toutes les appro hes d'analyses ont la possibilité d'a éder
aux variables y liques du pro essus de façon autonome et asyn hrone. Grâ e à la stru ture lient/serveur
du SGBD et dû à la possibilité d'un a ès par réseau, il est possible de distribuer les pro essus d'analyse
ou en ore de tester des nouvelles méthodes à distan e à partir d'un poste de travail dans les bureaux de
ProlARBED Re her he.
A.2.2 Gestion se ondaire
Du té de la gestion se ondaire, .-à-d. la gestion des données au niveaux du CRP Henri Tudor
les données numériques provenant de l'installation sont opiées périodiquement sur un disque portable
(JAZ-Drive 2GB) et sauvegardées sur un Poste de travail au CRP Henri Tudor. Au début du projet
ave des périodes plus ou moins régulières de deux semaines et ensuite dans des intervalles de quatre
semaines. Finalement le transfert a été arrêté quand il a été jugé que la taille du orpus d'exemples était
susamment grand. En parallèle, les données manuelles sont photo opiées et organisées dans un lasseur
an de pouvoir vérier et valider des omportements spé iaux déte tés par des analyses.
An de mettre les données à disposition pour les diverses analyses, un SGBD MySQL est utilisé. Le
tableau A.1 résume les données umulées pendant la période du premier dé embre 2000 au sept juillet
2001.
Nom de la
base de données
B001_BPC_40_100
Nom du
tableau
Nombre
lignes
Taille Données
[MB℄
Cal data_tbl
1478820
998,2
Cy li data_tbl 1478820
2122,1
Duree_fe_tbl
1332
0,6
Temp_fe_tbl
1332
0,2
B001_BPC_40_101
Cal data_tbl
1819911
1257,6
(17.03.2001 07.07.2001)
Cy li data_tbl 1820112
2611,9
Duree_fe_tbl
1309
0,6
Temp_fe_tbl
1309
0,2
Tab. A.1 Résumé de la base de données des données y liques
(01.12.2000 15.03.2001)
Taille Index
[MB℄
35,1
35,1
0,03
0,03
43
43,1
0,03
0,03
Il a été essayé d'adopter une nomen lature utilisée par une des équipes de re her he du Centre dans le
ontexte du développement de logi iels. Cependant une extension de ette dernière était né essaire puisque
les bases de données n'y étaient pas spé iées. La nomen lature spé ie, de gau he à droite : un identiant
du projet (B001), un a ronyme du ontenu (BPC : données provenant du système d'a quisition), un
identiant du type de format (40 : BD MySQL) et un numéro de version.
120
A.2.
Gestion de données
En raison de la taille de la base de données et par e que diérentes adaptations étaient faites au
système d'a quisitions on ernant les données y liques, deux versions de ette base de données ont été
né essaires.
An de ontrler l'a ès aux données spé iques du projet, deux types d'utilisateurs ont été réés : un
utilisateur le teur ave un droit d'a ès restreint à la le ture sur les bases du projet, et un utilisateur
administrateur ave le droit d'ajouter, de modier ou de supprimer des bases de données, des tableaux
ou des données dans les tableaux.
Con ernant les proto oles de ommuni ations les deux types de méthodes, a ès dire t au SGBD par
l'API et l'a ès par proto ole standardisé, ont été utilisées :
L'insertion des données ASCII provenant de la gestion primaire dans la base de données est réalisée
en utilisant les outils de base MySQL qui reposent sur l'API MySQL.
Tous les programmes d'analyse reposent sur la plate-forme de développement MATLAB. Entre
autres le développement de la onnexion ave des SGBD repose sur la toolbox spé ique qui ontient
les outils pour l'a ès aux bases de données. Cette boite à outils est ompatible ave le proto ole
standard ODBC et ave la variante plus ré ente JAVA appelée JDBC. Pour des raisons pratiques
seule la passerelle ODBC a été utilisée.
121
Annexe A. Détails te hniques du système d'a quisition et de gestion de données
122
Annexe B
Analyse de l'apprentissage d'une SOM
Les artes auto-organisatri es sont généralement utilisées pour réer de façon non-supervisée une
artographie deux voire trois dimensionnelle d'observations de dimensions plus élevées. La méthode essaye
de respe ter la topologie multidimensionnelle .-à-d. les relations de proximités des observations qui
existent dans l'espa e d'origine. La méthode qui est utilisée repose sur une relation de voisinage entre les
unités de la arte auto-organisatri e ( hap.2.2.2.5).
Dans le ontexte de la réation des alphabets pour le odage les artes auto-organisatri es sont utilisées
pour l'extra tion des formes primitives. Le but n'est don pas dire tement la réation d'une artographie
mais l'extra tion des formes représentatives. Les paramètres lassiques pour l'apprentissage d'une arte
SOM ne sont pas appropriés pour ette tâ he. Un exemple arti iel utilisant un orpus de formes dans
l'espa e R2 représenter par un ve teur de deux dimensions ~x = [x1 , x2 ] va illustrer la problématique.
(a)
(b)
B.1 Représentation du orpus arti iel ave ses quatre lasses de formes 2D
(a) Le orpus est représenté dans l'espa e des signaux
(b) Le même orpus dans l'espa e des variables ( haque point représente une forme 2D)
La gure B.1 montre le orpus arti iel. Il est omposé de quatre lasses (Forme 1 - Forme 4), ha une
omprenant des ve teurs ~x ∈ R2 qui représentent des lignes à deux points. L'exemple en deux dimensions
peut être vu omme une extra tion de formes primitives de taille G = 2 où le nombre de lasses est onnu
(C = 4). De plus le orpus arti iel est réé de façon à e que les lasses soient bien séparées (g. B.1(b)).
Les entres des lasses sont à C1 = [2, 1.5], C2 = [8, 8], C3 = [5.5, 3], C4 = [5, 10]. Notez que le
nombre d'individus dans les lasses n'est pas uniforme (N1 = 10, N2 = 12, N3 = N4 = 20) ; par ontre
la distribution intra- lasse est plus ou moins la même ar elle est réalisée de façon aléatoire ave une
varian e de ±1.
Une appro he lassique dans le ontexte des artes auto-organisatri es est la réalisation d'une artographie 2D du orpus de l'exemple arti iel. Le résultat d'une telle artographie, utilisant une arte à
Fig.
123
Annexe B.
Analyse de l'apprentissage d'une SOM
8x21 = 168 unités sur la arte, est illustré dans la gure B.2. Notez que l'exemple représente un as de
gures spé ial où la dimension des entrées (formes 2D) est la même que elle de la topologie de la arte
(2D 8x21).
Fig.
B.2 Cartographie 2D du orpus arti iel utilisant une SOM
La gure montre une première arte (U-matrix) qui représente les distan es entre les unités de la arte.
Les parties plus laires indiquent des frontières de séparations (ave des distan es plus importantes) entre
des zones de la arte. Les deux autres artes représentent la distribution des valeurs de ha une des deux
variables sur la arte.
Les quatre lasses sont lairement visibles (U-matrix) et il est possible d'attribuer haque forme à une
des zones de la arte. Par exemple : la forme 1 en haut à droite sur la arte et la forme 3 en haut à
gau he.
Dans et exemple une arte à 168 unités pour un orpus de 62 exemples a été apprise. Il est don
lair que ette arte est sur-dimensionnée pour le problème, mais la propriété de voisinage entre les unités
de la arte produit des ontraintes suplémentaires et de e fait rend ette artographie quand-même
représentative pour les observations.
Cependant dans l'extra tion des formes primitives le but est d'extraire du orpus un nombre réduit
de prototypes représentatifs (formes ara téristiques) qui ne sont pas onnus au préalable. En résumé on
peut dire que non seulement les formes ara téristiques sont à extraire, mais aussi le nombre de prototypes
qui représentent au mieux le orpus analysé n'est pas onnu. Ce sujet est dis uté dans l'annexe C.
Dans ette annexe le nombre de lasses dans le orpus est onnu et il s'agit d'utiliser l'algorithme SOM
an d'extraire les prototypes des lasses. Pour ela noter que haque unité de la arte représente un point
dans l'espa e des entrées, et de ette manière les unités bien pla ées au entre d'une lasse représentent
un prototype de ette lasse.
Le nombre élevé d'unités de la arte rend di ile la séle tion d'un prototype pour ha une des zones
de la arte. De plus, ave le nombre d'unités de la SOM le temps de al ul pour la phase d'apprentissage
augmente. L'idée est d'utiliser une arte ave un nombre réduit d'unités. De plus il est envisageable de
réduire la SOM à une seule dimension. La arte se réduit alors à une ligne d'unités qui sont onne tées
ha un seulement aux deux voisins dire ts (sauf pour les deux unités du début et de la n de la ligne
seulement un voisin dire t existe).
La gure B.3 montre la position des unités après apprentissage de inq artes unidimensionnelles de
taille variée (Nombre d'unités entre 2 et 6). Les lignes qui relient les unités représentent les onnexions
entre les unités de la SOM. Cela donne une information sur la topologie des artes unidimensionnelles.
Ave le nombre d'unités de la SOM, la représentation de la distribution du orpus arti iel s'améliore.
Cependant même ave six unités, deux de plus que de lasses dans le orpus, les unités ne sont pas
utilisables en temps que prototypes des lasses. Ce omportement s'explique ave la propriété de voisinage
(for es d'attra tion) entre les unités de la SOM. Le niveau de ette for e d'attra tion est paramétrisable
en inuençant la fon tion de voisinage utilisée.
Classiquement une forme gaussienne (voir g. 2.2(a)) est utilisée. Pour ette fon tion (éq. (2.15)) le
124
B.3 Résultat de l'apprentissage de inq SOM unidimensionnelles ave une variation du nombre
d'unités de 2 à 6.
Fig.
rayon d'inuen e r = σ ainsi que la distan e des unités au niveau de la arte d sont utilisés omme
paramètres. Pour une arte unidimensionnelle la distan e d est simplement la diéren e entre les index
des unités sur la arte. La gure B.4 représente ette inuen e pour diérents rayons.
Fig. B.4 Niveaux d'inuen e des unités de la arte en fon tion de leur distan e sur la arte et du
paramètre rayon d'inuen e
Dans le hapitre 2.2.2.5 la méthode d'apprentissage est détaillée (éq. (2.13)- (2.16)) et il y est expliqué que le rayon d'inuen e est diminué ave l'avan ement de l'apprentissage. I i le rayon nal de et
apprentissage est analysé.
Pour la gure B.3 un rayon de r = 1 (niveau par défaut) a été utilisé, e qui explique les attra tions
entre les unités de la SOM.
An d'analyser l'inuen e de e paramètre sur l'apprentissage de la SOM, une arte de quatre unités
est apprise ave diérents rayon d'inuen e. La gure B.5 montre le positionnement après apprentissage
des quatre unités en fon tion de e rayon.
Il est lairement visible que en diminuant le rayon, les unités se positionnent de plus en plus vers le
entre des lasses. La position des unités de la SOM pour (r = 0.25) est quasi au entre de ha une des
quatre lasses.
An de omparer le résultat ave elui obtenu pour les inq SOM de taille diérente (g.B.3) le même
al ul est réalisé pour un rayon nal r = 0.25. La gure B.6 montre les positions des unités de es inq
125
Annexe B.
Analyse de l'apprentissage d'une SOM
B.5 Évolution des positions des prototypes (formes primitives) ave le paramètre de voisinage de
la SOM
Fig.
SOM unidimensionnelles (g. B.3) après l'apprentissage.
Fig.
B.6 Résultat de inq SOM ave une variation du nombre d'unités de 2 à 6, ave un faible voisinage
Cette fois- i les unités se positionnent bien dans les entres des regroupements. Même pour trois unités
deux lasses sont bien représentées. De plus la relation entre les unités n'est pas perdue, les lignes entre
les unités représentent ette relation.
L'information de artographie n'est pas omplètement perdue ar il est visible que les positions des
unités sont inuen ées par la taille et la distan e entre les regroupements.
Pour le as de deux unités les positions sont plus près des lasses ave un nombre élevé d'individus
(C3 , C4 ).
Pour le as de trois lasses les lasses les plus pro hes (C2 , C4 ) sont lo alisées et la troisième unité
se trouve entre les deux autres mais, plus pro he de elle ave le plus grand nombre d'individus.
Pour le as de inq et six lasses (une ou deux unités de plus que né essaire) les unités libres sont
positionnées entre deux lasses reliées topologiquement. La position est inuen ée par la taille des
lasses et la distan e entre les lasses.
En utilisant une telle stratégie pour la onstru tion des SOMs ette méthode est utilisable pour
l'extra tion de formes ara téristiques ave le prototype qui est représenté par la position des unités.
126
Annexe C
Validation d'alphabets
Dans le hapitre 3.2.2 le sujet de l'extra tion de formes primitives dans le ontexte du odage PPA
est présenté. La méthode qui est présentée onsiste à extraire les formes les plus ara téristiques appelées
les formes primitives en se basant sur une lassi ation non-supervisée. Chaque méthode de lassi ation
non-supervisée appliquée à un orpus quel onque de formes arrive à produire un regroupement. Cependant
la qualité de la lassi ation résultante dépend de la méthode et des paramètres utilisés.
Dans ette étude les prototypes d'une lassi ation non-supervisée représentent un alphabet qui est
utilisé dans la phase d'en odage. Chaque réalisation d'une lassi ation produit un nouvel alphabet. Dans
l'étude une appro he multié helle est visée, e qui fait que les deux paramètres suivants sont indépendants
de la méthode de lassi ation utilisée :
la taille de la forme .-à-d. la taille de la fenêtre qui est utilisée pour extraire les formes. Ave
e paramètre la granularité de l'appro he multié helle est inuen ée, e qui inuen e le taux de
ompression du odage.
le nombre de formes qui vont être extraites. Ce paramètre inuen e le taux de ltrage réalisé
lo alement. Ave peu de formes une plus grande généralisation est réalisée, e qui implique en
même temps une plus grande perte de détails.
An de limiter le nombre d'alphabets qui est utilisé et de garantir en même temps une qualité d'approximation du odage, il s'agit de trouver les meilleures lassi ations dans l'espa e dressé par es deux
paramètres. En prin ipe il s'agit de trouver les A meilleurs alphabet pour le odage des signaux.
La méthode utilisée pour la réation des alphabets est une lassi ation non-supervisée. Des méthodes
sont analysées pour la validation de telles lassi ations. An d'expliquer et de visualiser la problématique,
la gure C.1 illustre un problème unidimensionnel basé sur une distribution d'observations de la variable
x.
Il s'agit de trouver le nombre de lasses qui représente au mieux ette distribution. Pour ela il est
important de dénir un indi ateur qui représente la qualité de la lassi ation. Dans un grand nombre de
as la qualité de la lassi ation est exprimée en analysant la ompa ité des lasses et la distan e entre les
lasses. Une lassi ation ave des lasses ompa tes et bien séparées les unes des autres est onsidérée
omme dis riminante.
De nombreuses analyses ont été faites sur e sujet. On donne i i seulement deux référen es qui re-
Fig.
C.1 Comportement d'une lassi ation selon le nombre de lasses.
127
Annexe C.
Validation d'alphabets
groupent un grand nombre de méthodes et te hniques utilisées dans e domaine [27℄, [18℄. Dans le ontexte
de e travail deux méthodes de validation de lassi ation ont été analysées et vont être détaillées dans
ette annexe. Il s'agit d'une méthode basée sur la varian e intra- lasse umulée et d'un index pour la
validation de lassi ations qui a été proposé par Davies et Bouldin [10℄.
Finalement les deux méthodes présentées sont appliquées à un orpus arti iel et au al ul des alphabets issus du odage adapté aux données proposé dans ette thèse.
C.1 La varian e intra- lasse umulée
Pour un orpus de données X il est possible de al uler la varian e intra- lasse umulée. Elle est
dénie par l'équation (C.1).
cvarIC (X ) =
X
(C.1)
varIC
C
varIC
est la varian e intra- lasse qui est dénie par :
(C.2)
Ave XC l'ensemble des données attribué à la lasse C . Pour la lassi ation on dénit que haque
données du orpus X ne peut être attribué à une seule lasse d'une lassi ation (C.3) :
varIC = var(XC )
ave XCi ∩ XCj = ∅
La varian e d'un ensemble X est dénie par :
X = ∪XC
var(X) =
X
X
∀i 6= j
(x − µ)2 P (x)
(C.3)
(C.4)
Dans les situations où la population n'est pas entièrement onnue, e qui veut dire que ni la moyenne
ni la probabilité P (x) ne sont onnues, on se limite généralement à une estimation de la varian e qui
se base sur une estimation de moyenne donnée par les exemples onnus. Cette estimation est dénie en
deux variantes : la variante biaisée (C.5) et la variante non-biaisée (C.6) (qui sera utilisée i i).
µ
1 X
(xi − x̄)2
N
(C.5)
1 X
(xi − x̄)2
N −1
(C.6)
s2 (X) =
X
s2 (X) =
X
Où x̄ est l'estimation de la moyenne de l'ensemble X qui elle est dénie par :
x̄ =
1 X
(xi )
N
(C.7)
X
Cette dénition de la varian e intra- lasse umulée est utilisable pour la validation de lassi ation
monovariable, ar la varian e (C.4) n'est dénie que dans et espa e.
Cependant dans le ontexte de la validation des alphabets utilisés pour le odage adapté, une méthode
multivariée est indispensable puisque une forme primitive a toujours une taille supérieure à un. De plus
la taille des formes primitives n'est pas xe à ause de l'appro he multié helle.
La varian e n'est ependant pas simplement extensible au as multivarié. Dans [51℄ la norme kΣk
de la matri e de ovarian e Σ est utilisée omme varian e généralisée. Puisque la population des lasses
n'est pas entièrement onnue une estimation de ette varian e généralisée est notée par kSk. Cette norme
représente la ompa ité d'un orpus de données multivariées.
Il est don né essaire d'é hanger la varIC dans (C.1) et (C.2) par kSIC k ave
128
C.2.
SIC

S11
 S21

= cov(XIC ) =  .
 ..
Sp1
où Sij est déni dans la variante non-biaisé
Sij
S12
S22
···
···
Sp2
···
..
.

S1p
S2p 
.. 
.
Spp
= cov(xi , xj )
1 X
=
((xi − x̄i )(xj − x¯j ))
N −1
X
"
#
X
1 X X
1
xi xj −
xi
xj
=
N −1
N
X
X
L'index de Davies et Bouldin
(C.8)
(C.9)
(C.10)
X
La varian e intra- lasse umulée devient don
cvarIC (X ) =
X
C
kSIC k
(C.11)
Pour un orpus X donné la varian e intra- lasse umulée diminue en augmentant le nombre de lasses.
Une stagnation de ette évolution indique que l'augmentation du nombre de lasses n'améliore pas pour
autant la dis rimination de la lassi ation. Le point juste avant une telle stagnation, voire le premier
point d'un tel plateau indique un nombre de lasses intéressant. L'observation d'importantes hutes de la
varian e intra- lasse umulée suivies d'une stagnation sont les points les plus importants dans l'évolution
de et indi ateur.
Il est ependant né essaire de dénir à partir de quand il est question d'une hute, respe tivement
d'une stagnation. Les deux paramètres sont dépendants de la nature du orpus et doivent être ajustés au
mieux par un expert du domaine qui est analysé (voir hap. C.4).
C.2 L'index de Davies et Bouldin
La deuxième méthode analysée i i était proposée par deux her heurs D.L Davies et D.W. Bouldin et
se base sur une mesure de la ompa ité des lasses en relation ave la distan e entre les prototypes des
lasses. L'index est déni par l'équation (C.12).
DB =
C
Sn (Xi ) + Sn (Xj )
1 X
max
C i=1 i6=j
S(Xi , Xj )
(C.12)
Ave C le nombre de lasses. Au numérateur Sn (XC ) est la distan e moyenne entre les éléments de
la lasse C et le prototype respe tif. Elle est déni par (C.13).
Sn (XC )2 =
1 X
kx − CC k2
NC
(C.13)
x∈Xc
Ave XC l'ensemble des éléments de la lasse C et NC le nombre d'éléments dans ette lasse.
Au dénominateur, ave S(Xi , Xj ), se trouve la distan e entre les prototypes des lasses i et j dénis
par (C.14).
S(Xi , Xj ) = kCi − Cj k
La distan e utilisée i i est la distan e eu lidienne (C.15)
kA − Bk2 =
X
k
(ak − bk )2
ave
A, B ∈ ℜk
(C.14)
(C.15)
129
Annexe C.
Validation d'alphabets
Fig.
C.2 Comportement des indi es de validation pour un exemple 1D
Une extension au as multivarié est don triviale. De plus une normalisation selon les dimensions est
réalisée par le rapport de la distan e moyenne intra- lasse sur la distan e des prototypes.
La méthode umule pour haque lasse i le maximum du rapport des moyennes des distan es intralasses ave la distan e entre les prototypes. Ce maximum est obtenu pour deux lasses pro hes dans
l'espa e ℜk et dont les étendues sont importantes, .-à-d. deux lasses qui sont di ilement séparables.
La méthode n'est utilisable que pour un nombre de lasses C >= 2.
En analysant diérentes lassi ations réalisées ave un nombre roissant de lasses, le minimum de
et indi ateur indique la réalisation qui ontient les lasses les plus ompa tes et les plus séparées les unes
des autres.
Cette méthode est utilisable s'il est possible de dénir un prototype d'une lasse. Pour toutes les
méthodes basées sur des prototypes ela ne pose pas de problèmes ; pour les autres il est né essaire de
dénir la méthode de al ul d'un prototype en se basant sur les membres d'une lasse.
C.3 Exemples arti iels
An d'illustrer le omportement des deux méthodes, deux exemples arti iels sont utilisés. An de
simplier la représentation graphique, un premier exemple unidimensionnel est proposé (voir g.C.1). Il
s'agit d'une distribution d'observations d'une seule dimension qui est représentée sur l'axe des x (g C.2).
Dans la gure C.2 deux axes sont représentés : l'axe supérieur montre l'évolution des deux indi es
ave le nombre de lasses, l'axe inférieur montre tout d'abord les observations selon l'axe des x (petits
er les bleus) et en-dessous les positions des prototypes des lasses pour les diérentes réalisations de
lassi ation. Du té gau he le nombre d'unités SOM utilisées sont données pour haque réalisation, et
à droite les valeurs des deux indi es de validation (varian e intra- lasse umulée / Index de Davies et
Bouldin) sont a hées. En-dessous du marqueur de haque prototype la valeur de la varian e intra- lasse
est a hée.
Les valeurs représentent quatre groupes plus ou moins ompa ts ave diérents nombres d'observations par groupe. La lassi ation non-supervisée est réalisée par une arte auto-organisatri e (SOM) en
utilisant la même méthode qui est utilisée pour l'extra tion des formes primitives, .-à-d la réation des
alphabets (voir annexe B pour plus de détails).
Pour la varian e intra- lasse umulée, la première stagnation dans l'évolution ommen e pour C = 4.
Les diminutions pour les valeurs de C > 4 ne sont que relativement faible. Cependant déjà le gain entre
130
C.4.
Fig.
Appli ation à la validation des alphabets
C.3 Comportement des indi es de validation pour un exemple 2D
la lassi ation réalisée ave C = 3 et C = 4 n'est plus très élevé.
En analysant l'index DB le minimum est réalisé pour C = 4, mais la diéren e de l'index DB entre
les réalisations C = 3 et C = 4 n'est que très faible.
Pour les deux indi ateurs de validation, la meilleure lassi ation est obtenue pour quatre lasses,
mais le résultat pour trois lasses est envisageable.
Un deuxième exemple de groupements de données dans l'espa e de deux dimensions (X1 et X2 ) est
représenté dans la gure C.3. Le al ul de la varian e intra- lasse umulé se base sur la norme de la
matri e de ovarian e.
Dans ette représentation les diérentes réalisations pour C = 2 jusqu'à C = 6 sont superposées.
Les ouleurs et symboles séparent les diérents prototypes qui, pour des auses de visibilité, sont reliés
entre eux par des lignes. En même temps es lignes représentent la relation des unités SOM sur la arte
unidimensionnelle (voir Annexe B). Dans la légende de la gure les valeurs des deux indi es de validation
(varian e intra- lasse umulée / Index de Davies et Bouldin) sont reprises.
Pour et exemple aussi les deux indi es indiquent que la meilleure lassi ation est produite pour
C = 4 et retrouvent don aussi le nombre de groupes qui existent dans le orpus de données.
C.4 Appli ation à la validation des alphabets
An d'appliquer es méthodes à la validation des alphabets, l'appro he suivante a été utilisée. Dans
la phase 1a (g 3.1) un grand nombre d'aplhabets est produit en variant les deux paramètres prin ipaux
de l'extra tion de formes primitives à savoir la taille de la forme (G) et le nombre de formes (C) dans un
alphabet. Une grille omplète de es deux paramètres est réalisée pour G allant de 6 à 60 par intervalle
de 6 et pour C de 3 à 30 par intervalle de 1. L'intervalle de la taille de formes était hoisi plus grand
an de limiter le temps de al ul et le volume de données à manipuler, ar depuis le début une appro he
multié helle était visée, e qui orrespond à une séle tion de plusieurs tailles. Le but de la validation est
double : d'abord il faut trouver les é helles qui semblent les plus pertinentes, et en même temps pour
es é helles trouver le nombre de formes qui représentent au mieux ette é helle. Pour la produ tion des
alphabets 50% des signaux du orpus ont été séle tionnés de façon aléatoire.
Dans la phase 1b (g 3.1) tous les signaux ont été en odés sur base de tous es alphabets. An d'éviter
que le orpus d'apprentissage ne soit utilisé pour la validation les autres 50%, des signaux ont été utilisés.
L'en odage représente une lassi ation dans le sens d'une attribution d'une partie de signal à une lasse
131
Annexe C.
Validation d'alphabets
.-à-d. une forme primitive d'un alphabet. Les informations de ette lassi ation sont utilisées pour la
validation.
A ause du nombre élevé de signaux respe tivement de parties des signaux qui sont attribués aux
formes primitives, un al ul de validation a posteriori tel qu'il était utilisé pour les exemples n'est pas
réalisable. Une méthode in rémentale pour le al ul des indi es de validation était né essaire.
An de pouvoir al uler les deux indi es de validation, les variables suivantes sont gérées pour haque
lasse de haque alphabet durant le odage :
1. Le nombre d'éléments attribué à la lasse. Pour haque élément attribué à une lasse ette variable
est in rémentée
NC (k) = NC (k − 1) + 1
2. Un ve teur ave la somme des éléments attribuées à une lasse
AC (k)[i] = AC (k − 1)[i] + xi ∀i ∈ Rp
3. Une matri e (symétrique) ave la somme des ombinaisons des éléments i, j attribués à une lasse
pour la matri e de ovarian e
BC (k)[i, j] = BC (k − 1)[i, j] + xi xj ∀i, j ∈ Rp
4. et la somme des distan es entre le prototype et l'élément attribué à une lasse
DC (k) = DC (k − 1) + kx − CC k2
Après le odage les indi es de validation sont al ulés de façon suivante en se basant sur les variables
NC , AC , BC et DC :
Sij , utilisé dans le
al ul de la varian e intra- lasse umulé (C.11), est al ulé par :
SCij
Sn(XC )
1
1
=
BC [i, j] −
AC [i]AC [j] ∀i, j ∈ Rp
NC − 1
NC
(C.16)
utilisé pour l'index de Davise et Bouldin (C.13) se al ule par :
r
DC
NC
(C.17)
Il est don possible de al uler pour haque alphabet orrespondant à une paire de paramètres (G,C),
ave G la taille de la forme primitive et C le nombre de formes dans l'alphabet, une valeur pour les deux
indi ateurs. Le résultat est représenté dans les gures C.4(a) et C.4(b).
Un premier onstat est que les omportements des deux indi es ne sont pas aussi ohérents que dans
les deux exemples 1D et 2D. Mais en globalité il est possible de dire que la plage des alphabets ave
G > 24 & C > 15 est inintéressante dans les deux as.
Con ernant l'index Davise-Bouldin, où les valeurs minimales représentent de bonnes lassi ations,
les alphabets ave G > 24 ont le minimum pour des nombres de lasses (C <= 7). Le meilleur alphabet,
elui qui représente le minimum global, orrespond aux paramètres G = 60 et C = 6. Aussi l'alphabet
ave G = 6 obtient de faibles valeurs pour et index. Pour ette é helle le nombre de lasses à prendre
en ompte est C = 12.
En analysant la varian e intra- lasse umulée, pour laquelle la pente et les positions de paliers lo aux
indiquent les alphabets intéressants, seulement pour G >= 48 les petits nombres de lasses C = 4 seraient
intéressants. Les alphabets les plus intéressants selon et indi ateur sont dans le domaine 18 <= G <= 24
et 4 <= C <= 8, ar les pentes y sont les plus importantes en omparaison ave les paliers qui suivent es
pentes. Analysons en ore l'é helle G = 6 an de omparer e résultat ave l'index Davise-Bouldin. Pour
C = 12 un petit palier peut être déte té si l'on se limite à l'axe du nombre de formes, e qui orrespond
au même alphabet indiqué par l'index Davise Bouldin.
Pour la suite de l'étude une séle tion de quatre alphabets a été dé idée. Il n'est ependant pas trivial,
en nous basant sur es indi ateurs, de lairement identier les alphabets les plus pertinents. Mais les
indi ateurs peuvent donner une orientation.
An de garantir une appro he multié helle, les quatre alphabets seront séle tionnés dans des é helles
diérentes. Un premier alphabet pour G = 6 & C = 12, où les deux indi ateurs semblent plus ou moins
ohérents. Un deuxième pour G = 24 & C = 5, qui est le plus intéressant selon la varian e intra- lasse
umulé. Un troisième à G = 42 & C = 6 et un dernier qui orrespond au minimum de l'index DaviseBouldin ave G = 60 & C = 6.
Sn (XC ) =
132
C.4.
Appli ation à la validation des alphabets
(a)
(b)
C.4 Résultat des al uls d'indi es de validation pour les 280 alphabets : (a) surfa e représentant
la varian e intra- lasse umulée (b) surfa e représentant l'index de Davise et Bouldin.
133
Fig.
Annexe C.
134
Validation d'alphabets
Table des gures
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
3.21
Stru ture générale d'une a iérie à ar éle trique . . . . . . . . . . . . . . . . . . . . . . . .
Vue détaillée du four . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L'intérieur de l'a iérie de Belval . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
S héma de l'installation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
S héma du système de refroidissement et du traitement des fumées . . . . . . . . . . . . .
Flux des données provenant de l'installation . . . . . . . . . . . . . . . . . . . . . . . . . .
Méthodes d'a ès aux données au CRP Henri Tudor . . . . . . . . . . . . . . . . . . . . .
Prin ipe et hypothèse an d'engendrer une baisse de onsommation. . . . . . . . . . . . .
Con ept du ontrle prédi tif en ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le odage et l'analyse du omportement du pro essus . . . . . . . . . . . . . . . . . . . .
Carte auto-organisatri e de Kohonen (SOM) 2D ave le ve teur d'entrée ξ~ = {x1 , · · · , xn }
et les ve teurs de référen e représentés par w~ k = {w1,k , · · · , wn,k } . . . . . . . . . . . . . .
L'adaptation des prototypes pour la SOM . . . . . . . . . . . . . . . . . . . . . . . . . . .
Représentation lassique d'un système . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stru ture du réseau TLFN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Deux types de réseaux ré urrents : Jordan et Elman . . . . . . . . . . . . . . . . . . . . .
Contrle par apprentissage supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le ontrle par modèle inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Contrle basé sur un modèle interne et un modèle inverse. . . . . . . . . . . . . . . . . . .
Première partie de l'analyse évolutive : le odage adapté aux signaux . . . . . . . . . . . .
Le signal arti iel utilisé pour la validation des méthodes. . . . . . . . . . . . . . . . . . .
Te hnique d'extra tion des formes primitives . . . . . . . . . . . . . . . . . . . . . . . . .
Prototype et membres de lasses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Méthode d'en odage des signaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Re onstru tion du signal arti iel après le odage. . . . . . . . . . . . . . . . . . . . . . .
Niveau de re onstru tion basé sur le odage . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemples des alphabets utilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analyse omment sont utilisées les formes d'un alphabet (A0) . . . . . . . . . . . . . . . .
Re onstru tion du signal et omparaison ave une appro he de moyenne ottante. . . . .
Analyse du omportement de l'erreur ave la taille de l'alphabet. . . . . . . . . . . . . . .
Partie du signal exemple re onstruit par A1 et A2 . . . . . . . . . . . . . . . . . . . . . .
Deuxième partie de l'analyse évolutive : regroupement des harges selon leur évolution. . .
Deux images similaires ou non ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Similarité entre trois séquen es simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Similarité entre deux séquen es simples de taille diérente . . . . . . . . . . . . . . . . . .
Similarité entre trois séquen es simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Deux séquen es simples pour expliquer la distan e DTW . . . . . . . . . . . . . . . . . . .
Cal ul de la matri e des distan es lo ales . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le prin ipe de la distan e DTW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Cal ul et alignement DTW pour l'exemple . . . . . . . . . . . . . . . . . . . . . . . . . . .
135
5
5
6
6
7
11
13
15
15
17
27
27
28
30
30
32
33
33
40
41
41
43
44
45
47
49
50
50
51
52
52
54
54
55
57
58
58
59
60
Table des gures
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.30
3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40
3.41
3.42
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
4.20
4.21
4.22
4.23
4.24
136
Classi ation hiérar hique basée sur la distan e DTW . . . . . . . . . . . . . . . . . . . . 62
Inuen e de la pénalité dire tionnelle du DTW sur la lassi ation . . . . . . . . . . . . . 63
Méthode de normalisation de DDT W par la taille des séquen es . . . . . . . . . . . . . . . 65
Exemple de deux ve teurs ara téristiques ave une information de distribution des omposantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Distan e DTW entre deux y les de produ tion ... . . . . . . . . . . . . . . . . . . . . . . 68
Classi ation hiérar hique de quatre y les de produ tion basée sur la distan e DTW . . . 68
Prin ipe de la lassi ation non-supervisée basée sur des prototypes et un apprentissage
ompétitif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Carte auto-organisatri e de Kohonen (SOM) 2D ave le ve teur d'entrée x et les ve teurs
des poids wi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Relation entre heminement et alignement DTW . . . . . . . . . . . . . . . . . . . . . . . 72
Mappage DTW : Une mise à é helle bi-dire tionnelle . . . . . . . . . . . . . . . . . . . . . 72
Exemple de mappage ave ompression et étirement . . . . . . . . . . . . . . . . . . . . . 73
Inuen e de la pénalité sur le mappage DTW . . . . . . . . . . . . . . . . . . . . . . . . . 73
Un exemple du orpus ave les formes primitives de l'alphabet . . . . . . . . . . . . . . . 75
Corpus des séquen es utilisées dans l'exemple . . . . . . . . . . . . . . . . . . . . . . . . . 75
Prototypes initiaux utilisés dans l'exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Séquen es mappées, attribuées au prototype M3 à l'instant t = 0 . . . . . . . . . . . . . . 77
Exemple d'une séquen e moyenne et de la modi ation du prototype . . . . . . . . . . . . 78
Le résultat de l'apprentissage des prototypes . . . . . . . . . . . . . . . . . . . . . . . . . 79
Comparaison des prototypes initiaux aux prototypes naux. . . . . . . . . . . . . . . . . . 80
Résultat de l'apprentissage des prototypes sur les données du four . . . . . . . . . . . . . 82
Les 16 prototypes d'évolutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Le ontrle prédi tif en ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Les deux séquen es test S(t) et Q(t) pour analyser la lo alisation DTW . . . . . . . . . . 90
Résultat de la lo alisation en utilisant la méthode DTW de base en représentant l'alignement réalisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
La matri e de distan e globale GDM en illustration 3D . . . . . . . . . . . . . . . . . . . 91
Dernière olonne de GDM (j = M ) : Ddtw (Pi (t), Q(t))∀i = 1 · · · N . . . . . . . . . . . . . 92
Résultat de la re her he de la partie la plus similaire . . . . . . . . . . . . . . . . . . . . . 92
Les trois formes qui omposent l'alphabet de l'environnement de test . . . . . . . . . . . . 93
Les trois séquen es types de l'environnement test . . . . . . . . . . . . . . . . . . . . . . . 94
Un exemple de séquen e d'évolution : T6 (t) . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Courbes de distan es DTW entre T6,8 (t) et toutes les parties M1 , M2 , M3 . . . . . . . . . 97
Lo alisation DTW-LB pour le stade d'évolution T6,8 (t) ave les séquen es types M1 , M2 , M3 97
Première prédi tion au stade d'évolution T6,8 (t) . . . . . . . . . . . . . . . . . . . . . . . . 98
Deuxième prédi tion au stade d'évolution T6,8 (t) . . . . . . . . . . . . . . . . . . . . . . . 98
Graphique global de la séquen e d'évolution T6 (t) . . . . . . . . . . . . . . . . . . . . . . . 99
Première prédi tion au stade d'évolution T6,21 (t) . . . . . . . . . . . . . . . . . . . . . . . 100
Ex. 1 - Nr-Ref. 1987 : Représentation du signal original ave les re onstru tions basées sur
les quatres odages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Ex. 1 - Nr-Ref. 1987 : Le graphique global pour les 11 stades d'évolution . . . . . . . . . . 104
Ex. 1 - Nr-Ref. 1987 : Lo alisation DTW-LB pour le stade d'évolution huit (2400s) . . . . 105
Ex. 1 - Nr-Ref. 1987 : Analyse lo ale après les premières 5 min du y le de produ tion. . . 106
Ex. 2 - Nr-Ref. 41 : Représentation du signal original ave les re onstru tions basées sur
les quatres odages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Ex. 2 - Nr-Ref. 41 : Graphique global pour les 11 stades d'évolution . . . . . . . . . . . . 108
Ex. 2 - Nr-Ref. 41 : Graphique lo al à 900 se ondes . . . . . . . . . . . . . . . . . . . . . . 109
Ex. 3 - Nr-Ref. 42 : Représentation du signal original ave les re onstru tions basées sur
les quatres odages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Ex. 3 - Nr-Ref. 42 : Le graphique global pour les 16 stades d'évolution . . . . . . . . . . . 111
4.25 Ex. 3 - Nr-Ref. 42 : Analyse de l'évolution des premières propositions à 900s, 2100s et
2700s du y le de produ tion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.1 Représentation du orpus arti iel ave ses quatre lasses de formes 2D . . . . . . . . . .
B.2 Cartographie 2D du orpus arti iel utilisant une SOM . . . . . . . . . . . . . . . . . . .
B.3 Résultat de l'apprentissage de inq SOM unidimensionnelles ave une variation du nombre
d'unités de 2 à 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.4 Niveaux d'inuen e des unités de la arte en fon tion de leur distan e sur la arte et du
paramètre rayon d'inuen e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.5 Évolution des positions des prototypes (formes primitives) ave le paramètre de voisinage
de la SOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.6 Résultat de inq SOM ave une variation du nombre d'unités de 2 à 6, ave un faible
voisinage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.1 Comportement d'une lassi ation selon le nombre de lasses. . . . . . . . . . . . . . . . .
C.2 Comportement des indi es de validation pour un exemple 1D . . . . . . . . . . . . . . . .
C.3 Comportement des indi es de validation pour un exemple 2D . . . . . . . . . . . . . . . .
C.4 Résultat des al uls des indi es de validation pour les 280 alphabets . . . . . . . . . . . .
112
123
124
125
125
126
126
127
130
131
133
137
Table des gures
138
Liste des tableaux
1.1
3.1
3.2
3.3
3.4
3.5
3.6
3.7
4.1
A.1
Cara téristiques prin ipales du four . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Exemple de triplet du odage du signal arti iel . . . . . . . . . . . . . . . . . . . . . . . . 44
Rédu tion de mémoire en relation ave les paramètres de l'alphabet . . . . . . . . . . . 48
Alphabets utilisés ave leurs paramètres . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Comparaison de la distan e eu lidienne et de la distan e DTW sur les séquen es U (t), V (t)
et W (t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Les mots utilisés dans l'analyse de lassi ation . . . . . . . . . . . . . . . . . . . . . . . . 61
Attribution des séquen es aux prototypes initiaux ave leur distan e DTW ave le prototype 76
Comparaison des résultats obtenus par les quatre diérentes atégorisations . . . . . . . . 82
Détails sur les trois premiers minima de la lo alisation DTW-LB . . . . . . . . . . . . . . 96
Résumé de la base de données des données y liques . . . . . . . . . . . . . . . . . . . . . 120
139
Liste des tableaux
140
Glossaire
Ce glossaire ne reprend que les abréviations spé iques utilisées dans e do ument.
: angl. Adaptive Pie e-wise Constant Approximation
BMU : Prototype gagnant dans une appro he d'apprentissage ompétitive (angl. Best Mapping Unit)
CSV : Valeurs séparées par virgules ; angl. Comma
Separated Value
DTW : Dynami Time Warping (eng.), heminement temporel dynamique
DTW-LB : DTW bornée à gau he. Angl. : Dynami Time Warping Left Bounded
GDM : matri e globale des distan es umulées (angl.
Global Distan e Matrix)
LDM : matri e des distan es lo ales (angl. Lo al
Distan e Matrix)
MF : Moyenne Flottante (angl. Moving Average)
MLP : Per eptron multi ou he. Angl. Multi Layer
Per eptron
PAA : angl. Pie ewise Aggregat Approximation
ou en ore Pie ewise Constant Approximation (PCA)
PLA : angl. Pie ewise Linear Approximation
PPA : Pie ewise Pattern Approximation
SGBD : Système de gestion de bases de données
TF : Transformée de Fourier
UdtwC : Classi ation non-supervisée basée sur la
distan e DTW, angl. Unsupervised DTWbased Clustering
APCA
141
Glossaire
142
Bibliographie
[1℄ J.B. Allan and L.R. Rabiner. A unied approa h to short time fourier analysis and synthesis. Pro .
IEEE, 65 :15581564, 1977.
[2℄ J.-C. Baumert, J.-L. Rendueles Vigil, P. Nyssen, J. S haefers, G. S hutz, and S. Gillé. Improved
ontrol of ele tri al ar furna e operations by pro ess modelling. Te hni al steel resear h series EUR
21411, European Commission, Luxembourg EC publi ation o e, 2005.
[3℄ R. Bellman. Dynami Programming. Prin eton University Press, 1957.
[4℄ R. Bellman and S. Dreyfus. Applied Dynami Programming. Prin eton University Press, Prin eton,
New Jersey, 1962.
[5℄ D. Berndt and J. Cliord. Using dynami time warping to nd patterns in time series. In Pro eedings
of the KDD Workshop, pages 359370, Seattle, July 1994.
[6℄ Laurent Bougrain. Étude de la onstru tion par réseaux neuromimétiques de représentations interprétables : Appli ation à la prédi tion dans le domaine des télé ommuni ations. PhD thesis, Université
Henri Poin aré - Nan y 1, 2000.
[7℄ Mi hael H. Bra kett. Data sharing using a ommon data ar hite ture. Wiley Professional Computing.
Katherine S howalter by John Wiley & Sons, In , 1994.
[8℄ C.H. Chen, editor. Fuzzy Logi And Neural Network Handbook. IEEE Press, 1996.
[9℄ G. Cybenko. Approximation by superpositions of a sigmoid fun tion. Mathemati s of Control,
Signals and Systems, 2 :303314, 1989.
[10℄ D. L. Davies and D. W. Bouldin. A luster separation measure. IEEE Trans. on Pattern Analysis
and Ma hine Intelligen e, 1(2) :224227, April 1979.
[11℄ Stéphane Durand. TOM, une ar hite ture onnexionniste de traitement de séquen es. Appli ation à
la re onnaissan e de la parole. PhD thesis, Université Henri Poin aré - Nan y 1, 1995.
[12℄ J.L. Elman. Finding stru ture in time. Cognitive S ien e, 14 :179211, 1990.
[13℄ J.-P. Haton et M.-C. Haton. L'intelligen e arti ielle. Que sais-je ?, 2444, 1989.
[14℄ M.A. Fis hler and O. Firs hein. Intelligen e : The Eye, the Brain, and the Computer. Addison-Wesley
Publishing Co., Boston, MA, 1987.
[15℄ B. Fritzke. Some ompetitive learning methods, 1997.
[16℄ S. Gillé and G. S hutz. Improved ontrol of ele tri ar furna e operations by pro ess modelling,
hap 2. ECES 7210-PR-12 - Fifth Te hni al Report, Mar h 2002.
[17℄ M.T. Hagan, H.B. Demuth, and M. Beale. Neural Network Design. PWS Publishing Comp., 1996.
[18℄ Maria Halkidi, Yannis Batistakis, and Mi halis Vazirgiannis. On lustering validation te hniques.
Journal of Intelligent Information Systems, 17(2-3) :107145, 2001.
[19℄ Babak Hassibi and David G. Stork. Se ond order derivatives for network pruning : Optimal brain
surgeon. In Stephen José Hanson, Ja k D. Cowan, and C. Lee Giles, editors, Advan es in Neural
Information Pro essing Systems, volume 5, pages 164171. Morgan Kaufmann, San Mateo, CA, 1993.
[20℄ M. H. Hassoun. Fundamentals of Arti ial Neural Networks. The MIT Press, Cambridge, Massahusetts, London, England, 1995.
143
Bibliographie
[21℄ S. Haykin. Neural Networks, A omprehensive Foundation. Prenti e-Hall, New Jersey, 1999.
[22℄ D.O. Hebb. The Organization of Behavior : A Neuropsy hologi al Theory. Wiley, New York, 1949.
[23℄ J. Hertz, A. Krogh, and R.G. Palmer. Introdu tion to the Theory of Neural Computation. Addison
Wesley, Redwood City, 1991.
[24℄ J.J. Hopeld and D.W. Tank. Computing with neural ir uits : A model. S ien e, 233 :625633,
1986.
[25℄ K. Hornik, M. Stin h ombe, and H. White. Multi-layer feedforward networks are universal approximators. Neural Networks, 2 :359366, 1989.
[26℄ W.T. Miller III, R.S. Sutton, and P.J. Werbos, editors. Neural Networks for Control. The MIT
Press, Cambridge, Massa husetts, London, England, 1996.
[27℄ A. K. Jain, M. N. Murty, and P. J. Flynn. Data lustering : a review. ACM Computer Surveys,
1999.
[28℄ M.I. Jordan. Attra tor dynami s and parallelism in a onne tionist sequential ma hine. In Pro eedings of the Eighth Annual Cognitive S ien e So iety Conferen e, Hillsdale, 1986. Erlbaum.
[29℄ Jean-Daniel Kant. Modélisation et mis en oeuvre de pro essus ognitifs de atégorisation à l'aide
d'un résau onnexionniste. PhD thesis, Université de Rennes I, 1996.
[30℄ Dr Eamonn Keogh. A tutorial on indexing and mining time series data, 2002.
[31℄ E. Keogh. Exa t indexing of dynami time warping. In In 28th International Conferen e VLDB,
pages 406417, Hong Kong, 2002.
[32℄ E. Keogh, K. Chakrabarti, M. Pazzani, and Mehrotra. Dimensionality redu tion for fast similarity
sear h in large time series databases. Journal of Knowledge and Information Systems, pages 263286,
2000.
[33℄ E. Keogh, K. Chakrabarti, M. Pazzani, and Mehrotra. Lo ally adaptive dimensionality redu tion
for indexing large time series databases. In In Pro of ACM SIGMOD Conferen e on Management
of Data, pages 151162, 2001.
[34℄ S. Köhle. Einussgröÿen des elektris hen energieverbrau hs und des elektodenverbrau hs von li htbogenöfen. Stahl u. Eisen, 1992.
[35℄ S. Kim, S. Park, and W. Chu. An index-based approa h for similarity sear h supporting time warping
in large sequen e databases. ICDE, 2001.
[36℄ T. Kohonen. Asso iative memory : a system theoreti approa h. Springer-Verlag, Berlin, 1978.
[37℄ T. Kohonen. Self-organized formation of topologi al orre t feature maps. Biologi al Cyberneti s,
43 :5969, 1982.
[38℄ M. Krishnan, C.P. Neophytou, and Glenn Pres ott. Wavelet transform spee h re ognition using
ve tor quantization, dynymi time warping and arti ial neural networks. Centre for Ex ellen e in
Computer Aided System Engineering and Tele ommuni ation & Information S ien es Loboratory.
[39℄ Y. Lallement, M. Hilario, and F. Alexandre. Neurosymboli integration : ognitive grounds and
omputational strategies. In A tes du ongrès WOCFAI, Paris, 1995.
[40℄ B.P. Lathi. Signal Pro essing & Linear Systems. Berkeley, Cambridge, 1998.
[41℄ Y. LeCun, J. Denker, S. Solla, R. E. Howard, and L. D. Ja kel. Optimal brain damage. In D. S.
Touretzky, editor, Advan es in Neural Information Pro essing Systems II, San Mateo, CA, 1990.
Morgan Kauman.
[42℄ M. Lemasson. Etude de séries temporelles à l'aide de artes auto-organisatri es. Mémoire de maîtrise,
UFR-MIM Université de Metz, Août 2001.
[43℄ Y. Linde, A. Buzo, and R.M.Gray. An algorithm for ve tor quantizer design. IEEE Transa tions on
Communi ation, 1980.
[44℄ Lennart Ljung. System identi ation. Theory for the user. Prenti e Hall PTR, 1999.
[45℄ D. Mar us. Déte tion et extra tion d'événements dans un ux de données temporel. Mémoire de
Maîtrise, Mathématiques Dis rètes, Université Louis Pasteur de Strasbourg, O tobre 2002.
144
[46℄ T.M. Martinetz and K.J.S hulten. Arti ial Neural Networks, hapter A "neural-gas" network learns
topologies, pages 397402. North-Holland, Amsterdam, 1991.
[47℄ J.L. M Cullo h and W. Pitts. A logi al al ulus of ideas immanent in nervous a tivity. Bulletin of
Mathemati al Biophysi s, 5 :115133, 1943.
[48℄ C. S. Myers and L. R. Rabiner. A level-building dynami time warping algorithm for onne ted word
re ognition. IEEE Trans. A oust., Spee h, Signel Pro essisng, 29 :284297, April 1981.
[49℄ A.V. Oppenheim, A.S. Willsky, and I.T. Young. Signals and Systems. Prenti e-Hall In ., New Jersey,
1983.
[50℄ Du Truong Pham and Liu Xing. Neural networks for identi ation, predi tion and ontrol. Springer,
1995.
[51℄ Alvin C. Ren her. Methods of Multivariate Analysis. 1995.
[52℄ H. Sakoe and S. Chiba. Dynami programming algorithm optimization for spoken word re ognition.
IEEE Transa tions on A ousti s, Spee h, and Signal Pro essing, 27(1) :4349, February 1978.
[53℄ N. S haaf. Classi ation de sous-séquen es de signaux temporels, en se basant sur des modèles
prédénis de séquen es. Mémoire de maîtrise, MIM Université de Metz, Août 2003.
[54℄ G. S hutz, F. Alexandre, and S. Gillé. Neural networks in dynami pro ess analysis. Pro eedings of
th
IAR/ICD Workshop on 16
IAR anual meeting, pages 105110, november 2001.
[55℄ G. S hutz, F. Alexandre, and S. Gillé. Unsupervised extra tion of temporal evolution patterns on
an ele tri ar furna e pro ess. Preprints of the 11th IFAC MMM Symposium, september 2004.
[56℄ A. Tarsitano. A omputational study of several relo ation methods for k-means algorithms. Pattern
Re ognition, 36 :29552966, april 2003.
[57℄ O. Tim, L. Firoiu, and P. Cohen. Clustering time series with hidden markov models and dynami
time warping, 1999.
[58℄ E.R. Tufte. The visual display of quantative information. Graphi s Press, 1983.
[59℄ T. K. Vintsyuk. Spee h dis rimination by dynami programming. Kibernetika, 4 :8188, JanuaryFebruary 1968.
[60℄ D.J. Willshaw and C. von der Malsburg. How patterned neural onne tions an be set up by selforganization. In Pro . R. So . Lond. B., volume 194, pages 431445, 1976.
[61℄ Stuart N. Wrigley. Spee h re ognition by dynami time warping, 1998.
[62℄ B. Yi, H. Jagadish, and C. Faloutsos. E ient retrieval of similar time sequen es under time warping.
ICDE, pages 2327, 1998.
[63℄ B.K. Yi and C. Faloutsos. Fast time sequen e indexing for arbitrary lp norms. In Pro eedings of
the 26st Intl Conferen e on Very Large Databases, pages 385394, 2000.
145
Bibliographie
146
Résumé
Cette étude onsiste à étudier l'apport de réseaux de neurones arti iels pour améliorer le ontrle
de pro essus industriels omplexes, ara térisés en parti ulier par leur aspe t temporel. Les motivations
prin ipales pour traiter des séries temporelles sont la rédu tion du volume de données, l'indexation pour
la re her he de similarités, la lo alisation de séquen es, l'extra tion de onnaissan es (data mining) ou
en ore la prédi tion.
Le pro essus industriel hoisi est un four à ar éle trique pour la produ tion d'a ier liquide au Luxembourg. Notre appro he est un on ept de ontrle prédi tif et se base sur des méthodes d'apprentissage
non-supervisé dans le but d'une extra tion de onnaissan es.
Notre méthode de odage se base sur des formes primitives qui omposent les signaux. Ces formes,
omposant un alphabet de odage, sont extraites par une méthode non-supervisée, les artes autoorganisatri es de Kohonen (SOM). Une méthode de validation des alphabets de odage a ompagne
l'appro he.
Un sujet important abordé durant es re her hes est la similarité de séries temporelles. La méthode
proposée est non-supervisée et intègre la apa ité de traiter des séquen es de tailles variées.
onnexionnisme, réseaux de neurones, apprentissage non-supervisé, arte auto-organisatri e,
dynami time warping DTW, similarité
Mots- lés:
Abstra t
This study is interested in analyzing the ontribution of arti ial neural networks in order to
improve the ontrol of omplex industrial pro esses that are mainly hara terized by their temporal
behavior. The main motivations of the time series analysis are data redu tion, indexation based on
similarity, lo alization of sequen es, knowledge extra tion and predi tion.
The analyzed industrial pro ess is an ele tri ar furna e for the liquid steel produ tion in Luxembourg.
The proposed approa h is a on ept of predi tive ontrol based on unsupervised learning te hniques with
the aim of knowledge extra tion.
Our signal oding method is based on primitive patterns that ompose the signals. These patterns,
building the oding alphabet, are extra ted using an unsupervised method, the self organizing maps of
Kohonen (SOM). An alphabet validation approa h is proposed.
One of the important subje ts of this resear h is the similarity of time series. The proposed method
is unsupervised and able to handle sequen es of arbitrary size.
onne tionist, neural networks, unsupervised learning, self organising maps, dynami time
warping, similarity
Keywords:
147
148
1/--страниц
Пожаловаться на содержимое документа