Analyse formelle de concepts

L'analyse formelle de concepts (en anglais Formal Concept Analysis, FCA) s'attache à étudier les concepts lorsqu'ils sont décrits formellement, c'est-à-dire que le contexte et les concepts sont complètement et précisément définis. Elle a été introduite par Rudolf Wille en 1982[1] en tant qu'application de la théorie des treillis (voir treillis de Galois). Elle repose sur les travaux antérieurs de M. Barbut et B. Monjardet[2], sur toute la théorie des treillis[3] et dispose également d'une solide base philosophique[4].

Un concept peut être défini par son intension et son extension : l'extension est l'ensemble des objets qui appartiennent au concept tandis que l'intension est l'ensemble des attributs partagés par ces objets.

Définitions

Un contexte est un triplet ( G , M , I ) {\displaystyle (G,M,I)} G {\displaystyle G} et M {\displaystyle M} sont des ensembles et I G × M {\displaystyle I\subseteq G\times M} . Les éléments de G {\displaystyle G} sont appelés les objets et ceux de M {\displaystyle M} les attributs. L'ensemble de couple I {\displaystyle I} est considéré comme une relation et est donc noté g I m {\displaystyle gIm} au lieu de ( g , m ) I {\displaystyle (g,m)\in I} ce qui se dit : « l'objet g {\displaystyle g} possède l'attribut m {\displaystyle m} ». Les lettres G {\displaystyle G} et M {\displaystyle M} proviennent de l'allemand Gegenstände et Merkmale.

On définit les opérateurs de dérivation pour A G {\displaystyle A\subseteq G} et B M {\displaystyle B\subseteq M} par A = { m M g A g I m } {\displaystyle A'=\{m\in M\mid \forall g\in A\cdot gIm\}} et B = { g G m B g I m } {\displaystyle B'=\{g\in G\mid \forall m\in B\cdot gIm\}} . L'ensemble A {\displaystyle A'} est l'ensemble des attributs partagés par tous les objets de A {\displaystyle A} et l'ensemble B {\displaystyle B'} est l'ensemble des objets qui possèdent tous les attributs de B {\displaystyle B} .

Un concept du contexte ( G , M , I ) {\displaystyle (G,M,I)} est un couple ( A , B ) {\displaystyle (A,B)} A G {\displaystyle A\subseteq G} et B M {\displaystyle B\subseteq M} qui vérifie A = B {\displaystyle A'=B} et B = A {\displaystyle B'=A} . Pour un concept ( A , B ) {\displaystyle (A,B)} , on dit que A {\displaystyle A} est son extension et B {\displaystyle B} son intension.

On définit un ordre (partiel) sur les concepts par ( A 1 , B 1 ) ( A 2 , B 2 ) A 1 A 2 ( B 2 B 1 ) {\displaystyle (A_{1},B_{1})\leq (A_{2},B_{2})\Leftrightarrow A_{1}\subseteq A_{2}(\Leftrightarrow B_{2}\subseteq B_{1})} .

On peut utiliser les opérateurs de dérivation pour construire un concept à partir d'un ensemble d'objets X {\displaystyle X} ou d'attributs Y {\displaystyle Y} en considérant les concepts ( X , X ) {\displaystyle (X'',X')} et ( Y , Y ) {\displaystyle (Y',Y'')} respectivement. En particulier pour un objet g {\displaystyle g} on appelle γ g {\displaystyle \gamma g} le concept objet ( { g } , { g } ) {\displaystyle (\{g\}'',\{g\}')} et pour un attribut m {\displaystyle m} on appelle μ m {\displaystyle \mu m} le concept attribut ( { m } , { m } ) {\displaystyle (\{m\}',\{m\}'')} .

Exemple

Considérons comme ensemble d'objets les nombres entiers de 1 à 10 : G = { 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 } {\displaystyle G=\{1,2,3,4,5,6,7,8,9,10\}} et comme ensemble d'attributs des propriétés mathématiques : M = { p a i r , i m p a i r , c o m p o s e ´ , p r e m i e r , c a r r e ´ } {\displaystyle M=\{pair,impair,compos{\acute {e}},premier,carr{\acute {e}}\}} .

La relation d'incidence I G × M {\displaystyle I\subseteq G\times M} peut être représentée sous forme d'un tableau où les lignes correspondent aux objets et les colonnes correspondent aux attributs.

nombre composé pair impair premier carré
1 x x
2 x x
3 x x
4 x x x
5 x x
6 x x
7 x x
8 x x
9 x x x
10 x x

On a { 3 } = { i m p a i r , p r e m i e r } {\displaystyle \{3\}'=\{impair,premier\}} et { i m p a i r , p r e m i e r } = { 3 , 5 , 7 } {\displaystyle \{impair,premier\}'=\{3,5,7\}} . Donc ( { 3 , 5 , 7 } , { i m p a i r , p r e m i e r } ) {\displaystyle (\{3,5,7\},\{impair,premier\})} est un concept formel.

Treillis de concepts

Chaque paire de concepts possède une borne inférieure et une borne supérieure uniques. Étant donné les concepts ( G i , M i ) {\displaystyle (G_{i},M_{i})} et ( G j , M j ) {\displaystyle (G_{j},M_{j})} , leur borne inférieure est ( G i G j , ( M i M j ) ) {\displaystyle (G_{i}\cap G_{j},(M_{i}\cup M_{j})'')} et leur borne supérieure est ( ( G i G j ) , M i M j ) {\displaystyle ((G_{i}\cup G_{j})'',M_{i}\cap M_{j})} .

Du fait de l'ordre partiel entre les concepts et des bornes, les conditions sont respectées pour construire un treillis de concepts.

Références

  1. Wille, R. (1982) Restructuring lattice theory: an approach based on hierarchies of concepts. In: Rival, I. (ed.) Ordered Sets.445-470. Dordrecht-Boston, Reidel.
  2. M. Barbut & B. Monjardet, Ordre et Classification (2 tomes), Paris, HACHETTE UNIVERSITE, , 176 p.
  3. (en) G. Birkhoff, Lattice theory, American Mathematical Soc., , 418 p. (ISBN 978-0-8218-1025-5, lire en ligne)
  4. A. Arnauld & P. Nicole, La logique ou l'art de penser, Gallimard, , 406 p. (ISBN 978-2-07-072726-1)

Bibliographie

(en) Bernhard Ganter et Rudolf Wille (en), Formal Concept Analysis : Mathematical Foundations, Berlin, Springer Verlag, , 284 p. (ISBN 978-3-540-62771-5)

  • icône décorative Portail de l’informatique