Correcteur orthographique open source...

Postez ici des liens vers d'autres sites intéressants, des références de bouquins, d'articles., des manifestations. ..
Avatar du membre
Rpkx
Maître distillateur
Messages : 459
Enregistré le : jeudi 12 octobre 2006 20:12
Localisation : Belgique, Liège + 5 Km

Correcteur orthographique open source...

Message non lu par Rpkx »

Bonjour à tous,

J'étais toujours entre la chaise et le clavier, mais ces derniers temps je n'ai pu m'empêcher d'éplucher les nouveaux dictionnaires pour Open Office que les pirates de "Di collecte" * ont créés début 2008 en se basant très largement sur le mien.

Ils m'ont d'abord cité comme auteur du dictionnaire version 2007, mais en s'empressant de dire qu'ils ont rajouté un tas de mots que j'avais éliminés (parce que trop farfelus ou exotiques), qu'il y avait des redondances, etc. , qu'ils ont recréé toute la liste des verbes.

Dans leur dictionnaire dernière mouture (de novembres 2008), il y a beaucoup moins d'entrées dans le fichier fr.dic parce que toutes les dérivations sont expliquées en long et en large dans le fichier des affixes qui passe ainsi d'environ 600 lignes de règles (ce qu'il était possible de retenir avec un peu d'habitude) à plus de 9000 lignes (un truc complètement imbuvable).
Le résultat des courses est que la moindre erreur sur un drapeau (deux caractères maintenant) placé après un verbe, ou dans les règles correspondantes peut mettre à mal toute la conjugaison de celui-ci sans que l'on s'en rende compte tout de suite.

Exemple : dépecer/b0a+ générait la conjugaison de dépecer mais pas les formes dépeça, dépeçais, ... parce qu'on avait oublié de penser au c-cédille devant a et o.
vêtir/iG ne générait pas vêtîmes et vêtirent (2 règles oubliées),
des formes de l'imparfait manquaient pour certains verbes en -er, etc.

Au drapeau iG, utilisé pour le verbe vêtir et ses composés dé-, re- et sur-, il a 48 règles.
Pour les drapeaux c1, c2, c3 et c4, il n'y avait que 490 règles. Pas difficile d'oublier quelques cas dans un tel "foutoir".

En un mot leur dictionnaire fonctionnait aussi bien en avril 2008 que le mien en juillet 2007 pour les mots simples, peut-être même un peu mieux mais à quel prix.
Il ne gère toujours pas correctement les mots-composés et les majuscules après l' ou d' dans la phrase.

J'ai donc retravaillé leur dictionnaire qui me donne enfin satisfaction après un grand coup de M. Propre pour éliminer des mots exotiques, farfelus ou carrément des néologismes douteux et surtout vérifier les règles d'affixes en éliminant un tas de règles fausses ou inutiles.

Ce dictionnaire revu et corrigé, je le garde pour moi. On ne m'aura plus comme fin 2007 où je me suis fait proprement déposséder de mon travail d'un an après avoir débloqué le problème de licence du dictionnaire original sur lequel je m'étais basé.

Les responsables d'OOo France et de Mozilla France m'ont chaleureusement remercié et allaient intégrer mon dictionnaire dans la version suivante de leur programmes.
Du côté d'OOo cela n'a jamais été le cas et Mozilla a simplement proposé mon dictionnaire classique comme second choix sur leur site d'addons. En choix par défaut, ils proposaient vers octobre 2007 un dictionnaire reforme 1990, que j'avais vaguement corrigé dans la foulée.

Les gens de di collecte ont ensuite récupéré mon dictionnaire classique pour créé le leur qui est sorti en version bêta fin 2007. Quand je critiquais leurs choix, c'est tout juste si on ne m'a pas dit de la fermer. Je devais arrêter de "polémiquer". J'ai donc été proprement mis sur la touche...

@+

* Cela s'écrit en un mot, mais je ne veux pas que ce soit indexé par Google. Ces gens savent que j'ai une dent contre eux et ne manquent pas d'intervenir sur les forums quand je dis tout le bien que je pense d'eux.
Modifié en dernier par Rpkx le mercredi 28 janvier 2009 18:39, modifié 1 fois.
Image "I'm Retired: I was Tired Yesterday & I'm Tired again Today..."
Militun
Maître distillateur
Messages : 1426
Enregistré le : jeudi 06 mars 2008 20:49
Localisation : En Franche-Comté

Message non lu par Militun »

D'accord.
J'utilise aussi Open Office depuis quelques années, et pour mon utilisation, c'est tout à fait suffisant. Et ce n'est pas du tout une usine à gaz. Mais pour avoir un dico, assez simple et performant on prend lequel alors ?
Avatar du membre
Rpkx
Maître distillateur
Messages : 459
Enregistré le : jeudi 12 octobre 2006 20:12
Localisation : Belgique, Liège + 5 Km

Message non lu par Rpkx »

Bonjour,

Mon dictionnaire n'étant pas sous forme d'extension son installation est plutôt délicate. Je ne le propose donc pas directement.

Je te conseille de télécharger le deuxième dictionnaire proposé sur cette page.
http://extensions.services.openoffice.o ... my/term/93
Prends bien le dictionnaire classique si tu es partisan de l'orthographe que tu as apprise à l'école.
Par défaut, OOo 3 installe le dictionnaire français classique+réforme 1990, que j'appelle le dico des feignants parce qu'il accepte "maître" et "maitresse" dans la même phrase sans réagir.

C'est un des gros reproches que je fais à OOo, installer par défaut un dictionnaire bâtard sans laisser le choix à l'utilisateur entre un des deux seuls valables : le classique ou le réforme 1990 pour ceux qui veulent ou sont obligés de suivre cette c****

@+
Image "I'm Retired: I was Tired Yesterday & I'm Tired again Today..."
Militun
Maître distillateur
Messages : 1426
Enregistré le : jeudi 06 mars 2008 20:49
Localisation : En Franche-Comté

Message non lu par Militun »

Je te remercie. J'ai pris le dico, mais il faut qu'avant tout je passe à la version 3.x d'Open office.
Avatar du membre
Rpkx
Maître distillateur
Messages : 459
Enregistré le : jeudi 12 octobre 2006 20:12
Localisation : Belgique, Liège + 5 Km

Message non lu par Rpkx »

Bonjour,

Oui, OOo 3 est sorti depuis un moment déjà et tu aurais tort de rester avec une vieille version 2.

Parmi les modifications que je trouve les plus intéressantes dans la version 3, il y a l'affichage au bas de l'écran de la langue du paragraphe en cours (et la possibilité d'en changer pour le correcteur) et un curseur qui permet de zoomer.

Les dictionnaires sont maintenant fournis sous forme d'extensions, donc mises à jour automatiques possibles, mais difficulté plus grande pour les éditer manuellement. Il faut d'abord les localiser au huitième niveau de l'arborescence de OOo, dans \share.

@+
Image "I'm Retired: I was Tired Yesterday & I'm Tired again Today..."
Avatar du membre
Rpkx
Maître distillateur
Messages : 459
Enregistré le : jeudi 12 octobre 2006 20:12
Localisation : Belgique, Liège + 5 Km

Message non lu par Rpkx »

Salut,

Quelques précisions intéressantes :

Mes dictionnaires français se retrouvent dans le dossier
C:\Program Files\OpenOffice.org 3\share\uno_packages\cache\uno_packages\E2.tmp_\dict-fr-Vazkor.oxt\dictionaries
Reconnaissez qu'on peut difficilement faire plus simple comme accès...

Après avoir étudié la structure et la syntaxe de l'extension dictionnaire français classique + réforme de Dicollecte, je me suis créé une extension qui installe en une fois:
- mon dictionnaire Myspell français classique version 2008 (pour pouvoir comparer)
- leur dictionnaire Hunspell français classique, mais corrigé, amélioré et optimisé pour répondre à mes besoins :D
- leur dictionnaire fusionné, que je n'utilise que comme second contrôle sur des sites comme Wikipédia (avant de corriger des fautes qui n'en sont plus...)

Je ne suis plus du tout motivé par ces dictionnaires. Je me contente d'y corriger les erreurs que je découvre encore. On ne se refait pas...

J'ai maintenant d'autres centres d'intérêt, dont l'arnaque du siècle : le prétendu Réchauffement climatique d'origine anthropique.
http://skyfal.free.fr/
http://www.pensee-unique.fr/index.html

@+
Image "I'm Retired: I was Tired Yesterday & I'm Tired again Today..."
Avatar du membre
wal
Administrateur - Site Admin
Messages : 9827
Enregistré le : lundi 02 octobre 2006 16:29
Localisation : Provence

Message non lu par wal »

Rpkx a écrit : le prétendu Réchauffement climatique d'origine anthropique.
Le terme anthropique signifie-t-il humaine? J'avoue avoir du mal avec ce vocabulaire. Quelle différence entre les deux?

Un moment j'ai pensé à l'entropie, mais je suppose que ça n'a rien à voir... :?
J'aime le vin d'ici mais pas l'eau de là (Pierre Dac)
Avatar du membre
Rpkx
Maître distillateur
Messages : 459
Enregistré le : jeudi 12 octobre 2006 20:12
Localisation : Belgique, Liège + 5 Km

Message non lu par Rpkx »

Bonjour,
Le terme anthropique signifie-t-il humaine?
Oui.
On trouve aussi l'expression "réchauffement climatique anthropogénique", pour dire la même chose.

Pourquoi faire simple, quand on peut faire compliqué ?

Entre nous, ce prétendu réchauffement climatique d'origine humaine a méchamment du plomb dans l'aile.
De plus en plus de scientifiques indépendants critiquent ouvertement cette hystérie répandue par Al Gore et l'IPCC (GIEC) et les écolo-bobo-facistes.

@+
Image "I'm Retired: I was Tired Yesterday & I'm Tired again Today..."
Répondre