Sources de liste de mots

Je recherche une source de noms, d'adverbes, d'adjectifs et de verbes en plusieurs langues.

J'aimerais que les listes soient déjà divisées et qu'elles ne doivent pas passer à travers l' OED (et les équivalents non anglais) à la main en recréant ces listes.

Je ne m'intéresse pas vraiment aux définitions, et je comprends que certains mots peuvent être des parties multiples du discours – c'est bien – des mots comme «beaucoup» peuvent être un nom ou un adjectif et peuvent apparaître dans les deux listes.

Quelqu'un connait-il une telle source? Sinon, quelqu'un pourrait-il me montrer dans la bonne direction?

Je suis d'accord avec le format de l'un des éléments suivants (ou similaires si les gens ont des idées):

  • Csv: <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • Fichiers en clair comme «noms», «verbes», etc.
  • Une table mysql
  • etc

J'ai utilisé WordNet de Princeton University pour certains projets. Il s'agit d'une base de données lexicale en anglais. Global WordNet est une extension du projet essayant de faire de même pour toutes les langues.

Vous pourriez également être intéressé par des projets connexes à http://wordnet.princeton.edu/wordnet/related-projects/

Cela peut ne pas aider du tout, je ne sais pas. Mais MediaWiki a un api pour la liste de toutes les pages appartenant à une certaine catégorie. Vous pouvez essayer de l'utiliser sur Wiktionary.org.

Remarques:

  • Chaque requête renvoie seulement 500 résultats. Cependant, à la fin, il spécifie également un paramètre à utiliser dans une autre requête pour obtenir les 500 résultats suivants.
  • Il comprend tout dans la catégorie spécifiée, même d'autres sous-catégories.
  • Les résultats semblent être par ordre alphabétique, mais tout commence par une lettre majuscule avant tout en minuscule.

Exemples:

  • Les premiers titres de 500 pages dans le Wiktionnaire anglais dans la catégorisation "noms anglais"
  • Continuer, en utilisant le paramètre spécifié à la fin de la requête précédente
  • Premiers titres de 500 pages dans le Wiktionnaire anglais simple dans la catégorie "Noms"
  • Encore une fois, continuer à utiliser le paramètre spécifié à la fin de la requête précédente

En espérant que cela aide, c'est ce que je pourrais proposer.

Je serai la deuxième suggestion de wordnet de @ teknikqa, mais je vous suggère de vérifier leurs API;

HISTOIRE : J'ai eu un cours d'AI qui avait une partie d'analyse de langue; J'ai utilisé les API perl de wordnet pour rechercher automatiquement les trois types de définition les plus élevés et classer le libellé à partir de la fin de l' histoire en temps réel .

Il existe des API pour beaucoup de langues

FYI: Le projet a obtenu un A +