Je recherche une source de noms, d'adverbes, d'adjectifs et de verbes en plusieurs langues.
J'aimerais que les listes soient déjà divisées et qu'elles ne doivent pas passer à travers l' OED (et les équivalents non anglais) à la main en recréant ces listes.
Je ne m'intéresse pas vraiment aux définitions, et je comprends que certains mots peuvent être des parties multiples du discours – c'est bien – des mots comme «beaucoup» peuvent être un nom ou un adjectif et peuvent apparaître dans les deux listes.
Quelqu'un connait-il une telle source? Sinon, quelqu'un pourrait-il me montrer dans la bonne direction?
Je suis d'accord avec le format de l'un des éléments suivants (ou similaires si les gens ont des idées):
<word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
J'ai utilisé WordNet de Princeton University pour certains projets. Il s'agit d'une base de données lexicale en anglais. Global WordNet est une extension du projet essayant de faire de même pour toutes les langues.
Vous pourriez également être intéressé par des projets connexes à http://wordnet.princeton.edu/wordnet/related-projects/
Cela peut ne pas aider du tout, je ne sais pas. Mais MediaWiki a un api pour la liste de toutes les pages appartenant à une certaine catégorie. Vous pouvez essayer de l'utiliser sur Wiktionary.org.
Remarques:
Exemples:
En espérant que cela aide, c'est ce que je pourrais proposer.
Je serai la deuxième suggestion de wordnet de @ teknikqa, mais je vous suggère de vérifier leurs API;
HISTOIRE : J'ai eu un cours d'AI qui avait une partie d'analyse de langue; J'ai utilisé les API perl de wordnet pour rechercher automatiquement les trois types de définition les plus élevés et classer le libellé à partir de la fin de l' histoire en temps réel .
Il existe des API pour beaucoup de langues
FYI: Le projet a obtenu un A +