OpenNLP

Basisdaten

Entwickler Apache Software Foundation
Erscheinungsjahr 22. April 2004[1], 14. April 2012[2]
Aktuelle Version 2.4.0[3]
(16. Juli 2024)
Betriebssystem Plattformunabhängig
Programmier­sprache Java[2][4]
Kategorie Computerlinguistik
Lizenz Apache 2.0
opennlp.apache.org

Die Apache OpenNLP Bibliothek ist ein auf maschinellem Lernen basierendes Toolkit in der Programmiersprache Java für die Verarbeitung von natürlichsprachlichem Text im Bereich Computerlinguistik oder Natural Language Processing (NLP). Sie unterstützt die gängigsten NLP-Aufgaben, wie Identifikation der Sprache, Tokenisierung, Satzsegmentierung, Part-of-Speech-Tagging, Extraktion benannter Entitäten, Chunking, Parsing und Auflösung von Koreferenzen. Diese Aufgaben sind in der Regel erforderlich, um fortgeschrittenere Textverarbeitungsdienste aufzubauen. Es gilt die Freie-Software-Lizenz der Apache Software Foundation. Ziel des OpenNLP-Projekts ist es, ein ausgereiftes Toolkit für die oben genannten Aufgaben zu entwickeln und eine Anzahl von vorgefertigten Modellen für verschiedene Sprachen bereitzustellen.

Die enthaltenen Komponenten ermöglichen es, die jeweilige Aufgabe der Sprachverarbeitung auszuführen, ein Modell zu trainieren und oft auch ein Modell zu bewerten. Jede dieser Komponenten ist über ihre Programmierschnittstelle (API) zugänglich. Darüber hinaus sind sie jeweils über die Kommandozeile (CLI) aufrufbar, um Experimente und Schulungen zu erleichtern.[5]

Details

[Bearbeiten | Quelltext bearbeiten]
[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. sourceforge.net.
  2. a b projects.apache.org. (abgerufen am 8. April 2020).
  3. Release 2.4.0. 16. Juli 2024 (abgerufen am 21. Juli 2024).
  4. www.openhub.net. In: Open Hub. (abgerufen am 25. Januar 2021).
  5. OpenNLP – Quora. Abgerufen am 11. Februar 2019.
  6. Models Download – Apache OpenNLP. Abgerufen am 11. Februar 2019.
  7. OpenNLP Tools Models. Abgerufen am 11. Februar 2019.
  8. Apache Stanbol – OpenNLP POS Tagging Engine. Abgerufen am 11. Februar 2019.