Neologd installieren

Neologd ist ein Dictionary, das mit MeCab verwendet werden kann.  Seine Stärke ist für Neologismen und Eigennamen.
Der Inhalt des Dictionary wird zweimal in einer Woche aktualisiert.

Neologd ist hier zu finden:
https://github.com/neologd/mecab-ipadic-neologd

Eigentlich steht dort alles, wie man es installiert und verwendet... Aber hier beschreibe ich trotzdem...

Systemvoraussetzung:
Ubuntu 16.04
Mindest RAM 1.5GB

Zuerst clont man das repository:

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

 Mit "depth 1" wird der Umfang des repositorys eingegrenzt. Wenn man das ganze Repository clonen will, soll man "--depth 1" aus der Befehlzeile löschen.

Dann geht man zum Ordner:

$ cd mecab-ipadic-neologd

Und von dort kann man das Dictionary installieren:

$ ./bin/install-mecab-ipadic-neologd -n

Mit diesem Befehl wird auch das Update vom Dictionary ausgeführt.  Weil das Wörterbuch zweimal in einer Woche aktualisiert wird, sollte man vielleicht häufig machen...

So ist die Installation fertig. Wenn man das Wörterbuch mit MeCab verwenden will, soll man den Befehl so formulieren:

$ mecab -d /usr/lib/mecab/dic/mecab-ipadic-neologd
Zum Beispiel das Wort "幽☆遊☆白書" wird mit Neologd richtig als Eigenname analysiert:



Mit dem IPA-Dic wird das Wort nicht als Eigenname erkannt:




Neologd ist daher geeignet für die Textanalyse für das gegenwärtige Japanisch

Kommentare

Beliebte Posts