Neologd installieren
Neologd ist ein Dictionary, das mit MeCab verwendet werden kann. Seine Stärke ist für Neologismen und Eigennamen.
Der Inhalt des Dictionary wird zweimal in einer Woche aktualisiert.
Neologd ist hier zu finden:
https://github.com/neologd/mecab-ipadic-neologd
Eigentlich steht dort alles, wie man es installiert und verwendet... Aber hier beschreibe ich trotzdem...
Systemvoraussetzung:
Ubuntu 16.04
Mindest RAM 1.5GB
Zuerst clont man das repository:
Mit "depth 1" wird der Umfang des repositorys eingegrenzt. Wenn man das ganze Repository clonen will, soll man "--depth 1" aus der Befehlzeile löschen.
Dann geht man zum Ordner:
Und von dort kann man das Dictionary installieren:
Mit diesem Befehl wird auch das Update vom Dictionary ausgeführt. Weil das Wörterbuch zweimal in einer Woche aktualisiert wird, sollte man vielleicht häufig machen...
So ist die Installation fertig. Wenn man das Wörterbuch mit MeCab verwenden will, soll man den Befehl so formulieren:
Mit dem IPA-Dic wird das Wort nicht als Eigenname erkannt:
Neologd ist daher geeignet für die Textanalyse für das gegenwärtige Japanisch
Der Inhalt des Dictionary wird zweimal in einer Woche aktualisiert.
Neologd ist hier zu finden:
https://github.com/neologd/mecab-ipadic-neologd
Eigentlich steht dort alles, wie man es installiert und verwendet... Aber hier beschreibe ich trotzdem...
Systemvoraussetzung:
Ubuntu 16.04
Mindest RAM 1.5GB
Zuerst clont man das repository:
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
Mit "depth 1" wird der Umfang des repositorys eingegrenzt. Wenn man das ganze Repository clonen will, soll man "--depth 1" aus der Befehlzeile löschen.
Dann geht man zum Ordner:
$ cd mecab-ipadic-neologd
Und von dort kann man das Dictionary installieren:
$ ./bin/install-mecab-ipadic-neologd -n
Mit diesem Befehl wird auch das Update vom Dictionary ausgeführt. Weil das Wörterbuch zweimal in einer Woche aktualisiert wird, sollte man vielleicht häufig machen...
So ist die Installation fertig. Wenn man das Wörterbuch mit MeCab verwenden will, soll man den Befehl so formulieren:
$ mecab -d /usr/lib/mecab/dic/mecab-ipadic-neologdZum Beispiel das Wort "幽☆遊☆白書" wird mit Neologd richtig als Eigenname analysiert:
Mit dem IPA-Dic wird das Wort nicht als Eigenname erkannt:
Neologd ist daher geeignet für die Textanalyse für das gegenwärtige Japanisch
Kommentare
Kommentar veröffentlichen