ふと思いついたので、tree-tagger を使って英文の形態素解析を試してみました。
要素(単語)に分解してそれぞれの品詞とかを分けてくれるので英語学習にも良さそう…?
Mac にインストールして試してみたのでその備忘録。
$ mkdir tree-tagger
$ cd tree-tagger
# Mac OSX 用のパッケージをダウンロードする
$ wget http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger-MacOSX-3.2.tar.gz
# スクリプトをダウンロードする
$ wget http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tagger-scripts.tar.gz
# インストールスクリプトをダウンロードする
$ wget http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/install-tagger.sh
# 英語のパラメータファイルをダウンロード(他の言語も必要な場合は別途ダウンロードする)
$ wget http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/english-par-linux-3.2-utf8.bin.gz
圧縮ファイル等、すべて解凍する必要はなくて、そのままフォルダに格納するだけでよいです。
$ sh ./install-tagger.sh
TreeTagger version for Mac OS-X installed.
Tagging scripts installed.
English parameter file (UTF8) installed.
Path variables modified in tagging scripts.
You might want to add /xxxx/xxx/tree-tagger/cmd and /xxxx/xxx/tree-tagger/bin to the PATH variable so that you do not need to specify the full path to run the tagging scripts.
$ vim ~/.bash_profile
# 以下を設定
export PATH=$PATH:/xxxx/xxx/tree-tagger/cmd:/xxxx/xxx/tree-tagger/bin
# 設定を反映
$ source ~/.bash_profile
$ echo 'This is a pen!' | tree-tagger-english
reading parameters ...
tagging ...
finished.
This DT this
is VBZ be
a DT a
pen NN pen
! SENT !
DT: Determiner(限定詞)
VBZ: verb be, pres, 3rd p. sing be(動詞の三人称単数形現在)
NN: noun, singular or mass(名詞の単数形または不可算名詞)
SENT: end punctuation(文末の句読点記号)
なお、 echo する文字列(英文)はシングルクォートしましょう。
$ echo "This is a pen!" | tree-tagger-english
-bash: !": event not found
新しい記事へ
はてなブックマーク登録ボタンを一覧ページに設置する方法と SSL 対応の方法
古い記事へ
新宿御苑で初夏の癒やしを感じてきました♥
mac に pip をインストールする
mac は標準で python が入っていますが、パッケージ管理の pip がインストールされていないので入れてみました。
2017/05/26 09:00
[GAS] Google Drive の特定フォルダ配下のフォルダ・ファイルの権限を一括で移譲する
Google Drive の特定フォルダ配下のファイル・フォルダの権限を一括で移譲するツールを Google Apps Script で作りました。
2018/11/10 15:54
[Windows] Ophcrack を使ってユーザーパスワードを解析する方法
家族で使っていた Windows7 のログインパスワードを忘れたため、Ophcrack を使って解析したときの記録です。
2017/09/30 21:00
[shell] フォルダ内にある大量の ZIP ファイルをまとめて解凍する
とある ZIP を解凍すると中に大量の ZIP が居たときに幸せになれるコマンドを紹介します
2018/06/19 23:45
[MySQL] データファイルから DB を復元する
先日 MySQL が再起動できなくなる問題が発生し、急遽データファイル(.frm, .ibd)から復元しました
2018/11/25 12:44