neologdをローカルにインストール

よく忘れるのでメモ

Neologdは最新の単語が入っていてすごく便利なのですが,あまりにも変更があるので,研究に使うにはちょっと困ってしまいます。
Versionの固定されたちょっと古いものを使用します。

wget https://github.com/neologd/mecab-ipadic-neologd/archive/v0.0.5.tar.gz
tar zmvfp v0.0.5.tar.gz
cd mecab-ipadic-neologd-0.0.5

インストール

./bin/install-mecab-ipadic-neologd --prefix /path/to/install/dir -u

ここでuオプションをつけるとローカル領域にインストールできます。

正規表現でURLを削除

pythonで正規表現でURLを削除する方法のメモ

ここを参考に作成したのですが,どうもバグっているのか,Pythonと相性が悪いようなので修正した。


import re

str="。少し前ですがhttp://lite-ra.com/2014/11/post-605_2.htmlってどういうことなのでしょうか?"
ret = re.sub(r"(https?|ftp)(:\/\/[-_\.!~*\'()a-zA-Z0-9;\/?:\@&=\+\$,%#]+)", "" ,str)

print ret # 少し前ですがってどういうことなのでしょうか?