extrans.py
ちょっと前にsetomitsさんのblogにてgoodic.pyなるものを見つけました。
blogSetomits - goodic.py for Windows
なかなかおもしろかったので、類似品でextrans.pyなるものを作ってみた。
何かというと、exciteの翻訳ページを用いて英文和訳をするスクリプトです。使い方は以下。
~/src/python > python extrans.py "This is a pen."
これはペンです。
WinXP+cygwin、及びRedhat9にて動作を確認しました。
実装としては、
- HTMLタグを解析するのではなく、横着して正規表現にて対象領域を抜き出している
- 自分が英文和訳しか使わないので英文和訳にしか対応していない
- 出力文字コードはshift-jis(ターミナルによっては変更が必要)
となっています。
あと、proxy環境で使う場合には、urllibを使っているので環境変数http_proxy下記のように設定すれば良いです。
例えば、proxyのIPアドレスが192.168.0.1で、ポート番号が8000番をbashの環境変数に設定するなら
export http_proxy="http://192.168.0.1:8000/"
で、これで何をするかっていうと、英語サイトのRSSタイトルを翻訳するのに使ってます。
feedparserで取ってきたタイトルだけをひとまとめにして翻訳して、斜め読みします。ちょっとおかしな翻訳になったりはするけど、翻訳文を見て興味をそそられれば英文を見て判断すればいいのであんまり気にならないかな。
| 固定リンク


コメント