« 恋にヲチたら | トップページ | 不正接続防止 »

2005-04-25

extrans.py

ちょっと前にsetomitsさんのblogにてgoodic.pyなるものを見つけました。

blogSetomits - goodic.py for Windows

なかなかおもしろかったので、類似品でextrans.pyなるものを作ってみた。

何かというと、exciteの翻訳ページを用いて英文和訳をするスクリプトです。使い方は以下。

~/src/python > python extrans.py "This is a pen."

これはペンです。

WinXP+cygwin、及びRedhat9にて動作を確認しました。

実装としては、

  • HTMLタグを解析するのではなく、横着して正規表現にて対象領域を抜き出している
  • 自分が英文和訳しか使わないので英文和訳にしか対応していない
  • 出力文字コードはshift-jis(ターミナルによっては変更が必要)

となっています。

あと、proxy環境で使う場合には、urllibを使っているので環境変数http_proxy下記のように設定すれば良いです。

例えば、proxyのIPアドレスが192.168.0.1で、ポート番号が8000番をbashの環境変数に設定するなら

export http_proxy="http://192.168.0.1:8000/"

ソース

で、これで何をするかっていうと、英語サイトのRSSタイトルを翻訳するのに使ってます。

feedparserで取ってきたタイトルだけをひとまとめにして翻訳して、斜め読みします。ちょっとおかしな翻訳になったりはするけど、翻訳文を見て興味をそそられれば英文を見て判断すればいいのであんまり気にならないかな。

|

« 恋にヲチたら | トップページ | 不正接続防止 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/102385/3850801

この記事へのトラックバック一覧です: extrans.py:

» goodicコマンド [blogSetomits]
shunuhsさんのsh1.2のextrans.pyからトラックバックをいただきました。 何かというと、exciteの翻訳ページを用いて英文和訳をするスクリプトです。 とのこと。面白いですね。後で試してみよう。 ところでライブラリ化したgoodicを使って、コマンドラインからGoo辞書を引くgoodicコマンドを。 僕が使うたいていターミナルはEUC-JPなので、入出力ともEUC-JPです。 ということで、ソースと実行例は以下のような感じ。... [続きを読む]

受信: 2005-04-26 10:39

« 恋にヲチたら | トップページ | 不正接続防止 »