2008年11月26日水曜日

ngram2csv[表示のみ]

某JBスレで要望があったので適当に作ってみました。逆変換は実装してません。
出力csvの項目で重複している部分があるのはngram.datのファイル構造に起因します。
(sys.dicとngram.datの単語検索部分の共通化の為と思われます。)

使い方はsysdic2csvと一緒です。
ダウンロード

2 件のコメント:

Unknown さんのコメント...

leo.sさんJBスレに戻ってきて下さい!
3.0のsys.dic周辺が結構変わっててさっぱり分かりません!
sysdic2csvも3.0のsys.dicは読み込めませんでした。
3.0のsys.dicの場所は
/usr/lib/dic/ja以下のフォルダ
imとtokという2箇所にあります。
他にもwordpool.dicなんていうのもあります!

leo.s さんのコメント...

対応してみました。
imのsys.dicで一応使えますが、tokの方は・・なんの為のファイルかまだ調査してません。