2007年8月31日金曜日

webページをpsファイルに変換して保存したいのだが

ネットで検索するといくつかの方法が見付かった。

1、firefoxの印刷メニューのところでファイルに保存にチェックをいれ、psファイルを作成するを選ぶ。
2、html2psコマンドを用いる。
3、mozilla2psを用いる。

まず1であるが、ページ数がたくさんあった時に面倒。
2は、日本語の文字化けなど、問題がいくつかある。

そこで3を見付けたのだが、まだ使いかたがわからない。
ひきつづき探そう。
--------------------------------------------------
続けて探していたが、未だ解決できず。

まず、適当なスクリプトでダウンロードしたhtmlファイル(Downloaded_page.html)をpsファイルに変換したい場合、

html2ps Downloaded_page.html > Downloaded_page.ps

では、文字化けする。そのため、html2psrcに以下を書き加える。

/*---------ここから------------*/
BODY { font-family: eucjp}

@html2ps{
option{
encoding: "EUC-JP";
}
font {
eucjp{
names: "Ryumin-Light-H";
}
}
}
/*---------ここまで-----------*/

その後、

html2ps -e ISO-2022-JP -o Downloaded_page.ps Downloaded_page.html

を実行してみる。しかし、これでもうまくいかない。そこでその原因をDownloaded_page.htmlの文字コードがISO-2022-JPではないと考え、

nkf -j Downloaded_page.html > test.html

として、その後

html2ps -e ISO-2022-JP -o Downloaded_page.ps test.html

とした。すると、文字化けが消えた。

ところが、psファイルを表示しようとすると、psファイルの1ページ目はきちんと表示されるが、2ページ目に進もうとするとエラーが表示される。

おそらく原因は、html2psrcファイルでencodingをEUC-JPにしているためなのだろうが、nkfでEUCに変換してもうまくいかないし。

とにかくまだつまっている。。。

0 件のコメント: