トップページphp
4コメント2KB

pdf→html TEX→html についてですが

■ このスレッドは過去ログ倉庫に格納されています
0001syokora2006/06/05(月) 23:26:51ID:???
Webアプリケーションを作成することとなり、ブラウザ上でアップロード
すれば、自動で pdfをhtml化 TEX(テフ)をhtml化 のどちらかの機能を
もったものを作りたいのですが、これは可能でしょうか? また、
可能な場合どのような手法をとればよいでしょうか?(言語など)
0004nobodyさん2006/06/09(金) 21:36:14ID:???
>>3

PDFに適切なメタデータが付与されていれば、分類可能では。
TeXで作る時に、hyperrefパッケージとかで、pdfauthorやpdfkeywordに
きちんとデータを与えておけば、それを使ってデータベース化可能だと思う。
TeX→HTMLについても、ソースに\authorや\keywords, \institution(これら
はクラスファイルによってあったりなかったり)など、コマンドの引数として
情報が書いてあれば、それを使って文字列処理できるのでは。

# ただ、そういったデータがついていないファイルについては、誤分類
# 覚悟の上で、「本文中に工学部と書かれていれば所属タグを工学部にする」
# などの処理をするしかないかな。
■ このスレッドは過去ログ倉庫に格納されています