Pandocでテキストデータ変換

Pandocを使うと様々なテキストデータを変換することができます。Markdown、HTML、epub の変換に使えそうなのでインストールをしてみました。

資料は「Pandoc – Installing」を参考にしました。Haskellのアプリなので、Haskellが動作する環境であれば使えるそうですが、普通はhaskell-platform を入れて使うようです。Windows, MacOS X, Linux どれでもいけます。

haskell-platformについて、Ubuntuだと、下記のように簡単にインストールができるようです。texliveはPDF出力に必要だとのこと。

$ apt-get install haskell-platform.
$ apt-get install texlive

CentOSだと、haskell-platform をインストールするときに、ちょっと苦労するかもしれません。rpm版のHaskell実行環境 ghc はバージョンが若干古いですから、「Haskellをソースコードからインストールするのは大変そう… | hiro345」を参考にしてインストールすると良いでしょう。

Pandocはhaskell-platformに同梱されているcabalというパッケージ管理システムで簡単にインストールできます。 .bash_profileへ下記を追加して cabal で管理されているアプリが使えるようにしておきましょう。

export PATH=$HOME/.cabal/bin:$PATH

cabalを使ってpandocをインストールするには下記のようにします。

$ cabal update
$ cabal install pandoc

インストールができたら、下記のようにMarkdownで書いた sample.md ファイルなどを用意してみましょう。簡単にHTMLへ変換できます。cabalコマンドが動かないときは、$HOME/.cabal/bin/pandoc と指定してみましょう。

pandoc -f markdown -t html sample.md -s -o sample.html

Pandoc は Haskell のパーサコンビネータが強力なため、多くのテキスト変換モジュールを開発することができるという話もあります。Haskell に興味があるようでしたら、下記の書籍が良いでしょう。

同じタグの記事: CentOS
同じタグの記事: Haskell
同じタグの記事: Linux
同じタグの記事: Pandoc
同じタグの記事: Ubuntu
同じカテゴリの記事: Linux
関連書籍: CentOS
関連書籍: Haskell