計算機科学のブログ

HaskellのI/O バイナリデータの操作 ByteStringとUnicode、文字数とバイト数、Data.Text.Encodingモジュール、encodeUtf8関数

入門Haskellプログラミング (Will Kurt(著)、株式会社クイープ(監修、翻訳)、翔泳社)のUNIT4(HaskellのI/O)、LESSON 25(バイナリデータの操作)、25.5(練習問題)Q25-1の解答を求めてみる。

コード

import System.Environment
import qualified Data.Text as T
import qualified Data.Text.IO as TI
import qualified Data.Text.Encoding as E
import qualified Data.ByteString as B


main :: IO ()
main = do
    args <- getArgs
    let filePath = head args
    input <- TI.readFile filePath
    putStr "文字の個数: "
    print (T.length input)
    putStr "バイトの個数: "
    print ((B.length . E.encodeUtf8) input)

入出力結果(Terminal, Zsh)

% runghc sample1.hs hello.txt
文字の個数: 26
バイトの個数: 32
% cat hello.txt 
Hello, world!
Hello, 日本語!
% runghc sample1.hs sample1.hs 
文字の個数: 395
バイトの個数: 417
%