テキストファイルを分割するスクリプト


matriXscan というメール関連製品のログをチェックしたことがありました。 そのときに使ったテキストファイルを分割するスクリプトを紹介します。 ログのチェックはテキストエディタで開けばできるのですが、 そのときのログは 1.3 GB あり、テキストエディタでは開けない巨大なファイルになっていました。

環境

  • Windows

スクリプト

コード

特徴

  • ダブルクリックで動く JScript です。
  • スクリプトと同じディレクトリのファイルを、同じディレクトリに分割していきます。 分割後のファイル名は out1.txt, out2.txt, … となります。
  • 分割対象のファイル名はコード内に直接記入します。
  • 既に出力ファイルと同じ名前のファイル out1.txt が存在しても、上書きの確認画面は出ません。
  • JScriptを使っているのでWindowsでしか動きません。
  • テキストファイルの分割は、行レベルで行います。 そのためコード内で行数を指定しています。 一行の長いファイルだと分割方法を変える必要があり、上のコードでは分割できません。

即席で作ったコードです、改善点はたくさんあります。

100万行ごとに区切ったところ、 1.3 GB のファイルは 10個程のテキストファイル (それぞれ 100 MB 程度) に分割さました。 このレベルなら普通のテキストエディタで開けます。