テキストエディタとテキストファイル


 
テキストエディタについて

   テキストエディタとは、文字のみで構成された文書(テキスト)ファイルを編集できるソフトウエアである。例をあげると、Windows環境においてあらかじめ搭載されている”メモ帳”もテキストエディタである。このエディタは主に、プログラムコードやシステムの設定ファイルの多くがテキストファイルであることから、これらを編集するために用いられる。なお、ここでいう編集とは文書の新規作成も含むものとしている。
   テキストエディタの必要性を考えるとき、テキストファイル(厳密にはプレーンテキストファイルという)についてもう少し詳しく知らなければならない。

   ※ その昔、テキストエディタはワープロソフトの動作が遅いことから、日本語の文章を入力・編集するツールとしても利用されてきた(文章が完成に近づいたときにワープロソフトで読み込む)。しかし、最近はそのような使い方はしなくなっている。   

 テキストエディタの存在と使用について学ぶ意義
   テキストエディタの存在は一般的な用途では意識しなくてよいかもしれない。しかし、エンジニアの世界では計測機やマイコンに関するシステムで
   テキストファイルによって記述された定義ファイルを直接編集して、その設定を変えることも未だ行われている。
   以下に定義ファイルの例をリンクする。
   定義ファイルの例
   この内容を直接テキストエディタで編集することによって、その後の該当プログラムの処理が変化する。
   例えば、 color = Red を color = Blue とすると、画面の背景が赤から青に変更になるなどである。

   なお、定義ファイル(あるいはレジストリなど)は、目にすることはなくともほとんどの大規模プログラム(例えば、ブラウザ、メールソフト)で
   なんらかの形で持っていることになる(例:メールソフトの背景色を自分の好みに変更でき、次回起動時にもそれを覚えているなど)。

 


 
テキストファイルについて

   一口に”テキストファイル”と言ってもその内部形式(コンピュータからみた構造)はさまざまである。特に日本人にとっては日本語を扱う必要があるので、英語圏の場合よりも複雑である。これまで日本語を含んだテキストファイル(主にパソコンの場合)の多くはSHIFT-JISコードと呼ばれる漢字コードで表現されてきた。現在では、Unicodeが普及・定着中である。以下に、日本でよく用いられる漢字コードについて表にまとめる。

漢字コード名

主な用途

SHIFT-JISコード パソコン一般[終息中]
JISコード 電子メール転送
EUC UNIXで使用
Unicode 現在[2014年時点]、普及・定着中

   ※ EUC : Extended Unix Code の略
   
   この漢字コードが”表示されるテキストファイル”と”表示するテキスト閲覧ソフト”で一致しないときに起こるのが”文字化け”と呼ばれる現象である。

   次に、テキストの改行を表す”改行コード”も取り扱うOSによって異なっていることがある。この場合も”処理するソフト”と”処理されるテキストファイル”との間に不具合を生じることがある。以下に、主な改行コードを表にまとめる。

改行コード

主な使用OS

<CR><LF> Windows
<LF> UNIX
<CR> MACintosh *

   ※ <CR> : "Carriage Return"の略。もともと”行頭に戻る”ことを意味する文字コード
      <LF> : "Line Feed"の略。もともと”行を送る”ことを意味する文字コード

   * : OS9まで。OS X以後はUNIXと同様

  なお、これら異なった種類の”テキストファイル”を取り扱うには状況に応じて”変換”という作業を行う必要があるが、さまざまなソフトで行うことが可能であるので、興味のある者は各自調べてほしい。


  メモ帳の使用

   テキストエディタとしてWindows上ではメモ帳が全バージョンで使用可能である。

   ”メモ帳”の詳細な使用法は、ソフト内のヘルプ機能 [ヘルプがないこともある] か
外部インターネットでの解説を参考としてほしい。

 戻る