● テキストファイルのフォーマット(形式)とは?
コンピュータでデータを処理するときにフォーマット(形式、データの大きさ・順番等)が決まっていると
自動的に処理をするのが簡単である。
通常のデータ(いろいろなソフトウエアの専用データなど)はこの形式が決まっているが、自由度の高い
テキストファイルで自動処理を行うには用途に合わせてフォーマットを各々定める必要がある。
テキストファイルをフォーマットに従って記述するには以下のような知識が必要となる。
|
|
● 半角文字と全角文字について
日本におけるコンピュータの社会(取り扱い)では、半角文字と全角文字の区別をする必要がある。
半角文字と全角文字とは、もともとワープロにおける文字の大きさを示す言葉であったが、
任意の大きさや縦横比の文字を使用できる現在では、以下の意味で用いられることが多い。
すなわち、大雑把に分けると、半角文字はアルファベット圏で用いられる文字(1バイト文字)であり、
全角文字は漢字(2バイト文字)である。
ここで難しいのは、漢字はすべて全角文字であるが、アルファベットや数字等どちらにもある文字が存在することである。
(日本では半角文字のカタカナ[半角カナ]も存在するが、インターネット上では使用禁止文字となっている。)
(他にも全角のローマ数字や○で囲んだ数字が使用禁止文字である。)
最近、プロポーショナルフォント(文字固有の幅によって文字間隔が異なる書体)の普及によって
両者の違いが付きにくいので気をつける必要がある。
以下に例を示す。
半角文字: ABCDEFGHIJKabcdefghijk012345+-*/
全角文字: ABCDEFGHIJKabcdefghijk012345+−*/
なお、テキストエディタはワープロソフトなどと異なり、固定ピッチフォント(文字種によって文字間隔が変化しない書体)を
あらかじめ使用していることが多いので、その区別は比較的しやすくなっている。
|
|
● 定型フォーマットとは?
ここでいう定型フォーマットとは、例えば以下のように、1行目に学生番号、2行目に氏名、3行目に題目など
を順番通りに記述したものを示す。
定型フォーマットで記述することは、指定されたサンプル(例題)と同じような形にすることであり、
勝手に空白・改行を入れたりアレンジをしてはいけない。また、半角文字や全角文字などの指定がある場合は
それに従わなければならない。
1:学生番号(半角):0000001
2:氏名(漢字):機械太郎
3:題目:コンピュータについて
|
|
● 固定長フォーマットとは?
ここでいう固定長フォーマットとは、上の定型フォーマットに加え、
各項目の文字列が使用する長さも決まっている形式を示す。
コンピュータにとって処理を行うのは簡単であるが、
余分なスペースがある(逆に文字列の長さが足りない場合もありえる)のでそのときどきによって使用する。
例えば、以下のように1行の全体の長さが固定されているものをいう。
この形式では、指定されたサンプルを上書きするようにして編集するとよい。
なお、実際には、下の"*"や"*"の箇所に空白文字(スペース)が入ることを想定している。
1:学生番号:0000001**氏名:機械太郎*****題目:機械工学の歴史について******::行の終わり
2:学生番号:0000002**氏名:創成純一郎****題目:新しい自動車の機能********::行の終わり
3:学生番号:0000003**氏名:未来花子*****題目:航空機に関する詳細な報告*****::行の終わり
|
|
→ 戻る
|