HTML講習2

一つ前

[id:tsugehara:20060616:1150428696]

念のためはじめに

本テキストは実際に講習で使用するので、講習の刺激が薄くなるかもしれない点を理解した上で読んでいただくこと。
日記上の文章を少し改変するかもしれない点と、私の口頭補足が入る点が、本文章を完全に理解してから講習に臨む人の利点としてはあげられるが、個人的には講習参加者は本文章を読まないことをお薦めする。

本文(HTMLの生い立ち)

HTMLとは

HTMLというのはHyperText Markup Languageの略で、ハイパーテキストを作成するための、マークアップ言語という意味になります。
ハイパーテキストというのは、他の文書の位置情報(これをハイパーリンクと呼びます)が埋め込まれたテキストのことで、一つの文書から次々と他の文書に移動出来る文書を指します。今はWWWが一般的になっているので、感覚的に理解いただけると思います。Webページが全てテキストファイルだった時代の不便さを考えれば、発表当時いかに革新的な概念だったかはご想像いただけるでしょう。
マークアップ言語とはマークアップ、つまり目印をある規則に従ってつける事を意味します。「言語」を「規則」と読み替えれば少しわかりやすくなります。
表現を変えてもう一度言いますが、HTMLとは他の文書の位置情報を持つテキストを、規則性のある目印を用いて作成するための決まり事です。


なお、HTMLという規則を定めるにあたり発生した紆余曲折の関係で、現在は1999年12月にリリースされたHTML4というものが標準的になっています。(正確にはHTML4.01)
本書はHTMLの歴史を詳細に言及する資料ではないので、HTMLのバージョン差異に関しては特に記述しないものとします。ただ、本書はHTML4に特化しますので、それ以前の書籍で勉強された方には新しい事、または覆される事がいくつか存在する可能性がある点を留意しておいてください。

WWWとHTML

HTMLを理解するためには、WWWとHTMLの関係を知っておく必要があります。
なぜWebブラウザを立ち上げてURLを入力すると文書が表示されるのか。
文書がなぜHTMLという形式で記述されているのか。
これは全て、WWW、すなわちthe World-Wide Webというシステムで定義されているからです。


WWWは以下三つの概念から成ります。

  1. HTTP (Hyper Text Transfer Protocol)
  2. URL (Uniform Resource Locator)
  3. HTML (HyperText Markup Language)

「URLという位置情報」を基に「HTTPという通信」で「HTMLというドキュメント」を取得するための仕組み。それがWWWです。
HTTPもURLもHTMLもそれぞれ独立した仕様ですが、WWWを用いた通信というのはこれらを統括したものであり、今日「Web(ウェブ)」と呼称されるものは、このWWWのWebの部分のみを抽出した略称です。
WebサーバはWWWサーバ、WebブラウザはWWWブラウザと等価となります。

なぜHTMLが採用されたか

WWWでHTMLが採用されたのはなぜか。
これはとてもシンプルな話で、HTMLはWWWのために考えられた言語だからです。
HTMLの制定者達、ヨーロッパ合同素粒子原子核研究機構(CERN)というところですが、制定者達は、インターネットという環境を利用して、世界中の論文を関連付けたいと考えました。
そのためにハイパーテキストという仕組みを、最も簡潔に実現するための規約を制定し、HTMLをWWWという仕組みに組み込んだのです。
なお、HTTPもWWWのために考えられた通信プロトコルであり、URLもそうです。

SGMLとHTML

よく書籍にはSGMLとHTMLの関係が語られているので、ここで軽く触れます。
SGMLについてはISO8879に公式な仕様書が存在しますので、より興味を持っている人はそちらをご参照下さい。
また、さらに踏み込んだ解説は下記サイトなどに存在します。
http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/intro/sgmltut.html
概略は、HTMLはSGMLという似たような構造を持つ文書から派生したものだが、SGMLとは互換性がない。ただし、HTMLにもSGML的な表記を入れる事は出来る。という感じですが、SGMLについては理解しなくても、HTMLを理解する際の障壁とはなりません。
軽くそんな話もあるのだという程度の認識に留めておいて下さい。

終わりに

こんな感じかな。
ちょっと敷居が高いが、オープニングで気合を入れる意味ではこんなものだろう。