OSDN Git Service

229ccf18abc8c9c658ad9392e766d6ad18673aca
[luatex-ja/luatexja.git] / doc / sample1.tex
1 %#! time luatex sample1
2 \input s1sty.tex % style file
3
4 \message{BB}
5 \overfullrule=0pt
6 \def\LaTeX{L\kern-.36em\setbox0=\hbox{T}\vbox to\ht0{\hbox{\sevenrm A}\vss}\kern-.15em\TeX}
7 \font\mff=manfnt at 10pt
8 \def\mf{{\mff META{\rm\-}FONT}}
9 \def\textfontii{\the\textfont2 }
10 \def\AmS{{\textfontii A\kern-.1667em\lower.5ex\hbox{M}\kern-.125emS}}
11 \def\UPSILON{\char'7}%
12 \def\XyM{X\kern-.30em\smash{\raise.50ex\hbox{\UPSILON}}\kern-.30em{M}}%
13 \def\XyMTeX{\XyM\kern-.1em\TeX}%
14
15
16 % main matter
17 \centerline{\big Lua\TeX-jaパッケージ}\bigskip
18 \centerline{\large\the\year/\the\month/\the\day}\medskip
19
20 \message{AA}
21 \bigskip
22
23 本パッケージは,(最低でもp\TeX と同等の水準の)日本語組版をLua\TeX 上で実現させることを
24 目標としたマクロである.まだまだ足りないところはあるが,とりあえず動くようになった?ので公開する. 
25
26 %{\showboxdepth=10000\showboxbreadth=10000\tracingonline=1\scrollmode\showlists}\end
27
28 \beginparagraph 特徴
29
30 \item 欧文フォント/和文フォントの外部独立管理.
31 \item 違う和文フォントでも「メトリックが同じ」なら,字間に空白を挿入する際には同じものとして扱う.
32 {\bf 例}: 「ほげほげ){\gt (ふがふが}」は以下の出力より得られた:
33 \begintt
34 ほげほげ){\gt (ふがふが}
35 \endtt
36 \item 欧文や和文のベースライン補正が可能.
37 \item p\TeX とある程度コマンド名が互換.
38 \enditem
39
40 \beginparagraph 制限
41
42 \item 全体的にテスト不足です.
43 \item {\bf 現時点で\LaTeX での使用は殆ど考慮されていません.今は``plain Lua\TeX''で使ってください.}
44 \item |\accent|を和文文字に対して使うことはできません.
45 これは「フォントを後で置換する」という実装上,仕方のないことだと思われます.
46 \item 数式中の日本語は想定していません.|\hbox|か何かで囲ってください.
47 \item p\TeX にあった以下の機能はまだ実装していません.
48 \itemitem |\euc|, |\jis|, |\sjis|, |\kuten|といった,コード変換プリミティブ.
49 \itemitem |\kansuji|, |\kansujichar|.
50 \itemitem |\showmode|, |\jfam|, |\jcharwidowpenalty|.
51 \itemitem 縦組み関連一式.|\tate|, |\tfont|, |\tbaselineshift|, |\dtou|,$\,\ldots$
52 \enditem
53
54
55 \beginparagraph ファイル構成
56
57
58 \item {\tt luatexja-core.sty}: 
59 コア部分.拡張子は{\tt sty}であるが,この単一のファイルでplain \TeX と\LaTeX 両方に
60 対応するように設計する方針である.しかし,
61 {\bf 現時点で\LaTeX での使用は全く考慮されていない.}
62 \item {\tt luatexja-core.lua}: コア部分に使われるLuaコード.
63 \item {\tt luatexja-jfont.lua}: 和文フォント定義部のLuaコード.
64 \item {\tt luatexja-rmlgbm-data.lua}: 非埋込和文フォント用のデータ(小塚明朝Pr6N R由来).
65 \item {\tt luatexja-rmlgbm.lua}: 非埋込和文フォント (Ryumin-Light etc.) 定義部.
66 \item {\tt mk-rmlgbm-data.tex}: {\tt luatexja-rmlgbm-data.lua}作成用スクリプト
67 {\small(小塚明朝を{\tt luaotfload}で読み込んだ時のキャッシュが必要)\inhibitglue}.
68 \item {\tt luatexja-kinsoku.tex}: 禁則用ペナルティ等のパラメータを書いたファイル.
69 下のファイルによって{\tt ukinsoku.tex} (in up\TeX-0.30) から自動生成されたもの.
70 \item {\tt jfm-ujis.lua}: up\TeX-0.30の{\tt ujis.tfm}ベースのメトリックサンプル.
71 \item {\tt jfm-mono.lua}: 「全文字が全角幅」のメトリックサンプル.
72 \enditem
73
74 \beginsection 使用方法
75
76 大雑把に言うと,plain \TeX の状況で,以下のようにすればよい.
77 \begintt
78 \input luatexja-core.sty               % ←マクロ本体を読み込み
79 \jfont\tenipam={file:ipam.ttf:jfm=ujis} at 13.5\jQ 
80 \tenipam\parindent=1\zw 
81
82 \rm\tenipam abcほげほげ)(あいう本文本文……
83 \endtt
84
85 \beginsection 実装解説
86
87 \beginparagraph attributes, dimensions,$\,\ldots$
88
89 以下はLua\TeX-jaパッケージ内で使用するattributeやその他の種類のレジスタである.
90 上6つは内部処理用なので利用者が意識することはない.それ以外は,p\TeX に類似の名前の
91 primitiveがあることから,意味は容易にわかるだろう:
92
93 \item attribute |\luatexja@curjfnt|: 現在の和文フォント番号
94
95 p\TeX では内部のグローバル変数で「現在の横組/縦組和文フォント」をそれぞれ保持していたが,
96 当然ながら欧文用\TeX ではそのようなことはそのままではできない.
97 node~$p$が保持しているattribute |\luatexja@curjfnt|の値$k$は,
98 「もし$p$の中身が和文文字であれば,そのフォントは$k$番の番号のフォントである」という意味をもつ.
99
100 \item attribute |\luatexja@charclass|: (和文文字の)文字クラス
101
102 \item attribute |\luatexja@icflag|: この属性をもつkernはイタリック補正由来である
103
104 p\TeX では,|\kern|由来のkernと,イタリック補正由来のkernを内部で区別していた.しかし,
105 欧文用の\TeX ではそのような区別はなく,Lua\TeX においても区別がないようである.
106
107 \item language |\luatexja@japanese|: 「日本語」に対応する|\language|番号
108
109 \item attribute |\luatexja@yabaselineshift|: 欧文文字ベースラインの補正量.
110 \itemitem {\bf sp$\fam\bffam {}=2^{-16}\,{\bf pt}$単位の整数値}で指定.
111 正の値を指定すると,その分だけ欧文文字は下にずれる.
112 \itemitem 数式中では,boxやruleもこの量だけずれる\hfil\break
113 (よって,行中数式は全体が|\yabaselineshift|だけずれたように見える).
114 \item attribute |\luatexja@ykbaselineshift|: 和文文字ベースラインの補正量.
115
116 p\TeX では「和文が主」という考えからか,常に和文文字のベースラインが基準であり,
117 欧文文字の方をずらすことになっていた.しかし,「欧文の中に和文をちょっと入れる」ような場合では,
118 逆に和文文字をずらす方が理にかなっているので,和文文字のベースラインもずらせるようにした.
119
120 また,これを用いることで%
121 {\small 異なる文字サイズの文字を「上下中央揃え」で組む}ことも可能.
122 \item skip |\kanjiskip|: 和文文字同士の間に入る空白量.
123 \item skip |\xkanjiskip|: 和文文字と欧文文字の間に入る空白量.
124 \item count |\jcharwidowpenalty|: {\bf 未実装}
125 \item dimen |\zw|, |\zh|: 現在の和文フォントの「幅」/「高さ」(メトリックから指定)
126 \item dimen |\jQ|, |\jH|${}= 0.25\,{\rm mm}$
127 \enditem
128
129
130 \beginparagraph 和文フォントの定義
131
132 Lua\TeX-jaでは,大雑把にいうと
133 和文フォントは「実際の字形」と「和文用のメトリック情報 (JFM)」の組である.
134 JFM は和文文字の幅や,和文文字間の空白の入り方などを規定するもの%
135 {\small (p\TeX におけるJFMファイルとほぼ同じ内容)}であり,
136 |jfm-<name>.lua|という名称のファイルにLuaコードの形で書かれている.
137
138 和文フォントを使うには,
139 \TeX の|\font| primitiveと同様の書式を持った次の命令を用いて和文フォントを定義する:
140
141 \begintt
142   \jfont<font>={<font_name>:<features>} <size>  % local に定義
143   \gjfont<font>={<font_name>:<features>} <size> % global に定義
144 \endtt
145
146
147 \item {\bf <font_name> の指定について}\par\noindent
148 内部でluaotfloadパッケージを読み込んでいる.大きくわけて,以下の4種類がある.
149 このうち,前の2つはluaotfloadパッケージの機能である.
150 \itemitem |file:<file_name>|\par\noindent
151 TrueType/OpenTypeフォントをファイル名<file_name>で指定.
152 \itemitem |name:<font_name>|\par\noindent
153 システム内のフォント名を<font_name>に指定することも可能.
154 \itemitem |psft:<PSfont_name>|\par\noindent
155 PSフォント名<PSfont_name>を直接指定することもでき,
156 この場合はフォントは名前だけ(非埋込)となる.
157 例えば,本文章では,
158 \begintt
159 \jfont\tenmc={psft:Ryumin-Light:jfm=ujis} at 13.5\jQ
160 \jfont\tengt={psft:GothicBBB-Medium:jfm=ujis} at 13.5\jQ
161 \endtt
162 のような定義をし,標準和文フォントRyumin-Light, GothicBBB-Mediumを用いている.
163 %\itemitem |vf:<vfname>|
164
165 \item {\bf JFMの指定}:<features>欄に次を指定する.\par\noindent
166 \itemitem |jfm=<jfm_file>|: JFMとして|jfm-<jfm_file>.lua|を用いることを示す.必須.
167 \itemitem |jfmvar=<varkey>|\par\noindent
168 和文文字間の空白の挿入処理は,使用するJFMと,この<varkey>の値とのペアによって行われる.
169
170 \item luaotfload packageの他の機能,例えば各種のfeature,を用いてもよい:
171 \begintt
172 \jfont\tenipam={file:ipaexm.ttf:script=latn;+jp90;jfm=mt}
173 \endtt
174 なお,非埋込の場合は,GSUB/GPOSテーブルとして小塚明朝 Pr6N Rのものが用いられる
175 (|test01-noembed.pdf|を参照).
176 \enditem
177
178 \beginparagraph 組版パラメタの調整
179
180 日本語組版用の各種パラメタの調整には,次の命令を用いる.
181 \begintt
182   \setjaparameter{<key>=<value>, ...}       % local に変更
183   \globalsetjaparameter{<key>=<value>, ...} % global に変更
184 \endtt
185
186 <key> に許される値は次の通りである.
187
188 \enum ★がついているものは,段落や水平ボックス構成時の値が全体に影響するものである.
189
190 \enum ◎がついているものは,自動的にglobalな代入となってしまうもの.
191
192 \item |prebreakpenalty={<chr_code>, <penalty>}|★\par\noindent
193 p\TeX の|\prebreakpenalty|に対応した設定項目である.
194 \itemitem <chr_code>: 文字コードを指定する.一旦補助カウンタに代入されるので,
195 16進法での数値の指定 (|"abcd|) や,%"
196 文字トークンによる指定 (|`あ|) も可能である.
197 \itemitem <penalty>: penalty の値を0から10000までの自然数で指定する
198 {\small(範囲外でも可能だが)\inhibitglue}.
199
200 \item |postbreakpenalty={<chr_code>, <penalty>}|★\par\noindent
201 同様に,p\TeX の|\postbreakpenalty|に対応した設定項目である.
202 p\TeX では,同一文字に対して|\prebreakpenalty|, |\postbreakpenalty|の両方を定義する
203 ことはできなかったが,Lua\TeX-jaでは可能である.
204
205 \item |cjkxspmode={<chr_code>, <mode>}|★\par\noindent
206 p\TeX の|\inhibitxspcode|に対応した設定項目である.<mode>で許される値は,
207 \itemitem 0, 1, 2, 3: p\TeX の対応するprimitiveと同じ意味.
208 \itemitem |inhibit|: 前後の欧文文字との間の|\xkanjiskip|自動挿入を禁止.
209 \itemitem |preonly|: 前の欧文文字との間の|\xkanjiskip|自動挿入のみを許可.
210 \itemitem |postonly|: 後の欧文文字との間の|\xkanjiskip|自動挿入のみを許可.
211 \itemitem |allow|: 前後の欧文文字との間の|\xkanjiskip|自動挿入を許可.
212 \item |asciixspmode={<chr_code>, <mode>}|★\par\noindent
213 同様に,p\TeX の|\xspcode|に対応した設定項目である.
214 \item |yabaselineshift=<dimen>|:
215 欧文文字のベースライン補正量をdimensionで指定する.
216 \item |ykbaselineshift=<dimen>|:
217 和文文字のベースライン補正量をdimensionで指定する.
218 \item |kanjiskip=<skip>|★\inhibitglue: |\kanjiskip=<skip>|と同じ意味.
219 \item |xkanjiskip=<skip>|★\inhibitglue: |\xkanjiskip=<skip>|と同じ意味.
220 \item |jcharwidowpenalty=<penalty>|★\inhibitglue: |\jcharwidowpenalty=<penalty>|と同じ意味.
221 \item |autospacing[=<bool>]|★◎\par\noindent
222 %\item |autospacing[=<bool>]|★\par\noindent
223 和文文字間のglue(|\kanjiskip|)の自動挿入をするかしないかを制御.
224 \item |autoxspacing[=<bool>]|★◎\par\noindent
225 %\item |autoxspacing[=<bool>]|★\par\noindent
226 和欧文間のglue(|\xkanjiskip|)の自動挿入をするかしないかを制御.
227
228 \item |differentjfm=(large/small/average/both)|★◎\par\noindent
229 異なる$(\hbox{<jfm>}, \hbox{<varkey>})$である2つの和文文字の間の
230 glue/kernの計算方法を設定する.
231 左側文字由来,右側文字由来のものが両方存在した場合にのみ効力をもつ.
232 \itemitem {\tt large}: glue/kernの幅が両者のうち大きい方になるように定める.
233 \itemitem {\tt small}: 両者のうち小さい方.
234 \itemitem {\tt average}: 両者の相加平均.
235 \itemitem {\tt both}: 両者の合計値の幅をもつglue/kernを挿入する.
236
237
238 \enditem
239
240 \beginparagraph inhibitglue
241
242 |\inhibitglue|
243 : 指定箇所での和文フォントメトリック由来のglue/kernの挿入を禁止する.
244 内部的には,|user_id|が30111のwhatsit nodeを作成している{\small(メトリック由来の
245 glue/kern挿入処理で役目を終え,削除される)\inhibitglue}.
246
247
248 \beginparagraph 大まかな処理の流れ
249
250 Lua\TeX-jaパッケージでは,次のような流れで処理を行う.
251
252 \item 行末空白の削除: |process_input_buffer| callback
253
254 通常,\TeX において改行は空白とほぼ同じ意味であり,
255 改行した箇所には自動的に空白が入るようになっている.
256 だが,日本語ではそのような振る舞いは不自然であり,p\TeX でも
257 「和文文字で行が終わった場合,改行文字は無視する」という
258 使用になっている.
259
260 そこで,入力が和文文字で終わった場合,コメント文字を挿入することにより
261 この問題を解決する方法をとっている.
262 この部分のコードは前田氏のjafontspecパッケージの部分から拝借したが,挿入する文字を|%|から
263 (通常使用されることはないと思われる)|U+FFFFF|へと変更している.
264
265 \item 和文フォントへの置換: |hyphenate|, |hpack_filter| callbacks
266
267 この段階の前では,和文文字であっても,それを内部で表している|glyph_node|~$p$は,
268 「|\tenrm あ|」のように,欧文フォントが指定されている状態になっている.しかし,
269 $p$は「現在の和文フォント」の番号もattribute |\luatexja@curjfnt|として保持している.そのため,
270 この段階では,「和文文字が格納されている」|glyph_node|~$p$に対して,次を行う.
271
272 \itemitem $p$のフォントをattribute |\luatexja@curjfnt|の値に置換.
273 \itemitem $p$の|language| fieldを|\luatexja@japanese|の値に置換.
274 誤って和文文字間でハイフネーションがされてしまうのを防止するため.
275 \itemitem $p$の文字の文字クラスを計算し,その値をattribute |\luatexja@charclass|に格納.
276 これにより,|jp90|等のfeatureによりグリフが置換されても,文字クラスの値は保たれる.
277
278 \item (luaotfloadパッケージによるグリフ置換等の処理はこの位置で行われる)
279
280 \item メトリック由来glue/kernの挿入: |pre_linebreak_filter|, |hpack_filter|
281
282 ここで,メトリックに由来する和文文字間のglue/kernを挿入する.
283 基本的には連続する和文文字間に挿入するが,
284 \itemitem 水平ボックスの先頭/末尾,段落の先頭/末尾には「文字コード|'boxbdd'|の文字」があると
285 見做して空白を挿入する.
286 \itemitem 和文文字とそうでないもの(欧文文字,ボックス等)の間に関しては,
287 和文文字でない方は「文字コード|'jcharbdd'|の文字」であると見做す.
288 \itemitem フォントの異なる2つの和文文字においても,
289 両者のフォントのmetric keyとsizeが一致した場合は,
290 挿入処理においては「同じフォント」であるかのように扱う.
291 \itemitem  そうでない場合は,両者の間に「文字コード|'diffmet'|の文字」があると見做して,
292 両和文文字からそれぞれglue/kern |gb|, |ga|を計算し,そこから実際に入るglue/kernを
293 計算している(|\setjaparameter|中の|differentjfm|キーを参照).
294
295 \item |\kanjiskip|, |\xkanjiskip|の挿入: |pre_linebreak_filter|, |hpack_filter|
296
297 p\TeX の|adjust_hlist| procedureとほぼ同様の処理を用いて,
298 和文間glue |\kanjiskip|や和欧文間glue |\xkanjiskip|を
299 挿入する.
300 \itemitem 数式境界 (|math_node|) との間に|\xkanjiskip|を自動挿入するかの決定は,
301 p\TeX では数字{\tt 0}との間に挿入するかどうかで判定していたが,Lua\TeX-jaでは
302 「文字コード$-1$の文字」で判定している.
303 \itemitem 合字の周囲の空白挿入については,構成要素の文字列を通じて判断している.例えば,
304 「漢ffi字」という文字列に対して,
305 \itemT 「漢」と「ffi」間の空白挿入:「漢」と「f」間に入るかで判断
306 \itemT 「ffi」と「字」間の空白挿入:「i」と「字」間に入るかで判断
307
308 \item ベースライン補正: |pre_linebreak_filter|, |hpack_filter|
309
310 この段階では,(主として)欧文文字のベースラインをずらす作業を行う.幸いにして,
311 Lua\TeX で文字を表す|glyph_node|には|y_offset| fieldがあるので,作業は楽である.
312
313 補正量は,attribute |\luatexja@yablshift|の値(先も書いた通り,sp単位)である.和文文字の
314 補正量は|\luatexja@ykblshift|の値で指定されるが,以前の「和文フォントへの置換」処理において,
315 |\luatexja@yablshift|へと値を移し変えているので,この段階では|\luatexja@yablshift|の値のみを気にしている.
316
317
318 さて,実際に補正されるのは次の場合である:
319 \itemitem 文字 (|glyph_node|)
320 \itemitem ボックス・rule(文中数式内部).これによって,数式全体が下がったように見えるはず.
321
322 \item 和文文字の幅の補正: |pre_linebreak_filter|, |hpack_filter|
323
324 例えば,括弧類は「フォント中では全角幅だが,組版では半角幅として扱う」ことが多いが,このように
325 文字幅を補正する処理を最後に行う.jafontspecパッケージのように,補正対象となる|glyph_node|~$p$%
326 を,しかるべき量のglueと共に|\hbox|にカプセル化して行っている.
327
328 \enditem 
329
330 \beginparagraph 和文フォントメトリックについて
331
332 Lua\TeX-jaで用いる和文用のメトリック情報は,次のような構文で書かれたLuaファイルである.
333 見本として,|luatj-ujis.lua|を入れてある.
334
335 \item |jfm.dir|: 組方向を指定する.将来的にはいずれ縦組(|'tate'|)を実装したいが,
336 現時点では横組(|'yoko'|)のみの対応.
337 \item |jfm.zw|, |jfm.zh|: それぞれ|\zw|, |\zh|のフォントサイズに対する割合を記述する.
338 通常は両方とも1.0となるだろう.
339 \item |jfm.define_char_type(<class>, <chars>)|
340
341 p\TeX 用{\tt JFM}で言うところの「文字クラス」を定義する.
342 \itemitem <class>は文字クラスを表す1以上$\hbox{\tt0x800}=2048$未満の整数.
343 \itemitem <chars>には,<class>に属する「文字」達のUnicodeにおけるコード番号を
344 リストの形|{...}|で記述する.
345
346 また,このリストには,以下の「仮想的な文字」も指定可能である.
347 \itemT |'boxbdd'|: 水平ボックスの先頭/末尾,段落の先頭/末尾.
348 \itemT |'jcharbdd'|: 和文文字達の連続の境界.
349 \itemT |'diffmet'|: 異なるメトリックの和文文字間に入るglueの計算に使われる.
350
351 \item |jfm.define_type_dim(<class>,<left>,<down>,<width>,<height>,<depth>,<italic>)|
352
353 文字クラス<class>ごとに,文字の寸法のフォントサイズに対する割合を記述する.
354 \itemitem <left>: 例えば開き括弧類は組版をする際には半角幅だが,TrueTypeフォント内では
355 左に半角空白が付け加わって全角幅となっていることが多い.このような場合,逆に
356 TrueTypeフォントを基準にすると,「左に半角幅ずらす」ことをしないといけない.
357 <left>はその「左へのずらし量」を指定する.
358 \itemitem <down>: 同様に,「下へのずらし量」を指定する.
359 \itemitem <width>, <height>, <depth>: それぞれ幅,高さ,深さ.
360 \itemitem <italic>: イタリック補正値(未実装).
361
362 \item |jfm.define_glue(<bclass>, <aclass>, <width>, <stretch>, <shrink>)|
363
364 文字クラス<bclass>の文字と<aclass>の文字の間に,自然長<width>,伸び<stretch>, 縮み<shrink>
365 (いずれもフォントサイズ基準)のglueを挿入する.
366
367 \item |jfm.define_kern(<bclass>, <aclass>, <width>)|
368
369 文字クラス<bclass>の文字と<aclass>の文字の間に,幅<width>のkernを挿入.
370
371 \enditem
372
373
374
375 \vfill\eject
376 \leftline{{\big 組版サンプル}\hfill
377 \noindent 出典: 日本語Wikipediaの「\TeX」の項,2011/3/10}
378
379 \bigskip
380 %% sample
381 \TeX(読み方については、「読み方」の小節を参照)は数学者・計算機科学者である
382 ドナルド・クヌース (Donald~E. Knuth) により作られた組版処理ソフトウェアである。
383
384 \beginsection 名称について
385
386 製作者であるクヌースによって以下のように要請されている。
387
388 \beginparagraph 表記法
389
390 正しくは“\TeX”と表記するが、それができない場合には
391 “{\tt TeX}”と表記する(“{\tt TEX}”と表記するのは誤り)。
392
393 \beginparagraph 読み方
394
395 \TeX はギリシャ文字の T-E-X(タウ・イプシロン・カイ)であるから、「テックス」ではなく、
396 ギリシャ語読みの [tex](「テフ」)のように発音するのが正しい。
397 しかしそのような発音は難しいので、クヌースは「テック」と読んでも構わないとしている。
398 日本では「テフ」または「テック」という読み方が広まっている。
399
400 \beginsection 機能
401
402 \TeX はマークアップ言語処理系であり、チューリング完全性を備えた関数型言語でもある。
403 文章そのものと、文章の構造を指定する命令とが混在して記述されたテキストファイルを読み込み、
404 そこに書かれた命令に従って文章を組版して、組版結果を{\tt DVI}形式のファイルに書き出す。
405 {\tt DVI}形式というのは、装置に依存しない (device-independent) 中間形式である。
406
407 {\tt DVI}ファイルには紙面のどの位置にどの文字を配置するかといった情報が書き込まれている。
408 実際に紙に印刷したりディスプレイ上に表示したするためには、{\tt DVI}ファイルを解釈する
409 別のソフトウェアが用いられる。{\tt DVI}ファイルを扱うソフトウェアとして、各種のヴューワや
410 Post\-Scriptなど他のページ記述言語へのトランスレータ、プリンタドライバなどが利用されている。
411
412 組版処理については、行分割およびページ分割位置の判別、ハイフネーション、リガチャ、
413 およびカーニングなどを自動で処理でき、その自動処理の内容も種々のパラーメータを変更する
414 ことによりカスタマイズできる。数式組版についても、多くの機能が盛り込まれている。
415 \TeX が文字などを配置する精度は$25.4 / (72.27\times 2^{16})\,{\rm mm}$%
416 (約$5.363\,{\rm nm}$、$4{,}736{,}286.72\,{\rm dpi}$)である。
417
418 \TeX の扱う命令文の中には、組版に直接係わる命令文の他に、新しい命令文を定義するための
419 命令文もある。\TeX のこの機能を使って使用者が独自に作った命令文はマクロと呼ばれ、
420 こうした独自の改良をマクロパッケージと呼ばれる形で配布できる。
421
422 比較的よく知られている\TeX 上のマクロパッケージには、クヌース自身による plain \TeX、
423 一般的な文書記述に優れた\LaTeX\ ({\tt LaTeX})、数学的文書用の\AmS-\TeX などがある。
424 一般の使用者は、\TeX を直接使うよりも、\TeX に何らかのマクロパッケージを読み込ませたものを
425 使うことの方が多い。そのため、これらのマクロパッケージのことも “\TeX” と呼ぶ場合があるが、
426 本来は誤用である。
427
428 \TeX のマクロパッケージには、他にも次のようなものなどがある。
429
430 \item B{\sc ib}\TeX\ ({\tt BibTeX}) ……参考文献リストの作成に用いる。
431 \item S{\sc li}\TeX\ ({\tt SLiTeX}) ……プレゼンテーション用スライドの作成に用いる。
432 \item \AmS-\LaTeX\ ({\tt AMS-LaTeX}) ……
433 数学的な文書の記述に強い\AmS-\TeX の機能と\LaTeX の機能を併せ持つ。
434 \item \XyMTeX\ ({\tt XyMTeX}) ……化学構造式の描画に用いる。
435 \item MusiX\TeX\ ({\tt MusiXTeX}) ……楽譜の記述に用いる。
436 \enditem
437
438 \TeX とそれに関連するプログラム、および\TeX のマクロパッケージなどは CTAN(Comprehensive TeX Archive Network、
439 包括 TeX アーカイブネットワーク)からダウンロードできる。
440
441
442 \beginsection 数式の表示例
443
444 たとえば
445 \begintt
446 -b \pm \sqrt{b^{2} - 4ac} \over 2a
447 \endtt
448 は以下のように表示される。
449 $$
450 -b \pm \sqrt{b^{2} - 4ac} \over 2a
451 $$
452
453 また、
454 \begintt
455 f(a,b) = \int_{a}^{b}\frac{1 + x}{a + x^{2} + x^{3}}dx
456 \endtt
457 は以下のように表示される。
458 $$
459 f(a,b) = \int_{a}^{b}{1 + x \over a + x^{2} + x^{3}}dx
460 $$
461
462
463 \beginsection 生い立ち
464
465 \TeX は、クヌースが自身の著書The Art of Computer Programmingを書いたときに、組版の汚さに憤慨し、
466 自分自身で心行くまで組版を制御するために作成したとされている。開発にあたって、伝統的な組版および
467 その関連技術に対する広範囲にわたる調査を行った。その調査結果を取り入れることで、\TeX は
468 商業品質の組版ができる柔軟で強力な組版システムになった。
469
470 \TeX はフリーソフトウェアであり、ソースコードも公開されていて、誰でも改良を加えることができる。
471 その改良版の配布も、\TeX と区別できるような別名を付けさえすれば許される。また、\TeX は非常に
472 バグが少ないソフトウェアとしても有名で、ジョーク好きのクヌースが、バグ発見者に対しては
473 前回のバグ発見者の2倍の懸賞金をかけるほどである。この賞金は小切手で払われるのだが、貰った人は
474 記念に取っておく人ばかりなので、結局クヌースの出費はほとんど無いという。
475
476 クヌースは\TeX のバージョン 3 を開発した際に、これ以上の機能拡張はしないことを宣言した。
477 その後は不具合の修正のみがなされ、バージョン番号は 3.14、3.141、3.1415、$\ldots$というように
478 付けられている。これは更新のたびに数字が円周率に近づいていくようになっていて、
479 クヌースの死の時点をもってバージョン$\pi$として、バージョンアップを打ち切るとのことである。
480
481 クヌースは\TeX の開発と同時に、\TeX で利用するフォントを作成するためのシステムである
482 \mf も開発した。こちらのバージョン番号は 2.71、2.718、2.7182、$\ldots$というように、
483 更新のたびに数字がネイピア数に近づいていくようになっている。さらにクヌースは\mf を使って、
484 \TeX の初期設定欧文フォントであるComputer Modernのデザインも行った。
485
486 \TeX および\mf は、これもクヌース自身によって提唱されている文芸的プログラミング\ 
487 (Literate Programming) を実現する{\tt WEB}というシステムでPascalへトランスレートされることを
488 前提に記述されている。しかし実際には{\tt WEB2C}でC言語に変換してコンパイルされ実行形式を
489 得ることが多い。
490
491 \beginsection \TeX の日本語化
492
493 日本語組版処理のできる日本語版の\TeX および\LaTeX には、アスキー・メディアワークスによるp\TeX\ 
494 (pTeX) およびp\LaTeX\ (pLaTeX) と、NTTの斉藤康己によるNTT J\TeX\ (NTT JTeX) およびNTT J\LaTeX\
495 (NTT JLaTeX) などがある。
496
497 \TeX の日本語対応において技術的に最も大きな課題は、複数バイト文字コードへの対応である。
498 p\TeX(および前身の日本語\TeX)は、JIS X 0208を文字集合とした文字コード(ISO-2022-JP、EUC-JP、
499 およびShift\_JIS)を直接扱う。DVIフォーマットは元々16ビット以上の文字コードを格納できる仕様が
500 含まれていた。しかしオリジナルの英語版では使われていなかったため、既存プログラムの多くはp\TeX が
501 出力するDVIファイルを処理できない。またフォントに関係するファイルフォーマットが拡張されている。
502 これに対してNTT J\TeX は、複数の1バイト文字セットに分割することで対応している。例えば、
503 ひらがなとカタカナは内部的には別々の1バイト文字セットとして扱われる。このためにオリジナルの
504 英語版からの変更が小さく、移植も比較的容易である。ファイルフォーマットが同じなので英語版の
505 プログラムでDVIファイル等を処理することもできる。しかし後述するフォントのマッピングの問題が
506 あるため、実際には多くの使用者がNTT J\TeX 用に拡張されたプログラムを使っている。
507
508 使用する日本語用フォントについてはp\TeX が写研フォントの使用を、NTT J\TeX が大日本印刷フォントの
509 使用を前提としており、それぞれフォントメトリック情報(フォントの文字寸法の情報)をバンドルして
510 配布している。しかし有償であるこれらのフォントのグリフ情報を持っていなくても、画面表示や印刷の
511 際に使用者が利用できる他の日本語用フォントで代用することができる。つまり写研フォントや
512 大日本印刷フォントのフォントメトリック情報を用いて文字の位置を固定し、画面表示や印刷には
513 他の日本語用フォントを用いていることが可能である。このため日本語化された\TeX 関係プログラムの
514 ほとんどは、画面表示や印刷で実際に使うフォントを選択できるように、フォントのマッピング
515 (対応付け)を定義する機能を持っている。
516
517 歴史的には、アスキーが日本語\TeX の PC-9800 シリーズ対応版を販売したために個人の使用者を中心に
518 普及した。一方、NTT J\TeX は元の英語版プログラムからの変更が比較的小さいという利点を受けて、
519 UNIX®およびUNIX互換OSを使う大学や研究機関の関係者を中心に普及した。
520
521 しかし現在では次に挙げる理由から、日本語対応\TeX としてp\TeX が使われていることが多い。
522
523 \item UNIX®用、およびUNIX互換OS用の主な日本語対応\TeX 配布形態である
524 ptexliveやptetex3がp\TeX のみを採用している。
525 \item Microsoft Windows用の主な日本語対応\TeX 配布形態であるW32\TeX が
526 p\TeX を扱える(NTT J\TeX も扱える)。
527 \item p\TeX の扱い方を解説する文献の方が、NTT J\TeX のものに比べて、
528 出版物とWeb上文書の両方で多い。
529 \item p\TeX は縦組みにも対応しているが、NTT J\TeX は対応していない。
530 \enditem
531
532 \beginsection \TeX による組版の作業工程
533
534 \TeX を利用して組版を行うには、通常次のような作業工程を取る。
535
536 \enum テキストエディタなどを用いて、文章に組版用命令文を織り込んだソースファイルを作成する。
537 \enum OSのコマンドラインから “|tex FileName.tex|” などと入力して\TeX を起動し、
538   {\tt DVI}ファイルを生成させる。
539 \itemitem ソースファイルにエラーがあれば、修正して再度\TeX を起動する。
540 \enum {\tt DVI}ウェアとよばれる{\tt DVI}命令文を解するソフトウェアを用いて組版結果を表示し、確認する。
541 \itemitem {\tt DVI}ウェアにはxdvi/xdvikやdviout for Windowsなどの{\tt DVI}ヴューア、
542   Dvips(k)やdvipdfm/DVIPDFM$x$などのファイル形式変換ソフトウェアなどがある。
543 \itemitem {\tt DVI}ファイルを{\tt DVI}ヴューアで画面表示または印刷する、
544   あるいはPDFやPost\-Scriptに変換して画面表示または印刷することで、組版結果を確認する。
545 \itemitem 修正の必要があれば、ソースファイルを修正して再度{\tt DVI}ファイルを作成、確認する。
546 \enditem
547
548 この間、作業工程が変わるたびにそれぞれのプログラムを切り替えたり、
549 扱う文書が大きいと章ごとにソースファイルを分割して管理したりと、比較的煩雑な作業を伴う。
550 そのため、この工程に係わる各種のプログラムやソースファイルの管理を一元的に行う
551 \TeX 用の統合環境がいくつか作成されている。
552
553 \beginparagraph GUI環境と\TeX
554
555 GUIはPCの普及に一役買ったが、同時にGUIしか触ったことのないPC利用者が増加した。
556 そのような利用者が、コマンドラインでの操作を余儀なくされる\TeX を非常に扱いづらく
557 感じてしまうのは否めないことである。
558 このため、GUIに特化した\TeX 用統合環境もいくつか作成されている。
559 \end