OSDN Git Service

280ecb63bf68f603e9697e9ef267b1b1811b6edf
[luatex-ja/luatexja.git] / src / ltj-otf.lua
1 --
2 -- luatexja/ltj-otf.lua
3 --
4 require('unicode')
5 require('lualibs')
6
7 luatexja.load_module('base');      local ltjb = luatexja.base
8 luatexja.load_module('jfont');     local ltjf = luatexja.jfont
9 luatexja.load_module('rmlgbm');    local ltjr = luatexja.rmlgbm
10 luatexja.load_module('charrange'); local ltjc = luatexja.charrange
11 luatexja.load_module('direction'); local ltjd = luatexja.direction
12 luatexja.load_module('stack');     local ltjs = luatexja.stack
13
14 local id_glyph = node.id('glyph')
15 local id_whatsit = node.id('whatsit')
16 local sid_user = node.subtype('user_defined')
17
18 local setfield = node.direct.setfield
19 local getfield = node.direct.getfield
20 local getid = node.direct.getid
21 local getfont = node.direct.getfont
22 local getchar = node.direct.getchar
23 local getsubtype = node.direct.getsubtype
24
25 local to_node = node.direct.tonode
26 local to_direct = node.direct.todirect
27
28 local node_new = node.direct.new
29 local node_remove = node.direct.remove
30 local node_next = node.direct.getnext
31 local node_free = node.direct.free
32 local has_attr = node.direct.has_attribute
33 local set_attr = node.direct.set_attribute
34 local unset_attr = node.direct.unset_attribute
35 local node_insert_after = node.direct.insert_after
36 local node_write = node.direct.write
37 local node_traverse_id = node.direct.traverse_id
38
39
40 local attr_curjfnt = luatexbase.attributes['ltj@curjfnt']
41 local attr_curtfnt = luatexbase.attributes['ltj@curtfnt']
42 local attr_yablshift = luatexbase.attributes['ltj@yablshift']
43 local attr_ykblshift = luatexbase.attributes['ltj@ykblshift']
44 local attr_tablshift = luatexbase.attributes['ltj@tablshift']
45 local attr_tkblshift = luatexbase.attributes['ltj@tkblshift']
46 local lang_ja = luatexja.lang_ja
47 local identifiers = fonts.hashes.identifiers
48
49 local ltjf_font_metric_table = ltjf.font_metric_table
50 local ltjf_font_extra_info = ltjf.font_extra_info
51 local ltjf_find_char_class = ltjf.find_char_class
52 local ltjr_cidfont_data = ltjr.cidfont_data
53 local ltjc_is_ucs_in_japanese_char = ltjc.is_ucs_in_japanese_char
54 local ltjd_get_dir_count = ltjd.get_dir_count
55 local dir_tate = luatexja.dir_table.dir_tate
56
57 luatexja.userid_table.OTF = luatexbase.newuserwhatsitid('char_by_cid',  'luatexja')
58 local OTF = luatexja.userid_table.OTF
59 local tex_get_attr = tex.getattribute
60
61 local cache_var = 2
62 local cache_outdate_fn = function (t) return t.version~=cache_ver end
63 local ivd_aj1 = ltjb.load_cache('ltj-ivd_aj1',cache_outdate_fn)
64 if not ivd_aj1 then -- make cache
65    ivd_aj1 = require('ltj-ivd_aj1.lua')
66    ltjb.save_cache_luc('ltj-ivd_aj1', ivd_aj1)
67 end
68
69
70 local function get_ucs_from_rmlgbm(c)
71    local v = (ivd_aj1 and ivd_aj1.table_ivd_aj1[c])
72    if v==true then
73      for i,w in pairs(ltjr_cidfont_data["Adobe-Japan1"].descriptions) do
74         if w.index==v then v = i; break end
75      end
76    end
77    v = v or 0
78    if v>=0x200000 then -- table
79       local curjfnt_num = tex_get_attr((ltjd_get_dir_count()==dir_tate)
80                                         and attr_curtfnt or attr_curjfnt)
81       local curjfnt = identifiers[curjfnt_num].resources
82       local base, ivs = v % 0x200000, 0xE00FF + math.floor(v/0x200000)
83       curjfnt = curjfnt and curjfnt.variants
84       curjfnt = curjfnt and curjfnt[ivs]
85       return curjfnt and curjfnt[base] or base
86    elseif v<0xF0000 then -- 素直に Unicode にマップ可能
87       return v
88    else -- privete use area
89       local r, aj = nil, ltjr_cidfont_data["Adobe-Japan1"] 
90       -- 先に ltj_vert_table を見る
91       for i,w in pairs(aj.shared.ltj_vert_table) do
92          if w==v then r=i; break end
93       end
94       if not r then
95          -- なければ ToUnicode から引く
96          local w = aj.characters[v].tounicode -- must be non-nil!
97          local i = string.len(w)
98          if i==4 then -- UCS2
99             r = tonumber(w,16)
100          elseif i==8 then
101             i,w = tonumber(string.sub(w,1,4),16), tonumber(string.sub(w,-4),16)
102             if (w>=0xD800) and (w<=0xDB7F) and (i>=0xDC00) and (i<=0xDFFF) then -- Surrogate pair
103                r = (w-0xD800)*0x400 + (i-0xDC00)
104             else
105                r = 0
106             end
107          end
108       end
109       if aj.shared.ltj_vert_table[r] then
110          -- CID が縦組用字形だった場合
111          local curjfnt_num = tex_get_attr((ltjd_get_dir_count()==dir_tate)
112                                         and attr_curtfnt or attr_curjfnt)
113          local t = identifiers[curjfnt_num]
114          if t.resources.sequences then
115             for _,i in pairs(t.resources.sequences) do
116                if (i.order[1]=='vert' or i.order[1]=='vrt2')
117                   and i.type == 'gsub_single' and i.steps then
118                   for _,j in pairs(i.steps) do
119                      if type(j)=='table' then 
120                         if type(j.coverage)=='table' then
121                            for i,k in pairs(j.coverage) do
122                               if i==r then return k end
123                            end
124                         end
125                      end
126                   end
127                end
128             end
129          end
130       end
131       return r
132    end
133 end
134
135 -- Append a whatsit node to the list.
136 -- This whatsit node will be extracted to a glyph_node
137 local function append_jglyph(char)
138    local p = node_new(id_whatsit,sid_user)
139    setfield(p, 'user_id', OTF)
140    setfield(p, 'type', 100)
141    setfield(p, 'value', char)
142    node_write(p)
143 end
144
145 local utf
146 do
147    utf = function (ucs)
148       local char = ucs
149       if ltjd_get_dir_count()==dir_tate then
150          local curjfnt_num = tex_get_attr((ltjd_get_dir_count()==dir_tate)
151                                         and attr_curtfnt or attr_curjfnt)
152          local t = identifiers[curjfnt_num]
153          if t.resources.sequences then
154             for _,i in pairs(t.resources.sequences) do
155                if (i.order[1]=='vert' or i.order[1]=='vrt2')
156                   and i.type == 'gsub_single' and i.steps then
157                   for _,j in pairs(i.steps) do
158                      if type(j)=='table' then 
159                         if type(j.coverage)=='table' then
160                            for i,k in pairs(j.coverage) do
161                               if i==char then return append_jglyph(k) end
162                            end
163                         end
164                      end
165                   end
166                end
167             end
168          end
169       end
170       return append_jglyph(char)
171    end
172 end
173
174 local cid
175 do
176    cid = function (key)
177       if key==0 then return append_jglyph(0) end
178       local curjfnt_num = tex_get_attr((ltjd_get_dir_count()==dir_tate)
179                                         and attr_curtfnt or attr_curjfnt)
180       local curjfnt = identifiers[curjfnt_num]
181       local cidinfo = curjfnt.resources.cidinfo
182       if not cidinfo or
183          cidinfo.ordering ~= "Japan1" and
184          cidinfo.ordering ~= "GB1" and
185          cidinfo.ordering ~= "CNS1" and
186          cidinfo.ordering ~= "Korea1" and
187          cidinfo.ordering ~= "KR" then
188          --      ltjb.package_warning('luatexja-otf',
189          --                        'Current Japanese font (or other CJK font) "'
190          --                           ..curjfnt.psname..'" is not a CID-Keyed font (Adobe-Japan1 etc.)')
191             return append_jglyph(get_ucs_from_rmlgbm(key))
192       else
193          local char = nil
194          for i,v in pairs(curjfnt.shared.rawdata.descriptions) do
195             if v.index==key then char = i; break end
196          end
197          if not char then
198             ltjb.package_warning('luatexja-otf',
199                'Current Japanese font (or other CJK font) "'
200                   ..curjfnt.psname..'" does not have the specified CID character ('
201                   ..tostring(key)..')',
202                'Use a font including the specified CID character.')
203          char = 0
204          end
205          return append_jglyph(char)
206       end
207    end
208 end
209
210 local function extract(head)
211    head = to_direct(head)
212    local p = head
213    local is_dir_tate = ltjs.list_dir == dir_tate
214    local attr_ablshift = is_dir_tate and attr_tablshift or attr_yablshift
215    local attr_kblshift = is_dir_tate and attr_tkblshift or attr_ykblshift
216    local attr_curfnt =   is_dir_tate and attr_curtfnt or attr_curjfnt
217    while p do
218       if getid(p)==id_whatsit then
219          if getsubtype(p)==sid_user then
220             local puid = getfield(p, 'user_id')
221             if puid==OTF then
222             --if puid==OTF or puid==VSR then
223                local g = node_new(id_glyph)
224                setfield(g, 'subtype', 0)
225                setfield(g, 'char', getfield(p, 'value'))
226                local v = has_attr(p, attr_curfnt); setfield(g, 'font',v)
227                --if puid==OTF then
228                   setfield(g, 'lang', lang_ja)
229                   set_attr(g, attr_kblshift, has_attr(p, attr_kblshift))
230                --else
231                --   set_attr(g, attr_ablshift, has_attr(p, attr_ablshift))
232                --end
233                head = node_insert_after(head, p, g)
234                head = node_remove(head, p)
235                node_free(p); p = g
236             end
237          end
238       end
239       p = node_next(p)
240    end
241    return to_node(head)
242 end
243
244 ltjb.add_to_callback('hpack_filter', extract,'ltj.otf',
245   luatexbase.priority_in_callback('hpack_filter', 'ltj.main'))
246 ltjb.add_to_callback('pre_linebreak_filter', extract,'ltj.otf',
247   luatexbase.priority_in_callback('pre_linebreak_filter', 'ltj.main'))
248 -- additional callbacks
249 -- 以下は,LuaTeX-ja に用意された callback のサンプルになっている.
250 --   JFM の文字クラスの指定の所で,"AJ1-xxx" 形式での指定を可能とした.
251 --   これらの文字指定は,和文フォント定義ごとに,それぞれのフォントの
252 --   CID <-> グリフ 対応状況による変換テーブルが用意される.
253
254 -- 和文フォント読み込み時に,CID -> unicode 対応をとっておく.
255 local function cid_to_char(fmtable, fn)
256    local fi = identifiers[fn]
257    local fe = ltjf_font_extra_info[fn]
258    if (fi.resources and fi.resources.cidinfo and fi.resources.cidinfo.ordering == "Japan1" )
259       and (fe and fe.unicodes) then
260       for i, v in pairs(fmtable.chars) do
261          local j = string.match(i, "^AJ1%-([0-9]*)")
262          if j then
263             j = tonumber(fe.unicodes['Japan1.'..tostring(j)])
264             if j then
265                fmtable.cid_char_type = fmtable.cid_char_type  or {}
266                fmtable.cid_char_type[j] = v
267             end
268          end
269       end
270    end
271    return fmtable
272 end
273 luatexbase.add_to_callback("luatexja.define_jfont",
274                            cid_to_char, "ltj.otf.define_jfont", 1)
275 --  既に読み込まれているフォントに対しても,同じことをやらないといけない
276 for fn, v in pairs(ltjf_font_metric_table) do
277    ltjf_font_metric_table[fn] = cid_to_char(v, fn)
278 end
279
280
281 local function cid_set_char_class(arg, fmtable, char)
282    if arg~=0 then return arg
283    elseif fmtable.cid_char_type then
284       return fmtable.cid_char_type[char] or 0
285    else return 0
286    end
287 end
288 luatexbase.add_to_callback("luatexja.find_char_class",
289                            cid_set_char_class, "ltj.otf.find_char_class", 1)
290
291 --IVS
292 local function enable_ivs()
293   ltjb.package_warning('luatexja-otf',
294     'luatexja.otf.enable_ivs() has now no effect.')
295 end
296 local disable_ivs = enable_ivs
297
298 luatexja.otf = {
299   append_jglyph = append_jglyph,
300   enable_ivs = enable_ivs,  -- 隠し機能: IVS
301   disable_ivs = disable_ivs,  -- 隠し機能: IVS
302   cid = cid, utf = utf,
303 }
304
305
306 -- EOF