-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
新元号対応, Adobe-Japan1-7 #13
Comments
| 元号 | Unicode | H | V | |------|-----|-----|-----| | 明治 | U+337E | 7621 (AJ1-0) | 12041( AJ1-4) | | 大正 | U+337D | 7622 (AJ1-0) | 12042 (AJ1-4) | | 昭和 | U+337C | 7623 (AJ1-0) | 12043 (AJ1-4) | | 平成 | U+337B | 8323 (AJ1-1) | 12044 (AJ1-4) | | ??? | U+32FF | 23058 (AJ1-7) | 23059 (AJ1-7) |
そういえば,dvipdfmx などが使うはずの Adobe CMap resources の最新版は TeX Live にまだ降りてきていないようです。今までどなたが CTAN に上げてくださっていたのでしょうか? # Adobe-Japan1-7 に対応した CMap がないと,japanese-otf(-uptex) も正常動作しないのではないでしょうか。また,Adobe-KR9 (#11) の件も同様かと。 |
Master/texmf-dist にあるものは |
CTAN の README は Karl さんが作ったもののようですから,最初に問い合わせるなら Karl さんでしょうか。時間が出来たら CMap の変更点を読んで,必要そうならリクエストしてみます。 |
CMapの変更点は勿論公式のドキュメントでご確認いただけると確実ですが、 Karlさんへ問い合わせていただけるとのこと、ありがとうございます。 |
ちょうど昨日 mapping-resources-pdf も更新されたようです。これでモノは揃った?? |
ついさっき知ったのですが、Adobe-Japan1-8 の候補が検討されているそうです。 |
先ほど Karl さんに問い合わせメールを送りました。 > adobemapping |
adobemapping の CTAN upload 担当を Karl さんから引き継ぎました。 https://github.com/aminophen/ctan-adobemapping この内容で今夜にでも upload するつもりです。 |
https://tug.org/pipermail/tlbuild/2019q1/004310.html
4/1 新元号発表,4/5 が CTAN からの最終インポートなので,忙しいですがなんとか間に合いますね。(もちろん,「3/22 時点のソースから出来るバイナリが正常に作動する」という前提ですが。) 何かうまい事前テスト方法はありますでしょうか。既に Adobe のリソースは TeX Live に収録されているので,適当なフォントさえあれば準備できるかもしれません。(例えば
|
新元号合字のU+32FFは Unocode blocksでは やろうとしていることは、実装としては「平成」の合字と同じことなので それから、一つ気にしているのは |
ご紹介いただいたSILのフォールバックフォント(Unicode 6.1) を試してみたところ、未定義のコードポイントは載せない方針のようで、U+32FF のグリフはありませんでした。 |
色々テストしていますが思ったより難しいです。 otfパッケージ側では正しいことをしていると思うのですが、
dviware に改造が必要となると、あまり時間はありませんね… |
master → new-era (b5b1d5b) で変化したバイナリは OFM と VF ですが,plain text で可視化しなおすと,VF は多分まだ意図通りにはなっていないようです。 OFM ファイル群
これらすべてに以下の行が追加された。
VF ファイル群
これらすべてに入った変更はヘッダ行のみ。 -(VTITLE JVF for Adobe-Japan1-6)
+(VTITLE JVF for Adobe-Japan1-7) |
すみません,誤解だったようで,「元々 VF は CID 23058〜23059 も含んでいたから変化しなかった」ということのようです。例えば cidjmr5-h.vf を見てみると
が最初から入っていて,0x5A12 = CID 23058 なので。そうすると,よくわからなくなってきました。 |
私のところでは④をテストするにあたり
という otfunifont.map を作って なお,dvipdfmx 実行中に
の警告が出ました。後者は「縦書き字形がない」ということなのだと思います。前者はよくわかりませんが,ソースを見た感じでは害はないようです。 うまくいっていないのは ToUnicode でした。ただし,PDF ビューア(Adobe Acrobat DC)の問題かもしれないので気にしなくてもいいのかもしれません。
これは上記の map で通っていますし,できた PDF を見ると
というエントリがあるので,問題なさそうです。
多分これは Adobe の glyphlist.txt だと思います。これは新元号が公表されないとグリフ名が決まらないはずですし,公表され次第 Adobe の方で glyphlist.txt を更新してくださると期待しておけばいいと思います。(もしかして,ToUnicode が効かないのはこれがまだだから?) |
検証ありがとうございます。こちらの手元でも、想定通りの結果を得ることが出来ました。 うまく行かなかったケースは、dvipdfmx のバージョンが古かった場合です。 vf (7書体 x 2方向 x 6サブフォント, dvipdfmxのwaring はこちらも同様に再現しています。
永いこと更新がされていないようですが、その果たす役割が分かっていません。 dviware に拡張が必要でないならば、そろそろ齋藤さんに相談しましょうか。 |
適当なテスト用の OpenType があると良いのですが。 |
フォントがないのでテストできないですが,新元号に対応したOTFパッケージを4/1に公開できるように作業しております. |
@psitau さん有難うございます。 |
@psitau さんリリース有難うございました。 @norbusan さん、 明日から旅行に出るため CTAN のトラブルがあったらどなたかフォローしていただけると助かります。 |
@t-tk 田中先生、更新しました。よろしくお願いいたします。 |
@munepi texjpのtlcontribは、僕は更新しないといけませんか?自動になりますか? |
AJ1-7なOpenType として @trueroad さんの 原ノ味ゴシック 20190413でテストしました。@trueroad さん、有難うございます。
ただし、evinceで pdf の該当文字列をコピー&ペーストしようとすると「㍾」「㍽」「㍼」「㍻」はペースト先で「明治」「大正」「昭和」「平成」となるのに対し令和の合字「㋿」は選択できずコピーも出来ません。 japanese-otf 側の問題で無いことは確かですが、前に述べられていた adobe の glyphlist.txt の問題でしょうか。 |
ToUnicode の問題をすっかり忘れていました…。いま出先にいて数日は戻れないので,とりあえず知っている範囲でコメントしておきます。
dvipdfmx のマニュアルに以下の記述がありますから,“多分そうだろう”と思っています。(すみません,実際の挙動調査はしていません。)
もし glyphlist.txt の問題だけであれば,このファイルは dvipdfmx バイナリに組み込まれるものではなく実行時に探されますから,リビルドは不要とみて良さそうです。 それにしても,glyphlist.txt に記述する PostScript glyph name は誰かが正式に決めるのだと思いますが,それは誰なんでしょう。Unicode の中の人? Adobe? |
原ノ味フォントがお役に立ててなによりです。 ToUnicode ですが、私の理解では AJ1 の場合は dvipdfmx は ToUnicode CMap を生成せず なので、 PDF viewer の持っている Adobe-Japan1-UCS2 を AJ1-7 のものに更新すれば 確かめたわけではありませんし、外していたら申し訳ありません。 |
コメントありがとうございます。
https://github.com/adobe-type-tools/agl-aglfn の README.md に
のように
うーーん。そうすると evince のソースを見に行かないといけないか。 |
evinceはpopplerをバックエンドに使っている、ということをどこかで見たので
手元の環境は TeX Live 2018 のため pTeX で扱えなかったため XeTeX で Adobe Acrobat Reader のフォルダ内の Adobe-Japan1-UCS2 は AJ1-7 対応したものになっていました。 |
XeTeX を使った場合は,ToUnicode が xdvipdfmx によって PDF に埋め込まれるので,PDF viewer の能力あるいはそれが内蔵する CMap などの変換テーブルの対応状況とは違うかもしれません。ただ,
であれば,今は pTeX でも大丈夫な可能性はありますね。週末に出先から帰ったら試してみます。 |
ちなみに TL2018 の pTeX / dvipdfmx のバイナリのままでも,CMap たちは TL2018 frozen の時点で AJ1-7 対応なので,OTF パッケージさえ更新すれば TL2018 で実験できそうに思います。 |
いえ、 XeTeX (というか xdvipdfmx)は AJ1 なら ToUnicode CMap の生成をせず PDF に埋め込まれません。ソースを見ると、AJ1 を含むいくつかの ROS では生成せず埋め込まないという動作になっているようです。実際に上記 XeTeX 用テストの なので、恐らく pTeX + dvipdfmx と条件は同じだと思います。 で、 PDF viewer 側ですが evince と同条件であろう poppler だとどうなるだろうと思い poppler 付属の pdftotext を試してみました。案の定、縦横とも U+32FF が出ず Adobe Acrobat Reader とは全く違う結果になりました。 さらに試しに、 poppler 付属の
みたいなことをしてから再度 pdftotext を掛けてみたところ、縦書き横書きともに U+32FF が出るようになりました。 ただ、 poppler のこの AJ1 CID → Unicode 変換テーブルは、Adobe のものとフォーマットが違うだけではなく変換内容も違うみたいで、特に縦書きの扱いがかなり異なるように見えます。。。 かなり本題と外れてしまってきていて申し訳ないのですが、蛇足ついでに LuaTeX も試してみました。 LuaTeX は AJ1 か否かなどお構いなしに必ず ToUnicode CMap を生成して埋め込むみたいです。上記 XeTeX 用テストと同様の LuaTeX 用テスト Adobe Acrobat Reader からコピペすると XeTeX の時とは文字列が異なります。横書きは XeTeX と同じ結果で U+32FF が出ますが、縦書きは出てきません。 LuaTeX の ToUnicode CMap 生成が OpenType feature を考慮していないから、と思います。 XeTeX でも AI0 なら ToUnicode CMap を生成して埋め込むので LuaTeX と同様の結果になると思います。 pdftotext だと Adobe Acrobat Reader 同様の横のみ U+32FF が出る結果となりました。 poppler 付属の |
では、なにもしなくていいって、よかった。ありがとうございます。 |
結局何がどこに効いているのか私は理解できていませんが、ざっくり言うと
ということを目指せばよいと理解しました。
私見ですが、この話題についていうとAdobe Japanとかpopplerのカテゴリーにピッタリな場所が TeX JP org 内には思い当たらず、移すべき先が無いということでここで続けてよいと思います。XeTeXやLuaTeX も解決策を探るために話題になることはよいことと思います。 |
Adobe-Japan のGitHub では既に"reiwa"の文字があちこちに入っていました。 |
遅ればせながら TL2019 をインストールしてみたので era.tex を試してみました。 pLaTeX, upLaTeX ともに Adobe Acrobat Reader からのコピペでは縦横とも U+32FF が出てきました。
これなんですが、 poppler-data の現行の cidToUnicode/Adobe-Japan1 はどうやって生成したものなのかよくわかりません。コミットメッセージを見ると xpdf から(そのまま)持ってきたもののように解釈できるのですが、 xpdf ではどうやって生成したものなのか記述を見つけることができませんでした。 何を気にしているかと言うと、Adobe純正の Adobe-Japan1-UCS2 とはテーブルの内容が大幅に違っているところがあり(特に縦書きグリフ)そのまま 32ff を 2 行追加していいのか疑問に思っています。 poppler-data の cidToUnicode/Adobe-Japan1 は、なんとなく何かのAJ1フォントのcmapテーブルを逆変換したような感じのテーブルになっていて、明治大正昭和平成の縦書き合字が出てきません。「(」の縦書きグリフは「︵」、「)」の縦書きグリフは「︶」になってしまいます。これに(何となく)あわせるのであれば、 32ff を 2 行追加するのではなくて
みたいにしなければならないように思います。これなら明治大正昭和平成と同じく令和の縦書き合字も出なくなります。 さもなければちゃんと Adobe-Japan1-UCS2 と同じ内容のテーブルにする、つまり明治大正昭和平成の縦書き合字が出て、「(」や「)」の縦書きグリフが「(」や「)」になるように大幅修正する。いずれか決めなければならないように思います。我々で決めるものでもないとは思いますが poppler のメンテナは日本語フォントのこういう話には興味が無いのではないかとも思います。 |
@trueroad さん、 もし @trueroad さんや関心のある皆さんが GitLab にも来ていただけるのでしたらそこで Issue を立てて議論を進めたいと思います。あるいは、ここで議論を進めたあと 私の GitLab に結論だけ Issue に記録する形でもよいかと思います。 |
では GitLab に Issue を立てて進めたいと思います。今日は遅いので明日以降に。 |
GitLab の私のところに issue を立てました。 |
ここで最近話題になっていたことと少し違ってAdobe-Japan1-7 (07/30/2019 対応)のための更新を行いました。 @norbusan さん、 |
dviout にある \CID{}のための CID→Unicode 変換機能も |
新元号対応についてです。
元号の組文字が Unicode と Adobe-Japan1-7 で追加されることが決まっているそうです。
新元号は2019年4月には発表されるそうなので、TeX Live 2019にぎりぎり間に合うタイミングでしょう。
ブランチ new-era を作っておきます。
sty/ajmacros.sty にも追加したいところですが、新元号の発表待ちです。
The text was updated successfully, but these errors were encountered: