IOC鳥類リスト亜種ドラフト日本語版v3.0dj
IOC 鳥類リストの本体が v2.10 に上がったのを受けて,亜種ドラフトも v3.0c から v3.0d へとアップデートされています.これを Refsort/Ruby 辞書ファイルに編集しなおしたものを "ioclist_v210.ref" としてリリースします.文字エンコーディングは UTF-8 のみです.
また,これに v2.10 対応の日本語版 "ioclist_v210j.ref" に収録した和名を加え,さらに "jbird_302.ref" に収録した日本周辺の亜種を加えたものを "ioclist_v30dj.ref" としてリリースしました.これも文字エンコーディングは UTF-8 のみです.
これらの作業をしていて気づいた点をいくつか.
まずオリジナル版の v3.0d ですが,驚愕すべきことがいくつか.まず学名についてですが,3種が v2.10 と異なっています.いずれもラテン語の語尾のわずかな違いで,学名表記には付き物の "表記の揺れ" ですが,このような標記の揺れを取り除くことを謳っている IOC List にはあるまじきものです.なぜ?
次に,これは本当に驚いたのですが,標準英名の中で,ウムラウトが堂々と使われています.これは本当に "へぇー?" です.人名が種名に含まれている種で,その人名がドイツ語の場合だと思うのですが,その結果亜種を含まないオリジナルの v2.10 との互換性が取れなくなっています.これも IOC のポリシーに反しているように思います.オリジナル版はこの次どうするのでしょうね?
これ以外に細かなバグとして,表題が v3.0c のままになっていたりもします.どうも全般的にデバッグ不足の感が否めません.次版ではちゃんと直っていることを期待しましょう.
それから,これは IOC の問題ではないのですが,これらのリストは基本的に Microsoft Excel の表として提供されています.この表の中の文字エンコーディングでは UTF が可能なので,多国語の文字を同時に含むことが出来るのですが,これを CSV ファイルに変換しようとすると,Office 日本語版では問題が生じます.CSV ファイルのエンコーディングは Windows-31J に決め打ちされており,UTF-8 で CSV に書き出せないのです.これは非常に困ります.
仕方がないので,私は Ubuntu 上にインストールされた LibreOffice の表計算ソフトを使って UTF-8 にエンコードされた CSV ファイルを作り,それをもとに作業を行いました.こういうところは,ぜひ Service Pack で改善してもらいたいところです.
| 固定リンク | 0
「自然」カテゴリの記事
- 南風強し(2023.02.01)
- ガマの穂がうまい?(2023.01.29)
- Refsort/Ruby v3.75 released(2023.01.29)
- 北風は強いがタシギは元気(2023.01.28)
- ヒクイナがガマの穂に飛びついた(2023.01.27)
「IT関連情報」カテゴリの記事
- Refsort/Ruby v3.75 released(2023.01.29)
- やっと買い場がやって来る(2022.12.10)
- Windows 11 にアップデート(2022.12.07)
- 20 年選手の ONU が壊れた(2022.11.04)
- Photoshop と Bridge の困ったところ(2022.10.22)
コメント