IOC鳥類リスト亜種ドラフト日本語版v3.0dj
IOC 鳥類リストの本体が v2.10 に上がったのを受けて,亜種ドラフトも v3.0c から v3.0d へとアップデートされています.これを Refsort/Ruby 辞書ファイルに編集しなおしたものを "ioclist_v210.ref" としてリリースします.文字エンコーディングは UTF-8 のみです.
また,これに v2.10 対応の日本語版 "ioclist_v210j.ref" に収録した和名を加え,さらに "jbird_302.ref" に収録した日本周辺の亜種を加えたものを "ioclist_v30dj.ref" としてリリースしました.これも文字エンコーディングは UTF-8 のみです.
これらの作業をしていて気づいた点をいくつか.
まずオリジナル版の v3.0d ですが,驚愕すべきことがいくつか.まず学名についてですが,3種が v2.10 と異なっています.いずれもラテン語の語尾のわずかな違いで,学名表記には付き物の "表記の揺れ" ですが,このような標記の揺れを取り除くことを謳っている IOC List にはあるまじきものです.なぜ?
次に,これは本当に驚いたのですが,標準英名の中で,ウムラウトが堂々と使われています.これは本当に "へぇー?" です.人名が種名に含まれている種で,その人名がドイツ語の場合だと思うのですが,その結果亜種を含まないオリジナルの v2.10 との互換性が取れなくなっています.これも IOC のポリシーに反しているように思います.オリジナル版はこの次どうするのでしょうね?
これ以外に細かなバグとして,表題が v3.0c のままになっていたりもします.どうも全般的にデバッグ不足の感が否めません.次版ではちゃんと直っていることを期待しましょう.
それから,これは IOC の問題ではないのですが,これらのリストは基本的に Microsoft Excel の表として提供されています.この表の中の文字エンコーディングでは UTF が可能なので,多国語の文字を同時に含むことが出来るのですが,これを CSV ファイルに変換しようとすると,Office 日本語版では問題が生じます.CSV ファイルのエンコーディングは Windows-31J に決め打ちされており,UTF-8 で CSV に書き出せないのです.これは非常に困ります.
仕方がないので,私は Ubuntu 上にインストールされた LibreOffice の表計算ソフトを使って UTF-8 にエンコードされた CSV ファイルを作り,それをもとに作業を行いました.こういうところは,ぜひ Service Pack で改善してもらいたいところです.
| 固定リンク | 0
「自然」カテゴリの記事
- ガガンボ(2025.06.05)
- 強風の五月晴れ(2025.04.27)
- コガモとアカメガシワ(2025.04.26)
- ムナグロ御一行様お着き(2025.04.26)
- フジが満開(2025.04.24)
「IT関連情報」カテゴリの記事
- IOC List v15.1 Released(2025.03.12)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
- Windows11 24H2 にアップデート(2024.10.05)
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
コメント