IOC鳥類リスト亜種ドラフト日本語版v3.0dj
IOC 鳥類リストの本体が v2.10 に上がったのを受けて,亜種ドラフトも v3.0c から v3.0d へとアップデートされています.これを Refsort/Ruby 辞書ファイルに編集しなおしたものを "ioclist_v210.ref" としてリリースします.文字エンコーディングは UTF-8 のみです.
また,これに v2.10 対応の日本語版 "ioclist_v210j.ref" に収録した和名を加え,さらに "jbird_302.ref" に収録した日本周辺の亜種を加えたものを "ioclist_v30dj.ref" としてリリースしました.これも文字エンコーディングは UTF-8 のみです.
これらの作業をしていて気づいた点をいくつか.
まずオリジナル版の v3.0d ですが,驚愕すべきことがいくつか.まず学名についてですが,3種が v2.10 と異なっています.いずれもラテン語の語尾のわずかな違いで,学名表記には付き物の "表記の揺れ" ですが,このような標記の揺れを取り除くことを謳っている IOC List にはあるまじきものです.なぜ?
次に,これは本当に驚いたのですが,標準英名の中で,ウムラウトが堂々と使われています.これは本当に "へぇー?" です.人名が種名に含まれている種で,その人名がドイツ語の場合だと思うのですが,その結果亜種を含まないオリジナルの v2.10 との互換性が取れなくなっています.これも IOC のポリシーに反しているように思います.オリジナル版はこの次どうするのでしょうね?
これ以外に細かなバグとして,表題が v3.0c のままになっていたりもします.どうも全般的にデバッグ不足の感が否めません.次版ではちゃんと直っていることを期待しましょう.
それから,これは IOC の問題ではないのですが,これらのリストは基本的に Microsoft Excel の表として提供されています.この表の中の文字エンコーディングでは UTF が可能なので,多国語の文字を同時に含むことが出来るのですが,これを CSV ファイルに変換しようとすると,Office 日本語版では問題が生じます.CSV ファイルのエンコーディングは Windows-31J に決め打ちされており,UTF-8 で CSV に書き出せないのです.これは非常に困ります.
仕方がないので,私は Ubuntu 上にインストールされた LibreOffice の表計算ソフトを使って UTF-8 にエンコードされた CSV ファイルを作り,それをもとに作業を行いました.こういうところは,ぜひ Service Pack で改善してもらいたいところです.
| 固定リンク | 0
「自然」カテゴリの記事
- 枯れ葉(2024.12.11)
- 師走入り(2024.12.01)
- 秋の顔ぶれいろいろ(2024.11.16)
- ムラサキシキブ(2024.11.15)
- ダイサギがやって来た(2024.11.04)
「IT関連情報」カテゴリの記事
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
- Windows11 24H2 にアップデート(2024.10.05)
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
- Excel上でPythonが使える(2024.07.15)
コメント