« オカヨシガモ | トップページ | アオサギ水没 »

2020/01/25

IOC List v10.1 Released

IOC World Bird List v10.1 が2020年1月25日にリリースされました.これは2020年最初のリリースで,年内にはもう1度7月ころにリリースが予定されています.前回 v9.2 のリリースが2019年6月22日だったので,今回は約7か月の更新間隔となっており,比較的長期の間隔でのリリースとなっています.感謝祭やクリスマスを挟んでいるからかもしれません.

今回収録されたのはが 40,が 250,が 2,322,現生が 10,770,絶滅種が 158,亜種が 20,005 です.これまでと同様,上目 (Superorder) の PALEOGNATHAE(古顎類)NEOGNATHAE(新顎類)や,系統群であるNEOAVES がリストの最上位の階層に載っています.


今回は日本のバーダーにとって大きな変更はありません.強いてあげると,チュウシャクシギの英名が従来の Whimbrel から Eurasian Whimbrel に変更になったことくらいです.これは,これまでチュウシャクシギ Numenius phaeopus の亜種のひとつであった N. phaeopus hudsonicus が種に昇格されて N. hudsonicus, Hudsonian Whimbrel, ハドソンチュウシャクシギ(推奨和名)となったことに伴うものだそうです.


日本のバーダーにはあまり関係ありませんが,今回はシャコの仲間のうち 16 種の英名が Francolin から Spurfowl に変更されました.ちなみに,日本でも多少関係ありそうなコモンシャコの英名は変更されず,Chinese Francolin のままです.


IOC 本家の Master List(学名と英名を収録)を編集して,Refsort/Ruby 用の辞書ファイルを作りましたので,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしました.

この辞書ファイルの正式なエンコーディングは UTF-8 です.従って,Linux 上で使う分には問題は生じませんが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ最初の行に

#!E -*- coding: UTF-8 -*-

というおまじないを書いておかないとエンコーディングの解釈がうまくいきませんのでご注意ください.

しかし,Windows 上でのデフォルトのエンコーディングである US-ASCIIWindows-31J でも手間なく使えるように,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.これはどのようなプラットフォームであっても,そのプラットフォームのデフォルトの Locale が無条件で US-ASCII を解釈できることを利用したものです.ただし,欧文のアクセントウムラウトを含む文字は,それらを含まない最も近い文字に置き換えられています.正版はあくまで UTF-8 なので,特に人名を含む種や,種の Authority を見るときにはご注意ください.


このオリジナル版の辞書ファイルに続いて,和名追加辞書 2 種と,IOC Master List(Excel ワークシート)の和名追加版も同時にリリースしました.和名追加辞書についても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.ただし人名や地名のアクセントやウムラウトなどは,それらを含まない最も近い文字に置き換えてありますのでご注意ください.

単に種名を調べるためだけであれば,和名追加版の Master List が最も便利です.ただし長大なワークシートなので,スクロールして探すのは無理.検索メニューからジャンプするのが便利です.

和名追加版の辞書ファイルのうち,UTF-8 でエンコードしてある ioclist_v101ju.ref は,Linux などで UTF-8 でエンコードした入力ファイルをソートするときに使うことを想定しています.Linux 上で使う際には,入力ファイルの最初の行に上記のようなエンコーディング指定を書く必要はありませんが,Windows 上で使う場合には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの最初の行に

#!E -*- coding: UTF-8 -*-

というエンコーディングを指定しておく必要があります.

逆に,Windows 上で Shift-JIS や Windows-31J でエンコードされた入力ファイルを,Windows-31J でエンコードされた辞書ファイル ioclist_v101jw.ref を用いてソートする際には,入力ファイルの冒頭にエンコーディングの指定は必要ありませんが,逆にこの辞書ファイルを Linux 上で使う場合には,入力ファイルは Windows-31J でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの冒頭に

#!E -*- coding: Windows-31J -*-

とエンコーディングを指定しておく必要があります.要するに,どのような場合でも辞書ファイルと入力ファイルのエンコーディングを揃え,かつそれぞれの入力ファイルのエンコーディング指定を冒頭に書いておくのが無難です.

これらのファイルは前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからダウンロードできます.それには,このブログ右側のコラムの最上段の “Archive„ の中の “IOC List Archive„ をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.

さて 2 年ほど前から Master List に多国語版が登場し,ちゃんと和名も載っているのですが,最近の種の分割などに対応しているようには見えず,和名の無い種もたくさんあるようです.そういう場合には,今回アップした各種辞書ファイルか,和名を追記した Master List を参照してみてください.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v10.1. It contains 10,770 extant species, 158 extinct species and 20,005 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v101u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well, and should contain a magic comment on the top of the file such as;

#!E -*- coding: UTF-8 -*-

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v101a.ref" encoded in pure US-ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two reference files “ioclist_v101ju.ref” and “ioclist_v101jw.ref” (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names. If you want to refer to Japanese names, please refer to those files. In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a magic comment specifying the encoding of the input file in the first line of the file, such as UTF-8, US-ASCII or Windows-31J.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be most convenient.

You can download an appropriate file from my area of Microsoft One Drive by clicking “IOC List Archive„.

| |

« オカヨシガモ | トップページ | アオサギ水没 »

自然」カテゴリの記事

IT関連情報」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« オカヨシガモ | トップページ | アオサギ水没 »