« コブハクチョウとユリカモメ | トップページ | Refsort/Ruby 2.90 Released »

2018/02/03

IOC List v8.1 Released

IOC World Bird List v8.1 が2018年1月25日にリリースされました.これは昨年秋に改訂周期が6か月に変更されて初めてのリリースです.前回 v7.3 のリリースが2017年7月31日だったので,今回は6か月弱の更新間隔を守ったリリースとなっています.このあたりの締め切りの守り方は過去から実に見事で,多くのソフトウェア開発のロードマップがだらだらと遅れることが普通であることを知っていると,驚異的にロードマップが順守されていることが分かります.

今回収録されたのはが 40,が 247,が 2,312,現生種が 10,699,絶滅が 158,亜種が 20,074 です.全体としては分類の粒度がわずかに細かくなり,属の数が若干増えています.また,前回同様,上目 (Superorder) の PALEOGNATHAE(古顎類)NEOGNATHAE(新顎類)や,系統群であるNEOAVES がリストの最上位の階層にこっそりと載っています.

今回は日本のバーダーにとっては注目すべき変更はありません.唯一気になったのは,日本鳥類目録に載っている亜種コガモ Anas crecca crecca が削除されてしまったことです.これは兄弟亜種の亜種オオコガモ Anas crecca nimia が削除されてしまったことにより,基亜種である亜種コガモも自動的に削除されたことに拠っています.これによりコガモは単型 monotypic となりました.これを読んで亜種アメリカコガモ A. c. carolinensis があるではないか?と疑問をお持ちの方は,IOC List では A. c. carolinensis は当初から種 A. carolinensis として扱われていたことを知っておくべきでしょう.この辺りの考え方の差異は非常に微妙.分類や種の実在性というものの意味を深く考えるきっかけになればよいと思います.

そのほか,ニュウナイスズメ Passer rutilans の種小名が rutilans から cinnamomeus に変更されています.これに伴い,日本鳥類目録に載っている亜種ニュウナイスズメ P. rutilans rutilans の学名も P. cinnamomeus rutilans に変わりましたので,今回の Refsort/Ruby の辞書ファイルではこの変更を取り込んでいます.

日本鳥類目録とは無縁ですが,今回はアリドリ科が大異動しています.中南米の鳥なので私など全く知らない分類群なのですが,科全体の内容が大幅に並べ替えられています.またムジヒタキ属 Pseudalethe の属名が Chamaetylas に変更,また従来 Incertae sedis #2 として所属不明だった種の所属がいくつか決まりました.

新世界ホオジロ類 (American Sparrows) が 26 の属を引き連れて新しい科 Passerellidae に異動し,旧世界ホオジロ類 (Buntings) の Emberizidae と分離されました.これは非常に大きな異動ですが,地理的に分離された科だと思えば自然とも言えます.

この異動に伴い,ホオジロ類の科と属の順番が大幅に変更になりました.IOC List v7.3 までは,リストの末尾はショウジョウコウカンチョウ科 Cardinalidaeルリノジコ属 Passerina で,最後の種はキバラルリノジコ P. leclancherii, Orange-breasted Bunting だったのですが,v8.1 のリストの末尾は,フウキンチョウ科 Thraupidae キガタイカル属 Parkerthraustes の P. humeralis, Yellow-shouldered Grosbeak, キガタイカルです.これまでキバラルリノジコを見慣れていた眼には,ん?という感じです.


IOC 本家の Master List を編集して,Refsort/Ruby 用の辞書ファイルを作りましたので,このブログサイトと,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしました.

今回もこの辞書ファイルの正式なエンコーディングは UTF-8 です.従って,Linux 上で使う分には問題は生じませんが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ最初の行に

#!E -*- coding: UTF-8 -*-

というおまじないを書いておかないとエンコーディングの解釈がうまくいきませんのでご注意ください.

しかし,Windows 上でのデフォルトのエンコーディングである US-ASCIIWindows-31J でも手間なく使えるように,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.これはどのようなプラットフォームであっても,そのプラットフォームのデフォルトの Locale が無条件で US-ASCII を解釈できることを利用したものです.ただし,欧文のアクセントウムラウトを含む文字は,それらを含まない最も近い文字に置き換えられています.正版はあくまで UTF-8 なので,特に人名を含む種や,種の Authority を見るときにはご注意ください.


このオリジナル英語版の辞書ファイルに続いて,和名追加版2種と,IOC Master List の Excel ファイルに和名を追加したものも同時にリリースしました.和名追加版の辞書ファイルについても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.ただし人名や地名のアクセントやウムラウトなどは,それらを含まない最も近い文字に置き換えてありますのでご注意ください.

和名追加版の辞書ファイルのうち,UTF-8 でエンコードしてある ioclist_v81jp1u.ref は,Linux などで UTF-8 でエンコードした入力ファイルをソートするときに使うことを想定しています.Linux 上で使う際には,入力ファイルの最初の行に上記のようなエンコーディング指定を書く必要はありませんが,Windows 上で使う場合には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの最初の行に

#!E -*- coding: UTF-8 -*-

というエンコーディングを指定しておく必要があります.

逆に,Windows 上で Shift-JIS や Windows-31J でエンコードされた入力ファイルを,Windows-31J でエンコードされた辞書ファイル ioclist_v81jp1w.ref を用いてソートする際には,入力ファイルの冒頭にエンコーディングの指定は必要ありませんが,この辞書ファイルを Linux 上で使う場合には,入力ファイルは Windows-31J でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの冒頭に

#!E -*- coding: Windows-31J -*-

とエンコーディングを指定しておく必要があります.要するに,どのような場合でも辞書ファイルと入力ファイルのエンコーディングを揃え,かつそれぞれの入力ファイルのエンコーディング指定を冒頭に書いておくのが無難です.

これらのファイルをダウンロードするには,従来通りこのブログの右側のコラムで “自作ソフト„ の中から個々のファイルをクリックしても良いのですが,前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからもダウンロードできます.それには,このブログ右側のコラムの最上段の “Archive„ の中の “IOC List Archive„ をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.今後は One Drive のみに集約していく予定です.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v8.1. It contains 10,699 extant species, 158 extinct species and 20,074 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v81u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well, and should contain a magic comment on the top of the file such as;

#!E -*- coding: UTF-8 -*-

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v81a.ref" encoded in pure US-ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two reference files (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names. If you want to refer to Japanese names, please see those files. In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a magic comment specifying the encoding of the input file in the first line of the file, such as UTF-8, US-ASCII or Windows-31J.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be more convenient.

You can download an appropriate file by clicking a link listed on the right column of this page, but you can also access files and folders built in my area of Microsoft One Drive by clicking “IOC List Archive„.

|

« コブハクチョウとユリカモメ | トップページ | Refsort/Ruby 2.90 Released »

IT関連情報」カテゴリの記事

自然」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/54612/66352658

この記事へのトラックバック一覧です: IOC List v8.1 Released:

» IOC List v8.2 Released [望湖庵日記 Lakeside Diary]
IOC World Bird List v8.2 が2018年6月25日にリリースされました.これは昨年秋に改訂周期が6か月に変更されて2回目のリリースで,年内にはもうこれ以上のリリースはないはずです.前回 v8.1 のリリースが2018年1月25日だったので,今回は5か月の更新間隔となっており,予定よりも1か月ほど早... [続きを読む]

受信: 2018/06/26 16:29

« コブハクチョウとユリカモメ | トップページ | Refsort/Ruby 2.90 Released »