日本鳥類目録第7版に準拠したRefsort/Ruby辞書ファイルをリリース
先月の中旬ころ,予告されていたとおり,日本鳥学会から "日本鳥類目録 改訂第7版" がリリースされました.マスコミ向けにニュースリリースが出てメディアでも扱われたので,目にした人も多かったのではないかと思います.今回の改訂は実に12年ぶり.この間に鳥類分類学は大きな変化に見舞われ,それは今でも続いています.すなわち,これまでは形態中心だった鳥類の系統分類に,遺伝子解析技術による進化系統学が持ち込まれ,そこで従来の常識を覆す結果が次々にもたらされているからです.
従来の日本鳥類目録 第6版は,この変化の大波をかぶる前の古典的な系統に則っていたのですが,さすがに現時点では新しい学問成果を取り入れないわけにはいきません.それにより今回の第7版は,属や科はおろか,目に至るまで大きな変化を含んだ改訂となりました.
早速,新しいリストを Refsort/Ruby の辞書ファイルに編集しようと思ったのですが,IOC List と違って,Web にリストが掲載されるのではなく,印刷出版物によるリリースという古典的なやり方です.この目録は一冊5,500円もするので,買おうかどうしようか迷っていました.さすがに2週間ほど経つと日本鳥学会の Web サイトに Excel で作成されたリストが掲載されましたので,それを拾ってきて辞書ファイルにしました.元のリストは学名と和名だけだったので,IOC List から英名を引っ張ってきて,学名,英名,和名という標準的なフィールド構成のリストにしてあります.また,Authority の人名にはアクセントやウムラウトが含まれているので,文字コードは UTF-8 に限定しています.
今回の改訂では,種の収録範囲が広がっただけではなく,日本で記録された亜種も包括的に収録されたのが大きな変更点で,これは皆さん大歓迎でしょう.この結果,第7版には667種(外来種含む)と,526亜種(外来種,ssp. 含む)が収録されています.自然分布種と外来種の両方に記載されている種もあり,たとえばトキがそうなのですが,これは歴史的経緯なども考慮されたものと思われます.
これで,日本の鳥類リストも現代的なものに一新されました.従来の分類体系が頭に染みついているバーダーがほとんどだと思いますので,ぜひ Refsort/Ruby とこの辞書ファイルを記録の整理にご活用ください.
| 固定リンク | 0
「自然」カテゴリの記事
- 南風強し(2023.02.01)
- ガマの穂がうまい?(2023.01.29)
- Refsort/Ruby v3.75 released(2023.01.29)
- 北風は強いがタシギは元気(2023.01.28)
- ヒクイナがガマの穂に飛びついた(2023.01.27)
「IT関連情報」カテゴリの記事
- Refsort/Ruby v3.75 released(2023.01.29)
- やっと買い場がやって来る(2022.12.10)
- Windows 11 にアップデート(2022.12.07)
- 20 年選手の ONU が壊れた(2022.11.04)
- Photoshop と Bridge の困ったところ(2022.10.22)
「科学」カテゴリの記事
- Refsort/Ruby v3.75 released(2023.01.29)
- 掩蔽直前の天王星とターコイズフリンジ(2022.11.09)
- 皆既月蝕と天王星蝕(2022.11.09)
- Refsort/Ruby v3.74 released(2022.10.16)
- IOC List v12.2 released(2022.09.03)
コメント
書洩らしましたが,この辞書ファイルのエンコーディングは UTF-8 です.従って,入力ファイルも UTF-8 でエンコードされていなければなりません.Windows の場合,デフォルトでは Windows-31J でエンコードされますので,UTF-8 が扱えるエディタなどで UTF-8 の入力ファイルを作り,かつ,そのファイルの第1行目に
#!E -*- coding: UTF-8 -*-
というマジックコメントを付けておく必要があります.これはちょっと面倒ですね.Linux であれば UTF-8 がデフォルトの文字コードである場合が多いので,このような操作は必要ない場合が多いと思います.
投稿: 俊(とし) | 2012/10/07 20:05
この辞書ファイルを UTF-8 でエンコードしたのは,Authority に含まれる人名にアクセントやウムラウトが含まれているためなので,これらの文字をアクセントやウムラウトを含まない文字に置き換えるか,そもそも Authority を含まない辞書ファイルにしてしまえば,Windows-31J でエンコード可能です.Windows プラットフォームではこちらのほうが便利かもしれませんね.
投稿: 俊(とし) | 2012/10/07 20:10