IOC List v4.1 Released
IOC List v4.1 がリリースされました.前回 v3.5 のリリースは2013年9月29日だったので,今回のリリースも3か月ちょっとしかかかっていません.相変わらず非常に速い周期で更新されています.
この v4.1 の Master List を編集して Refsort/Ruby の辞書ファイルとしたものをアップしました.IOC World Bird Names の Web サイトはすでに v4.1 への移行が完了したと表示されています.
なお,今回も辞書ファイルの正式なエンコーディングは UTF-8 です.従って Linux 上で使う分にはさほど問題が生じないでしょうが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ,かつ最初の行に
#!E -*- coding: UTF-8 -*-
というおまじないを置いておかないとうまく動きませんのでご注意ください.
しかし,そうは言っても Windows 上では相変わらず US-ASCII や Windows-31J がデフォルトのエンコーディングなので,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.実は今回この版を作るのにかなり手間取りました.というのも,オリジナルの UTF-8 版には実に多様な欧州言語の文字が含まれるようになってきており,それらを系統的に最も近い文字に置き換える仕掛けを作るのに時間がかかってしまったのです.ただし,この版では,欧文のアクセントやウムラウトを含む文字は最も近い文字に置き換えられています.正版はあくまで UTF-8 版なので,日常的な簡易版としてお使いください.
さて,このオリジナル英語版に引き続いて,和名を収録した日本語版を準備しようと思いますが,こちらは内容の修正と確認に手間がかかるため,しばらく時間をいただきたいと思います.
I am plesed to announce that I have posted a reference file for Refsort/Ruby compiled directly from the latest IOC World Bird List v4.1. It contains 10,568 species and 20,976 subspecies. Please try it out, and enjoy its capability and speed.
Note that the reference file "ioclist_v41u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well.
For those who want to use Refsort/Ruby in the ASCII environment, I have posted another reference file "ioclist_v41a.ref" encoded in pure ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.
| 固定リンク | 0
« 追い風340km/h! | トップページ | 初雪 »
「自然」カテゴリの記事
- ガガンボ(2025.06.05)
- 強風の五月晴れ(2025.04.27)
- コガモとアカメガシワ(2025.04.26)
- ムナグロ御一行様お着き(2025.04.26)
- フジが満開(2025.04.24)
「IT関連情報」カテゴリの記事
- IOC List v15.1 Released(2025.03.12)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
- Windows11 24H2 にアップデート(2024.10.05)
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
コメント