IOC List v4.3 Released
7月31日にIOC List v4.3 がリリースされました.前回 v4.2 のリリースは2014年4月15日だったので,今回のリリースはそれから3か月半.相変わらず定期的に更新されていて,実に驚くべき頻度です.今回収録されたのは10,684種と,20,999亜種です.
この v4.3 の Master List を編集して Refsort/Ruby の辞書ファイルとしたものをアップしました.IOC World Bird Names の Web サイトはすでに v4.3 への移行が完了間近と伝えています.
今回も辞書ファイルの正式なエンコーディングは UTF-8 です.従って Linux 上で使う分にはさほど問題が生じないでしょうが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ,かつ最初の行に
#!E -*- coding: UTF-8 -*-
というおまじないを置いておかないとうまく動きませんのでご注意ください.
しかし,Windows 上では相変わらず US-ASCII や Windows-31J がデフォルトのエンコーディングなので,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.ただし,この版では,欧文のアクセントやウムラウトを含む文字は最も近い文字に置き換えられています.正版はあくまで UTF-8 版なので,日常的な簡易版としてお使いください.
さて,このオリジナル英語版に引き続いて,和名を収録した日本語版(*1 *2)を準備しようと思いますが,こちらは内容の修正と確認に手間がかかるため,しばらく時間をいただきたいと思います.
I am pleased to announce that I have posted a reference file for Refsort/Ruby compiled directly from the latest IOC World Bird List v4.3. It contains 10,684 species and 20,999 subspecies. Please try it out, and enjoy its capability and speed.
Note that the reference file "ioclist_v43u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well.
For those who want to use Refsort/Ruby in the ASCII environment, I have posted another reference file "ioclist_v43a.ref" encoded in pure ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.
I will try to post two reference files (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names, but it may take a couple of weeks.
| 固定リンク | 0
「自然」カテゴリの記事
- 暑い夕方の月(2024.09.06)
- IOC List v14.2 Released(2024.08.27)
- 田んぼの近況(2024.06.07)
- ジューンベリーも実った(2024.05.24)
- クワの実がなった(2024.05.23)
「IT関連情報」カテゴリの記事
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
- Excel上でPythonが使える(2024.07.15)
- WSL2 をインストールして使っています(2024.06.19)
- Windows 再インストール時に VMD でハマる(2024.04.13)
コメント