IOC List v4.2 Released
4月15日にIOC List v4.2 がリリースされました.前回 v4.1 のリリースは2014年1月7日だったので,今回のリリースはそれから3か月ちょっと.相変わらず定期的に更新されていて,これは実に驚くべきことです.
この v4.2 の Master List を編集して Refsort/Ruby の辞書ファイルとしたものをアップしました.IOC World Bird Names の Web サイトはすでに v4.2 への移行が完了間近と伝えています.
今回も辞書ファイルの正式なエンコーディングは UTF-8 です.従って Linux 上で使う分にはさほど問題が生じないでしょうが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ,かつ最初の行に
#!E -*- coding: UTF-8 -*-
というおまじないを置いておかないとうまく動きませんのでご注意ください.
しかし,Windows 上では相変わらず US-ASCII や Windows-31J がデフォルトのエンコーディングなので,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.ただし,この版では,欧文のアクセントやウムラウトを含む文字は最も近い文字に置き換えられています.正版はあくまで UTF-8 版なので,日常的な簡易版としてお使いください.
さて,このオリジナル英語版に引き続いて,和名を収録した日本語版を準備しようと思いますが,こちらは内容の修正と確認に手間がかかるため,しばらく時間をいただきたいと思います.
I am plesed to announce that I have posted a reference file for Refsort/Ruby compiled directly from the latest IOC World Bird List v4.2. It contains 10,680 species and 20,964 subspecies. Please try it out, and enjoy its capability and speed.
Note that the reference file "ioclist_v42u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well.
For those who want to use Refsort/Ruby in the ASCII environment, I have posted another reference file "ioclist_v42a.ref" encoded in pure ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.
I will try to post two reference files (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names, but it may take a couple of weeks.
| 固定リンク | 0
「自然」カテゴリの記事
- タシギが7羽に増加(2023.12.06)
- タシギ来訪(2023.12.01)
- 冬の足音(2023.11.26)
- 引っ付き虫絶賛大量産中(2023.11.16)
- 寒かった秋の散歩(2023.11.11)
「IT関連情報」カテゴリの記事
- Refsort on Excel v2.50U released(2023.09.09)
- Refsort/Ruby v3.77 released(2023.09.09)
- Microsoft Teamsの複雑な仕様がやっとわかった(2023.08.20)
- IOC List v13.2 Released(2023.07.28)
- Refsort/Ruby v3.76 released(2023.07.22)
コメント