« Refsort/Rubyの紹介スライドをアップ | トップページ | ピカチュウつばめ »

2012/08/12

Refsort/Ruby v2.43 Released

Refsort/Ruby(例えば新しいほうから順番に *1 *2 *3 *4 *5 など)とは,辞書参照型ソーティングフィルタを Ruby スクリプトとして実装したもので,細々ながらも10年以上メンテナンスを続けているものです.辞書として,例えば生物を分類学上の順番に並べたものを用意すれば,入力された生物の種名を分類学上の順番に並べ替えてくれます.その最新版 v2.43 をリリースしました.

今回のリリースはマイナーな修正ですが,文字エンコーディングに関するものです.IOC がリリースしている IOC World Bird List は3万以上の亜種が網羅された膨大なものですが,何と文字コードが UTF-8 に限定されています.これは人名などにウムラウトアクセントが使われており,そのような多言語の文字列を一元的に扱うためにやむを得ない措置です.これを Refsort/Ruby の辞書ファイルにしたものをリリースしています(*1 *2).いずれも UTF-8 でエンコードされています.これを Windows 上の Refsort/Ruby で使うことはもちろん可能なのですが,コマンド・オプションでフィールド区切り文字を指定したいと思ったときに不具合が生じます.Windows のコンソールから指定できる文字は Windows-31J というエンコーディング(より正確には各国語版 Windows のロケールで指定されたエンコーディング)に限られます.Refsort/Ruby は UTF-8 の辞書ファイルを読み込んだ場合は,内部でのエンコーディングも UTF-8 に限定します.そこへ Windows-31J の文字列を割り込ませることはできません.

そこで v2.43 では,このようなエンコーディングの不一致を検出した場合には,コマンドラインから入力された文字のエンコーディングを辞書ファイルのエンコーディングに変換するようにしました.これは,今後のマルチエンコーディング時代でも使い勝手が悪くならないようにするための一つの改良です.

これ以外にも,フィールド指定に関する警告メッセージを増やしたりしました.だいぶ robust になってきたと思いますので,どうぞお使いください.

|

« Refsort/Rubyの紹介スライドをアップ | トップページ | ピカチュウつばめ »

IT関連情報」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/54612/55406645

この記事へのトラックバック一覧です: Refsort/Ruby v2.43 Released:

» 日本鳥類目録第7版に準拠したRefsort/Ruby辞書ファイルをリリース [望湖庵日記 Lakeside Diary]
先月の中旬ころ,予告されていたとおり,日本鳥学会から 日本鳥類目録 改訂第7版 がリリースされました.マスコミ向けにニュースリリースが出てメディアでも扱われたので,目にした人も多かったのではないかと思います.今回の改訂は実に12年ぶり.この間に鳥類分類学は大きな変化に見舞われ,それは今でも続いています.すなわち,これま... [続きを読む]

受信: 2012/10/07 15:45

» IOC List v3.2 Almost Released [望湖庵日記 Lakeside Diary]
約四半期ごとに更新を続けている IOC の World Bird List ですが,遅れていた v3.2 へのアップデートがリリースされようとしています.すでに本体のリストは北米時間で10月15日アップされているのですが,最終確認を取っている最中のようです.今回のアップデートはやや控えめなもので,種数は 10,466 ... [続きを読む]

受信: 2012/10/21 08:30

» 日本鳥類目録第7版の Refsort 辞書ファイルを更新 [望湖庵日記 Lakeside Diary]
昨年10月の7日と10日に,日本鳥類目録第7版を Refsort/Ruby の辞書として編集しなおしたものをアップしました.それに対して,わずかにあった誤植を取り除き,またあまり意味のなかった不詳亜種のレコードを取り除き,そして最新の IOC List v3.2 に記載の英名をできる限り取り入れるという改訂を行いました... [続きを読む]

受信: 2013/01/06 16:20

» Refsort/Ruby v2.44 [望湖庵日記 Lakeside Diary]
Refsort/Ruby(例えば新しいほうから順番に *1 *2 *3 *4 *5 など)とは,辞書参照型ソーティングフィルタを Ruby スクリプトとして実装したもので,細々ながらも10年以上メンテナンスを続けているものです.辞書として,例えば生物を分類学上の順番に並べたものを用意すれば,入力された生物の種名を分類学... [続きを読む]

受信: 2013/04/21 18:47

» Refsort/Ruby v2.47, jplant054 [望湖庵日記 Lakeside Diary]
このところ忙しくしていて,1か月以上ブログの更新ができませんでした.お天気が悪くて写真が撮れなかったというのも隠れた理由です. さて,辞書参照型ソーティング・フィルター Refsort/Ruby(例えば新しいほうから順番に *1 *2 *3 *4 *5 *6 *7 など)の最新版をちょうど1年前にリリースしたのですが,... [続きを読む]

受信: 2014/07/19 15:05

» Refsort/Ruby v2.48 released [望湖庵日記 Lakeside Diary]
辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です. 前回のリリー... [続きを読む]

受信: 2015/04/29 14:44

» Refsort/Ruby 2.50 Released [望湖庵日記 Lakeside Diary]
辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8 *9).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です. 前回の... [続きを読む]

受信: 2016/07/02 14:06

» Refsort/Ruby 2.51 Released [望湖庵日記 Lakeside Diary]
辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8 *9 *10).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です.... [続きを読む]

受信: 2017/04/30 13:17

« Refsort/Rubyの紹介スライドをアップ | トップページ | ピカチュウつばめ »