Refsort/Ruby v3.61 released
辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.61 をリリースしました.今回の改訂では新オプションの導入はありませんが,Locale と異なる辞書ファイルと入力ファイルを用いた場合の警告メッセージを,できる限り Locale のエンコーディングに変換して表示するようにしたことが最大の変化です.これによって変則的な使用法における使い勝手が改善されるはずです.
これまでは,例えば Windows 日本語版のコマンドコンソールで,UTF-8 でエンコードされた辞書ファイルと入力ファイルを使って並べ替えを行ったとき,辞書ファイルと照合できない入力レコードがあると,それを UTF-8 のエンコーディングのままコンソールに表示して警告していました.しかしこれは文字化けしてしまい,どういう問題があったのか把握できません.
今回の改訂では,警告文のエンコーディングを Locale に従って Winodws-31J に変換して表示するので,警告内容が把握しやすくなります.ただしこの変換は完璧ではなく,UTF-8 から Windows-31J に変換できない文字,例えばウムラウトやアクセントが付いた欧文文字は ? と表示されます.
以下にスクリーンショットを示しました.Refsort/Ruby v3.60 を用いた最初の実行では,警告文が文字化けしてしまっています.しかし v3.61 を用いた2回目の実行では,警告文が正しく変換されて表示されていることがわかると思います.
なお,並べ替え結果はいずれの場合も可読な形で表示されていますが,これが Windows のコンソールの機能なのか,Ruby の標準出力の機能なのかは調査不足です.Linux のターミナルでは Locale が異なれば並べ替え結果も文字化けします.
この改訂以外では,いつの間にか混入していたマイナーなバグを取り除いています.
Refsort/Ruby とそれに関するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの “Archive” の中の “Refsort/Ruby Archive” をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます.Refsort 本体の “refsort.rb” は “refsort_v361.rb” というファイル名でアップロードされていますので,ダウンロード後に適宜 “refsort.rb” に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.
Refsort on Excel v2.30 や日本鳥類目録 v7 に準拠した辞書ファイル,IOC List v11.2 に準拠した辞書ファイル,最新版に準拠したユーザーズガイドやプレゼンテーション用のスライドもこのアーカイブに収録されていますので,どうかご利用ください.
このソフトウェアは,一つの完結したアプリケーションというよりは,grep や sort のような「縁の下の力持ち」的なツールとして使われることを想定しています.しかし,各用途に特化した辞書ファイルという補助役が必要で,それらを含めた全体が一つの生態系として発展していくことが望ましいソフトウェアでもあります.新しい応用先を探索中ですので,何かアイデアがあればぜひお聞かせください.
| 固定リンク | 0
「自然」カテゴリの記事
- ガガンボ(2025.06.05)
- 強風の五月晴れ(2025.04.27)
- コガモとアカメガシワ(2025.04.26)
- ムナグロ御一行様お着き(2025.04.26)
- フジが満開(2025.04.24)
「IT関連情報」カテゴリの記事
- IOC List v15.1 Released(2025.03.12)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
- Windows11 24H2 にアップデート(2024.10.05)
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
「科学」カテゴリの記事
- 鳥の飛行力学 入門 第 2 版(2025.06.07)
- 「鳥の飛行力学 入門」書きました(2025.03.15)
- IOC List v15.1 Released(2025.03.12)
- ナガサキアゲハ(2024.10.16)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
コメント