Refsort v3.72 released
辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.72 をリリースしました.今回の改訂はバグの修正と,例外処理の若干の簡素化です.
まずバグの修正について.Refsort は --output, -o
オプションで出力するフィールドを自由に選択できるのですが,出力のフィールド区切り記号そのものが含まれているフィールドは二重引用符で囲んで出力するようにしています.これは出力の再利用を容易にするためで,ある意味必須の機能です.例えば出力の区切り記号が空白の場合,フィールド内部に空白があるとそのフィールドを二重引用符で囲みます.例えばこんな感じ.
A B "C1 C2" D E
このフィールドを再び Refsort で読み込むと,フィールド分割を { } で示すことにすれば,
{A} {B} {C1 C2} {D} {E}
という具合に正しくフィールドが分割されます.
ところが,フィールド内に二重引用符自身が含まれていると,二重引用符自身をエスケープしてやらないと再利用するときのフィールド分割がうまく行かずに困ったことになってしまいます.しかしこれまで二重引用符のエスケープは放置されたままというバグが残っていました.
今回,二重引用符で囲まれたフィールド内の二重引用符は CSV の習慣に従って二重引用符自身でエスケープする,つまり二重引用符を2個連ねることでエスケープすることにしました.つまりこんな感じに出力されます.
A B "C & ""Special""" D E
これを再利用時に Refsort で読み込むと,
{A} {B} {C & "Special"} {D} {E}
という具合に正しく分割されます.
もうひとつの改訂は --didyoumean, -y
や --fullsearch, -Y
オプションを使ったときのメッセージに,正解候補の文字列だけではなく,その候補が辞書ファイルの何行目にあるのかを示すようにしたことです.例えばこんな感じの出力が得られます.
!I 16: "オオタグロカモメ" not found in jpblist_v70p5w.ref
Did you mean? "オオズグロカモメ" at R 698
"オオセグロカモメ" at R 716
Refsort/Ruby とそれに関連するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v372.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは US-ASCII ですので,そのままでよいでしょう.現時点でユーザーズガイドは未改訂ですが,IOC List v12.2 が公開された後で,その内容を反映させたものをリリースする予定です.
| 固定リンク | 0
「自然」カテゴリの記事
- ガガンボ(2025.06.05)
- 強風の五月晴れ(2025.04.27)
- コガモとアカメガシワ(2025.04.26)
- ムナグロ御一行様お着き(2025.04.26)
- フジが満開(2025.04.24)
「IT関連情報」カテゴリの記事
- IOC List v15.1 Released(2025.03.12)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
- Windows11 24H2 にアップデート(2024.10.05)
- IOC List v14.2 Released(2024.08.27)
- Ruby を自力ビルドしてみた(2024.07.25)
「科学」カテゴリの記事
- 鳥の飛行力学 入門 第 2 版(2025.06.07)
- 「鳥の飛行力学 入門」書きました(2025.03.15)
- IOC List v15.1 Released(2025.03.12)
- ナガサキアゲハ(2024.10.16)
- 日本鳥類目録第8版に準拠したRefsort/Ruby用辞書ファイル(2024.10.13)
コメント