« 2023年8月 | トップページ | 2023年10月 »

2023年9月

2023/09/21

鳥といっしょに空を飛ぶ

久しぶりに投稿します.近況報告です.

いまだに真夏の暑さが続いています.草丈も 3m を越えるほどなので調整池の視界が効かず,鳥たちを見ることが難しいので,日々の散歩から遠ざかったままです.タカの渡りも見に行っておらず,今シーズンが終わりそうです.おかげで体が完全に鈍ってしまいました.間もなく健康診断なのに困ったな.何か言われそう.

なおかつ先週買った鳥の飛行に関する学術書を読み始めて,日本語訳の部分サンプルを作る作業にかかりきりになっており,ヒマさえあればキーボードとディスプレイに張り付いています.

ということで何のネタもないのですが,気晴らしに下のような動画を見ています.フランスのモン・サン=ミシェル上空を中・大型の鳥の群れとともにモーターグライダーで飛ぶ動画です.いろいろな種類の鳥たちが出てきますが,ガンの仲間が多いかな?中にはシノリガモ?やツルの仲間も出てきます.これらはいずれも野鳥ではなく飼育され訓練されている鳥たちのようで,グライダーの前席に座った人が手を伸ばして触れるほどの至近距離を飛んでいるのが興味深いです.

鳥の飛行性能を調べるのに,ハトを飼い馴らして風洞実験することが行われてきたのですが,これなら実際に上空での飛行性能を調べられるかもしれません.それにしてもよく馴れていますね.人に触られても平気です.

| | | コメント (1)

2023/09/09

Refsort on Excel v2.50U released

Refsort on Excel は,Refsort/Ruby (直前の記事をご覧ください)を Microsoft Excel 上で使うためのインターフェースを提供するマクロ埋め込みワークシートです.

今日,さまざまなデータを整理分析するのに表計算ソフトウェアは欠かせないものになっていますが,そのワークシート上に書かれたリストに対して,簡便で直感的なインターフェースで Refsort/Ruby の並べ替え機能を提供します.

元来 Excel の内部では UTF-16 という Unicode の符号化が用いられており,多言語の文字を混在して同時に扱うことができます.しかしこれまでは私の知識不足,能力不足から,扱えるエンコーディングを Windows-31J (Shift_JIS) に限定して Refsort on Excel を提供してきました.

今回の改訂ではこの制約を転換し,UTF-8 という Unicode の符号化スキームに切り替えました.これにより Excel 内部の UTF-16 と整合性が取れて,世界中のさまざまな言語の文字を混在させたリストに対して辞書を参照した並べ替えが可能となりました.

例えば IOC List にはアクセント付きの文字や,ウムラウト,トレマなどを含む文字が多用されています.それらが命名者表記や生息域の地名などに出てくるのは当然ですが,標準英名に含まれている場合もあります.標準英名は並べ替えのキーとして使う場合も多いので特に注意が必要です.例えば Seicercus soror Alström's Warbler が代表的です.従来は US-ASCII や Windows-31J でエンコードされた辞書ファイルではウムラウトを直接扱えないため,ウムラウトのない小文字の o で代用していました.しかしこれはある種の近似を行っていることになり,並べ替え結果を再利用する際に支障が出てくる可能性があります.今回の改訂でそのような近似は必要なくなりました.

当然ながら,そのためには UTF-8 でエンコードされた辞書を使う必要があり,従来とは使う辞書の種類が異なることに注意する必要があります.これまで私が作成して提供している辞書は,日本鳥類目録,IOC List,日本種子植物リストの3種類ですが,いずれも UTF-8 でエンコードしたものも提供してきました.エンコーディングはこれらのファイル名の末尾に付けた接尾辞で区別できます.接尾辞が "u" のものが UTF-8 で,"w" のものが Windows-31J でエンコードされたものです.

あらためて UTF-8 でエンコードされた辞書のリストを示すと,

ファイル名 内容
jpblist_v70p5u.ref 日本鳥類目録改訂第7版
ioclist_v132u.ref IOC List v1.32 オリジナル版
ioclist_v132ju.ref IOC List v1.32 和名追加版
jplant056u.ref 日本の種子植物リスト 新エングラー順

となります.いずれも BOM なし,改行コードが LF のテキストファイルです.

今後,Refsort on Excel v2.50U 以降を使う場合には,辞書ファイルにこれら UTF-8 でエンコードされたものを指定するようにしてください.また利用する Refsort は最新の v3.77 以降が望ましいので,こちらもご注意ください.

使用例のスクリーンショットを示します.IOC List から標準英名にウムラウトが使われているものを集めて,標準英名をキーにして並べ替えを行ってみました.辞書ファイルのキーは第 1 フィールド,入力のキーも第 1 フィールドです.正しく並べ替えられていることがわかります.

Refsort_on_excel_v250u

今回の改訂でようやく UTF-8 を使えるようになったので,多様な言語で書かれたリストに対して Refsort を Excel 上で使えるようになったはずです.詳しい説明は,Refsort/Ruby v3.77 と同時にリリースしたユーザーズガイドの付録をご覧ください.

| | | コメント (1)

Refsort/Ruby v3.77 released

辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.77 をリリースしました.今回の改訂内容は軽微なバグ修正と仕様の改善です.ただし同時に Refsort on Excel も改訂し,こちらは仕様を大きく変更しました.詳しくは次の記事をご覧ください.

今回の修正内容は以下の通りです.

  1. 辞書ファイルに埋め込みラベルが書かれていないときに,コマンドラインオプションでラベル出力を指定した場合の例外処理が不備でしたので,警告文を出力するとともにラベル出力をキャンセルするようにしました.
  2. コマンドラインオプションで -x (Excel mode) または -T(出力のフィールド区切り記号をタブにする)を指定すると同時に,ラベルのコメントも出力するよう,例えば M 1c と指定している場合は,ラベル本体とラベルのコメントをタブで区切るよう変更しました.これは Refsort on Excel での使い勝手を考慮したためです.

このスクリプトは最新の Ruby 3.22 で動作することを確認しています.

Refsort_v377_console

Refsort/Ruby とそれに関連するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v377.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは純粋な US-ASCII ですので,そのままでよいでしょう.

| | | コメント (0)

2023/09/03

汗だくの里山散歩

9月に入ったというのに,南海上を熱帯低気圧が進行中で,その湿った空気が入ってきたので蒸し暑いことこの上ありません.

今日は家人に付き合って近くの里山の森を散歩.すぐに汗だくになってしまいましたが,生き物たちは確実に秋の準備を始めているようです.

今日は渡り途中かもしれないキビタキの成鳥と幼鳥に出くわしました.また森のあちこちでは,夏の終わりを告げるクズの花が咲いていると同時に,ツリガネニンジンセンニンソウなどの秋の花が咲き始めていました.

Ushikuforest_0022m

Ushikuforest_0024m

早く涼しくなってほしい.

| | | コメント (0)

« 2023年8月 | トップページ | 2023年10月 »