IT関連情報

2022/09/18

ACアダプターを撲滅せよ

私の机の周りにはいくつもの AC アダプターがあります.無線 LAN ルーターの電源,NAS の電源,LED ライトの電源,などなど.これらの AC アダプターは相互に互換性がないのが普通で,電気製品が増えるたびに AC アダプターも増える,そして電源タップの周りは AC アダプターだらけになって,黒い四角い箱がごろごろ.

Wallg84ce3ba6b_640

こうなることを避けるために,私は出来るだけ電源内蔵の機器を買うようにしているのですが,なかなか希望通りにはいきません.例えば,現在使用中のネットワーク・ハブは,あれこれ探し回ってようやく電源内蔵・金属筐体のものが見つかったので良かったのですが,無線 LAN ルーターは業務用でもない限りそのようなものは全くありません.

どうして AC アダプターが世にはびこるのか,想像を巡らせてみました.

  1. 製品メーカーに電源を設計できるエンジニアがいない.電源回路は製品を底辺で支える大変重要な部分のはずだが,広告に書ける性能とは無関係のために重視されず,優秀なエンジニアを雇わない,エンジニアが育たない.
  2. 電源を内蔵すると国ごとに異なる電圧や規格に対応して認証を得るのが大変面倒.
  3. 自社で不慣れな設計をして製品事故(特に経年劣化)を起こすくらいだったら,電源専業の台湾デルタ電子から認証付きの AC アダプターの供給を受けたほうがよほど安上がりだし品質も安心.
  4. 電源内蔵でなくてもユーザーは気にしない・・・だろう.

しかし,私は大変気にするのですよ.床や机上に埃まみれになった AC アダプターがごろごろ転がっているのは許せません.そもそもまともな電源を作れないメーカーの製品はいまいち信用できない.技術の底力を疑いたくなるのです.特にチョークコイル電解コンデンサの選択や使いこなしは製品の信頼性に大きく関係します.パソコンに内蔵させる10万円もするグラフィックスカードですら,その電源回路のチョークコイルが振動して騒音(いわゆるチョーク鳴き)を発生させる不良設計がまかり通っているので全く呆れます.

しかし AC アダプターは無くなりませんねぇ.ますますはびこっています.私にできることは電源を内蔵した製品を探して買い求めることですが,年々選択肢が狭まっているのを感じて悲しくなります.

| | | コメント (0)

2022/09/03

IOC List v12.2 released

IOC World Bird List v12.2 のドラフト版は 8 月上旬にはアップロードされていたのですが,その後正式版になったというアナウンスが無いままに 9 月に入ってしまいました. その間 8 月 23 日付で BOW ページが v12.2 に更新されたというアナウンスがあっただけです.このため 8 月 23 日で更新が完了したと見なしたいと思います.

これは 2022 年 2 回目のリリースです.前回 v12.1 のリリースが 2022 年 1 月 20 日だったので,今回は 6 か月 + 1 か月以上経ってからの更新となりましたが,これは他の主要な鳥類チェックリストとの統合の議論がある程度進捗するのを見極めてから更新作業を行ったためと思われます.この調子だと,鳥類チェックリストの大統合が予想外に早く達成されるかもしれません.

今回収録されたのはが 44 ,が 253,が 2,383 ,が 11,093 (うち絶滅種が 160 ),亜種が 19,880 です.

今回と前回 v12.1 との差分を調べてみると大きな変更はなく,他の主要チェックリストに合わせて 20 種程度の英名を変更したことが目立つくらいです.大規模な属の異動もありませんでした.例によって日本のバーダー向けに重要と思われる変更点を書いておきますが,今回はほとんど書くべきことがありません.強いて書くと,

  1. Pandion cristatus, Easterm Osprey, オーストラリアミサゴが P. haliaetus, Western Osprey, ミサゴの亜種にまとめられ,P. h. cristatus となりました.これに伴い,P. haliaetus の英名が Western Osprey から Osprey に変更されました.ちなみに日本で見られるミサゴは基亜種 P. h. haliaetus です.従って今後日本のミサゴの英名はただの Osprey となります.
  2. Strix davidi, Pere David's Owl, シセンフクロウが S. uralensis, Ural Owl, フクロウの一亜種に格下げされ,S. u. davidi となりました.ちなみに日本の本州島のフクロウは S. u. hondoensis, 亜種フクロウです,他の島のフクロウも S. uralensis の亜種なので,シセンフクロウと同列の扱いです.

と,この程度です.今回は英名の変更が多かったのですが,日本のバーダーにとっては影響はわずかでしょう.なお,IOC List が更新されるたびに別記事で紹介していた tautonym(反復名)ですが,今回は前回の v12.1 と全く同じなので省略します.


IOC 本家の Master List(学名と英名を収録した Excel ファイル)を編集して,Refsort/Ruby 用の辞書ファイル(拡張子が .ref のテキストファイル)を作りましたので,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしました.

エンコーディングは UTF-8US-ASCII の2種類です.正版は UTF-8 版で US-ASCII 版は簡易版ですが,詳細についてはユーザーズガイドをご覧ください.


このオリジナル版の辞書ファイルと併せて,全ての掲載種に和名をつけた辞書ファイル 2 種と,IOC Master List の和名追加版(Excel ファイル)も同時にリリースしました.今回は山階鳥研論文誌に掲載されている目と科の新しい和名を参照して,目と科の和名を若干修正しました.さらに同じく山階鳥研の論文誌に掲載されたフクロウ目の種和名の改訂に関する論文を参照して,フクロウ類の和名の若干の改訂を行いました.変更部分は辞書ファイル中に明記してあります.元論文は辞書ファイルのヘッダー部分を参照してください.

和名追加辞書についても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.詳細についてはユーザーズガイドをご覧ください.

単に種名を調べるためだけであれば,和名追加版の Master List(Excel ファイル)が最も便利です.ただし長大なワークシートなので,目的の名前をスクロールして探すのは非効率です.検索メニューからジャンプするのが良いでしょう.


これらのファイルは前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからダウンロードできます.それには,このブログ右側のコラムの最上段の Archive の中の IOC List Archive をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.


なお旧版の v12.1j について,何か所か和名の誤記が見つかったので,訂正版をリリースしています.ioclist_v121jp1 という総称で,それぞれ UTF-8 と Windows-31J でエンコードしたものがあります.旧版を使い続ける方はこちらをお使いください.

さて,本年秋のリリースが予定されていた 10 年ぶりの更新となる日本鳥類目録改訂第 8 版ですが, Covid-19 の影響を受けて検討作業が遅滞しているとのことで,リリースを 1 年延期して 2023 年 9 月とすることがアナウンスされています.しかも,これまでになかったような和名の変更がいくつか予告されており,興味深いものになるようです.例えば長すぎる和名を短くするとか,亜種の名前を種名と異なるものにする例外を設けるとか・・・こちらの記事が参考になります.一年先延ばしになってしまいましたが,ぜひ世界の進度に伍して行ってもらいたいと思います.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v12.2. It contains 44 Orders, 253 Families, 2383 Genera, 11,093 species including 160 extinct ones, and 19,880 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v122u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List.

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v122a.ref" encoded in pure US-ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two different reference files "ioclist_v122ju.ref" and "ioclist_v122jw.ref" (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names for all species. If you want to know Japanese names, please refer to those files.

In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a magic comment specifying the encoding in the first line of these files, such as

#!E -*- coding: UTF-8 -*-

or, add an option "-E UTF-8" into your commandline.

You can skip this process if your iput file is encoded in the default encoding of your platform, e.g., US-ASCII or Windows-31J for Windows, UTF-8 for macOS or Linux.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be most convenient for quick reference.

You can download appropriate files from my area of Microsoft One Drive by clicking "IOC List Archive". Enjoy, and bon appétit.

| | | コメント (0)

Refsort/Ruby v3.73 released

辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.73 をリリースしました.今回の改訂は機能の追加が主なものです.

まず,数値の大小で並べ替えを行うための --value, -e オプションの機能を拡張し,数字の直後に + または - 記号を最大で 5 個まで付けることで,付けなかった場合の数値よりも「わずかに」大きいまたは小さい数値を表現できるようにしました.これにより例えば,

100-- < 100- < 100 < 100+ < 100++

という大小関係が成立するようになります.野外での生物個体数のカウント,培養シャーレや顕微鏡視野内のカウントなどで,概数として + や - を付ける場合があることに対応しました.

なお, 100+ や 100++ は 100 よりも「ほんのわずか」大きいということだけに意味があるので,他の数値に対しては 100 とほぼ等価です.このため強いて書けば,

100+ < 100++ < 100.001

99.999 < 100-- < 100- < 100

という評価になることにご注意ください.

負の数についても,+ はわずかに大きい数,- はわずかに小さな数を表すので,

-100-- < -100- < -100 < -100+ < -100++

となります.

次に --showencoding, -g の機能を以下のように修正しました.まず BOM や コマンドライン,あるいは何も指定がない場合のデフォルトで初期設定されているエンコーディングを表示し,その後辞書ファイルや入力ファイルを読み込んだ段階で埋め込みオプションによりエンコーディングが変更された場合には,変更後のエンコーディングも表示するようにしました.これによりエンコーディングの初期設定・変更の過程がわかりやすく表示されます.

Refsort/Ruby とそれに関連するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v373.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは US-ASCII ですので,そのままでよいでしょう.ユーザーズガイドは,リリースが遅れている IOC List v12.2 が完全にリリースされてから改訂したいと思います.

| | | コメント (0)

2022/08/12

お馬鹿なインターネット広告

以前からたびたび経験していたのですが,今回改めて感じたことを.それは Web サイトに現れる広告について.

最近,腕時計をインターネット通販で買ったのですが,買うまでにはいくつかのサイトを巡回して価格や在庫を調べました.そういうことをやっていると,すぐにポータルサイトの右側あたりに,買いたいと思っている時計の広告が勝手に出るようになります.これは HTTP coockie という仕組みを通して私が立ち寄った通販サイトが私の興味の対象を判断し,Google や Facebook などのプラットフォーム企業が運営する広告出稿事業を通して,半ば当てずっぽうに広告を出してくるものです.

これは「行動ターゲティング広告」と呼ばれるもので,プラットフォーム企業にとっては最も重要な収入源.なのでいくら苦情が出ても止めることはありません.最近ではプライバシーが侵害されているとの主張から,cookie のうちでも 3rd party cookie と呼ばれるものを排除する Web ブラウザも増えてきていますが,ユーザの行動履歴に基づいた(半ば当てずっぽうの)広告を目にしない日はありません.

Payperclickga993218dd_1280

launchpressoによるPixabayからの画像

ところで,私は結局ある通販サイトで腕時計を購入したのですが,奇妙なことにそれから何週間経っても買ったばかりの腕時計の広告が出稿され続けるのです.これは全く無駄な広告なので,もっとほかの商品の広告を見せてくれないかと思うのですが,よほど広告選択のアルゴリズムがお馬鹿なのか,出稿を依頼している企業は(私がその広告をあえてクリックすれば)無駄な広告料を Google AdSense に払うことになります.そうしてやってもいいんですけどね.

さらにもっとお馬鹿だと思うのは,私が自宅で LAN を共有している家族のパソコンで家族が訪れた Web サイトの商品広告が,私のパソコンに多数掲載されることです.おかげで女性用下着の広告がずらりと並ぶ光景には慣れてしまいました.Cookie の詳細な仕組みはわかりませんが,LAN 内の異なるパソコンを区別できないようでは,ターゲット広告とは言えません.

こんなこともあるので,私は定期的にパソコン内に数千個も溜まっている cookie を一掃するようにしているのですが,それでもすぐにターゲティング広告はやって来ます.インターネット上の情報のやり取りが無料だということの代償なので,それではインターネットを通した情報のやり取りに従量課金してその代わり広告なしの世界にする,という発想にはならないようです.例えばメール一通につき 1 円と課金すれば,スパムメールは瞬時に無くなると思うのですが,そうすると弊害や副作用,特にインターネット広告で食っている連中が死んでしまうので,なかなかそうはならないようです.

インターネットの仕組みは,山あいの温泉旅館のように建て増し建て増しされて来て,現在では新々別館が建ったような段階ですが,スパムやウィルスの無いプロトコルをスクラッチから作り直してもいいような気がします.しかしそれは世界の IT 覇権(特に DNS )を脅かすことになるので,大親分のアメリカは絶対にウンと言わず,むしろ中国がコッソリやらかしそうな気がします.

| | | コメント (0)

2022/07/07

Refsort v3.72 released

辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.72 をリリースしました.今回の改訂はバグの修正と,例外処理の若干の簡素化です.

まずバグの修正について.Refsort は --output, -o オプションで出力するフィールドを自由に選択できるのですが,出力のフィールド区切り記号そのものが含まれているフィールドは二重引用符で囲んで出力するようにしています.これは出力の再利用を容易にするためで,ある意味必須の機能です.例えば出力の区切り記号が空白の場合,フィールド内部に空白があるとそのフィールドを二重引用符で囲みます.例えばこんな感じ.

A B "C1 C2" D E

このフィールドを再び Refsort で読み込むと,フィールド分割を { } で示すことにすれば,

{A} {B} {C1 C2} {D} {E}

という具合に正しくフィールドが分割されます.

ところが,フィールド内に二重引用符自身が含まれていると,二重引用符自身をエスケープしてやらないと再利用するときのフィールド分割がうまく行かずに困ったことになってしまいます.しかしこれまで二重引用符のエスケープは放置されたままというバグが残っていました.

今回,二重引用符で囲まれたフィールド内の二重引用符は CSV の習慣に従って二重引用符自身でエスケープする,つまり二重引用符を2個連ねることでエスケープすることにしました.つまりこんな感じに出力されます.

A B "C & ""Special""" D E

これを再利用時に Refsort で読み込むと,

{A} {B} {C & "Special"} {D} {E}

という具合に正しく分割されます.

もうひとつの改訂は --didyoumean, -y--fullsearch, -Y オプションを使ったときのメッセージに,正解候補の文字列だけではなく,その候補が辞書ファイルの何行目にあるのかを示すようにしたことです.例えばこんな感じの出力が得られます.

!I 16: "オオタグロカモメ" not found in jpblist_v70p5w.ref
  Did you mean? "オオズグロカモメ" at R 698
               "オオセグロカモメ" at R 716

Refsort/Ruby とそれに関連するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v372.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは US-ASCII ですので,そのままでよいでしょう.現時点でユーザーズガイドは未改訂ですが,IOC List v12.2 が公開された後で,その内容を反映させたものをリリースする予定です.

| | | コメント (0)

2022/06/30

DX,無謬主義,ベストエフォート

相変わらず猛暑が続いて散歩に出かけておらず,ブログのネタがないためちょっと駄文を.

インターネットのある記事で,肉親が亡くなった際の諸手続きをやってみて,いかに IT 化ができていないのか,それはそもそもなぜなのかという記事が載っていました.私も最近同様の苦労をしたので共感を覚える内容だったのですが,同時に違和感も感じました.

家族の死で痛感、「行政DX」は国家400年の計であり未来のインフラづくりだ

私の違和感は,この記事の著者が日本の公的セクターが根源的に持つ「無謬主義」に言及していないこと,さらに IT の世界では標準の考え方である 「ベストエフォート」 を推奨していないことから来ています.

まず無謬主義について.これはおそらく遣隋使遣唐使の時代に隋や唐から学んで定着した官僚文化だと思うのですが (*注),つまりエライ人たちは間違わない,お役人はエライのだからお役人がやることは間違わない,絶対に間違ってはいけないのだという思想です.

お役人たちにすれば,どんな軽微なことでも間違ってはいけないと考えるので,箸の上げ下げまで細かく指示するような書式が考え出され,それを強制しておけば自分たちが責任を問われることはないと責任を逃れるための考え方にもなっています.

Bureaucracygce072122d_1280

Jana SchneiderによるPixabayからの画像

無謬主義は非効率を産みます.従って日本の行政手続きは非常に遅く非効率です.同じ住所・氏名・電話番号を何枚もの書式に書かされてうんざりします.逆に効率を求めると細かいところで矛盾が生じたり情報の欠落が露見したり,担当官の裁量によって結果が異なったりして,行政の責任が問われます.

私は一定の限度はあるものの,それが効率とトレードオフの関係になっている限り,行政手続きに軽微な欠陥があってもいいのではないかと思います.欠陥が残存する可能性があることを双方が事前に認識し,欠陥が顕在化した場合にどのような手続きでそれを是正するのか,事前に取り決めておけばよいと思うからです.昔の不動産屋の契約書には捨印をたくさん押すのが習慣でした.

そのためには行政の世界の考え方を根本から変えなければならのですが,彼らが自ら言い出すとは思えないので,これは政治の仕事になるだろうと思います.しかし政治家にそのようなセンスや問題意識があるのかと考えると,これはなかなか絶望的です.実務には疎いが権力や利権は大好きという連中が多いので,政治主導というのも考えにくい.非常に回りくどいですが,市民が上げた声を心ある政治家が拾い上げ,改革意識のある官僚たちとともに制度化していくという道しかないように思います.まあ何十年もかかるかも.

次は ベストエフォート です.これは反無謬主義と言ってもいいくらいなのですが,一言で言うと「現状出来る限りのことをしますが,間違ってたらごめんね,補償はしません.でもすぐに改良します.」というものです.ソフトウェアの世界はすべてこれで出来ています.バグのないソフトウェアはありません.極端な例ではテスラ社のクルマづくりはこのベストエフォートの思想にもとづいています.中国の民族系の完成車メーカーは元々すべてこれ.日本や欧米の完成車メーカーが眉をひそめる考え方ですが,クルマのように命に係わることがないような製品ではすでに世界の主流です.

これで大きな間違いはないだろうという製品をとにかく世に出してみて,不都合が見つかったらその都度直していく.しだいに欠陥は修正されていき,製品は洗練されたものに成熟していくというプロセスです.

私は行政の手続きもこれでいいのではないかと思うのです.最初から無謬で完璧なものでなければならないと自らを縛ってしまうと,準備に膨大な手間と時間とコストがかかり,しかもそれでも欠陥は残るものです.それよりは必要最低限の機能は保証したうえで,重箱の隅をつつきたがる人や欠陥を突いて利益を上げようとする連中への対策は後回しでもいい.素早くサービスを開始して,まずいところはその都度直していくことにしたほうが,全体としてはサービスレベルはより高くなると思うからです.

この点,新型コロナ・ウィルスに関連した持続化給付金などの補償制度はこの考え方に沿ってスピードを重視したものです.審査に多少の甘さがあるのはやむを得ません.さすがに今になって不正請求がボロボロ出てきていますが,それは返納や,最終的には徴税で回収できるはずのものです.

私はここ数年の確定申告では国税庁のウェブサイトを活用しています.初期のころはあまり褒められた出来ではありませんでしたが,最近はかなり洗練されてきました.寄付控除などは最も節税になるように寄付金を自動的に配分申告してくれます.また各種の保険料や証券会社の特定口座報告書などは XML ファイルを直接アップロードすればよいように進化しています.

Deathregistration

いつになったら死亡時の膨大で面倒くさい手続きが,ワンストップでパソコンからできるようになるのかわかりませんが,まずは小さな一歩を踏み出すことを始めてもらいたいと思います.

(*注) 無謬主義は権威主義的な国家がその存在理由としている思想でもあります.間違っていると思うのはそう思う人が間違っているからだ,間違っている人の思想は矯正しなければならないという風にエスカレートし,強制収容所まで作ったりします.また一神教教義も唯一絶対神の無謬性で成り立っています.そのため無理して奇跡をでっち上げて苦しい言い訳をしなければならないのです.

| | | コメント (0)

2022/03/12

Refsort/Ruby v3.71 released

辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *5 *5)の改訂版 v3.71 をリリースしました.今回の改訂は先月リリースした v3.70 に残っていたロジックの不備を補うもので,機能的な変更はありません.

前回の改訂でコマンドライン・オプション "-E, --encoding" を導入しましたが,BOM によるエンコーディング設定との整合性が十分に取れておらず,エンコーディングの優先順位が混乱していました.今回の改訂はその優先順位を整理し,それに基づいて警告文を出す条件と文言を改めたものです.改めて書くと,エンコーディングの優先順位は

BOM > 埋め込みオプション > コマンドライン・オプション > ロケール

となります.辞書ファイルや入力ファイルで BOM が検出されれば,それに従ってエンコーディングが(実質的には UTF-8 に)設定されます.BOM がない場合,埋め込みオプションがあればそのエンコーディングが使用され,埋め込みオプションも無くてコマンドライン・オプションがあればそれが使用され,エンコーディングに関するオプションが何も指定されていなければデフォルトのロケールが使用されるということになります.

新設したコマンドライン・オプションは,辞書ファイルと入力ファイルの両方に有効な “共通エンコーディング” という概念を作ります.すると,辞書ファイルと入力ファイルが同じエンコーディング(ロケールと異なっていてもかまいません)で書かれてさえいれば,コマンドライン・オプションを付けて実行するだけで,自動的に入力ファイルと辞書ファイルの両方にそのエンコーディングが設定されます.このとき,辞書ファイルに埋め込みオプションが書かれていれば,優先順位によって共通エンコーディングは上書きされますが,それがコマンドライン・オプションと同じであれば問題は生じません.

エンコーディングをどのような手段で指定しようとも,辞書ファイルと入力ファイルのエンコーディングは同一でなければなりません.これが一致していなければ Refsort はエラーを吐いて停止します.従ってユーザーは自分がどのエンコーディングを選択しているのか,よく意識する必要があります.これはロケールの中だけの世界では注意する必要が無かったことです.

Refsort/Ruby とそれに関するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v371.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは US-ASCII ですので,そのままでよいでしょう.ユーザーズガイドも若干改訂されています.

| | | コメント (0)

2022/02/10

Refsort/Ruby v3.70 released

辞書参照型ソーティング・フィルタ Refsort/Ruby (新しいほうから *1 *2 *3 *4 *5)の改訂版 v3.70 をリリースしました.今回の改訂では,辞書ファイルや入力ファイルのエンコーディングを指定するコマンドラインオプションを新設しました.意味的にやや大きな改訂なので,サブバージョンを 0.1 上げて v3.70 としました.

少し詳しく説明します.Refsort はその生い立ちからコマンドプロンプトでの操作とフィルタとしての機能を基本にしているため,ロケール以外のエンコーディングを扱うことは例外とし,その場合には辞書ファイルや入力ファイルの先頭に埋め込みオプションでエンコーディングを指定することにしていました.

しかし Windows において Windows-31JShift_JIS だけでなく UTF-8 も広く使われるようになり,Excel のワークシートから直接 UTF-8 の CSV ファイルを書き出せるようにもなって,ロケールを前提にすることに無理が生じてきました.そこで扱うファイルのエンコーディングをコマンドラインオプションで指定できるようにしました.オプションの書式は “-E encoding” または “--encoding encoding” です.“encoding” に与える文字列としては,Windows-31J,Shift_JIS,UTF-8,EUC-JP などの ASCII 互換エンコーディングが可能です.

エンコーディングを指定する複数の手段の間の優先順位は,

埋め込みオプション > コマンドラインオプション > ロケール

となります.つまりロケールが何であろうと埋め込みオプションがあればそれが使用され,埋め込みオプションが無くてコマンドラインオプションがあればそれが使用され,エンコーディングに関するオプションが何も指定されていなければデフォルトのロケールが使用されるということになります.

今回の改訂によるメリットは,例えば Windows 上では,従来 UTF-8 のファイルを使うにはわざわざファイルの先頭に埋め込みオプションを書かなければならなかったのに対して,今後はコマンドラインオプションで “-E UTF-8” と指定するだけでよく,扱うファイルに破壊的変更を加える必要がなくなったということです.これは運用上大きなメリットになると期待しています.従来の手法もそのまま残してあり,今回の改訂が上位互換となる建て付けなので,移行は円滑にできるはずです.

ただし辞書ファイルに関しては従来通り埋め込みオプションを書くことを推奨します.なぜならばユーザーにエンコーディングの選択を意識させずに済むからです.

また従来と同じく,エンコーディングをどのような手段で指定しようとも,辞書ファイルと入力ファイルのエンコーディングは同一でなければなりません.これが一致していなければ Refsort はエラーを吐いて停止します.ユーザーは自分がどのエンコーディングを選択しているのか,よく意識する必要があります.

Refsort/Ruby とそれに関するコンテンツのアーカイブを Microsoft One Drive に置いています.画面右側コラムの Archive の中の Refsort/Ruby Archive をクリックしていただくと,私の OneDrive 上に設けたライブラリが開きますので,そこから過去分も含めてファイルをダウンロードすることができます. Refsort 本体の refsort.rb は refsort_v370.rb というファイル名でアップロードされていますので,ダウンロード後に refsort.rb に変更するとよいでしょう.改行コードも CR/LF になっていますので,適宜変更してお使いください.エンコーディングは US-ASCII ですので,そのままでよいでしょう.ユーザーズガイドも若干改訂されています.

| | | コメント (0)

2022/01/21

IOC List v12.1 released

IOC World Bird List v12.1 が 2022 年 1 月 20 日にリリースされました.これは 2022 年 1 回目のリリースです.前回 v11.2 のリリースが 2021 年 7 月 20 日だったので,ちょうど 6 か月の更新間隔,新たな編集長 Pamela Rasmussen に代わってから 4 回目のリリースということになります.

今回収録されたのはが 44 ,が 253,が 2,376 ,が 11,088 (うち絶滅種が 160 ),亜種が 19,883 です.

今回の改訂は前回 v11.2 と比べると大変静かでおとなしい内容になっています.例によって日本のバーダー向けに重要と思われる変更点を書いておきますが,今回は 2 点のみです.

  1. 日本で見られるアオジは従来は Emberiza spodocephala (Black-faced Bunting) の亜種 E. s. personata 亜種アオジ とされてきましたが,これが種に昇格し E. personata (Masked Bunting) となりました.これに伴い,E. personata の和名をアオジと再定義し,亜種アオジを抹消しました.また E. s. personata が出て行った残りの E. spodocephala の和名は,その基亜種 E. s. spodocephala 亜種シベリアアオジがそのまま残されているため,シベリアアオジとしました.
  2. 絶滅したとされ,長らく標本の真正性が疑われていた Todiramphus cinnamominus miyakoensis 亜種ミヤコショウビン (Kuroda, Nagamichi, 1919) が抹消されました.これについては Wikipedia のこの記事が参考になります.

今回は英名の変更が多かったのですが,日本のバーダーにとっては影響はわずかでしょう.一方,種小名のラテン語の性による語尾変化の訂正はごくわずかでした.


IOC 本家の Master List(学名と英名を収録した Excel ファイル)を編集して,Refsort/Ruby 用の辞書ファイル(拡張子が .ref のテキストファイル)を作りましたので,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしました.

エンコーディングは UTF-8US-ASCII の2種類です.正版は UTF-8 版で US-ASCII 版は簡易版ですが,詳細についてはユーザーズガイドをご覧ください.


このオリジナル版の辞書ファイルと併せて,全ての掲載種に和名をつけた辞書ファイル 2 種と,IOC Master List の和名追加版(Excel ファイル)も同時にリリースしました.和名追加辞書についても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.詳細についてはユーザーズガイドをご覧ください.

単に種名を調べるためだけであれば,和名追加版の Master List(Excel ファイル)が最も便利です.ただし長大なワークシートなので,目的の名前をスクロールして探すのは非効率です.検索メニューからジャンプするのが良いでしょう.


これらのファイルは前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからダウンロードできます.それには,このブログ右側のコラムの最上段の Archive の中の IOC List Archive をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v12.1. It contains 44 Orders, 253 Families, 2376 Genera, 11,088 species including 160 extinct ones, and 19,883 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v121u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well, and should contain a magic comment on the top of the file such as;

#!E -*- coding: UTF-8 -*-

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v121a.ref" encoded in pure US-ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two different reference files "ioclist_v121ju.ref" and "ioclist_v121jw.ref" (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names for all species. If you want to know Japanese names, please refer to those files.

In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a magic comment specifying the encoding in the first line of these files, such as UTF-8, US-ASCII or Windows-31J. You can skip this process if your iput file is encoded in the default encoding of your platform, e.g., US-ASCII or Windows-31J for Windows, UTF-8 for macOS or Linux.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be most convenient for quick reference.

You can download an appropriate file from my area of Microsoft One Drive by clicking "IOC List Archive". Enjoy, and bon appétit.

| | | コメント (0)

2022/01/15

緊急着陸して滑走路を外れたB2

昨日の記事にコメントとして書きましたが,面白いので改めてスレッドを立てます.Google Earth にはこういうものもばっちり写っているのです.

2021 年 9 月 15 日,訓練飛行中に不具合が生じて緊急着陸した B2 です.火災や乗務員の怪我は無かったとのこと.事故を伝える米軍の広報誌の記事はこちら

B2_off_the_runway

上は私がピンを立てた画像で,この日付と場所の kmz をここに(ダウンロード - b220off20the20runway.kmz)アップしておきます.

緊急着陸時になぜ滑走路を外れたのかは不明です.昨日の記事のコメントには乗務員が射出した可能性を書きましたが,この画像を見る限りは射出はしていない模様.しかし,滑走路のタイヤ跡を見るとわかりますが,途中から滑走路を外れています.滑走路を塞がないように意図してタクシーしたものか?エンジン排気口の周囲が白く見えるのは,やはり予防的に消火剤をかけたからではないでしょうか?

こういうタイミングでちょうど衛星が真上に来ていたというのも実に面白いです.Street View では誰それさんの奥さんがごみを出しているところが写っていた,なんていうのがありましたが.

| | | コメント (1)

より以前の記事一覧