IT関連情報

2017/06/25

Refsort/Ruby v2.62 Released

辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8 *9 *10 *11 *12).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です.

前回のリリースはつい最近,今年2017年の6月,長年埋もれていたバグが発覚したため,慌ててその部分だけを修正したのですが,これは埋め込みマイルストーンの機能拡張でもやろうかと思って,スクリプトをいじっているうちに発見したものです.

バグの修正後,元々やろうと思っていた埋め込みマイルストーンの機能拡張を実装して未公開版としてリリースし,さらにそのスクリプトを最適化したものを v2.62 としてリリースします.

今回の機能拡張は,2点あります.まず,辞書ファイルの埋め込みマイルストーンの書式を拡張したもので,従来はレベルを表すのに,

#!m >>>>>[....]

などと書いて,レベルが5であると示していたのですが,レベルが深くなるにつれてこの書き方では煩雑になるだけでなく,レベルの視認も難しくなるため,新たに

#!m >5 [....]

という書き方も受け入れることにしました.これがまず第1点.

第2点目は,埋め込みマイルストーンを出力する際に,新たなオプション -M を設け,マイルストーンのレベルに応じてインデントを付けるようにしました.とりあえず,インデントは 半角2文字分/レベル としていますが,ソースコード1か所の修正で簡単に変更できます.出力はこんな感じになります.

[GALLIFORMES; キジ目]

 [Phasianidae; キジ科]

   [Bambusicola; コジュケイ属] # "Gould"

    コジュケイ

[ANSERIFORMES; カモ目]

 [Anatidae; カモ科]

   [Cygnus; ハクチョウ属] # "Garsault"

    コブハクチョウ

    コハクチョウ

    オオハクチョウ

   [Anas; マガモ属] # "Linnaeus"

    オカヨシガモ

    ヨシガモ

    ヒドリガモ

    マガモ

近日中にユーザーズガイドも改訂してアップする予定です.

| | コメント (0) | トラックバック (0)

2017/06/10

Refsort/Ruby v2.52 Released

辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8 *9 *10 *11).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です.

前回のリリースはつい最近,今年2017年の4月だったのですが,埋め込みマイルストーンの機能拡張でもやろうかと思ってスクリプトをいじっているうちに,私の理解不足から正規表現にバグがあることが発覚しましたので,慌てて応急処置をとったのが今回のリリースです.

幸いなことに,私がこれまでリリースした辞書ファイルを使う限りにおいては,このバグが顕在化することはなく人畜無害なのですが,とにかく明瞭なバグなので修正版をリリースします.

どういう箇所かというと,辞書ファイルを読み込んだり最終的な出力処理を行うときに,埋め込みマイルストーンを探す必要があるのですが,このときに正規表現内でキャプチャと後方参照を使います.その後方参照を文字クラスの中でも使えると誤解していたのが間違いでした.例えば以下のような表現です.

/^(#!m\s*(\S)\2*[^\\2][^#]*)/

ここで \2 というのは (\S) でキャプチャした非空白文字をそのあとで参照するためのものなのですが,これを文字クラス [...] の中でも使えると誤解していました.これは間違いなので,以下のように修正しました.

/^(#!m\s*(\S)\2*(?!\2)\S[^#]*)/

ここで,(?!\2)\S というのがミソで,これは否定先読みという表現.詳しい説明は省きますが,\2 ではない非空白文字一文字を表現したことになり,私が意図したとおりの動作をすることを確認しました.これは Ruby のユーザーズフォーラムで質問し,ある方から親切に教えていただいたので何とか修正できた次第です.

繰り返しになりますが,機能の追加は何もなく,Ruby の最新版 v2.4.1p111 で動作することを確認しています.

また近日中にユーザーズガイドを改訂してアップする予定です.

| | コメント (0) | トラックバック (0)

2017/04/30

Refsort/Ruby 2.51 Released

辞書参照型ソーティングフィルターをスクリプト言語 Ruby で実装した Refsort/Ruby の開発を10年以上続けています(例えば新しいほうから順に *1 *2 *3 *4 *5 *6 *7 *8 *9 *10).もう仕様は落ち着いていて機能の追加をするつもりはなく,細々とバグのメンテナンスを行っている状態です.

前回のリリースは昨年2016年の7月だったのですが,今回の変更は,Windows用のRuby実行環境である Rubyinstaller の更新が滞ったことに端を発しています.この Rubyinstaller に代わって,別の作者が更新を買って出て,Rubyinstaller2 なるものをリリースし始めました.

ところが,この作者の実装はエンコーディングに癖があって,Windows なのにデフォルトの外部エンコーディング Encoding.default_external を強引に UTF-8 に決め打ちしているのです.欧州のユーザ,特に Rails の開発者にとって,エンコーディングは UTF-8 しか眼中にないらしく,他のエンコーディングを使う理由は無いでしょ!と問答無用のノートが付けられています.

しかし,これは Ruby レファレンスマニュアルの記述とは食い違いますし,これまで作成してきたスクリプトの中には動かなくなるものが出てきます.そして,現に Refsort/Ruby がそうなってしまうのです.そこで,文句を言いつつも,この実行環境でも問題なく動くように修正したものが今回の Refsort/Ruby です.

繰り返しになりますが,機能の追加は何もなく,Ruby の最新版 v2.4.1p111 で動作することを確認しています.

また近日中にユーザーズガイドを改訂してアップする予定です.

| | コメント (0) | トラックバック (1)

2017/04/24

IOC List v7.2 Released

IOC World Bird List v7.2 が2017年4月22日にリリースされました.前回 v7.1 のリリースが2017年1月8日だったのですが,これはやや変則的に普段よりも早い周期でリリースされたもので,今回はその周期を元に戻す形になっています.

今回は定性的には特に目立つ変更はありません.今回収録されたのは科が 240,属が 2,295,現生種が 10,681,絶滅種が 159,亜種が 20,087 です.前回 v7.1 でアナウンスされたように,最新の研究の進展に伴い,旧来の鳥類分類体系を書き換える時期に来ていること,そのため,2017年中を目標に新たな分類体系に移行する予定であることは変わりないようです.そのためか,前回同様,上目 (Superorder) の PALEOGNATHAE(古顎類)NEOGNATHAE(新顎類)や,系統群であるNEOAVES がリストの最上位の階層にこっそりと載っています.

定量的には,亜種の整理統合が継続して行われており,今回も200弱の亜種が統合されて減少しています.以前は新しい亜種をどんどん掲載していく時期もあったのですが,さすがに現在はその揺り戻しが来ている時期になっています.また,研究の進展によって,絶滅種がわずかずつながら増えていっているのも興味深いところです.


IOC 本家の Master List を編集して,Refsort/Ruby 用の辞書ファイルを作りましたので,このブログサイトと,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしておきます.

今回もこの辞書ファイルの正式なエンコーディングは UTF-8 です.従って,Linux 上で使う分には問題は生じませんが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ最初の行に

#!E -*- coding: UTF-8 -*-

というおまじないを書いておかないとエンコーディングの解釈がうまくいきませんのでご注意ください.

しかし,Windows 上でのデフォルトのエンコーディングである US-ASCIIWindows-31J でも手間なく使えるように,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.これはどのようなプラットフォームであっても,そのプラットフォームのデフォルトの Locale が無条件で US-ASCII を解釈できることを利用したものです.ただし,欧文のアクセントウムラウトを含む文字は,それらを含まない最も近い文字に置き換えられています.正版はあくまで UTF-8 なので,特に人名を含む種や,種の Authority を見るときにはご注意ください.


このオリジナル英語版の辞書ファイルに続いて,和名追加版2種と,IOC Master List の Excel ファイルに和名を追加したものも同時にリリースしました.和名追加版の辞書ファイルについても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.ただし人名や地名のアクセントやウムラウトなどは,それらを含まない最も近い文字に置き換えてありますのでご注意ください.

和名追加版の辞書ファイルのうち,UTF-8 でエンコードしてある ioclist_v72ju.ref は,Linux などで UTF-8 でエンコードした入力ファイルをソートするときに使うことを想定しています.Linux 上で使う際には,入力ファイルの最初の行に上記のようなエンコーディング指定を書く必要はありませんが,Windows 上で使う場合には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの最初の行に

#!E -*- coding: UTF-8 -*-

というエンコーディングを指定しておく必要があります.

逆に,Windows 上で Shift-JIS や Windows-31J でエンコードされた入力ファイルを,Windows-31J でエンコードされた辞書ファイル ioclist_v72jw.ref を用いてソートする際には,入力ファイルの冒頭にエンコーディングの指定は必要ありませんが,この辞書ファイルを Linux 上で使う場合には,入力ファイルは Windows-31J でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの冒頭に

#!E -*- coding: Windows-31J -*-

とエンコーディングを指定しておく必要があります.要するに,どのような場合でも辞書ファイルと入力ファイルのエンコーディングを揃え,かつそれぞれの入力ファイルのエンコーディング指定を冒頭に書いておくのが無難です.

これらのファイルをダウンロードするには,従来通りこのブログの右側のコラムで “自作ソフト„ の中から個々のファイルをクリックしても良いのですが,前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからもダウンロードできます.それには,このブログ右側のコラムの最上段の “Archive„ の中の “IOC List Archive„ をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.今後は One Drive のみに集約していく予定です.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v7.2. It contains 10,681 extant species, 159 extinct species and 20,087 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v72u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well, and should contain a magic comment on the top of the file such as;

#!E -*- coding: UTF-8 -*-

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v72a.ref" encoded in 7-bit ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two reference files (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names. If you want to refer to Japanese names, please see those files. In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a magic comment specifying the encoding of the input file in the first line of the file, such as UTF-8, US-ASCII or Windows-31J.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be more convenient.

You can download an appropriate file by clicking a link listed on the right column of this page, but you can also access files and folders built in my area of Microsoft One Drive by clicking “IOC List Archive„.

| | コメント (4) | トラックバック (0)

2017/04/14

FreeNAS Corralの開発がとん挫

このブログで断続的に報告している FreeNAS の新しいバージョン Corral ですが,唐突に公式のフォーラムで開発のとん挫と Technology Preview への格下げが発表されました.今後の開発は,現在の安定版である 9.10 系列をもとに Corral に盛り込まれた要素を移植する形で再開され,その最初の成果は 9.10.3 として5月にリリースされる予定だというものです.

フォーラムでは,これまで何とか Corral を動かそうと苦闘してきたユーザたちから様々な反応が寄せられています.中には,この決定を非常に残念に思う,これまでの努力は何だったんだ?という否定的なものもありますが,大部分は開発チームの決断に理解と賛同を示したものです.

私自身,これまで書いてきたように,Corral は未完成な状態でリリースされたと感じており実戦投入できずにいたものですから,今回の決定をむしろ歓迎しています.フォーラムでもコメントされているように,Corral で実現しようとした数々の新機能は,そのほとんどが 9.10 系列で実現されるはずで,これまで Corral を動かそうとしてきた努力は無駄にはならないはずです.

より深堀りすると,とん挫の原因の一つは GUI のフレームワークとして採用された MontageJS の開発チームが解散してしまうという不幸に見舞われ,MontageJS の開発が大幅に遅延してしまったということがあるようです.これでは Corral の開発もうまく行かないのは当然です.

また,開発のリーダーだった jkh という人物が Corral のリリースとほぼ同時に開発元企業を辞めたのですが,彼が Corral のリリース期限に自分の転職時期を合わせてしまい,転職時期は動かせないため開発を急ぎ,事前の内部テストが不十分な状態でリリースを宣言してしまったのではないか?という疑問も付きまといます.

いずれにせよ,私はこれまで通り 9.10.2-U2 を使い続け,9.10.3 が出た段階でそちらに乗り換えればよいだけの話なので,大した影響はないのですが,それにしても,ソフトウェア開発のプロジェクトマネジメントは一筋縄ではいかないという一例を目の当たりにしました.

| | コメント (0) | トラックバック (0)

2017/04/09

FreeNAS Corral 10.0.3, not yet!

FreeNAS Corral こと 10.0 がリリースされたことはすでにお伝えしましたが,いろいろと不具合が多くてまだ実戦に投入できる段階ではありませんでした.この週末に,10.0.3 という新しい安定板がリリースされたので,今度こそは稼働できるか?と期待を込めてインストールしてみました.

結果ははずれ.ブートしてみたのですが,いつまで経っても立ち上がってきません.しかたがないので,サーバーに直接キーボードとディスプレイをつないでブートしてみると,どうやら Network Plugin を読み込むところでスタックしているようです.私のマシンのネットワークチップは,やや古い Intel 82579V という少々珍しいものなのですが,このドライバが読み込めていないようです.しかし 9.10.2-U2 や 10.0.0 ではちゃんと読み込めていたので,どうもヘン.

いずれにせよ,10.0.3 もまだ実戦投入は無理という結論を出さざるを得ませんでした.残念.

| | コメント (0) | トラックバック (1)

2017/04/02

FreeNASのブートドライブが劣化

FreeNAS Corral こと,FreeNAS 10.0 がリリースされたことは先々週にお知らせしましたが,やはり世界各地で果敢な人柱たちが阿鼻叫喚の騒ぎを起こしながらバグ出しをしてくれたおかげで,10.0.2 という暫定バージョンでとりあえず落ち着いているようです.

私自身はすでに申し上げているように,9.10 系列の最新安定板 9.10.2-U2 で運用しているのですが,週末の夜になって異変が発生しました.私はブートドライブに超短尺の USB スティックを使っているのですが,このドライブにエラーが起きているとシステムが警告を出してきたのです.いろいろ調べてみると,やはりこのドライブの checksum が異常です.

仕方ないので,昨日土曜日は早朝から新しい USB スティックを使ってシステムを再インストールしました.その後,SambaNFS のファイル共有環境を整え,元通り使えるようになりました.

問題を起こした超短尺 USB スティックは ADATA 製で,一応この業界では名の通ったブランドなのですが,子細に構造を調べてみると,microSD カードを超短尺 USB スティックに差し込んで使うタイプのものでした.このタイプの USB スティックは回路が異常に発熱して自分で壊れてしまう経験を何度もしており,今回もそれで逝ってしまったのではないかと推測しています.

捨ててしまうには惜しいので,物理フォーマットをやり直してエラーの出た領域を除外し,普通のデータ交換用などさし障りのない用途に使おうと思っています.

| | コメント (0) | トラックバック (0)

2017/03/25

FreeNAS Corral の命名の理由?

FreeNAS 10.0 が FreeNAS Corral と名前を改めたことは先週の記事でお知らせしましたが,この命名の由来については,FreeNAS Forum で尋ねられたにも関わらず,明確なことは明らかにされていません.

しかし,Corral 本来の意味は,アメリカ西部開拓時代に野営をする際に馬車で野営地を取り囲むように円陣を組んだ,というものです.さらに,FreeNAS Corral になってから毎度お決まりのように出てくる六角形の囲いのシンボルが,まさにこの円陣を表していると思われることから,NAS のみならず Docker などの仮想化プラットフォームすべてを内包した新たなコンピューティング・プラットフォームという意味で Corral という命名をしたのではないかと思われます.つまり,かなり野心的に風呂敷を広げてプロモーションを開始したと見て取れます.

映画好きの人にとって,この Corral という単語は “OK 牧場の決闘” という繰り返し映画化されたモチーフ(*1 *2 *3 *4)に使われていることで有名で,いわばアメリカ版忠臣蔵のようなお話です.日本語では “牧場” と訳されていますが,これは本来は “牛囲い” とでもいうべきもので,町はずれの,カウボーイたちが町にやってきたときに一時的に牛を預かっておくための囲い,という意味なのですが,この単語が IT の分野で使われるようになったというのは,非常に感慨深いものがあります.

| | コメント (0) | トラックバック (0)

2017/03/20

FreeNAS Corral Out

Windows Home Server 2011亡き後,ハードウェアはそのままに “FreeNAS” というフリーのNAS OSをインストールして試用しています.これまで “FreeNAS 9.10.2-U2” というFreeBSD 10.3ベースのバージョンをインストールし,クライアントのバックアップ用として便利に使ってきました.

開発中だった新しいバージョン “FreeNAS 10 Corral” が3月中旬にリリースされたのでさっそくインストールしてみたのですが,


  • Volume の設定がちゃんと引き継がれていないように見える

  • SMBNFSなどのServiceの設定がうまく引き継がれない

  • ファイルやディレクトリのPermissionの設定方法がよくわからない

という状態で,NFSマウントができなかったり,Windowsのシステムイメージのバックアップ先にSMBマウントしたData Setを指定すると,Windows が “0x8078006F” というエラーを吐いてバックアップできないなどという症状なので,元の “9.10.2-U2” に戻してしまいました.Corral-U1が出るまでは静観するつもりです.

システムを設定するためのGUIが大幅に変更になったこともあり,特にPermissionの設定法がよくわからないままです.ベースOSが “FreeBSD 11.0” になったり,Dockerなどの仮想化機能が強化されたりしていますので,プラットフォームとしては非常に魅力的なのですが,設定方法の変化があまりに大きすぎてちょっとついて行けません.

もうしばらくすると解説記事が出回るだろうと思いますので,それを読んで勉強したいと思います.

| | コメント (1) | トラックバック (4)

2017/01/09

IOC List v7.1 Released

IOC World Bird List v7.1 が2017年1月8日にリリースされました.前回 v6.4 のリリースが2016年10月22日だったのですが,今回は通常の3か月のピッチよりもやや早く出されています.これは担当の委員が旅行に出る必要があるため,前倒しされたのだそうです.

そのせいもあってか,今回の変更は少なめです.今回収録されたのは,科が 238,科が未確定の属が 2,属が 2,294,現主種が 10,660,絶滅種が 155,亜種が 20,358 です.ただし今回アナウンスされた重要な点は,最新の研究の進展に伴い,旧来の鳥類分類体系を書き換える時期に来ていること,そのため,2017年中を目標に新たな分類体系に移行する予定であることです.このための前準備なのでしょうか,これまで記載がなかった上目 (Superorder) の PALEOGNATHAE(古顎類)NEOGNATHAE(新顎類)や,系統群であるNEOAVES がリストにこっそりと載っています.

また,これも下準備なのかもしれませんが,これまで,分類のトップバッターだったTINAMIFORMES(シギダチョウ目)が,CASUARIIFORMES(ヒクイドリ目)の後ろに来るなど,並べ方の順序も波乱が予想されます.


IOC 本家の Master List を編集して,Refsort/Ruby 用の辞書ファイルを作りましたので,このブログサイトと,Microsoft One Drive 上に設けた “IOC List Archive„ にアップロードしておきます.

今回もこの辞書ファイルの正式なエンコーディングは UTF-8 です.従って,Linux 上で使う分には問題は生じませんが,Windows 上で使う際には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ最初の行に

#!E -*- coding: UTF-8 -*-

というおまじないを書いておかないとエンコーディングの解釈がうまくいきませんのでご注意ください.

しかし,Windows 上でのデフォルトのエンコーディングである US-ASCIIWindows-31J でも手間なく使えるように,エンコーディング指定なしの汎用 US-ASCII 版もアップしておきます.これはどのようなプラットフォームであっても,そのプラットフォームのデフォルトの Locale が無条件で US-ASCII を解釈できることを利用したものです.ただし,欧文のアクセントウムラウトを含む文字は,それらを含まない最も近い文字に置き換えられています.正版はあくまで UTF-8 なので,特に人名を含む種や,種の Authority を見るときにはご注意ください.


このオリジナル英語版の辞書ファイルに続いて,和名追加版と,IOC Master List の Excel ファイルに和名を追加したものも同時にリリースしました.和名追加版の辞書ファイルについても,UTF-8 でエンコードしてあるものが正版ですが,Windows などでの使い勝手を考慮して Windows-31J でエンコードしたものも同時にアップしてあります.ただし人名や地名のアクセントやウムラウトなどは,それらを含まない最も近い文字に置き換えてありますのでご注意ください.

和名追加版の辞書ファイルのうち,UTF-8 でエンコードしてある ioclist_v71ju.ref は,Linux などで UTF-8 でエンコードした入力ファイルをソートするときに使うことを想定しています.Linux 上で使う際には,入力ファイルの最初の行に上記のようなエンコーディング指定を書く必要はありませんが,Windows 上で使う場合には,入力ファイルは UTF-8 でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの最初の行に

#!E -*- coding: UTF-8 -*-

というエンコーディングを指定しておく必要があります.

逆に,Windows 上で Shift-JIS や Windows-31J でエンコードされた入力ファイルを,Windows-31J でエンコードされた辞書ファイル ioclist_v71jw.ref を用いてソートする際には,入力ファイルの冒頭にエンコーディングの指定は必要ありませんが,この辞書ファイルを Linux 上で使う場合には,入力ファイルは Windows-31J でエンコードされ(辞書ファイルと入力ファイルのエンコーディングを揃える),かつ入力ファイルの冒頭に

#!E -*- coding: Windows-31J -*-

とエンコーディングを指定しておく必要があります.要するに,どのような場合でも辞書ファイルと入力ファイルのエンコーディングを揃え,かつそれぞれの入力ファイルのエンコーディング指定を冒頭に書いておくのが無難です.

これらのファイルをダウンロードするには,従来通りこのブログの右側のコラムで “自作ソフト„ の中から個々のファイルをクリックしても良いのですが,前述のとおり,Microsoft One Drive 上に設けた IOC List 専用のフォルダからもダウンロードできます.それには,このブログ右側のコラムの最上段の “Archive„ の中の “IOC List Archive„ をクリックしてください.そうすると One Drive のフォルダに入ることができますので,あとは適当に選んでダウンロードしてください.今後は One Drive のみに集約していく予定です.


I am pleased to announce that I have posted reference files for Refsort/Ruby compiled directly from the latest IOC World Bird List v7.1. It contains 10,660 extant species, 155 extinct species and 20,358 subspecies, respectively. Please try it out, and enjoy its capability and speed.

Note that the reference file "ioclist_v71u.ref" is encoded in UTF-8 in order to retain all European accents and umlauts with complete fidelity as they are in the IOC Master List. Therefore, your input file should be encoded in UTF-8 as well, and should contain a line of text below on the top of the file.

#!E -*- coding: UTF-8 -*-

For those who want to use Refsort/Ruby in universal ASCII environments, I have posted another reference file "ioclist_v71a.ref" encoded in pure ASCII. Note that characters with accents and umlauts have been simplified to their nearest neighbors. So please be careful in particular when you refer to authorities of species.

I have also posted two reference files (encoded in UTF-8 and Windows-31J, respectively) which include Japanese names. If you want to refer to Japanese names, please see those files. In order to sort a list properly using these reference files, you need to align the encoding of the input file to that of the reference file, and you should add a line specifying the encoding of the input file on the first line, such as UTF-8, US-ASCII or Windows-31J.

A master list in Excel format containing a column of Japanese names has been posted as well. This would be more convenient.

You can download an appropriate file by clicking a link listed on the right column of this page, but you can also access files and folders built in my area of Microsoft One Drive by clicking "IOC List Archive" on the right column.

| | コメント (0) | トラックバック (1)

より以前の記事一覧