lang

SIMBAD

天文学で広く使われている「SIMBAD」という天体データベースがあるが、google画像検索で “simbad” という単語を調べると中東のお兄さん風のキャラクター画像がよく出てくる。そうか、SIMBADって『アラビアンナイト(千夜一夜物語)』のシンドバッドにちなんだ名前か、と今さら気づいた。

英・仏語ではシンドバッドは “Sinbad” だが、スペイン語・ポルトガル語あたりで “Simbad” という綴りになるらしい。独・伊では日本語に近い “Sindbad“。

天体データベースのSIMBADは、”Set of Identifications, Measurement, and Bibliography of Astronomical Data” の頭字語であるとのこと。

SIMBADを運営しているストラスブール天文台には「VizieR」という天体データベースもあって、自分はどちらかというとVizieRの方をよく使っているかも。SIMBADとVizieRの違いがよく分からなかったが、VizieRは元々ESA(欧州宇宙機関)の宇宙ミッションで使うために作られたデータベースで、出自がSIMBADと違うというのと、観測の論文にだけ載っていてまだ番号が付いていない天体も収録されているとか、大規模サーベイの天体もフルに収録しているとか、書式がばらばらな各カタログに統一的なメタデータを付加して検索しやすくしているとか、いろいろSIMBADとは違うらしい1

VizieRは何と読むか分からなくて、ずっと「ヴィズィーアール」とか適当に言っていたのだが、google翻訳に発音させてみると「ヴィズィール」「ヴィズィーア」という感じらしい。vizierはアラビア語やペルシャ語の「宰相」を表す言葉で、wazirとも書く。カタカナで「ワジール」と書くと、中東の人名で何となく見覚えがある。結局こちらもアラビアンナイトにちなんだ命名ということか。何かの頭字語なのかは調べても分からなかった。

さらに、ストラスブール天文台には天体画像のデータベースとして「Aladin」というのもある。これもアラビアンナイト由来。

  1. What Is SIMBAD, and What Is It Not?, C. Loup et al. (2019) ↩︎

ほこる

物に埃が付くことを「ほこる」という動詞で表す人が以前の職場にいた。「レンズがほこってたらこれ(ブロアー)で掃除して」とか。高知出身の方だったが、あれは高知周辺の方言だろうか。

自分の部屋は布団を敷いて寝起きをしているせいか、室内に置いている物品が今日も盛大にほこっている。西日が射す時刻になると埃が目立つ。

へとヘ

今日日の印刷物はほぼ電子ファイルでの入稿になっているので、組版・印刷工程での校正(内校)はおそらく昔よりずいぶん楽になっている。(縦組/横組用の約物の混在や横転、改行・字下げの消失など、電子入稿から組んだ場合に発生しがちな特有の問題というのもあるにはあるが。)

出版済みの四六判単行本を10年後に文庫に組み替えるとか、A社で出ていた本をB社から出し直すといった場合、元の電子データがもはや出版社に存在しない場合がある。そういう場合は、既存の本をスキャンして OCR で電子化したデータから組版を行う。

OCR は文脈や語彙を理解せずに文字を認識するため、OCR 原稿では形が似た別字になってしまう場合がよくあり、内校は1文字ずつ全部見ることになって労力が増える。「荼毘に付す」が「茶毘に付す」になったり「ポーズ」が「ボ一ズ」になっていたりする。

今年の大学入試共通テストで「匂配」「科拳」といった誤字が問題文にあったとの報道があるが、これも原稿作成の段階で誰かが OCR を使ったのではと予想。

OCR 原稿で特に厄介なのが、ひらがなの「へ」とカタカナの「ヘ」が入れ替わる現象。判別が大変難しい。内校に PC が使える場合はワープロにコピペして、判別しやすいフォント・級数にして確認したりする。Mac の場合には小塚明朝が判別しやすい。

以下は最近校正した OCR 原稿からの抜粋を小塚明朝で表示したもの。官能小説なので「へ」を使う台詞がたくさん出てくる。原本では全てひらがなの「へ」だが、OCR 原稿では一部がカタカナの「ヘ」に置き換わってしまっている。どこでしょう。

正解はこちら。

このように脈絡なく突然混入してくるので OCR は油断できない。フォントによらず、ひらがなのへは2画目が下に凸の曲線、カタカナのヘは2画目が直線的か上に凸の曲線になる傾向があるのでそこで判別するくらいしかないが、ゴシックではほぼ見分けが付かない。

経験値

大正あたりが舞台のラノベの校正で、「経験値が足りない」という台詞が出てきた。自分の感覚では、経験値という言葉は RPG が由来で、1980〜1990年代以降に出てきたと思う。新参の言葉だという感覚はもう薄いか。

手元の広辞苑第七版には意外にも「経験値」が載っているが、語義は「これまでの経験から推測して得られる値」。ゲーム由来の意味とは異なり、「〜が足りない」「〜が上がる」のように使うものではない。これは「経験則」などの類義語として、経済分野などで昔から使われていたものらしい。へー。

今日ではコンピュータゲームでの用例が多いが、それ以前にも違う意味で使用されていた[2](後述)。

経済・統計用語

『広辞苑(第六版)』では、「これまでの経験から推測して得られる値。」と記載されている。「経験値」という言葉はコンピュータゲーム(以下、「ゲーム」と略)が日本で一般的になる以前から経済や統計の用語として専門書や新聞の記事で使われており、1983年5月12日付の日本経済新聞には「石油危機後の経験値によれば、原油市場価格はOPECの余剰率(原油生産能力の未稼働率)と反比例する。」との記述がある[2]。広辞苑の説明はいわば「古典的な意味での経験値」の説明である[2]。

ゲーム由来の用例については、わざわざ「経験*値*が足りない」と言わなくても、「経験が足りない」でよくない? と思うことも多い。「関係性」という言葉も、昨今目にするほとんどの用例なら単に「関係」でよくない? と思う。

上部へスクロール