2025年10月14日火曜日

多言語対応の難しさ

この夏,一般社団法人ことばのまなび工房のウェブサイトをリニューアルした.再構築した理由は,前ウェブサイトを担当していた理事が退任してしまったため,私が引き継がねばならなくなったからである.ちょうどよい機会とばかり,ウェブサイトだけでなく,DialogbookやSpiceBoxといった各種のシステムを,一つのサーバに集約して一括管理することにした.

なお,DialogbookはSMILEプロジェクトで使用している自作の学習ポートフォリオシステムであり,SpiceBoxは国際会議SPICEを運営するために用意したプログラム管理&発表評価システムである.こちらもやはり自作のアプリで,HCD研究発表会においてすでに長年の実績がある同システムをもとにSPICE用にカスタマイズして作成したものである.

ウェブサイトの多言語対応

話がズレた.ウェブサイトのリニューアルである.諸所の事情から,ほぼスクラッチから再構築することになった.使い慣れているWordPressを利用し,新しいサーバに構築しなおした.さらに,せっかくだからと多言語対応してみようということにした.

以前から日英の二カ国語には対応させていたのだが,前任者から「いろいろ苦労した」と話を聞いていた.そこで,今回は事前にいろいろ調べて,ありモノで対応できるならそれをうまく活用しようという方針にした.

調べてみると,Bogoというプラグインがよく使われているらしい.ということで,それを導入してみた.現在,https://www.kotoba-kobo.jp/ (英語), https://www.kotoba-kobo.jp/ja/ (日本語), https://www.kotoba-kobo.jp/ko/ (韓国語)の三言語に対応している.

次のスクリーンショットを見てほしい.これは日本語モードのトップページである.右上に,言語切り替えのリンクが置かれている.ここで言語を切り替えると,メニューも自動的にそれぞれの言語に切り替えられ,記事もそれぞれの言語のものになる.

たいへんうまくできている.運用も極めて簡単だ.いずれかの言語で記事を投稿したとする.編集画面に,他言語版の記事を用意するというボタンが現れているので,それらを押すと,記事がまるっとコピーされ,それぞれの言語版の記事が用意される.あとは,それぞれの記事をその言語に翻訳して,公開するだけである.とってもシンプル.

いくつかの難しさ

しかし,やってみてわかったのは,多言語対応をきちんとやるのは,なかなか難しいということである.世界的な多国籍企業で各種の言語リソースが投入されているような組織でもない限りは,きっちりと多言語対応するのは困難が伴うだろう.

まず,用意した言語分の記事が登録されてしまうので,管理が煩雑になる問題がある.リニューアルしたウェブサイトには,固定ページを除くと,いま7本の記事が投稿されている.三言語に対応しているので,内部的にはその3倍の,21本の記事が用意されている.

対応させる言語の数を増やしたら,さらに大変になるだろうということは,火を見るよりも明らかだ.

翻訳の質保証も問題である.いまは,ほぼ機械翻訳に頼りきっている.幸いにして,英語と韓国語は私が読めるので,ざっと見て,おかしな訳出があったら手で修正するようにはしているものの,自然な翻訳になっているかどうかは自信がない.ここは,やはりそれぞれの言語に対して母語話者がチェックして必要があれば修正できるような体制を用意すべきだろう.

さらに,どこかを修正したら,それを他言語に対しても,手動で修正をかけなければならないという問題もある.これは,プログラミングにおける「コピペはあかん,関数にして再利用せよ」という哲学に通じるものがある.

以上のような難しさがあるため,今回の件に関していえば,あともう一言語,中国語版くらいは用意したほうがよいかなと考えているが,どうしたものかといささか考えあぐねている.機械翻訳がそこそこ優秀になってきている今,他言語版を用意する必要は実はそれほどなくて,まるっと自動で機械翻訳させる仕組みを用意するだけで,良いんじゃね?という極論にも至ってしまい,いやはや,どうしたものだろう.

2025年10月9日木曜日

剽窃ダメ!絶対!

某大物漫画家によるパクリ騒動が炎上している.このテの話題,数年に一度,思い出したように炎上しますなあ。著作権の侵害だ,いや,肖像権の問題だ,など,いろいろな意見で盛り上がっていて,やはり大物漫画家だけあって,熱心なファンがアクロバティックに擁護する意見なんかも出していて微笑ましい(いや,ダメだろ)ものの,やはり,剽窃はいけない.

トレパク,パクリ,模写,いろいろな言い方があるが,ここははっきりと「剽窃」と指摘すべきである.万引きは窃盗です.パパ活は売春です.

剽窃はなぜいけないか

さて,では剽窃は何がいけないか.いろいろと問題点は指摘できるが,ここでは,私の経験と照らし合わせて次の問題点を紹介しておきたい.

はい出ました.この意見である.「これだけ見ても,イラストから真似たのもあるんじゃ?」♪───O(≧∇≦)O────♪

はいはい,こういう意見が必ず出てくるわけですよ.こんな意見(綾辻, 2025)もあったぞ?

でも、放っておいたら世間的には天才漫画家として崇められている江口寿史の方がオリジナルということになり、自分の方がニセモノ扱いされてしまうかもしれず、これほど悲しいことはない。

蛇足だが,これは「引用」なのでなんの問題もなく,かつ,無断でやってよい.というか,本来,引用は断り無しにやるものだ(文章を引用する場合.図版の引用はまたちょっと事情が異なる).昨今,無断引用などという珍奇な用語が流布しているが,書いた文章を公開しようという者であるならば,引用のルールくらいきちんと学んでいただきたいものである.

私の経験

もう昔話だし,時効でもあるけれど,私がかつて,こんなことをされたという剽窃事例を紹介したい.ネットもまだ黎明期といってよい頃,21世紀に入ってすぐ,くらいの出来事である.

何が行われたかというと,私の書籍に掲載されていたプログラムのソースコードが,「まるっと」ウェブサイトに掲示されていたという事例である.しかも,ご丁寧に,書籍では日本語で入れていたプログラム内のコメント文を,全て,英語に翻訳して.

まだS先生はご存命のようなのでイニシャルで示すが,それをやらかしたのは,O大学,S先生の研究室に所属していた博士後期課程の学生で,S研究室のウェブサイトに,ご丁寧にもソースコード一式が勝手に載せられていたのである.

2000年あたり,ということでググればすぐにわかってしまうが,画像処理関係のプログラムを指南する書籍である.当時はGitHubはまだなかったかな.ソースコードを共有するとすればSourceForgeなどを使っていた時代である.本の内容をフォローアップする出版社のウェブサイトなどもなく,書籍に掲載していたプログラムをCD-ROMなどで提供することもしていなかった.

ということは,彼は,全て,手打ちで入力し,さらにコメントも英訳したということである!けっこうな量があったので,努力賞はあげてもよいかもしれないけれど.

さて,問題は,彼のウェブサイトに,出典もなにも書かれておらず,全て,自前でプログラムを用意したというような記述があったことである.これは由々しき問題だ.彼のソースコードが元ネタであり,私が剽窃したと捉えられてしまうではないか.

向こうは画像処理では大御所のS先生である.いや,S先生のところの学生である.私もまだ駆け出しに毛の生えた程度の年齢だったので,いかにも分が悪い.

今であれば断固としてクレームを入れ,毅然とした態度をとるところだが,当時は私も日和っていて,どうしたものかと悩んだだけで終わってしまった.幸にして,こちらが剽窃したという話は出ず,当該ウェブサイトも学生くんが卒業してしまったか,いつの間にか消えていた.

こういうことがあるので,剽窃は,ダメですよ.ほんと,ダメだからね.

参考文献

綾辻つづみ(2025)【ショートショート】江口寿史にトレパクされて (2,709文字),note,https://note.com/nabewata_lit/n/n4884be5d7d89