Skip to main content

Wikisourceの入力品質

今でも近所のお店に行けば手に入る文語(大正)譯とは別に、明治譯聖書といふものがあり、これが文學界から非常に高い評価を受けてゐるものであることは以前より聞いてゐたのだが、たまたまWikisourceに明治元譯の新約テキストが置いてあるのを知つて、手元の大正譯と讀み比べてみるのも一興かと、全ルビのLaTeXを起こしてみたのが、どつぼの入り口だつた。

出來上がつたPDFを、さて、冒頭馬太傳から讀み始めたとたん、明らかな入力ミスと思はれる、おかしな假名遣ひや、意味の通らない節などに次々ぶち當たり、まともに讀み進めることが出來ない。

今思へば、ここで諦めるのがよかつたのだが、折角PDF(LaTeX)化プログラムも書いたのだし、以前から日本聖書協會出版の中附きルビが嫌ひで、いつかは肩附きルビの文語譯を自分で作つてみたいといふ希望もあつたので、日本の古本屋から明治二九年刊大日本聖書舘の新約全書を手に入れて、それと比べながらWikisourceの入力ミスを正してやらうと取り掛かつたのが、どつぼの二段目。

最初先づやつたのは、出來上がつた新約全書PDFを、意味に拘らず通しで讀む。明らかな假名遣ひの誤りや、明治譯には無い筈の句讀點や略體字、不自然な云ひまはしに出逢つたら、原本にあたり、ソースの誤りを正す。(想像を上廻る數の假名遣ひ及び助詞の誤り、ここでやうやく深みに嵌つたことに氣附くものの…)

次に、やはり通しで、今度は前後の文脈を捉へながら讀み進め、脈絡のつかない箇所に出逢へば、同じ處置をする。(漢字、片假名の誤りも少なからず…)

三度目は、さらに廣い文脈で意味をとりつつ讀み進める。その際理解に詰まつたら、大正譯や欽定英譯も參照しつつ、ソースの拔けや矛盾を探して正す。使はれてゐる漢字や片假名にも氣を配る。(節が亂れたり、そつくり拔けてゐるところもあつた)

かうして現在四周目に入つてゐるが、Wikisourceにはもうかれこれ二千箇所近い修正を入れた。しかし、バグ曲線は未だ收束しない。信者でもないものが新約全書を四度通しで讀むことになるとは、自分でも、いつたい何がしたかつたのか、よくわからなくなつてきてゐる。

オリジナル入力は、かなりの力作であり、頭が下がる思ひだが、なにぶん一人での作業らしく、ミスが多く、未だ未だ校正が必要で、現在のところ信頼できるソースとは呼び難い。英譯に關して云へば、随分立派な聖書 Web Site が一つならず保守されてをり、欽定譯など四百年以上も前の版も蔑ろにされず、ちやんと讀むことが出來る。一方、日本では大正譯すら無視されてゐる始末。古いものを破壊しておけば、それで何かを創造したやうな氣分になれる進歩主義は日本の宗教界をも覆つてしまつてゐるやうである。

入力デバッグをしてゐてなにより不滿だつたのが、「あっき、ぶどう、とおい、ちいさい、おこない、なんじ、おしえ、いずみ、ひざまずく、…」など、普段から歴史假名遣ひに親んでゐれば、まづ絶對にしないし、したくてもできないタイプのミスが多すぎる。この手の仕事をするのなら、「あっき」と入れて「悪鬼」と出たり、「とおい」と入れて「遠い」と出るやうな假名漢字辭書は、自分の環境から捨てた後に取り掛かるべきだらう。

もつとも、原書にも、自由(じゆう)、或は(あるひは)、功(いさほし)、…など、正統な歴史假名遣ひや字音假名遣ひとは異なる假名遣ひも用ゐられてをり、この時代、正書法の發展途上であつたことがうかがへる。

また、中(ち[ゆ]う)、悔改め(く[いひ]あらため)、首石([おを]やいし)、忠臣(ち[ゆ]うしん)、理(こと[はわ]り)、威光([ゐい]くわう)…など、全體を通して一貫しない假名遣ひも散見される。

片仮名についても、メソポタニ[アヤ]、イスカリ[ヲオ]テ、カペナウ[ムン]、[エヱ]レミヤ…など、表記のゆれがいくつも見られる。

漢字について云へば、「辯」と「辨」が混同して用ゐられてゐたり、「収、与、豊、恒、回、証、…」など俗字略體字も幾つか使はれてゐたのは意外だつた。

大正譯になると、假名遣ひと片仮名表記が整理統一され、俗字略體字も消える換りに、文體はより平易になり、そのぶん迫力がなくなり、rhythmの惡いものとなつてゐる。

今囘、Wikisourceのデバッグといふ、言つてみれば人の粗探しを肴に、新約全書を繰り返し讀むことができたのは、イエス樣にしてみれば浮かばれない話だらうが、當人にとつては大變幸運だつた。オリジナルを入力された方には心より感謝申し上げたい。

ちなみに、明治元譯と名うつたWikisourceには、もう一つあるのだけれど、なんだかBlogとWikiを混同したやうな下らない御託を書き連ねた上、冒頭一行にも滿たない馬太1-1には、原書に當たらずともすぐにそれとわかる入力ミスがある。以來二度と近寄らないことにしてゐるが、カテゴリメニューに堂々と割り込んできてゐて、迷惑甚しい。ああいふ塵芥を驅除する仕組みといふものはWikisourceにはないのだらうか…

Comments

Popular posts from this blog

明治元譯新約聖書のPDF化

WIKISOURCEにあるソーステキスト を元に四福音書(明治元譯)をPDF化してみました。讀合はせはしてをりませんが、最初の叩き臺として投稿します。 ソース中※印のコメントは除いた  麪と麫が混在してゐるので「麪」に統一した 「湱」のglyphがAdobe-Japan1-6コレクション中に無いため、「氵」と「砉」を合成して表示するやうにした 字體はできるかぎり正字體に改めた。ただし「又」の筆押さへなどAdobe-Japan1-6コレクション中にglyphの無いものは對應できてゐない ルビは原則肩付ルビとしたが、元ソースが熟語一纏めにルビを振つてゐるものについては一部對應できてゐない 親文字揃へができてをりません 節番號とそれに續く本文との間に改行が入らないやう禁則處理をしたつもりですが、所所うまく行つてをりません 「あっき」「じゆう」「ぶどう」など明かな假名遣ひの誤りを正した 馬太傳福音書 馬可傳福音書 路加傳福音書 約翰傳福音書 2017-12-19: BitBucketに、 LaTeXソース生成ツールを置きました 。 2018-03-19: 以下を更新した。   5. ルビは出来うる限り肩付ルビとした   6. 不相變親文字揃へができてゐません   7. 節番號とそれに續く本文との間に改行が入らないやう禁則處理を多少ましにした   8. 假名遣ひの誤りは氣付いた箇所についてWikisourceの方を編集したがその際基本原本のままとした。(例へば「自由」の假名が「じゆう」となつてゐるのは明治二九年新約全書に倣つた)又、明治二九年新約全書では「首石」は「をやいし」となつてゐる箇所があるが、元のWikisourceを尊重して「おやいし」の儘に置いた。   9. PDFをひととほり眺め氣付いた箇所について明治二九年新約全書に從ひWikisourceを修正した   10. 章建てを頁の上隅に記載するやうにした   11.  LaTeXソース生成ツールを更新した 2018-03-20: 使徒行傳 を加へた。 羅馬書 を加へた。 2018-03-28:  哥林多前書 と 哥林多後書 と 加拉太書 と 以弗所書 と 腓立比書 と 哥羅西書 を加へた。 2018-04-04:  帖撒羅尼迦前書 、 帖

新約全書

新約全書明治二九年大日本聖書舘を底本とした、電子復刻明治元譯聖書を以下に置く。 新約全書 明治二九年大日本聖書舘 底本   PDF(IPAmj 明朝 Ver.005.01)   PDF(小塚明朝 Pr6N) 新約全書英和對照 KJV & 明治二九年大日本聖書舘   PDF 栞あり(PDF IPAmj 明朝 Ver.005.01)   PDF 栞あり(PDF 小塚明朝 Pr6N) 新約全書 分冊   PDF(IPAmj 明朝 Ver.005.01) 馬太傳福音書 馬可傳福音書 路加傳福音書 約翰傳福音書 使徒行傳 達羅馬人書 達哥林多人前書 達哥林多人後書 達加拉太人書 達以弗所人書 達腓立比人書 達哥羅西人書 達帖撒羅尼迦人前書 達帖撒羅尼迦人後書 達提摩太前書 達提摩太後書 達提多書 達腓利門書 達希伯來人書 雅各書 彼得前書 彼得後書 約翰第一書 約翰第二書 約翰第三書 猶太書 約翰默示録   PDF(小塚明朝 Pr6N) 馬太傳福音書 馬可傳福音書 路加傳福音書 約翰傳福音書 使徒行傳 達羅馬人書 達哥林多人前書 達哥林多人後書 達加拉太人書 達以弗所人書 達腓立比人書 達哥羅西人書 達帖撒羅尼迦人前書 達帖撒羅尼迦人後書 達提摩太前書 達提摩太後書 達提多書 達腓利門書 達希伯來人書 雅各書 彼得前書 彼得後書 約翰第一書 約翰第二書 約翰第三書 猶太書 約翰默示録 英和對照新約全書 分冊   PDF 栞あり(IPAmj 明朝 Ver.005.01) 馬太傳福音書 馬可傳福音書 路加傳福音書 約翰傳福音書 使徒行傳 達羅馬人書 達哥林多人前書 達哥林多人後書 達加拉太人書 達以弗所人書 達腓立比人書 達哥羅西人書 達帖撒羅尼迦人前書 達帖撒羅尼迦人後書 達提摩太前書 達提摩太後書 達提多書 達腓利門書 達希伯來人書 雅各書 彼得前書 彼得後書 約翰第一書 約翰第二書 約翰第三書 猶太書 約翰默示録   PDF 栞あり(PDF 小塚明朝 Pr6N) 馬太傳福音書 馬可傳福音書 路加傳福音書 約翰傳福音書

變體假名、踊り字、傍線など

明治譯 にできるかぎり沿つた、變體假名、踊り字、傍線などを附加した 路加傳福音書 を投稿します。 KJV との 對譯 も用意しました。横書きで傍線が上についてゐるのは愛嬌といふことで。(因みに大正元年十二月二十日大英國北英國聖書會社發行の英和對照新約全書では傍線が上にあることをこの後知りました) 筆押へ IPAmj明朝フォント が筆押への有る「又」などのglyphを用意してくれてをり、これに對應した TeXパッケージ もあることを知り、Adobe-Japan-1-6に無い幾つかの字體への對應をした。あまり奇麗なフォントではないが無いよりはと我慢する。 變體假名 また、此のフォントでは、一部、 變體假名 も出せることがわかり、これを使つてみようと思ひたつ。但し、明治譯聖書に於ける變體假名の利用には、特にルールらしきものは見當らなかつた。流石に一つ一つ追ふだけの根気はないので、自分なりのルールをつくり、適當に交ぜてある。( utf-to-jis.el  で處理。)雰圍氣だけは出てゐるやうに思ふ。 IPAmj明朝フォント に用意されてゐないglyphについては、今のところ出すことができない。「こと」や「ヨハネ」が表示できないのが殘念。 濁點變體假名 此のフォント では、濁點變體假名glyphが用意されてゐないので、 pxjaschar.sty を拾ってきて、縱書き横書き用に分け、其其 pxjaschart.sty 、 pxjaschary.sty  としてtuningした。 TeX macro TeX處理すると 「ハ」(MJMZM{090171}) の配置位置がずれる。氣持ち惡いので pxjaschar[ty].sty  中に \hakern  と \bakern  を定義して調整した。 踊り字 踊り字に對應した。明治譯では假名の繰り返しに 二の字點UTF{303B} が使はれてゐるが、これの濁點glyphがないので、濁點變體假名と同じやうに \* で補った。 また、 ajKunoji が横書きではエラーを吐くので、今のところ横書きでは利用してゐない。 片假名傍線 明治譯に倣ひ、片假名傍線を施した。片假名は、人名、地名、其の他と分けて一本線、二本線、線無しとした。( utf-to-jis.el  に定義。)