六点漢字の自叙伝(24)


 六点漢字の自叙伝(第24回)1998年10月、通巻第190号

        OCRではじめて自動点訳したのは『特許公報』

          − 公表できなかったこの実験の事実 −

 昭和50年10月頃、電子技術総合研究所の電子計算機室長であった矢田光治氏と都立工業技術センターの平塚尚一氏が附属盲学校へ来られ、当時の汎用コンピュータで技術開発する具体的テーマがないかと尋ねられた。

 私を訪ねて来られたのは、その月ごろの雑誌「コンピュートピア」に私が紹介されていたからである。

 平塚氏は、この年の5月に附属盲学校を訪ね、すでに点字プリンターの試作を志していたが、まだそれは組み立てられていなかった。

 平塚氏が5月に附属盲学校を訪ねて来たのは、4月26日の朝日新聞における日本ME学会での私の点字による日本語入力の発表の記事を見てのことであった。

 そこで私は、当時コンピュータを最も利用した印刷法であった電算写植に用いられている磁気テープで点字本を作る、自動点訳印刷の実験を行ないたいと申し出た。

 昭和48年の実験はコンピュータが小規模で、また自由に使えないなどの制約があり、ごく短い文章だけの実験に留まっていた。

 点訳に用いる磁気テープは、コンピュータ用のオープン磁気テープで、1巻の直径は7インチであった。

また、その幅は当時のオープン録音テープの幅よりずっと広かった。

そして9トラックで、テープの直角方向に文字などのコードが記録されていた。

 点訳用のテープデータは、国会図書館電子計算課と東京JPから提供を受けることができた。

 前にも述べたが、この両者は私に非常に協力して下さっていた。

 国会図書館からは、『当用漢字音訓表』のほか、『国会図書館図書目録』の一部分も提供された。

 東京JPからは、『坊っちゃん』(夏目漱石)、『若きヴェルテルの悩み』(ゲーテ)、『脳のはたらき』(千葉康則)、『トランジスタの誕生』(菊池誠)など多数あった。

 ただ、これらの磁気テープを自動点訳し、紙テープの点字コードにするのであるが、小さな単行本でも直径約20センチの紙テープで数巻になる。

 これを岡崎式点字データタイプライターで印刷するのであるが、なにしろ毎秒3〜4マス程度の印刷速度であったから、非常に時間がかかり待ち遠しいものであった。

 その頃、当分の間は漢字を含む日本語OCRは無理とされていたので、電算写植により通常の本を印刷するデータから、直接自動点訳するというのが私のアイディアであった。

 そして、何冊もの本について、六点漢字を用い実験することができた。

 このように電算写植から自動点訳ができるようになると、次はまだ無理と言われるOCRで、紙に書かれた文字から直接、自動点訳を行なう方法を模索するようになった。

何といっても、これこそが本当の自動点訳だからだ。

 当時、通産省の国家的開発プロジェクトに「日本語のパターン認識」に関するものがあった。

このプロジェクトは、昭和46年から55年までの10年にわたる壮大なもので、具体的な目標の一つは、漢字を含む日本語の文字認識であった。

 今日においては、「ヨメール」、「マイリード」、「よみとも」などで日常的に行なわれている、いわゆる日本語OCRについての開発である。

 昭和50年頃においては、その日本語OCRが最先端の開発テーマであった。

 私は雑誌『エレクトロニクス』(オーム社)の記事で、その開発状況の一端を知った。

そこで、記事の筆者を手がかりに早速、川崎にある東芝総合研究所にS(坂本)氏を訪ね、日本語OCRによる磁気テープの1巻をいただいた。

 その磁気テープの内容は、『特許広報』の一部で、文字数は1万字であった。

 この磁気テープは以前に紹介した、共同通信社などで用いていた「CO59コード」(Common Code 1959)で記録されていた。

 しかし、CO59コードでは電子技術総合研究所の既に使っているコードとは合わない。

そこで、虎ノ門にある日本コンピュータセンターで「富士通漢字コード」に変換してもらい自動点訳ができた。

 今のJIS漢字コードが制定される以前の、不便な話の一つである。

 自動点訳による点字で点訳結果を確認してみると、特許番号、特許の日付、申請者、特許内容などが書かれていた。

 磁気テープとともに渡された墨字原文のコピーは、10ページ程度のものであった。

 これが紙に印刷された日本語を、直接自動点訳した最初の実験であった。

 その時期は昭和51年11月で、附属盲学校が夜まで文化祭準備にあわただしい最中であった。

 時間の合間をみて同僚の中口氏に虎ノ門までコード変換された磁気テープデータを受け取りに、一緒に行ってもらったことを懐かしく思い出す。

 これで紙に印刷された文字からの自動点訳を行なったことになる。

 しかし、『特許広報』のOCRデータを提供してくれたS氏は、その後上司にひどくしかられたそうである。

 それは開発中のシステムの資料を外部に漏らしたからである。

 読み取り方法と精度、研究の進捗状況など、競争会社に対する秘密のこともあったであろう。

 また、開発元の通産省にも無断であったから、しかられるのも無理ないことで、私は、S氏に申し訳ないことをお願いしたと思っている。

 だから、この日本語OCRによる初めての自動点訳実験の事実を、これまでどこにも漏らさなかった。

 だが、それから22年を経た今日では時効であろうから、初めてここに公表する。

 そして、その点訳された「特許広報」の資料の一部が私のところに保存されている。

 もう一つ、忘れられない自動点訳実験がある。

 私は国語辞典を自動点訳したかったので、矢田光治氏に相談した。

 すると、矢田氏はすぐに、私の目の前で情報処理学会の淵一博先生に電話をかけて下さった。

 そして同学会がデータ化した『新明解国語辞典』(三省堂、山田忠雄ほか)第3版があるから、それを点訳実験に使ってよいという了解を得て下さった。

そして、その磁気テープは三省堂にあるから、そこの仲佐氏から受け取るようにと言われたので、すぐに神田の三省堂に行った。

 そして著者の許諾を得る手続きを取り、磁気テープ6巻を送っていただいた。

これには、あの国語辞典として有名な、『新明解国語辞典』の全データが入っていた。

 この辞書は数百万部以上売れた辞典類の大ベストセラーで、この自動点訳は胸をときめかす出来事であった。

 これは後に日本職能開発センターの点字ディスプレイで引ける国語辞典となり、またAOK日本語ワープロVer2.4における「声の国語辞典」と関連することになるのである。

  これらは、視覚障害者が必要に応じその場で言葉が調べられる、初めての電子国語辞典となった。

 しかし、それには、なおこの「新明解国語辞典」の磁気テープを入手した昭和51年から、パソコンによる視覚障害者用ワープロが、ある程度発達するまでの約10年を要した。

 また、昭和56年から、ブレイルマスターという点字ラインプリンターに8インチフロッピーディスク装置などが付属した点字複製装置が、何年計画かで、全国の盲学校に設置された。

 金沢工業大学の水野舜教授が、私の依頼により、「新明解国語辞典」のうち、重要語のマークのついたものをこのブレイルマスターで印刷できるようにして下さった。

 フロッピーディスクは全8枚であり、点字は約2000ページあった。

 もし、辞典の全体を点訳したら、この10倍以上のものになったと考えられる。

しかし、当時の点字ラインプリンターでは、その印刷は無理であった。

 この8枚のフロッピーディスクを、横浜市立盲学校の新城直教諭などに送り新明解国語辞典の重要語が印刷された。

 同様に、盲学校の何校かにこの新明解国語辞典のフロッピーディスクが送られた。

 これは、辞典の自動点訳の最初であり、そのフロッピーディスクなど、記録されたデータの送付による点訳の最初であるとも思う。

                    (六点漢字協会会長/長谷川貞夫)

もどる