★阿修羅♪ > 政治・選挙・NHK56 > 785.html
 ★阿修羅♪
第95回 明治の「バラバラ事件」もヒット 読売新聞の記事DBを体感 (2007/01/30)
http://www.asyura2.com/08/senkyo56/msg/785.html
投稿者 ROMが好き 日時 2008 年 12 月 10 日 14:15:33: Dh66aZsq5vxts
 

(回答先: 第92回 ソニーはどこへ向かうのか PS3の可能性と不透明な未来 (2006/12/21) 投稿者 ROMが好き 日時 2008 年 12 月 10 日 14:12:58)

第95回 明治の「バラバラ事件」もヒット 読売新聞の記事DBを体感 (2007/01/30)
http://web.archive.org/web/20070202033125/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index.html

2007年1月30日

 いま読売新聞で、創刊125周年記念事業の一環として、明治7年(1874)以来のすべての新聞記事をコンピュータで自由自在に検索し、記事そのものを読めるようにするという一大データベース作りが進行中である。そんなものどこにでもあるような気がするが、実はない。

 第1に明治、大正、昭和、戦前期というような古い時代を網羅するものはない。第2に、他のデータベースは、ほとんどがテキストベースで、発刊時の姿のままで読むことができない。これは驚くほどのすぐれもので、その両面を可能にしている。あらゆるキーワードで記事が検索できるだけでなく、記事がすべてイメージでメモリーに入っているので、発行時の紙面そのままの体裁で読むことができる。

 キーワード検索すると、そのキーワードを含む記事の見出しの一覧が明治時代から通年で出てくる。見たい記事の見出しをクリックすると、その日の紙面がそのまま出てくる。最初は一面丸ごと広告欄まで入った形で出てくる。目的の記事はその中で赤いピンで囲われた形で出てくる。そこをもう一度クリックすると、その記事だけが切り出された形で示される。縮小も拡大も思いのままだし、もちろん、そのままプリントアウトすることも自由にできる。

 
「大(おお)新聞」と「小(こ)新聞」を網羅
……………………………………………………………………
 読売新聞では、実は86年以後の新聞記事については「ヨミダス」というデータベースができあがっていて、すべての記事が自由に検索できるようになっている。しかし、それ以前の分については、索引付きの縮刷版はあるが、コンピュータで利用できるデータの形ではなかった。

 それを明治の創刊号からはじめて、全部を利用可能にしようということで、この一大プロジェクトがはじまった。

 いちばん大変だったのが、明治時代の最初期の新聞だったという。

 明治時代の新聞には、「大(おお)新聞」と「小(こ)新聞」があった。大新聞は、政治、経済など、天下国家の動きを中心的に報じたが、小新聞は、天下国家のことも多少は伝えたが、重きを置いて伝えたのは一般社会のできごと、市民の市井生活、風俗、事件、事故などだった。要するに、いまの新聞でいう社会面の記事である。

 明治時代の小新聞で、現在にいたるまで連綿と切れ目なく発行がつづいている新聞は、読売新聞だけである。

 
next: 社員・OBが手作業でキーワードを付ける
http://web.archive.org/web/20070202033125/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index1.html

社員・OBが手作業でキーワードを付ける
……………………………………………………………………
 その最初の10年間の新聞は、いまの感覚でいうと「えっ、これが新聞!?」といいたくなるような新聞で、小見出しも付いていない1項目数行の記事がベタベタとならんでいるだけの新聞だった。

 そのような記事をコンピュータで検索・利用可能にするためには、一つひとつの記事を読んで、その内容にふさわしい見出しを付け、検索用のキーワードを付していかなければならない。

 それは素人ではとてもできない。結局、府中市にある読売新聞社の府中別館に特設の作業室を作り、そこに常時数十名の現役社員と社員OBから成る特別チームが、日夜新聞をひたすら読んで、検索キーワード付けをするという作業を94年にはじめた。

 作業をはじめたら、昔の新聞を読む面白さに皆ひきこまれてしまって、作業がなかなか進まなかったというが、約5年の歳月をかけて、明治時代の60万本に及ぶ記事のすべてにキーワード付けをする作業を終了させた。そして、99年にCD-ROM39枚組の「明治の読売新聞」を92万円で売り出すことができた。

 これによって明治時代の歴史研究が一挙に進むことになったから、日本中の歴史研究者から大歓迎された。このプロジェクトは新聞業界でも高い評価を受け、2000年度の新聞協会賞を受賞している。

 読売新聞では、当初からこれを明治時代だけで終わらせず、大正、昭和から現代にいたるまで拡張しようと計画していた。明治時代のデータベースが完成したあとも、チームは解散せず、同じ作業がつづけられた。2001年にはCD−ROM29枚組の大正時代の巻が完了した。このときから、検索して調べていくうちに、わからないことが出てきたら、即座にコンピュータの画面上で百科事典が引けるように、平凡社の世界大百科事典がいっしょに組みこまれるようになった。

 その後も同じ作業が続けられ、CD-ROM35枚組の戦前T(大正15年〜昭和11年)とCD-ROM23枚組の戦前U(昭和12年〜昭和20年)が03年に完成した。

 ここまでくると、CD-ROMが全部で100枚を超えてしまっているので、通して利用しようとすると、ディスクの交換で大変な手間がかかることになった。しかし、この間にハードディスクの記憶容量が飛躍的に向上したので、ここまでに出たすべてのCD-ROMをハードディスクにインストールして一括利用する(串ざし検索可能)ことが可能になった。

 それによって、使い勝手が一気に向上し、利用率も一気にアップした。

 
next: 「すごい」の一語につきるデータベース
http://web.archive.org/web/20070202025059/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index2.html

「すごい」の一語につきるデータベース
……………………………………………………………………
 その後04年にCD-ROM39枚組の戦後I(昭和21年〜昭和35年)ができ、それにつづいて、CD-ROM77枚分の戦後U(昭和36年〜昭和45年)が、つい最近完成したところである。

 それがしばらく前に私の事務所に持ちこまれ、しばらく使ってみて、その感想を聞かせてほしいということになった。

 どんなものなのだろうと、はじめはオズオズ使ってみたが、使ってみて驚いた。

 これはもう「すごい」の一語につきる。

 なにがすごいといって、まず新聞がイメージで姿のまま保存されていて、それがどのようにでも引き出すことができるということである。新聞記事のデータベースはいろいろあるが、ほとんどがテキストだけをデータにしてあって、キーワードが含まれている文章だけを打ち出してくれるシステムである。

 しかし、新聞情報で大事なのは、テキストで記述されている内容だけではない。もっと大切なのはその紙面である。一つひとつの記事の内容もさることながら、それが新聞のどこにどのような扱いで載ったか、どのような見出しがついていたか、その記事の大きさはどうであったか、その紙面全体はどのように構成され、その記事の前後には、どのような記事がどのような扱いでのっていたか。こういった情報が記事内容と同等あるいはそれ以上に大切なのである。それがテキストだけの検索方式では全部飛んでしまう。

 それらの事実がこの読売の方式では全部出てくる。検索しただけで、記事の見出し、段数、写真の有無がわかり、見出しをクリックすれば、その日の紙面そのものが出てくる。カーソルを記事のところにもっていけば、記事はいくらでも拡大できる。

 
next: 過去の時代を手軽に追体験
http://web.archive.org/web/20070202025400/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index3.html

過去の時代を手軽に追体験
……………………………………………………………………
 時間軸上の移動も自由自在で、その前の日の新聞も、翌日の新聞もすぐに読むことができる。また、「自動ページめくり」機能があるから、一定のスピード(速くも遅くもできる)で、次々に新聞を読んでいくことが簡単にできる。もちろんストップも1枚めくりも可能だ。

 使ってみると、この機能が実に役に立つ。この機能を利用すると、過去の時代の世の中の動きをいながらにして追体験できる。

 私は昭和戦争の最末期から、戦後の最初期の時代をずっとつづけてめくってみたが、これは劇的な体験だった。まるでタイムマシーンにのってあの時代に舞い降りたような気分になる。そしてページめくりを少し速めの自動にしてやるとまるで日本の歴史が目の前に流れていくのを見ているような気分になった。

 同じことを満州事変の前後とか、大正時代、明治時代でもやってみたが、これをやると、歴史の見え方がまったくちがってくる。キーワード検索して、いきなり目的の記事のところだけを読んだのでは決してわからない、その時代の全体像が一挙に見えてくるのである。

 こんなことができるのも、歴史上の全紙面をイメージで全部記憶させてしまった読売方式の威力だろう。ある時代からは、新聞にはみな縮刷版ができているから、同じようなことが、縮刷版を捲ればできることはできる。

 事実これまでにした幾つかの仕事で、そういうことをやったことが何度もある。しかし活字が小さい縮刷版を読むという仕事は、眼が疲れ神経が疲れる仕事だから、そう長くはつづけられない。それに縮刷版それ自体がモノとして扱いにくい。ある時代を通して調べるとなったら、大変な冊数の縮刷版をめくっていかなければならないし、索引が付いていても、あっちをめくりこっちをめくりで、大変な肉体労働になる。必要なところをコピーに取るというのがまた大仕事である。

 ところがこれは、そのすべてがアッという間にできてしまうのだ。そして必要なところはいくらでもハードコピーを取ることができるのだ。

 
next: 歴史の研究法すら変える威力
http://web.archive.org/web/20070202024928/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index4.html

歴史の研究法すら変える威力
……………………………………………………………………
 これは歴史の研究法が全く変わってしまったなと思った。

 事務所に訪ねてくる学生や編集者に、このシステムを好きなように使わせてみたら、みんなビックリ仰天している。

 いま現に近現代史がかかわる研究をしている学生もいるし、昔学生時代にそういう方面の研究をやりましたという編集者もいたが、みんな一様に苦労していたのが、資料集めである。国会図書館などに何日も通いつめてさまざまの制約(1日にとれるコピーの制限などがある)の下に苦労して集めていた資料がこれだとアッという間に集めてしまうことができるのである。

 「まるでウソみたいです。これがあったら論文がいくらでも書けちゃいます」

 「あのときのあの苦労はいったいなんだったんだろう、と思います」

 などとみな口々にいう。

 いまのところ、読売のこのデータベースは、明治/大正/戦前I/戦前II/戦後I/戦後IIなどにわかれていて、それぞれが数十万円するから、購入者は、大学、研究機関、図書館、企業などの法人である。

 法人は、複数端末でネットワーク利用を可能にする制度があるから端末1つあたりの利用料金がいくらになるかは簡単には算出できない。しかし、これが驚くべき情報量を持っていて、その使い方ひとつで研究業績などいくらでもあげられるということがわかってから、多くの学校、研究機関がどんどん購入に踏み切っている。利用希望者がひきもきらず、大学などでは、購入したところ一人30分以内などの時間制限をかけているところもあるという。

 近現代史の専門の研究者の中には、これがどうしもほしくて、個人で購入してしまった人もいる。モニター含みで一人で丸々購入するとなると、約500 万円かかり、けっして安くはないが、自分の研究者人生に、これがどれほど役に立つかを考えたら(研究論文がいくらでも書けてしまう)、これは高くないと判断したのだそうである。

 私のようなもの書きでも、これがあるかないかで、できる仕事の量が圧倒的にちがうだろう。

 
next: 「田中角栄」のキーワードで改めて振り返る
http://web.archive.org/web/20070206180817/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index5.html

「田中角栄」のキーワードで改めて振り返る
……………………………………………………………………
 試みに、「田中角栄」のキーワードを入れてみたら、戦後I(1946〜1960)では、304件しかヒットしなかったものの、戦後II(1961〜1970)になると4250件もヒットした。

 「戦後I」の時期は、1947年(昭和22年)の総選挙で、田中土建の社長であった角栄が、新潟三区から出馬して当選。最年少の議員になるところからはじまる。当選早々田中は、第二次吉田内閣で法務政務次官に抜擢される。そのような華々しい成功をおさめたと思ったら、今度はあっという間に炭管疑獄事件にまきこまれて、国会開会中に逮捕されるという、天国から地獄への大転落を経験している。

 『田中角栄研究』を書くとき、この時代のことも書いたが、朝日新聞の縮刷版しか参照しなかったため、読売のデータベースではじめて知る事実もでてきた。このときの田中逮捕は、現役の法務政務次官の逮捕であるから、検察も相当気を使ったらしく、逮捕の日、5人の検事が動員されて、自宅と田中土建の会社だけでなく、「神楽坂妾宅」にも家宅捜索が入り、約2時間にわたって捜索された上、多数の証拠物件が押収されたとある。

 炭鉱国有化に反対する炭鉱業者から数千万円の反対運動費が出て、その使途のうち70万円(いまの貨幣価値で数千万円)が酒代に消え、14万円がハイヤー代に消えた。田中逮捕の傍証を固めるために、反対運動の拠点になった神田の有名旅館の女中2人が事情聴取されたなどなど、事件モノに強い読売社会部の面目躍如の記事が続々でてくるのに感心した。

 「戦後II」で、田中角栄関連の記事がドンとふえるのは、この時期に角栄は一挙に政界実力者になり、自民党政調会長、大蔵大臣、幹事長などを歴任するからである。この間の記事の見出しを追っていくだけで、この時代の日本の政治の動きをほとんど全部フォローできるといって過言ではない。

 この次に出る予定の「戦後III」になったら、角栄は総理大臣になり、金脈事件、ロッキード事件、ヤミ将軍としての政界支配と、大きなできごとが連続して起きることになるから、おそらく「田中角栄」のキーワードでヒットする記事は、何万件にもなるはずである。

 
next: 「戦後III」までいくには、2009年になりそうだ
http://web.archive.org/web/20070206180817/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index6.html

 「戦後III」までいくには、2009年になりそうだ(時代が進むにつれて、新聞のページ数がふえていくから手間もかかる)というが、そこまでいったら、もうヨミダスにつなげて読売の全紙面完全検索可能になる日はほとんどそこにきているといっても過言ではないだろう。

 かねてから、コンピュータの処理速度があがり、ハードディスクの記憶容量があがっていけば、いずれ可能になるといわれていたことが、本当に現実のものになりつつあるのだ。

 
キーワードには記者の知識を徹底利用
……………………………………………………………………
 もうひとつこの読売のシステムで特筆すべき長所は、検索のキーワード付けを、コンピュータで自動化せずに、全部人間がひとつひとつやったことだ。そのため、この検索システムは本当の意味で最適化されている。つまり、人間がちゃんと記事をひとつひとつ読んで、その内容にぴったりのキーワードをいくつでもあてはめるという考え方でやってきたから、きわめて柔軟性に富んだ検索が可能になっているのだ。

 普通は検索ワードの入れ方がちょっとまちがっていると、ヒットすべきものがヒットしないということが起こりがちで、時代によって同じものが別の呼称を持っている場合など、なかなかうまくいかないものだが、このシステムでは、新聞記者の知識を徹底的に利用して、ちょっとちがう呼称でもみなヒットするように工夫がこらされている。

 たとえば、「東京大学」のことなら、「帝大」「東京帝大」「第一高等学校」「一高」「東京開成学校」「工部大学校」「医学校」など、みんなヒットするのである。

 
next: 「バラバラ事件」で明治大正の事件も大量にヒット
http://web.archive.org/web/20070206180828/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index7.html

「バラバラ事件」で明治大正の事件も大量にヒット
……………………………………………………………………
 最近つづけざまにバラバラ事件があったので、「バラバラ事件」で引いてみた。すると、明治大正の昔から何百件もヒットすることがわかった。しかし、明治の古いものは、先に述べたように、見出しがなかったはずである。事実記事そのものを引き出して見てみると、その記事の中に「バラバラ事件」なることばは全く出てこない。それでもヒットするのは、記事を読んでキーワード付けした人が、事件の内容はいまで言う「バラバラ事件」だからということで、そのようなキーワード付けをしたということなのだ。

 たとえば、「明治のバラバラ事件」で検索して出てくる記事の本当の見出しは

鈴ヶ森の首なし女の首か
 上野不忍池で首入り釜発見

 というような記事である。この見出しの記事をバラバラ事件に分類することはコンピュータにはできない。やはり人間が分類したからできたのである。

 大正時代の例では

住職の妻、子を殺し手足を切り刻む
 不義の結果遂に収監/富山市

池田侯邸の竹ヤブから人の首現る
 近来の怪事件として大崎分署大活動を開始す

果然!竹ヤブから腐乱した胴と手足
 疑雲に包まれた生首事件

 といった事件が出てくるが、これらのどこにも「バラバラ事件」の言葉は使われていない。

 「バラバラ」という表現は昭和5年の

バラバラにして別々に埋めたか
 生首事件の死体現れず

 あたりででてくるが、この時代のバラバラ事件は「惨殺体事件」「怪死体事件」「八つ切り事件」などと呼ばれていて、「バラバラ事件」の呼び名は与えられていない。「バラバラ事件」がさかんに使われるようになったのは、昭和7年3月かららしいということが、このデータベースを利用すると一挙にわかる。

 
next: 事件の文脈もたちどころにわかる
http://web.archive.org/web/20070206180837/http://www.nikkeibp.co.jp/style/biz/feature/tachibana/media/070130_kijidb/index8.html

事件の文脈もたちどころにわかる
……………………………………………………………………
 人を殺すと死体が残る。死体の処理に困ったときすぐに考えつくのが、死体をバラバラにすることらしく、「バラバラ」事件というのは、実に想像以上に多く、検索するとたちまち何十件も出てくる(見出しの件数でいうと、何百件にもなる)。

 バラバラ事件のような猟奇的事件は報道量も多く、死体の発見、犯人逮捕、裁判と一つの事件で何度も報道されるから、データベースでの見出しヒット数は多くなるのである。そして、大々的に報道されるような大きなバラバラ事件があったあとは、それに触発されてか、それに似たようなバラバラ事件がつづけて起こるということが昔からある。

 たとえば昭和7年に起きた東京「寺島」の元祖バラバラ事件のあと、東京の蒲田でも玉の井でもおきているし、しばらくして群馬県の奥利根でも起きている。

 バラバラ事件のような特殊な事件の様態で検索しても面白いし、汚職、疑獄などで検索しても面白い。政治家、芸能人などの固有名詞で検索しても面白い。

 このシステムが事務所に置かれていた間、ついつい夜ふかしをしていろんな検索をしてしまった。そして、このシステムの持つ情報量の大きさに驚嘆した。

 当分の間、このシステム、あまりに高価であるため、だれでもいつでも利用できるというわけにはいかない。しかし、多分、そう遠くない時期に、たいていの公共図書館にこのシステムが入って、一般の人も気軽に利用できるようになるのではないか。こんな面白いものはなかなかないから、公共図書館に入れたら、利用者の人気が爆発するだろうからだ。最近の図書館は、人気爆発が予想されるアイテムはすぐに入ってくるのである。

 
立花 隆

 評論家・ジャーナリスト。1940年5月28日長崎生まれ。1964年東大仏文科卒業。同年、文藝春秋社入社。1966年文藝春秋社退社、東大哲学科入学。フリーライターとして活動開始。1995-1998年東大先端研客員教授。1996-1998年東大教養学部非常勤講師。2005年10月 -2006年9月東大大学院総合文化研究科科学技術インタープリター養成プログラム特任教授。

 著書は、「文明の逆説」「脳を鍛える」「宇宙からの帰還」「東大生はバカになったか」「脳死」「シベリア鎮魂歌―香月泰男の世界」「サル学の現在」「臨死体験」「田中角栄研究」「日本共産党研究」「思索紀行」ほか多数。近著に「滅びゆく国家」がある。講談社ノンフィクション賞、菊池寛賞、司馬遼太郎賞など受賞。
 

  拍手はせず、拍手一覧を見る

 次へ  前へ

▲このページのTOPへ      HOME > 政治・選挙・NHK56掲示板

フォローアップ:

このページに返信するときは、このボタンを押してください。投稿フォームが開きます。

 

  拍手はせず、拍手一覧を見る


★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
投稿コメント全ログ  コメント即時配信  スレ建て依頼  削除コメント確認方法
★阿修羅♪ http://www.asyura2.com/  since 1995
 題名には必ず「阿修羅さんへ」と記述してください。
掲示板,MLを含むこのサイトすべての
一切の引用、転載、リンクを許可いたします。確認メールは不要です。
引用元リンクを表示してください。