★阿修羅♪ > テスト17 > 457.html
 ★阿修羅♪  
▲コメTop ▼コメBtm 次へ 前へ
テスト
http://www.asyura2.com/09/test17/msg/457.html
投稿者 SOBA 日時 2009 年 10 月 25 日 16:52:49: LVbi13XrOLj/s
 

選挙運動や官僚答弁にも関連する文書、「民主党英国政治実務調査団報告」をOCRテキスト貼付処理し阿修羅にアップしました。
http://soba.txt-nifty.com/zatudan/2009/10/post-9b45.html

 阿修羅管理人、阿修羅空さんから大規模UP板のパスワード連絡があり、早速OCRテキスト貼付処理した「民主党英国政治実務調査団報告」(pdfファイル)をアップロードできました。(OCRテキスト処理は読み取り間違いが時々あります。コピペしておかしいところは元pdfファイルで確認してください。)

 ダウンロード先URLは下記です。約5MBあります。

http://www.asyura2.com/bigdata/bigup1/source/198.pdf

※阿修羅さんの大規模UP板サーバーの回線が細いのかスピードが遅いです。もしご自分でAdobe Acrobat Proをお持ちであれば下記民主党HPからダウンロードしてご自分でOCR処理する事をお勧めします。pdfを開いたら、「文書メニュー→OCRテキスト認識→OCRを使用してテキストを認識」とし「すべての文書」となっているのを確認したらOKです。

 なお、民主党HPで同じファイルを置いてあるURLは下記です。

2009/10/13
改めて国会法改正へ 政府参考人答弁禁止へ意欲 小沢幹事長が会見で
http://www.dpj.or.jp/news/?num=17094

↑上記ページの末尾に「ダウンロード、民主党英国政治実務調査団報告」として下記URLで紹介されています。

http://www.dpj.or.jp/news/files/eikoku0909.pdf

※上記、民主党HPにアップされているのは、OCRしておらずいわば画像です。OCRでテキスト処理すれば、例えば「インターネット」「個別訪問」とか検索して関連部分を拾って読んだり、繰り返し読んだりするのに便利です。「気になる部分、あるいはこれ良いカモね」と言う部分を範囲指定してコピーアンドペーストなどしたりもできます。

 元々、民主党が最初からワードなどで作成し、それをpdfに変換していれば正確なテキストが張りつけられていて問題がなかった訳です。ワードなどからpdfであれば、最終的なファイルサイズはおおよそ500KBくらいのものだったはずです。民主党が、なぜ5MB、しかも使い辛い画像としてのpdfにしてしまったのか理解できません。

 Twitterで民主党逢坂議員、藤末議員にも「呟き」ましたが、まだ返事はありません。

http://twitter.com/28SOBA/status/5009552394

http://twitter.com/28SOBA/status/5009714515

http://twitter.com/28SOBA/status/5009823453

http://twitter.com/28SOBA/status/5010098156

http://twitter.com/28SOBA/status/5013795249

 
関連
10月19日小沢幹事長記者会見ビデオと、OCRテキスト処理した『民主党英国政治実務調査団報告』をご紹介をしておきます。

 

  拍手はせず、拍手一覧を見る

  拍手はせず、拍手一覧を見る


★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
投稿コメント全ログ  コメント即時配信  スレ建て依頼  削除コメント確認方法
★阿修羅♪ http://www.asyura2.com/  since 1995
 題名には必ず「阿修羅さんへ」と記述してください。
掲示板,MLを含むこのサイトすべての
一切の引用、転載、リンクを許可いたします。確認メールは不要です。
引用元リンクを表示してください。