★阿修羅♪ 現在地 HOME > 掲示板
 ★阿修羅♪
次へ 前へ
MITが“リアル腹話術”の映像デッチ上げ技術を開発 投稿者 佐藤雅彦 日時 2002 年 5 月 16 日 12:33:03:

●昨年12月にウサマ・ビン・ラディンの怪しいビデオ映像が公表され、
デッチ上げ贋作の可能性が広く論じられました。さらに、このビデオの
発表から間もなく、小ブッシュの“腹話術映像”までがネットで流れ、
ウサマの映像なるもののインチキぶりがますます際立ったわけでした。
(これらについては、この記事の末尾に参考リンクを貼っておきます。)

●本日、MITが、本物ソックリに画像合成できる“リアル腹話術”映像
作成技術を開発したニュースを見つけましたので、紹介します。
今回のはどうやら、音声に“本物ソックリ”にシンクロできる映像を
合成する技術のようです。しかし下記の『ボストン・グロウブ』紙の
記事を読むかぎり、映像の主人公となる“合成女優”は、実物のモデル
が喋ることもできない日本語の歌(なんだろう? 坂本九の「スキヤキ」
かな?)を上手に歌ってきかせることさえできるというのだから、贋作的
音声合成のほうはすでに完成の域に達しているのかな、などと考えてしま
います。……だとすれば、“ウサマのビデオ”なるものの信憑性はますます
怪しくなるわけで……。(笑)

●5月15日が沖縄返還記念日だということで、新聞では佐藤栄作首相の“功績”
を回顧する記事が目立ちましたが、1972年6月17日にこの首相が退陣記者会見
を行なった際、「新聞は偏向している」といって記者たちを追い出し、テレビ
カメラだけを相手に会見を行なったものでした。ニクソンは1960年の大統領
選挙のときにテレビ中継をバカにして“テレビ写り ”の良いケネディに僅差
で敗北するという苦い経験をし、68年の選挙ではテレビを利用した“メディア
仕掛けの選挙”を戦って楽勝したのですが、佐藤栄作はニクソンの順風満帆な
政治運営に羨望し、テレビに過大な期待をかけていたのかも知れませんね、
幼稚にも……。 奇しくも同日、アメリカのワシントンDCではウォーター
ゲイトビルに忍び込んだコソ泥盗聴工作員が逮捕され、『ワシントン・ポスト』
の新入り記者コンビが追いかけるかたちでニクソンの黒い秘密が徐々に
暴かれていき、けっきょく、テレビで放送できないような汚らしい言葉がたくさん
収まっているホワイトハウス大統領執務室録音を執拗に隠そうとしたばかりに
国民から決定的な不信を買い、2年後にホワイトハウスを逃げ出すことに
なったのでしたが……。
(米国の選挙とテレビの関係については『メディア仕掛けの選挙』[ダイア
モンド&ベイツ著技術と人間刊]を参照。)

●テレビは「真実を伝える」メディアとは言えません。編集や呈示のしかた
によって、視聴者をだまし扇動するプロパガンダ・メディアにもなるし、
詐欺商法の宣伝媒体にもなります。皮肉にも、正力松太郎が“反共プロパガンダ
宣伝ネットワーク”として構想した日本テレビ放送網が、プラダの偽物を
モーニングショーの通販コーナーで販売したり、同局が誇る扇動番組『ザ・
ワイド』において男性タレントの“不倫”を扱った虚偽報道を行ない名誉毀損
で訴えられて、賠償命令を喰らうなどの不祥事が相次いでいますし……。
(テレビの政治的利用については『メディア仕掛けの政治』[グレイバー編、
現代書館]を参照。)

■日本テレビ:TVショッピングの偽プラダ騒動で謝罪と商品回収
http://www.mainichi.co.jp/news/selection/archive/200203/29/20020329k0000e040051000c.html
■■名誉毀損:川崎麻世さん不倫報道で日テレに賠償命令 東京地裁 
http://216.239.35.100/search?q=cache:AcMGYrC55CEC:www.mainichi.co.jp/news/compact/20020412p1500m040032001c.html+%93%FA%96%7B%83e%83%8C%83r+%96%BC%97_%9A%CA%91%B9+%90%EC%8D%E8%96%83%90%A2&hl=ja


■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

http://www.boston.com/dailyglobe2/135/metro/At_MIT_they_can_put_words_in_our_mouths+.shtml

At MIT, they can put words in our mouths
【MITは我々を“腹話術の人形”に変えることができる】
By Gareth Cook, Boston Globe Staff
5/15/2002

CAMBRIDGE - Scientists at the Massachusetts Institute of Technology have created the first realistic videos of people saying things they never said - a scientific leap that raises unsettling questions about falsifying the moving image.
【ケンブリッジ発――マサチューセッツ工科大学の研究者たちが、言ってもいなことを人々に喋らせる本物そっくりの映像を創りだした。科学技術上の一大飛躍ではあるが、デッチ上げ映像が制作可能になったことへの懸念も生じている。】

In one demonstration, the researchers taped a woman speaking into a camera, and then reprocessed the footage into a new video that showed her speaking entirely new sentences, and even mouthing words to a song in Japanese, a language she does not speak. The results were enough to fool viewers consistently, the researchers report.
【ある実演では、一人の女性に喋らせてそれをカメラに収め、映像を再処理して、その女性が話してもいない全く新奇な言葉を喋らせたり、それどころかこの女性は日本語が話せないのに、日本語の歌をうたう映像まで創りだした。このデッチ上げ映像を見せられた人々は、一人残らず被験者が本当にそうした言葉を喋ったり日本語の歌をうたったのだと信じてしまったという。】

The technique's inventors say it could be used in video games and movie special effects, perhaps reanimating Marilyn Monroe or other dead film stars with new lines. It could also improve dubbed movies, a lucrative global industry.
【この技術の開発者は、ビデオゲームや映画の特殊効果に利用できるし、マリリン・モンローや今は亡き他のスターたちに新しいセリフを喋らせることもできる、と発言している。この技術を使えば映画の吹き替えもこれまで以上のものが作り出せるだろうから、世界規模のカネ儲け産業である映画づくりにも貢献できそうだ。】

But scientists warn the technology will also provide a powerful new tool for fraud and propaganda - and will eventually cast doubt on everything from video surveillance to presidential addresses.
【だがこの技術は詐欺とプロパガンダを助長する強力な道具にもなるので最終的には映像による監視活動から大統領演説にいたるまでおよそ映像というものの信頼が一切なくなってしまう、と科学者たちは警告している。】

''This is really groundbreaking work,'' said Demetri Terzopoulos, a leading specialist in facial animation who is a professor of computer science and mathematics at New York University. But ''we are on a collision course with ethics. If you can make people say things they didn't say, then potentially all hell breaks loose.''
【「これはまさに革命的な成果だ」と語るのは、ニューヨーク大学のコンピュータ科学と数学の教授で顔面アニメーションの指導的な専門家でもあるデメトリ・ターゾポウロス氏。だが「我々はこのままでは倫理問題に直面せざるを得ない。実際には言ってもいないことを他人に“喋らせる”ことができるようになれば、世の中は地獄の門が開いたような大混乱に陥る恐れがある。」】


The researchers have already begun testing the technology on video of Ted Koppel, anchor of ABC's ''Nightline,'' with the aim of dubbing a show in Spanish, according to Tony F. Ezzat, the graduate student who heads the MIT team. Yet as this and similar technology makes its way out of academic laboratories, even the scientists involved see ways it could be misused: to discredit political dissidents on television, to embarrass people with fabricated video posted on the Web, or to illegally use trusted figures to endorse products.
【この技術を生みだした研究者たちは、すでにNBC『ナイトライン』のスペイン語吹き替えを実用化する目論見で、同番組キャスターであるテッド・コッペル氏の映像を用いて技術的な試験を行なっている、と開発チームのリーダー役でMITの大学院に在学中のトニー・エザット氏は語ってくれた。しかしこの技術も他の同種の技術も、大学の研究室からただちに実社会に応用される性質のものなので、開発にたずさわっている当の研究者たちでさえ、「反体制の人物が不本意な言動を行なうインチキ映像を作ってテレビで晒し者にして信用を失墜させる」とか「インチキ映像をデッチ上げてインターネットで公開して一般人に嫌がらせをおこなう」とか「社会的信用がある有名人に“商品推薦”のインチキせりふを“喋らせて”詐欺商法を行なう」など、乱用の危険性があることをはっきりと認めている。】

''There is a certain point at which you raise the level of distrust to where it is hard to communicate through the medium,'' said Kathleen Hall Jamieson, dean of the Annenberg School for Communication at the University of Pennsylvania. ''There are people who still believe the moon landing was staged.''
【「メディアを通して意志疎通を行なうのは無理だと感じ、決定的な不信感を抱くようになる臨界点というのは、たしかに存在しているのです」と語るのは、ペンシルヴェニア大学アンネンバーグ記念コミュニケーション学部のキャスリーン・ホール・ジェイミソン学部長。彼女はこうも指摘している――「なにしろ今もって“人類の月面着陸はインチキ芝居だ”と信じている人たちがいるくらいですからね。」】

Currently, the MIT method is limited: It works only on video of a person facing a camera and not moving much, like a newscaster. The technique only generates new video, not new audio.
【今のところ、MIT方式の“映像腹話術”には限界がある。ニュースキャスターのように、カメラに写った人物の正面像で、しかもあまり動かない人物に限定されるからだ。それにこのテクニックでは、新奇の映像をデッチ上げることはできるが、まったく存在していない新奇の音声をデッチ上げることまではできない。】

But it should not be difficult to extend the discovery to work on a moving head at any angle, according to Tomaso Poggio, a neuroscientist at the McGovern Institute for Brain Research, who is on the MIT team and runs the lab where the work is being done. And while state-of-the-art audio simulations are not as convincing as the MIT software, that barrier is likely to fall soon, researchers say.
【だがマクガヴァン脳研究所の神経科学者で、問題のMIT研究チームに参加しこの研究室の運営スタッフであるトマソ・ポッジョ氏によれば、こんかいの知見をあらゆる角度から写した動く頭部の映像に拡張することは、困難ではないと心得るべきだという。それに現段階の音声シミュレーション技術はMITのこのソフトウェアほど信頼性が高くはないが、遠からず障壁は突破できると研究者たちは語っている。】


''It is only a matter of time before somebody can get enough good video of your face to have it do what they like,'' said Matthew Brand, a research scientist at MERL, a Cambridge-based laboratory for Mitsubishi Electric.
【「あなたの顔を映したそれなりの映像が入手できれば、どんな“セリフ”でも自由に言わせることが可能になる時代が間もなくやってきますが、それは単に時間の問題ですよ」――三菱電機がケンブリッジ市に有するMERL研究所のマシュー・ブランド研究員はそう語った。】

For years, animators have used computer technology to put words in people's mouths, as they do with the talking baby in CBS's ''Baby Bob'' - creating effects believable enough for entertainment, but still noticeably computer-generated. The MIT technology is the first that is ''video-realistic,'' the researchers say, meaning volunteers in a laboratory test could not distinguish between real and synthesized clips. And while current computer-animation techniques require an artist to smooth out trouble spots by hand, the MIT method is almost entirely automated.
【アニメイターたちはもう何年も前から、人々の映像に別人のセリフを貼り付ける作業にコンピュータを用いてきた。その典型的な例は、赤ん坊がオトナのような言葉を喋るCBSテレビの『ベイビー・ボブ』だ。しかし、この作業で得られる映像は娯楽番組として見るぶんには耐えられるけど、コンピュータで強引に作りだしたことがまだはっきりとバレてしまうほど粗雑なのである。今回のMITの技術は、「画像としては本物ソックリの出来」と呼べる最初の成果だ、と開発チームは自慢している。なにしろ実験室で弁別試験を受けたボランティア被験者たちは、“実写”映像と“デッチ上げ”映像の区別がつかなかったのであるから。それに、現行のコンピュータ支援アニメ作成技術ではやっかいな部分は人手で修正を加える必要があるが、MIT方式だとほぼ完全に全自動でデッチ上げ映像を制作できる。】

Previous work has focused on creating a virtual model of a person's mouth, then using a computer to render digital images of it as it moves. But the new software relies on an ingenious application of artificial intelligence to teach a machine what a person looks like when talking.
【従来の方式では、特定人物の口の部分の“仮想モデル”を創出し、コンピュータを使ってその“仮想の口”が動く場面をデジタル映像を創出するという段取りを踏んでいた。だがMITが今回開発したソフトウェアは、人工知能を巧みに応用して特定人物が喋っているときに“どう見えるか”をコンピュータに教え込むという方法をとっている。】

Starting with between two and four minutes of video - the minimum needed for the effect to work - the computer captures images which represent the full range of motion of the mouth and surrounding areas, Ezzat said.
【エザット氏によれば、この“リアル腹話術映像”の作成は、まず特殊画像処理に必要な最低限のデータ量である2〜4分間のビデオ映像を撮影し、そこからコンピュータが口とその周辺のあらゆる動きを示している映像をキャプチャーするところから始まる。】

The computer is able to express any face as a combination of these faces (46 in one example), the same way that any color can be represented by a combination of red, green, and blue. The computer then goes through the video, learning how a person expresses every sound, and how it moves from one to the next.
【赤・緑・青の三色の光源を組み合わせればどんな色彩でも合成できるように、MITチームのコンピュータはこのようにキャプチャーで得た顔の映像(たとえば46種類の映像)を組み合わせることで、どんな表情でも作り出せるという。次いで、このコンピュータは、対象人物が発するあらゆる音声に関して、それぞれの発声の際の様子や、他の音に移るときの様子を“学習”する。】

Given a new sound, the computer can then generate an accurate picture of the mouth area and virtually superimpose it on the person's face, according to a paper describing the work. The researchers are scheduled to present the paper in July at Siggraph, the world's top computer graphics conference.
【この研究の報告論文によれば、どんな音声を貼り付けても、コンピュータはその音声を発声する際の的確な口の動きを画像合成し、それを顔面の映像に要領よく組み込むことができるという。研究チームはこの論文を、7月に開かれる世界最大のCG会議である“シグラフ”大会で発表する予定だ。】

The effect is significantly more convincing than a previous effort, called Video Rewrite, which recorded a huge number of small snippets of video and then recombined them. Still, the new method only seems lifelike for a sentence or two at a time, because over longer stretches, the speaker seems to lack emotion.
【従来の“腹話術映像”をデッチ上げる方法は「ビデオリライト法」といい、これはさまざまな発声の様子を映像記録に収めて、この膨大な映像断片を切り貼りして“もっともらしく見える発話行為の虚偽映像”を作成するという手法であった。この「ビデオリライト法」よりも、今回のMITの手法は格段に“本物らしい”映像をデッチ上げることができる。ただし、この新手法を用いても、“本物らしく見える”のはせいぜい1〜2本の文章に限定されている。というのも、これより長い文章を“喋らせる”と、合成画像は顔の表情が欠落しているので、不自然に見えてしまうからだ。】

MIT's Ezzat said that he would like to develop a more complex model that would teach the computer to simulate basic emotions.
【MITのエザック氏は、コンピュータが特定人物の基本的な表情も“学習”できるような、もっと複雑なモデルを開発したいと語っている。】

A specialist can still detect the video forgeries, but as the technology improves, scientists predict that video authentication will become a growing field - in the courts and elsewhere - just like the authentication of photographs. As video, too, becomes malleable, a society increasingly reliant on live satellite feeds and fiber optics will have to find even more direct ways to communicate.
【いまのところは最新のMIT技術を用いても、専門家が見れば“腹話術映像”のウソを見破ることができる。だが技術の進歩によって、従来の写真鑑定にように、今後は――裁判に証拠として提出される映像やその他の映像について――映像の真偽を鑑定してお墨付きを与える商売が“成長分野”になるだろうと、科学者たちは予測している。それに現代社会は光ファイバー通信や衛星実況中継への依存を強めているけれども、録画映像はこのようにインチキが行なわれやすいので、今後は直接的なコミュニケーションの方法を模索していく必要に迫られるであろう。】

''We will probably have to revert to a method common in the Middle Ages, which is eyewitness testimony,'' said the University of Pennsylvania's Jamieson. ''And there is probably something healthy in that.''
【我々はおそらく、中世の社会ではごく当たり前に行なわれていた方法に立ち戻らなければならなくなるでしょう。つまり(映像証拠重視の審理で裁判を進めるのでなく)目撃者の証言に頼る、という方法に……」――ペンシルヴェニア大学のジェイミソン教授はそう語り、ひとこと言い添えた――「そのほうが健全でしょうしね、たぶん」。】


●[Sample video clips available on web page]

SYNTHETIC VIDEO
Can you tell the difference between the real video clips and the synthetic ones created by new MIT software? Watch these clips, decide which are real and which are fake, then see the answers below.
【女性が実際に喋っている映像と、MITで開発された新型ソフトによる“デッチ上げ腹話術映像”とを並べてみました。
どっちが本物で、どっちが合成映像か、見分けがつきますか? 正解は下記の通り。】

Source: Massachusetts Institute of Technology.

Answers: Clips 1A and 2 B are real; clips 1B and 2A are synthetic.
【本物の映像は1Aと2B。デッチ上げ合成映像は1Bと2A。】

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

参考資料


http://asyura.com/sora/war5/msg/447.html
戦争・国際情勢5 投稿NO:447 2001/12/05 15:32:34
題 名: 退役CIA工作員が、ハリウッド映画人の手を借りたスパイ工作の数々を初告白

http://asyura.com/sora/war7/msg/169.html
WA7 169 2001/12/14 12:15:17
題 名: ペンタゴンが御披露目した映像魔術「ウサマ・ビン・ラディンの告白の巻」の“台本”

http://asyura.com/sora/war7/msg/193.html
WA7 193 2001/12/14 16:45:08
題 名: ウサマ・ビン・ラディン「犯行告白」ビデオに対して当然わき上がった懐疑的な反応

http://asyura.com/sora/war7/msg/216.html
WA7 216 2001/12/14 23:02:50
題 名: 【追補】ウサマ・ビン・ラディン「犯行告白」ビデオに対して米国でも当然わき上がった批判的・冷笑的な反応

http://asyura.com/sora/war7/msg/225.html
WA7 225 2001/12/15 00:39:56
題 名: ペンタゴン版「ウサマ・ビン・ラディン犯行告白」ビデオは米国でも嘲笑の的

http://asyura.com/sora/war7/msg/248.html
WA7 248 2001/12/15 12:58:58
題 名: ペンタゴン版「ウサマ・ビン・ラディンの犯行告白」ビデオの信憑性をめぐる議論

●【爆笑】贋作版「小ブッシュの戦争陰謀告白」ビデオ公開!
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
http://asyura.com/sora/war7/msg/296.html
WA7 296 2001/12/16 23:33:22
投稿者: 佐藤雅彦
e-mail:
題 名: 【爆笑】贋作版「小ブッシュの戦争陰謀告白」ビデオ公開!

ペンタゴン版「ウサマ・ビン・ラディン犯行告白」ビデオなんて
誰でもデッチ上げられる、という見本だそうです。

●表題のような情報を入手したので、紹介しておきます
-----------------------------------------------------------
DOCTORED BUSH VIDEOTAPE SHOWS HOW EASY IT IS TO DO


Note: this tape is a fake created by two Australians
that demonstrates how easy it is to alter video
evidence.
【注記:このビデオは2人のオーストラリア人が作り
 だした贋作だが、これを見れば、“映像証拠”なる
 ものをいかにたやすく改竄してデッチ上げられるか
 が一目瞭然である。】
http://members.optushome.com.au/okandil/bush.asf
-----------------------------------------------------------

●私が入手したのは以上の情報だけなので、贋作版「小ブッシュ
 戦争陰謀告白」ビデオを作ったオーストラリア人の詳細などは
 いっさい不明です。
 なお、このビデオは阿修羅サイトにもUPしておきました。

   贋作版「小ブッシュの戦争陰謀告白」ビデオ
  http://www.asyura.org/bigup1/source/005.asf

●このビデオで電話の相手に向けてブッシュは以下のような
 セリフを語っています。
■■■■@■■■.■■■■■■■■■■■■■■■■■■■

このビデオの中の小ブッシュのせりふ

But make no mistake about it,
my resolve is steady and strong

about winning this..war that has been
declared on america..It's a new kind of war..
【いいかね。わたしの心はもう決まってるんだ。
これに勝つってことはね。
アメリカに向けて宣戦布告された戦争に。
これは新型の戦争なんだ。】

I understand it's a new kind of war and
this government will adjust and this
government will call others to join us.
【私も理解してるさ。これが新型の戦争だってことは。
この政府はこれに合わせていくさ。
この政府で、他にも呼びかけて参加させる。】

to make sure this act..these acts..
thousands of Arab Americans who
conducted these acts and those who
harbor them are held accountable for
their actions..make no mistake..
【そして、こうした行為、こういった行為がだな、
こういった行為を行なってる数千人のアラブ系アメリカ人や、
それをかくまっている連中は自業自得だってことだ。
まあそういうことだよ。】
■■■■@■■■.■■■■■■■■■■■■■■■■■■■

●このビデオの観賞(笑)のポイントは、小ブッシュの声でトンデモ
 発言をデッチ上げ、それを小ブッシュの画像に貼り付けて、ほど
 よく口の動きをシンクロさせていることでしょう。(この贋作の場合
 は完全にシンクロとまでは言えませんが。)

●この小ブッシュ贋作ビデオをついて私が知ったのは日曜日の晩
 ですから、オーストラリアの贋作家がペンタゴン版「ウサマ・ビン・
 ラディンの犯行告白」ビデオを見て奮起してから製作にとりかかった
 のだとすれば、1日かそこらで作り上げたわけです。正直、ハリウッド
 よりすごいかも知れない……。(笑)
  小泉鈍一郎総理ならこう言うかな? 「感動した! よくやった!」

●どうでしょう? 日本でもヒマとテクニックを持て余している方が
 いたら、政治家が登場するこういうコラージュ動画を作ってみては。
 
●なお、このビデオについての反響を以下に紹介しておきますが、
 正直いってショボイです……。

■■■■@■■■.■■■■■■■■■■■■■■■■■■■
●このテープに対する反響

1.Of course its easy to doctor videos, singers do it all the time. Example,
Witney Huston had a makeover in the concert Michael Jackson gave recently.
Before the doctored tape she looked like a junkee.

-----------------------------------------------------------
2.Keith A. MacNevins:> Some Arab critics of the Osama bin Laden tapes say
some of the typed lines show ignorance of the language (by interpreters)
and ignorance of Islamic phrases.

■■■■@■■■.■■■■■■■■■■■■■■■■■■■


 次へ  前へ



フォローアップ:


 

 

 

 

  拍手はせず、拍手一覧を見る


★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
投稿コメント全ログ  コメント即時配信  スレ建て依頼  削除コメント確認方法
★阿修羅♪ http://www.asyura2.com/  since 1995
 題名には必ず「阿修羅さんへ」と記述してください。
掲示板,MLを含むこのサイトすべての
一切の引用、転載、リンクを許可いたします。確認メールは不要です。
引用元リンクを表示してください。