じじぃの「科学夜話・視覚ソフトウェア・自動運転車は安全か?すごい数学」

使える数学!(2007)L07 code-03 ハミング距離

動画 YouTube
https://www.youtube.com/watch?v=1cM_Rst4lT4

What is image classification?


Getting Started with Image Classification

November 2, 2022 Label Studio
●What is image classification?
Image classification is the task of assigning one (single-label classification) or more (multi-label classification) labels to vectors within a given image or groupings of images. If you’ve ever wondered how Google Photos identifies your, your family members, and your friends' faces, it’s because of image classification.
https://labelstud.io/blog/getting-started-with-image-classification/

ハミング距離【Hamming distance】

2021.12.12 IT用語辞典 より
ハミング距離とは、同じ長さの符号列(ビット列や文字列など)を比較して、同じ位置の符号が異なっている箇所の数。
同じ長さの2つの符号列について、先頭から順に同じ位置同士を比較していったとき、内容が食い違っている符号の数を表す。片方の符号列をもう一方に変形するのに必要な置き換え回数と理解することができる。
例えば、ビット列で考える場合、「01010101」と「01110111」では同じ位置で値が一致しているビットが6つ、異なっているビットが2つであるため、ハミング距離は2となる。ビットに限らず任意の符号列で考えることができ、文字列「confirm」と「comfort」であれば不一致は3文字であるためハミング距離は3である。

                  • -

『世界を支えるすごい数学――CGから気候変動まで』

イアン・スチュアート/著、水谷淳/訳 河出書房新社 2022年発行

3章 ハトにバスを運転させよう より

自動運転車は安全か

世界中の自動車メーカーがその気になったら、運転手もハトもバスを運転しないような日がすぐにでもやって来るだろう。バスがバスを運転するのだ。世界は自動運転車のまったく新たな時代へと突入しようとしている。
あるいはそれは無理かもしれない。
自動運転をめぐる課題の中でももっとも難しいのは、周囲の状況を確実に正しく解釈することである。いまでは高解像度の小型カメラが何億台も製造されているので、自動運転車に独自の”目”を搭載するのはたやすい。しかし視覚には目だけでなく脳も必要なので、自動車やトラックやバスにはコンピュータ視覚ソフトウェアも搭載しなければならない。そうすれば、何が見えているかを判断し、それに応じて適切に反応できるはずだ。
自動車メーカーに言わせると、自動運転車の長所の1つは安全性だという。
    ・
コンピュータ視覚を支える技術の中でも自動運転にとってもっとも重要なのが、機械学習というさらに流行りの分野である。膨大な数の画像を使って深層学習ネットワークを訓練することで、画像を正しく特定できるよう結合強度を調整し、許容できるレベルの正確さを実現する。この手法は幅広い応用分野で大成功を収めている。しかい2013年、その成功ばかりが注目されすぎて欠点に目が向けられていなかったことが明らかになってきた。深刻な問題の1つが、人間は正しく認識できるのにコンピュータはとてつもなく間違えるよう意図的に手が加えられた画像、いわゆる”敵対的サンプル”である。
図はネコの2枚の画像である。見たとおりだ。違っているのは数ピクセルだけで、我々にはまったく同じに見える。ネコとネコ以外の膨大な画像で訓練した標準的なニューラルネットワークは、左の画像はネコと正しく特定する。ところが右の画像は、アボカドから作るメキシコの緑色のソース、ワカモレであると言い張る。それどころか、左の画像がネコである自信度を88%とするのに対し、右の画像がワカモレである自信度は99%とする。よく言うように、コンピュータは何百万もの間違いを超高速で犯していく装置なのだ。
この手の画像が”敵対的サンプル”と呼ばれるのは、システムを意図的に欺くために使えるからである。実際にはコンピュータは、これに似た画像の大部分をネコと認識するだろう。しかしクリスチャン・セゲディらが2013年にこのような敵対的な画像の存在に気づいた。そして2018年にアディ・シャミアらが、深層学習システムでこのような敵対的サンプルが生じうる理由、それが避けられない理由、そしてわずか数ピクセルを変えるだけでニューラルネットワークを惑わせられる理由を解明した。
このような重大な間違いに陥りかねない根本原因が、次元性である。2つのビット列が互いにどのくらい異なるかを数値化するのは、何ビットを置換すると一方からもう一方のビット列になるかを表す。ハミング距離というものが一般的に使われる。
    ・
シャミアらは市販の数字認識システムを使ってこの定理を検証してみた。カテゴリーは0から9までの数字に対応する10個である。彼らは数字の7の画像をわずか11ビット変えるだけで、このシステムに10個の数字のどれとも誤解させられるような敵対的サンプルを作ることができた。7以外のどの数字でも同じである。
憂慮すべき事態だろうか? 自動運転車が通常目にするような”自然な”画像は、意図的にシステムをだますようには作られてはいない。しかし1日50万枚ほどの画像を目にするし、たった1枚間違って解釈しただけで事故につながる。最大の懸念は、破壊者やテロリストが道路標識に黒か白のテープの小さい切れ端を貼るだけで、コンピュータが止まれの標識を最高時速100キロと誤って認識するよう仕向けられてしまうことだ。このようなことを踏まえると、危険な自動運転車が業界からの圧力で拙速に導入されようとしているという心配がますます深まってくる。納得いかない人にはいま一度言っておきたい。新薬や新たな治療法がこんなに杜撰(ずさん)な方法で導入されることはけっしてないはずだ。危険かもしれないと疑うれっきとした理由があるならなおさらだ。
バスにバスを運転させてはならない。

                  • -

どうでもいい、じじぃの日記。
AIの目は人間の目を超えたのだろうか。
大腸検査など画像診断では、人間が見過ごしてしまう小さながんなどはAIのほうが優れている。
2匹のネコを比べた場合、どこが違うかを判断する場合もAIのほうが優れているかもしれない。
ただ、ネコの毛が風に揺られて変化している場合、AIはその違いをネコの身体が違うと判断してしまうのではないか。
そういう点で、自動車運転で判断しなければならない情報は無限にあるような感じだ。
私は高齢者ドライバー、車の運転には気をつけましょう。