じじぃの「科学・地球_206_スパコン富岳後の日本・がんゲノム医療」

社会課題の解決に貢献するスーパーコンピュータ「富岳」

動画 YouTube
https://www.youtube.com/watch?v=e5VpPgu8Wkg

HPCIフォーラム|スーパーコンピュータ「富岳」への期待

2021年度からの共用開始前に、試験的に「富岳」を使って社会的・科学的に重要な研究を行う課題です。
文部科学省により選ばれた、シミュレーションとAIやデータサイエンス、災害対策等を組み合わせた課題の概要をご紹介します。
https://fugaku100kei.jp/events/20210309/exhibit.html

中公新書ラクレ 「スパコン富岳」後の日本――科学技術立国は復活できるか

小林雅一(著)
はじめに――日本の科学技術が世界を再びリードする日
第1章 富岳(Fugaku)世界No.1の衝撃
第2章 AI半導体とハイテク・ジャパン復活の好機
第3章 富岳をどう活用して成果を出すか――新型コロナ対策、がんゲノム医療、宇宙シミュレーション
第4章 米中ハイテク覇権争いと日本――エクサ・スケールをめぐる熾烈な国際競争
第5章 ネクスト・ステージ:量子コンピュータ 日本の実力

                  • -

『「スパコン富岳」後の日本ー科学技術立国は復活できるか』

小林雅一/著 中公新書ラクレ 2021年発行

第3章 富岳をどう活用して成果を出すか――新型コロナ対策、がんゲノム医療、宇宙シミュレーション より

先端科学の最前線を訪ねる

TOP500などで他を寄せ付けない圧倒的強さを見せる富岳だが、理研をはじめ関係者は開発プロジェクトの当初から「ベンチマークで1位になることが目標ではない」と言い続けてきた。むしろ「実用性を重視し、本当に社会の役に立つスパコンを作りたい」と。
その強い思いは実際の運用体制に現れている。富岳の本格利用が始まるのは2021年だが、既に20年前から前倒しでさまざまな分野への活用が始まっている。本章では、この富岳を駆使して先端科学の最前線で活躍する3名の研究者へのインタビューを取り上げる。
最初はコロナ対策への活用だ。理研は富岳を使い、ウイルスの飛沫感染シミュレーションを実地。これにより各種マスクの有効性や、電車・タクシー・航空機や劇場など公共施設における感染リスクなどを検証した。
これと並んで、コロナ治療薬の候補を富岳で探索する試みも大きな期待を集めている。これは「創薬シミュレーション」と呼ばれ、その第一人者である京都大学の奥野恭史教授らを中心に進められている。2020年7月にはわずか3ヵ月で数十種類候補物質を特定できたという。
コロナ治療薬などの開発で富岳が果たす役割、コスト削減などのメリット、ここまでの成果、さらに巨費を投じた国家プロジェクトの意義など、広範囲にわたって奥野教授から取材した。
一方、東京医科歯科大学・M&Dデータ科学センター・センター長の宮野悟教授は、「がんゲノム医療」のパイオニアとして、富岳を使い患者の全ゲノム解析にかかる時間を劇的に短縮。その一方で、コロナに感染した患者が重症化する原因も探している。
最期に神戸大学大学院・理学研究科の牧野淳一郎教授は、「シミュレーション天文学」の第一人者として「宇宙の大規模構造」や「銀河の衝突」などのメカニズムを富岳で解明しようとしている。
宮野、牧野両教授とも専門とする研究の傍ら、スパコンを自主開発できるほど、この分野に通じており、その力量を買われて富岳のコデザイン(共同設計)推進チームにも加わっていた。卓越した科学者であると同時にスパコンのエキスパートでもある両教授から、これからの科学研究で富岳が果たす役割などについて話を聞いた。またスパコンの利用実態や巨額の開発費などについても率直な見解を得た。
コロナのような喫緊の問題からゲノムや宇宙論など深遠かつ壮大なテーマまで、富岳がどのように活用され、私たちの社会や科学に貢献するのかを見ていこう。

がん患者の命を救う全ゲノム解析とAI――富岳で劇的スピードアップ

宮野悟(東京医科歯科大学・M&Dデータ科学センター センター長)

――これまで、がんゲノム医療にスパコンやAIはどのように使われてきたのでしょうか。

ヒトのゲノム(DNAに記された全遺伝情報)は本来、G、A、C、Tの塩基(文字)が何億、何十億と連なった長大な文字列です。が、ゲノムの「シーケンサー(読み取り装置)」から出力される文字列は各々100~150文字くらいの断片なんです。ちょうど長い文章をシュレッダーにかけたようなものですね。それらをつなぎ合わせて、元のDNAの文字列を復元するジグソーパズル解きのような作業にスパコンを使ってきました。
    ・
「困った、どうしようか」と世界中を聞いて回ると、IBMの「ワトソン(Watson for Genomics)」というAIがあることを知りました。このAIにがん患者のゲノム情報を入力すると、それについてのレビュー(科学的評価)をしてくれる、というのです。
ワトソンは、世界中のがんに関する文献や治験情報、薬の特許情報などにもとづいて、どの遺伝子変異がこの患者のがんの原因になっているかを推定し、可能性の高い順番にランキングする。そればかりか、「この変異には、現在治験中のこの薬が効きそうだ」ということを専門医に説明し理解できるように教えてくれます。
「これを我々も導入して使おう」と決めた時には、藁にもすがる思いでした。なぜなら(胃がんや肺がん、大腸がんなど)固形がんで全ゲノムのシーケンスをすると、数百万ヵ所もの遺伝子変異が検出されるからです。白血病のような血液がんの場合でも1万弱です。とても入手に頼っていたのでは対処できません。

――そこでワトソンを導入したわけですね。16年、宮野先生をはじめ東大医科学研究所の医療チームが、このワトソンを使って「血液がんに侵され、死を覚悟した女性」の命を救って、大きなニュースになりました。現在、スパコンやAIの活用で、何人くらいの患者さんが救われているのでしょうか。

現時点の正確な数字はわかりませんが、最初の15~16年にかけての1年間では200人くらいでしょうか。これはゲノム・シーケンスとAI解析で治療方針を検討した患者さん全体の約2割に当たります。ただ「病気が完治した」という事例だけでなく、「症状の悪化を食い止めた」というケースも含めてですが。

――ワトソン以外にも、「ディープテンソル」という別種のAIも使われていると聞きましたが。

ディープテンソルはここ数年のAIブームで特に注目されたディープラーニングという技術にもとづいて富士通研究所が開発しました。学習機能を備えていて、主にネットワーク解析に使われます。
我々の研究チームはディープテンソルで、転移がんを引き起こす遺伝子変異をがん細胞のネットワークから推定しようとしています。ただ、これは非常に時間のかかる作業で、「SHIROKANE」(宮野氏が東京大学・ヒトゲノム解析センター在籍中に共同開発したデータ解析に最適化されたスパコン)を使うと2ヵ月半はかかります。

――それを富岳でやれば、かなり時間を短縮できますか。

おそらく20分くらいで終わるでしょう。しかも我々が富士通研究所と共同で加えた改良によって、ディープテンソルはがんの転移メカニズムの一端も説明できるようになりました。また治療薬の研究にも応用できると思います。同じがんの患者さんでも、特定の抗がん剤が効いたり効かなかったりしますよね。その理由を探せるようになるでしょう。

――我々素人から見ると、アマゾンのクラウド・サーブスとスパコンはまったく別物に思えるのですが、第一線の研究者にとって両者はほぼ同じ位置付けにあるのですが。

そうです。ただし「データを転送したり、解析したものをダウンロードするネットワークの負荷を無視すれば」という条件付きですが。要はスパコンと言っても多数のチップ(CPUやGPUなど)をネットワーク背続した点では、アマゾンのクラウド・サービスと同じです。
ただしチップの種類は違いますね。アマゾンのクラウドは、インテル製のCPUやエヌビディア性のGPUなどを多数つないでクラスター(集団)化したものでしょう。これに対し富岳は、(電力効率に優れた)ARMアーキテクチャのCPUを搭載したもので、非常に省電力で動くようになりました。

――話は変わりますが、日本でも19年に「がんゲノム医療」が始まりました。しかし、それはいわゆる「遺伝子パネル検査」と呼ばれるものです。この検査では、患者のゲノムの中からせいぜい数百種類の遺伝子をチェックしているだけですね。

多くて数百種類です。

――これに対し宮野先生は「ゲノムの全シーケンスでやるべきだ」と主張されていますね。

最初から、そう言い続けています。そもそも厚労省に「がん患者のゲノムを調べ、そのデータにもとづいて治療方針を決める医療を作りませんか」ともちかけたのは私です。でも結果的には、患者のゲノムではなく、限られた数の遺伝子だけをチェックする「遺伝子パネル検査」になってしまいました。

――それはコストが一番の理由ですか。

厚労省の官僚に話を聞くと、「(全シーケンスによって)治療標的にならない箇所の情報を得るということでは薬事承認が得られそうもない。だから(各種のがんを引き起こす)新たな遺伝子変異や治療法が見つかる都度、そのパネルにどんどん追加していけばいいんじゃないか」と。これが厚労省の立場ですね。それはそれで私はいいと思いました。とにかく、ゲノム医療のスタート・ボタンを押しただけでも日本にとって大きな進歩と見るべきです。

――そこで富岳のようなトップクラスのスパコンはどんな役割を果たすのでしょうか。

臨床ではなくあくまで最先端の研究に使われると私は見ています。ただ、最先端のスパコン開発は正直、ベンチマーク・テストで一番になるのが目的であるように思えてなりません。たとえば京の時には、今のような「大規模データ解析とAIが使えるようにする」といった用途を想定して開発されませんでした。
実は富岳プロジェクトも開始時点ではそうでした。これに対し私たちコデザイン推進チームは「がんゲノム・シーケンスのような大規模なデータ解析さらにAIをやれるコンピュータにしないと(研究の現場で)使えないよ」と強く訴えました。
コデザインというのは「どんなアプリをどの程度のパフォーマンスで走らないのか。そのためにはどんなハードウェア、基本ソフト、ファイルシステムが必要か」ということを検討するチームです。5年間で100回以上のミーティングを重ねて、京のボトルネックや弱点を洗い出し、富岳の開発に反映させることができました。