PEOPLE

未来をつくる人たち

“医療画像診断大国”日本を人工知能で支える診断支援システム【エルピクセル代表・島原佑基氏】|イベントレポート

2017.06.05 8:50

TEXT BY
長谷川リョー

TAGS

RHS2 ディープラーニング 人工知能(AI) 画像診断
  • シェア
  • このエントリーをはてなブックマークに追加

「AI×医療の”今”をつかみ”未来”をつくる」をテーマに2016年9月に行われた「Realtime Healthtech Seminar vol.2」。本記事では、島原佑基氏(エルピクセル株式会社 代表取締役)による「人工知能を活用した医療画像診断支援・再生医療と製薬研究」と題された講演の内容を再構成してお届けします。

ライフサイエンス領域における画像解析のパイオニアである「エルピクセル」の代表・島原氏が、日本だからこそ医療診断支援システムを開発する意義、機械学習よりも効率がよい「能動学習」、そしてディープラーニングを活用した医療診断支援ソフトウェアの今後の課題について語った。

ライフサイエンス領域における画像解析のパイオニア「エルピクセル」

今回は「人工知能を活用した医療画像診断支援」を中心としたお話をさせていただきます。まず我々の会社「エルピクセル」について簡単に説明させてください。

「エルピクセル」は研究室のメンバーで立ち上げた、いわゆる大学発ベンチャーです。細胞の培養、顕微鏡の開発、画像解析をワンストップで開発する珍しい研究室を出た会社です。

私自身はもともと「合成生物学」という遺伝子を組み替えて新しい生命を作るといった、生物工学に近いことをやっていました。この学問においてもシミュレーションや情報処理が必要になります。

その研究を通じて思ったのは、情報処理力の向上により確かに処理できる範囲は多くなった一方で、そこまで人間の遺伝子の理解は進んでいないということです。つまり、時代がもう少し先にならないと遺伝子工学や合成生物学は難しいのではないかと思いました。そこでより実用化が早く、生物研究者としての知見も活かしやすい画像解析をより深堀って研究してみることにしたんです。

弊社CTOである朽名夏麿は私の実質的な元指導教官であり、生物博士・研究者。バックボーンにバイオ系がありながらも、コンピュータ将棋で世界2位になったりと、情報学の専門性も併せ持っています。

「どういった技術で、差別化ポイントはなんですか?」といった質問を受けることも少なくないのですが、やや説明が難しいので、ここでは実績を一つだけ説明させてください。


(本記事内のスライド資料の権利はすべてエルピクセル株式会社に帰属)

ライフサイエンス研究における画像処理ソフトウェアのデファクトスタンダードになっている「ImageJ」というソフトウェアがあります。このソフトウェアにプラグインという形で、我々は研究者向けに画像処理ソフトウェアを提供しています。かなり幅広く解析メニューを用意しており、全世界で3万ダウンロード(うち海外が5割)されております。

こうしたものを作ってきたノウハウや技術を生かした事業展開をしようと考えていたのが、会社のスタートです。

良質かつ大量の医療画像がある日本だからこそやる意義がある

では、こうした研究や事業の背景についても説明させてください。

昨今、「ビッグデータ」という言葉を聞く機会が著しく増えていますが、画像の膨大化が進んでいます。たとえば皆さんが持っているスマートフォン。ガラケー時代と取れる画像のデータ量を比較すると、100〜1,000倍と増大しています。

こうした画像の膨大化は医療でも同じことが起きてます。医療現場ではCTやMRI、顕微鏡や内視鏡といったモダリティの進化によって解像度も上がりましたし、撮れる枚数も増えて、こちらにおいてもデータの膨大化が起きているのです。

医療画像を診断する「読影医」といった方々がいます。読影医の作業量はこの10年で3倍以上になってしまいました。そして問題になっているのは読影医の平均年齢が50歳を超えているということです。単純に考えると10年以内に定年を迎えてしまうので、この10年で代替診断手法を見つけないとまずいのではないかということが業界のコンセンサスになっています。

そして、さらに深刻なのは生体検査を行う病理医。日本には現在2,000名ほどしかいません。こちらも平均年齢が50歳を超えている状況で、画像診断医が全体として圧倒的に不足している状況になっています。向こう10年で何かしらの打開策を見つけなくてはなりません。

そうした医師をAIを活用したソフトウェアによって支援できないかということを考えています。それでも、「そもそも日本でやる意味があるのか?」という疑問の声があるかもしれません。医療機器のほとんどが輸入に頼っている現状があるからです。

それでも我々は、日本だからこそやるべきだと考えています。なぜなら日本は圧倒的な医療画像大国だからです。

人口100万人あたりの国別のCT、MRIの台数は圧倒的に世界一位。良くも悪くも日本には大量のCT、MRI機器があり、かつ良質な診断画像が多くあります。技術としての人工知能ももちろん大事なのですが、それと同様に質の良いデータ量も不可欠です。日本はその両方を併せ持っているので、国を代表する産業になるように盛り上げていきたいと考えています。

通常の機械学習よりも効率的な「能動学習」とは?

我々は最近の「AIブーム」に乗っかってやっているわけではなく、2006年から国立がん研究センターと地道に取り組んできました。2011年に特許を取得し、2012年に『Nature Communications』というジャーナルに発表した技術が「能動学習」です。

機械学習の若干特殊な学習をうまく使ったシステムになっています。いわゆる一般的な機械学習であれば、「これがガンである」ということをひたすら教え込ませていきます。それによって過去の傾向から分類をしていくようになります。

一方、能動学習もAとBの違いを最初に教え込ませるのですが、機械もAかBを迷う場面があります。この際に明らかに違うものは機械が分類し、迷うものだけこちらに聞いてくる。それをその都度ラーニングさせることで、機械学習よりも教師データ作成にかかるコストを大幅に削減することができました。コストは1/100でかつ、判定精度は向上しています。

今回は具体例として、脳動脈瘤の検出についてご紹介します。「脳動脈瘤」とは脳ドックなんかで見つかることのある疾患です。

こちらの画像をみてください。太くて白いのが動脈。こうした太い血管の形状に脳動脈瘤のコブがないかを検出する検査があります。コブは1mm、3mm、5mmと大きくなるにつれ破裂し、くも膜下出血を引き起こす恐れがあるため、なるべく小さいうちに見つけることが大切。1mmでも見逃さないという先生もいる一方で、人によっては精度にバラつきが出てしまうというのは先生方も認めているところです。

我々としては現在の診断ワークフローに乗せることで、診断支援することはできないかということを考えています。方法としては2D、3Dの画像に対して疑われる部分に色をつけるといったシンプルな支援の仕方。皆さんも使ったことがあるであろう文書作成ツールのwordでは、ミススペルを自動で検出してくれますが、その医療版だと思っていただければいいかもしれません。

こういうものがあるだけでも「ありがたい」というお言葉を先生方からもいただいています。先生方は1日に大量の画像を診断しないといけないということで、見逃しを極力減らすことが可能になります。現在は、実際に研究目的のもと、このシステムを現場で使っていただいています。

使用している技術の全体像について話すと膨大になってしまうので、ここではその一部について概略をお話させていただきます。

まず重要なのは画像の前処理を必ず挟むことです。世の中では、「ディープラーニングにとりあえずデータを食わせれば、何かが出るのでは」といった誤解があります。そんなに簡単にはいかないのが実情です。

猫を認識する程度であれば大量の画像を読み込ませればいいのですが、医療の場合は春田さんもおっしゃったように、そもそもデータセットが整備されていないことが多々あります。

普段診断で忙しい先生方にその辺りのご協力をいただきながらやらなければいけないということで、闇雲にデータを食わせればなんとかなる世界ではないと言えます。テーマにもよりますが、最高精度のソフトウェアを開発しようとすれば、データセット作成、データの前処理に関してはしっかりと取り組む必要があるということは強調しておきたいところです。

ディープラーニングを用いた診断支援ソフトウェアの今後の課題

今後の技術的な課題は、やはりデータ量を増やすということになるかと思います。基本的にデータセットが増えれば増えるほど精度は上がっていきます。オペレーションをする中で、自動でデータセットが蓄積されていく仕組みを今作っているところです。

二つ目の課題は、症例数の限られているものでも有効な前処理や学習方法で研究開発を行うということ。もちろん技術は日々進歩していますので、論文をキャッチアップするのも大切ですが、論文になる前の情報をいかにキャッチするのかも大事です。そのため我々は積極的に情報をシェアしながら、追っています。

ここまでディープラーニングの話を進めてきたものの、我々はディープラーニングそのものにこだわっている会社というわけではなく、いかに精度の良いソフトウェアを作るかということが一番の関心事です。ディープラーニングの活用をはじめ、有用な技術を組み合わせて最高性能のソフトウェアを作っていく。

先ほど説明した「能動学習」も実はディープラーニングと競合する技術でなく、高め合う技術です。今後もスピード感を持って診断支援のソフトウェアを開発していきます。

ソフトウェアが医療機器として承認が取れるようになりましたが、今のところディープラーニングを活用したソフトウェアが承認された事例は世界中でもほとんどありません。我々が提供しているような診断支援ソフトウェアの承認のためには新しいロジックが必要になりますので、この辺りは行政を中心にご苦労されている点かと思います。

誤解を受けることがありますが、我々は自動診断ソフトウェアを作っているわけではなく、「診断支援ソフトウェア」を作っています。最後の診断は自分が責任を持つという意識を持つ先生が少なくとも私も周りでは100%です。そういった責任感の強い先生方に対してこうした支援をすることがまずは最初のステップではないかと考えています。

  • シェア
  • このエントリーをはてなブックマークに追加

島原 佑基Yuki Shimabara

エルピクセル株式会社
代表取締役

東京大学大学院修士(生命科学)。大学ではMITで行われる合成生物学の大会iGEMに出場(銅賞)。研究テーマは人工光合成、のちに細胞小器官の画像解析とシミュレーション。グリー(株)に入社し、事業戦略本部、のちに人事戦略部門に従事。KLab(株)では海外事業開発部にて米・アジア各社との業務提携契約を締結。2014年3月にエルピクセル(株)創業。「始動 Next Innovator 2015(経済産業省)」シリコンバレー派遣選抜メンバー。