ページの本文へ

Hitachi
お問い合わせお問い合わせ

株式会社日立医薬情報ソリューションズ

Column

デジタル こぼれ話

「医薬」よもやまばなし

2024年04月10日

デジタルヘルスに限らず、医療・製薬の世界でもインパクトのある「AI(人工知能)」ですが、AIの進展はコンピュータと大きく関わっています。
今回は、医療・製薬の世界にも関係する「AI(人工知能)」とコンピュータについて簡単に少しだけ見てみることにしましょう。

コンピュータ(電子計算機)の進展

計算機という点では、「アンティキティラ島の機械」が現在確認できる最古の歯車式計算機とされています。紀元前2世紀頃の古代ギリシア時代に天体運航の計算のために作られたとされています。
17世紀頃から種々の機械式計算機が作られましたが、現代のコンピュータに通じるデジタル式で電子回路を採用したものは20世紀に入ってからです。

アラン・チューリングは1936年の論文で「チューリングマシン」を提示しました。これは、アルゴリズムを表現し、これを解釈して実行するという、コンピュータの概念を定式化したものです。その後、チューリングは、ドイツの暗号機「エニグマ("謎"の意)」に対する暗号解読機を製作していて、これはナチス・ドイツを敗北に導いたものと評価されています。
余談ですが、イギリスの作曲家エルガー(「威風堂々」の作曲者でもある)の作品に「エニグマ変奏曲」というのがあります。・・閑話休題・・

コンピュータの動作原理である「プログラム内蔵方式」は、1945年にジョン・フォン・ノイマンによって提唱され、その方式は「ノイマン型コンピュータ」と言われます。これはハードウェアとソフトウェアを分離し、ソフトを入れ換えることで同じハードを多目的に使えるようにするものです。今となっては当たり前のことのようですが、これは画期的な概念でした。
ノイマンはコンピュータに関する特許を主張することなく全て公開し、科学の進展を何より重視したとされます。
1946年、真空管を使って演算処理をするデジタル計算機ENIACが作成され、これが一般に広く知られた初の汎用コンピュータとなりました。

尚、数値表現に用いられる二進法の数理は、1698年に数学者ライプニッツが確立したものです。また、コンピュータ科学の基礎的な理論の一つであるブール代数は、1854年に数学者ジョージ・ブールが発見したものです。

論理回路(ブール論理に対応する電子回路)を制御する論理素子としては、20世紀初頭にフレミングが発明した真空管、ベル研のショックレーらが発明したトランジスタ、テキサスインスツルメンツのキルビー並びにフェアチャイルドセミコンダクターのロバート・ノイスが発明したIC(集積回路)、そしてその集積度を上げたLSI(大規模集積回路)と進展し、CPU(中央処理装置:制御装置と演算装置)だけでなく、メモリ(高速な主記憶装置と大容量の補助記憶装置)、IO(入出力)装置も含めた技術革新に伴って、コンピュータの小型化・低消費電力化・高速化が実現することになりました。
また、量子力学の原理を応用して、計算速度の飛躍的向上が期待される「量子コンピュータ」の研究も進められています。

「AI」とは何か

「人工知能(AI:Artificial Intelligence)」は、明確な定義はないものの、人のような知能を人工的にコンピュータといった機械で再現したものを指します。
「人工知能」という言葉が初めて使われたのは、1956年のダートマス会議と言われています。後のAI研究の大家となるジョン・マッカーシーやマービン・ミンスキーが中心となり、「学習や知能の特徴は機械でシミュレートできる形式に記述可能である」という主張がなされました。

1950年代後半から1960年代にかけて起こった第一次AIブームでは、探索・推論によって問題を解いていくものでした。当時としては画期的ではあったものの、ルールや設定が決まりきった迷路やパズルゲームなどのトイ・プロブレム(おもちゃの問題)と呼ばれる問題しか解けない、つまり現実の問題を解けないという課題により、第一次ブームは下火になりました。

1980年代の第二次AIブームでは、「エキスパートシステム」が隆盛でした。知識を論理ルールとして蓄積することで、特定領域の問題を解くものです。初期の例としては、質量分析データから有機化合物を同定するDENDRALや、Q&A内容から感染細菌を特定して抗生物質を提案するMYCINがあります。ここでは知識表現の研究が進みましたが、人間が整理・蓄積する知識には限界がありました。

2000年代からの第三次AIブームは、「機械学習」がキーです。機械学習は、AIのプログラム自身が学習する(知識を習得する)仕組みです。知識を人間が整理して蓄積する必要があったエキスパートシステムとは大きく異なります。
特に近年大量のデータが集積されるようになり、これを学習に利用できるようになったことが、機械学習の実用化に繋がったという面もあります。
ベースとなるニューラルネットワークは、脳の神経細胞の働きをコンピュータ上のプログラムで再現しようとするものです。
そして2010年代から脚光を浴びたのが、ニューラルネットワークを発展させた深層学習(ディープラーニング)です。深層学習は機械学習の一つです。この進展により、AIが実用的な技術として広く応用されるようになっています。
ディープラーニングは当初、将棋や囲碁で人間との対決で勝利したということでも注目されましたが、言語処理、文字・音声・画像認識や推論・予測は大きく進展して、多くの領域に適用されています。自動運転にも応用されています。

そして、2023年から急速に話題に上るようになったのが「生成AI」です。認識・識別タスクに加えて、データを作り出す生成タスクが可能で、ディープラーニングの技術が使われています。第四次AIブームとも言えそうな勢いです。
テキスト生成AIは、指示文を与えることで、新しいコンテンツやアイデアを作成できるAIの一種です。
ベースになっているのは、大規模言語モデル(LLM:Large Language Models)という技術です。大量のテキストデータを使って学習された自然言語処理の深層学習モデルで、単語間の関係付けを言語能力に転嫁しており、自然な文章を生成することができます。指示文に合わせたテキストを生成し、対話もできます。
画像生成AIにおいても、画像の内容と単語を結び付け(ここもAIで自動生成)、これを学習に使用します。指示文の内容から作る画像の特徴を決めて、これに合わせた画像になるように再構成することで新しい画像を生成します。
音声や動画に対する生成AIも実用化されてきています。
こうした生成AIでは、特別なプログラミングを必要とせず、自然言語(指示文)で使えることが強みになって普及しています。

AIの現在地と未来

特定の領域・用途に限定して機能を発揮するAIを「特化型AI」と言います。
将棋・囲碁AIはもちろん、医療画像の読影支援や自動運転といったものも特化型です。現在実用化されているものは、ほぼこの特化型に相当します。

これに対して、人間の知的作業を広範に理解・学習・実行できるAIを「汎用AI」と言います。
生成AIのChatGPTは文章を扱うことに関しては、かなり汎用性があるといえます。
その観点からは、生成AIはこれまでの特化型AIに比べると、汎用AIに近づいていると言えそうです。

AIの能力判定方法として「チューリングテスト」というのがあります。人と機械(AI)が文字を使って会話をし、会話相手が機械であることを人が見破れなければ、その機械は人と同等の知能を持つとみなすというものです。この基準でいえば、人と同等の会話は成立できているようにみえます。

生成AIに関しては、生成物及び学習データのいずれについても著作権の問題が完全には解決されていません。同様にプライバシーにも配慮が必要です。また学習データの偏りによる偏見などのバイアスが生じることもありえます。
そして、生成ロジックを人間が容易に解釈・制御できないブラックボックスの状態になっていることも課題です。
出力される情報は学習データの質・量、対象とする領域・範囲といったことに依存しますので、その真偽・正確性は保証されたものとは言い切れません。つまり、まことしやかな嘘をつくことがあるということです。しかも自然な表現なので、一見して見破ることが難しいケースもあります。
提示される情報を理解・解釈するのは人間に委ねられていることを認識した上で利用する必要があるのです。

技術革新に対して社会は変化しつつ発展してきた過去はあるものの、こうしたAIの能力の全貌や社会的影響も未知です。革新的な新技術には、恩恵も脅威もあります。
人間の脳と同レベルのAIが誕生する技術的特異点「シンギュラリティ」は訪れるのか・・今後の動向を注視していきましょう。



私たちの健康に大きな役割を担う医薬品、そして医療・ヘルスケア。
そうしたQOL(Quality Of Life)産業界全般にわたって、そのプロセスや情報を支えるITを介して、
日立医薬情報ソリューションズは人々の健康・QOL向上に貢献していきます。


2024年4月10日
吉田 亜登美

Contact Us