行政システム株式会社

Topics vol.4 ChatGPTがやってきた。シンギュラリティも間近か?

 今年に入ってからChatGPTに関する話題が絶えない。公開後たった5日間でユーザ数が100万人を突破するという驚異的な普及を見せ、日本の国会ではChatGPTで生成した質問を首相に投げかけ、首相の答弁とChatGPTが生成した答弁を比較するというパフォーマンスまで見られた。

 ChatGPTを使ってみた体験から、シンギュラリティ(機械が人間の知性を超える特異点)も間近ではないかと興奮する人がいる一方、嘘やデタラメを吐き出すとんでもない代物だと反発する人もいる。新技術が登場する場面では、それに期待を寄せる人と恐怖を感じて拒絶する人が出てくるのは世の常である。

 しかし、今回は様相が少し異なる。ビル・ゲイツやスティーブ・ウォズニアック[efn_note]スティーブ・ジョブズとともにAppleを創業した技術者。[/efn_note]など技術知識がある人々までが警鐘を鳴らし、OpenAIのCEOであるサム・アルトマンは米議会の公聴会で「政府による規制介入が重要」だと発言した。通常であれば、「民間の自主規制に任せ、政府は余計な介入をするな」と言うところだ。

 考えてみると、ChatGPTの開発経緯においては不思議なところがある。まず、誰もシンギュラリティを超えようなどとは考えていなかった。自然言語処理、つまり自動翻訳を実現するために深層学習を利用したのが始まりだ。そして文章を理解する上では単語の順番が大きな意味を持つため、再帰型モデル(RNN:Recurrent Neural Network)が採用された。

 しかし、長期記憶や処理性能の問題が立ちはだかり、これを解決するためAttentionというアイデアが提案され、このAttentionを主体としたモデルへと変わっていく。誰か1人の天才が画期的な発明をしたというわけでもない。自動翻訳のために、多くの研究者・技術者が改善アイデアを提案・実装しながらシステムを進化させていったのである。

 このAttention機構を持つものがTransformerであり、エンコーダ・デコーダという自動翻訳のモデルは引き継いでいた。GPT(Generative Pretrained Transformer)とはこのデコーダ部分(エンコーダから引き継いだ意味ベクトルと出力した単語を入力として次単語を予測する)のみを使って学習させたものである。

 ただ、デコーダ部分を切り出して次単語予測のシステムを構築しようとしても、深層学習の常として教師データの作成が大きな壁となる。しかし、GPTの場合は人間が作成した文章があればそのまま教師データとして使える。次単語をマスキングしながら学習を重ねていけばよいからだ。また、パラメタを増やすほど、学習すればするほど精度が上がることもわかってきた。GPTのパラメタ数は約1億、GPT-2は約15億、ChatGPTで使われているGPT-3は1,750億。GPT-4は仕様が未公開だが2,000億から1兆と言われている。

 このようにAIが独り歩きしていくと、どこまで行くことになるのだろうか。コンピュータは人間と異なり身体を持っていない。だから身体的な感覚に基づく常識や物理的な常識を持っておらず、これまでのAI研究ではこのような常識をどのように組み込むかが課題であった。しかし不思議なことに、ChatGPTの場合は身体が無いにも関わらず、身体的・物理的常識も獲得しているように見えるのだ。

 このように考えてみると、「ChatGPTが人間の知性を超えるのか」という問いがいかに不毛であるかに気付かされる。逆に「人間の知性とは何か」を我々に問いかける。知性があるのかどうか、それは受け取る人間がどのように判断するかによる。果たして皆さん方は、この文章を読んで知性があると感じただろうか。もし感じなかったら、私は人間ではないのだろうか。

トピックス一覧へ戻る