PR

AIと考える「AI用語の基礎知識」基本編

AIと考える「AI用語の基礎知識」基本編 デジタル
ソルティ
ソルティ

AIには固有の専門用語がたくさんありますよね?

AI
AI

一般的にあまり意味が浸透していないAI関連の用語は、確かにあります。

私が現在までに50種類を超えるAI関連の記事を執筆してきましたが、ある日記事で用いているAI専門用語があまりにも多くなっていることに気がつきました。これは自分で記事を見直しているうちに感じたことです。

AIと図書館のイメージ
Grokによるイメージ画像

本サイトの主な目的は、学術的にAIを解説するのではなく、幅広い読者の方へ響くように「AIの利用例や可能性」を考えていくことなので、難しい言い回しは極力避けたいのですが、必要な専門用語を避けて通ることはできません。

そこで今回は、AI関連の話題を取り上げていく上で「避けて通ることができない」専門用語を厳選してピックアップし、当のAI本人にその意味や用途などをやさしく解説してもらいながら、皆様にご紹介していこうと思います。

ソルティ
ソルティ

それでは早速見ていきましょう!

AIがやさしく解説する「AI用語の基礎知識」基本編

スポンサーリンク

AI関連の記事に登場する基礎的な用語

プロンプト (Prompt)

AI
AI

「プロンプト」とは、AIに対して指示や質問を与える入力文やコマンドのことです。

AIはユーザーから送られてくる「プロンプト」を元に、回答や生成物を作り出しています。人間同士でも相手と対話を行う際に、こちらから発する「言葉」が必要なのと同じ原理で、プロンプトはユーザー自身の言葉とも言えます。

プロンプトのイメージ画像
Grokによるイメージ画像

ChatGPT・Grok・Geminiなどの対話型AIや、イメージを作成してくれる画像生成AIは、このプロンプトの内容次第で出力結果が大きく変わってきます。適切なプロンプトを考えることは「AI対話の技術」と言えるでしょう。

AIから「より良い出力」を引き出すために重要なのは、「具体的に書く」「文脈を明確にする」「実験を繰り返す」の3点だとAI自身は主張します。私も今後は、この部分を意識しながらAIと対話することを心がけようと思います。

ソルティ
ソルティ

聞き方次第で帰ってくる結果が大きく変わる点が、AIの面白さですね。

シングルモーダルAI(Single Modal AI)

AI
AI

「シングルモーダルAI」とは、1つのデータタイプ、例えば画像・テキスト・音声のいずれか1つを扱うAIモデルを指している言葉です。

単一の機能に特化したAIモデルのことを、「シングルモーダルAI」と呼びます。画像と音声、自然言語処理や物体検出、予測モデルの分野などで主に活躍しているAIで、我々の身近にも利用例や活用例が数多く存在します。

シングルモーダルAIのイメージ画像
Grokによるイメージ画像

シングルモーダルAIは、単一の「データモダリティ(画像・音声・テキストなど)」機能に特化することで、特化型ゆえに高い精度と効率性を実現しているAIモデルと言えます。後述する「マルチモーダルAI」とは異なるAIモデルです。

なお「モダリティ」とは、言語学や哲学、論理学などで広く使われている概念で、認識や表現の様式・方法を指す言葉です。モダリティとモーダルは「異なる領域や文脈」で使われる言葉だと覚えておくと良いでしょう。

シングルモーダルAIの活用事例

例えばAmazonのアレクサなどの「スマートスピーカー」や、アプリで活躍している翻訳ツール、AI自動運転車両における歩行者や信号の検知、天気予報や在庫管理システムなどは、シングルモーダルAIの活用事例です。

スマートスピーカーのイメージ画像
Grokによるイメージ画像

ソーシャルメディア上にあるユーザーのコメントやレビューの「感情分析」を行っているのもシングルモーダルAIで、この仕組みは、運営者が特定の投稿をポジティブかネガティブか判断する際に活用されています。

シングルモーダルAIの普及が世界的な認知度と需要を生み出した後、AIは企業や研究機関の開発努力によって、複数のモダリティを同時に処理できる段階へと進化を遂げることになります。それが「マルチモーダルAI」です。

ソルティ
ソルティ

シングルモーダルAIは、今や日常の様々な場面で活躍するAIモデルですね。

マルチモーダルAI(Multi Modal AI)

AI
AI

「マルチモーダルAI」とは、複数のデータタイプ(画像とテキスト、音声とテキストなど)を同時に処理・統合するAIモデルを指す言葉です。

異なるシングルモーダルAI機能を同時に扱えるAIモデルを、「マルチモーダルAI」と呼びます。このAIモデルは異なるデータタイプを統合的に理解し、関連付けながら分析・出力できる能力を備えている点が大きな特徴です。

マルチモーダルAIのイメージ画像
Grokによるイメージ画像

マルチモーダルAIの仕組みについては当サイトの別記事に詳しいので、こちらも併せてご参照ください。例えて表現すれば、素材を見て考えながら料理を生み出していくメカニズムを持っているのが、マルチモーダルAIと言えます。

従来のシングルモーダルAIでは出来なかった「複数のモダリティを同時に処理しながら考えて出力する」という一連の動作は、近年の「計算処理技術の高速化」によって達成できたAIの画期的な進化例と言えるでしょう。

マルチモーダルAIの活用事例

例えば、ユーザーが画像を送信して「これが何か教えて」と尋ねると、それを音声とテキストで解説・説明してくれるSiriやGoogleアシスタントは、このマルチモーダルAIに分類されるAIモデルです。

ECサイトのイメージ画像
Grokによるイメージ画像

ユーザーから提供された画像を元に「同じ商品」を探し、サイトに掲載されている価格や購入者のレビュー(テキスト形式)をまとめて提供してくれるGoogleレンズも、マルチモーダルAIモデルの活用事例と言えるでしょう。

利用時にシングルとマルチの違いを感じることはおそらく少ないでしょうが、AIが画像を見ながらテキストも同時に判読し、その情報を自分で処理してまとめながらユーザーに回答を出すというのは、実はすごい技術なのです。

ソルティ
ソルティ

複雑な処理過程を実現したAIモデルが、マルチモーダルAIなのですね。

ニューラルネットワーク(Neural Network)

AI
AI

「ニューラルネットワーク」は、人工知能(AI)の中核を成す技術を表す言葉で、人間の「脳神経回路」を模倣した構造を持っているモデルです。

生物学的なインスピレーションから始まり、数学的・計算機科学的な手法の進化と共に形成されていったのが、「ニューラルネットワーク」技術です。AIが言及しているように、これは人間の「脳神経回路」を模倣しています。

ニューラルネットワークのイメージ画像
Grokによるイメージ画像

ニューラルネットワークは、「学習」を通じて自身のパラメーターを調整しながら、タスクに最適化されていく特性を持っています。シングルモーダルAIとマルチモーダルAIの両方に共通している技術基盤です。

その仕組みはかなり複雑なのですが、単純化して説明すると、ニューラルネットワークは各種のデータを「特徴(重み)付け」しながら学習して、活性化関数で調整や処理を行いながら、最終出力層で結果を生成しています。

ソルティ
ソルティ

脳神経回路を模倣した技術が、賢いAIを生み出すことに成功したのですね。

機械学習(Machine Learning)

AI
AI

「機械学習」とは、AIが誰かから明示的にプログラムされることなく、自身の経験やデータから自律的に学習を行なっていく仕組みです。

生成AI関連の記事やニュースでよく目にする「機械学習 (マシン・ラーニング)」は、AIが「データそのもの」から自分でルールやパターンを見つけ出す技術を指す言葉で、その機能進化は現在進行形で続いています。

機械学習のイメージ画像
Grokによるイメージ画像

AIの機械学習は、「教師あり」「教師なし」「強化学習」という3種類に分類されます。そして、前述のニューラルネットワークを深層化した機械学習の進化系は、「ディープラーニング」と呼ばれます。ちょっとややこしいですね。

「機械学習」というのは、AIの学習方法を示す大きな括りの専門用語で、その機械学習の技術を「より進化させたもの」は「ディープラーニング」と呼ばれている、と覚えておくと、使い分けがしやすいでしょう。

AI
AI

ディープラーニングの登場は、機械学習のレベルを大幅に上げました。

ソルティ
ソルティ

自分で学習しながら賢さをアップさせていく仕組みが面白いです。

エッジAI (Edge AI)

AI
AI

「エッジAI」とは、デバイス自体でAI処理を行う技術を指す言葉です。

スマートフォンやカメラ、IoTデバイスなどで直接AIの処理が行われることを「エッジAI」と呼びます。インターネット接続を行わず、デバイス単体でAIタスクを処理できる点が特徴の技術です。

エッジAIのイメージ画像
Grokによるイメージ画像

エッジAIは、動作時にインターネット回線を一切介さない仕様となっているため、プライバシー保護に優れており、また即時性も高く、スマホの顔認証や自動運転のセンサーなどに用いられています。

名前の由来

ちなみにこの用語に使われている「エッジ (Edge)」という名称は、ネットワークアーキテクチャにおけるデータ処理の場所を表す「エッジ(端)」という概念から来ていると、AIは教えてくれました。

ネットワーク全体を「中央(クラウド)」から見たとき、デバイスやセンサーのある場所が「端=エッジ」に位置する、という概念が名前の由来です。末端で利用するAI技術がエッジAIだと覚えておきましょう。

ソルティ
ソルティ

デバイスは処理の末端にあたるので、「エッジ」と呼んでいるのですね。

クラウドAI(Cloud AI)

AI
AI

「クラウドAI」は、リモートサーバー上でAI処理を行う技術を指す言葉です。

エッジAIとは対照的に、デバイスから送信されたデータを「クラウド上」で処理しながら、その計算結果をインターネット経由で返す仕組みは「クラウドAI」と呼ばれます。大規模な計算や複雑なAIモデルの利用に適した技術です。

クラウドAIのイメージ画像
Grokによるイメージ画像

例として、ChatGPT-4や画像生成AI、音声アシスタントAIなどにはクラウドAI技術が活用されており、エッジAIだけでは処理できない「複雑なタスク」の実行を行いたい場合に、その効果を発揮してくれます。

クラウドAIを利用する場合には、必ずデータの送信と保存が必要になるため、「プライバシー面の保護と対策」が必要になるという点、そして「インターネット接続に由来する遅延」が、この技術最大のネックと言えるでしょう。

両方を活用できる「ハイブリッド方式」

スマートフォン向けの翻訳アプリ、そしてAppleが発表したAI「Apple Intelligence」は、これらのエッジAIとクラウドAIを必要に応じて「適宜使い分ける」特性を持っています。これらは「ハイブリッド方式」の技術です。

ハイブリッド方式のイメージ画像
Grokによるイメージ画像

ユーザーが求めるタスクがエッジAIだけで処理できる場合、極力そこで計算を完了させて出力するようにして、複雑で高度な計算が必要になる場合には、クラウドAI(インターネット)へ接続してタスク処理を行うのがハイブリッド方式です。

今後はエッジAIの基幹となるデバイス本体の半導体性能が上昇することが見込まれ、さらに5G以上の「高速な通信技術」も普及していく可能性も高いため、このハイブリッド方式は、ますます注目されていくことでしょう。

ソルティ
ソルティ

プライバシーを最大限に保護しながらAIを利用できるスタイルが良いですね。

基礎編まとめ

今回の記事を執筆するにあたって、今まで何となく意味を理解していたつもりの用語の数々をピックアップしてみましたが、改めてAI自身の口から詳細に内容を解説してもらったことで、個人的に様々な発見がありました。

ロボットのイメージ画像
Grokによるイメージ画像

今までは「分かったつもり」で使っていたAI関連の基礎用語が、詳細に調べてみると「自分が考えていたのとは少し違う意味合い」だったという発見も数多くあり、記事を執筆しながら私自身も良い勉強になった次第です。

今回は、読者の皆様にAI基礎用語に親しんでもらいましたが、次回の記事では「AI用語の基礎知識・応用編」と題して、AIの画像生成や自動運転技術、教育分野で用いられている専門用語を取り上げていきます。

ソルティ
ソルティ

最後までお読み頂き、ありがとうございました!

ソルティ92
この記事を書いた人
ソルティ

AIと考えるブログ著者|書店員歴20年以上|アナログ(人間)とデジタル(AI)の対話形式で記事を執筆する聞き上手なタヌキがアバター|利用AIはChatGPT・Gemini・Grok|職業や分野を問わずAIで社会に貢献する人を応援します

ソルティをフォローする
デジタル
ソルティをフォローする

コメント

タイトルとURLをコピーしました