生成AIと共に歩んだ記録 ― 2022年から2026年までの変遷

この記事は約10分で読めます。

 生成AIの進化は驚くほど速く、数ヶ月前の常識がすぐに塗り替えられてしまいます。「いつ、どんな技術があり、自分はどう感じていたか」を忘れないための備忘録として、これまでの利用遍歴をまとめました。


2022年:衝撃の登場と「様子見」の時期

 私が生成AIの存在を初めて知ったのは、2022年(令和4年)11月のChatGPT公開時でした。テキストベースで自然な対話ができるAIの登場は大きな話題となりましたが、当時は利用登録が必須。入力データが学習に利用される懸念もあり、当初は遠巻きに眺めている状態でした。

一方、画像生成の分野ではStable Diffusionが台頭し、AIが「クリエイティビティ」を持ち始めたことに衝撃を受けたのを覚えています。

2023年前半:仕組みへの探究心と模索

 直接登録することに抵抗があった私は、Hugging Face(機械学習モデルの共有プラットフォーム)経由で、有志が公開しているLLM(大規模言語モデル)を試し始めました。

この頃、模索していたのは「音声チャット」の実現です。しかし当時は、

  1. 音声からテキストへの変換(STT)
  2. AIによるテキスト回答の生成
  3. テキストから音声への変換(TTS)

という3つの工程を介す必要があり、タイムラグが大きすぎて実用的ではないというのが当時の結論でした。

仕組みを学ぶ:Transformerとの出会い

「なぜこんなに自然に話せるのか?」という仕組みが気になり、本格的な勉強を始めました。

  • Courseraの「Supervised Machine Learning: Regression and Classification」を修了。
  • DeepLearning.AIにて、アン・ドリュー・ン(Andrew Ng)氏のコースを受講。

大学で数学をしっかりやっておけばよかった……と痛感するほど内容は高度でしたが、現在のAIの心臓部である論文**『Attention Is All You Need』に基づいたTransformer**技術の画期的な仕組みに触れ、その進化の理由が少しずつ見えてきました。

2023年中盤~2024年:身近になるAIと音声対話の幕開け

2023年5月、GoogleがBard(現在のGemini)を公開。登録不要で使えるようになったことで、利用頻度が上がりました。東京へ行った際、電車内で大々的に広告されていたのも印象的です。

2024年5月には、ついにGPT-4oがリリースされ、マルチモーダル(音声・視覚・テキストの統合)なやり取りが可能に。 その後、MicrosoftのCopilotが無料で音声対話に対応していることを知り、試行錯誤を開始しました。初期は日本語で話していても突然英語で返ってきたり、ループしたりと不安定な面もありましたが、**「AIとスムーズに会話ができる時代」**の到来を確信しました。

それと同時に、声が簡単に複製される「ディープフェイク」による詐欺の危険性を肌で感じ、期待と恐怖が入り混じる時期でもありました。

2025年:日常への浸透と「記憶」の活用

2025年に入ると、動画生成AIも実用レベルに達しました。悪用やフェイクニュースの懸念も強まりましたが、利便性は無視できないものに。

私はこの頃、仕事や日常の相談に本格的にAIを導入するため、ChatGPTGeminiの有料プランへ登録しました。登録の決め手は、過去の対話内容を保持する**「メモリ機能」**です。文脈(コンテキスト)を共有できることで、説明の手間が省け、より深い相談が可能になりました。ハルシネーション(もっともらしい嘘)は依然としてありましたが、それを理解した上で使いこなす「AIリテラシー」が身についてきた実感があります。

2026年:選択と新たなツールへの移行

そして2026年現在。世界情勢やAIの軍事利用に関する動向を受け、自身の利用環境を見直しました。ChatGPTとの契約を一度終了し、データのバックアップをとった上で、現在はAnthropic社のClaudeをメインに利用しています。

特に最近は、開発者向けツールであるClaude Codeの評判を耳にすることが増えました。「凄すぎてヤバい」という声が溢れており、情報の真偽を慎重に見極めつつも、技術の底知れぬ進化に圧倒されています。


今後の展望:AIネイティブな未来へ

振り返ってみれば、たった数年で検索のあり方や仕事の仕方が劇的に変わりました。今や生成AIは「便利なツール」を超え、「なくてはならないパートナー」へと進化しています。

これから成長する「AIネイティブ」な子どもたちが創る未来の社会は、どのような姿をしているのでしょうか。一抹の不安はありますが、それ以上に、この歴史的な技術革新の渦中に生きていることに興奮を隠せません。

日々進化するこの技術を、これからも冷静に、かつ好奇心を持って追い続けていこうと思います。

 生成AIについての記録と記憶です。進化が速いので何時ごろにどんなだったかが分かるようにしておくためのメモ。

初めて知った生成AI

 生成AIを知ったのは2022年(令和4年)のChatGPTの公開の頃。テキストベースのAIでチャットができるともの凄く話題になったのでどんなものかは気になってました。その頃は登録しないと使えなかったのでチャットの内容を学習されるのが何となく嫌で使ってませんでした。また、画像の生成AIについてはStable Diffusionが流行っていました。

生成AI初めての利用

 登録しないと使えないので、結局はHugging Faceというサービスを利用してそこで公開しているサービス(ChatGPTを有料で利用している人が沢山の入出力を利用してオリジナルのLLMを作る試みで公開しているサービス)を利用していました。

 その頃は音声でのチャットのサービスを作れないかと考えてました。そのうち出てくるだろうと思いつつも、HuggingFaceで同じようなものができないかと色々調べると、チャットした文字を音声に変換する、逆は音声を文字に変換して生成AIとチャットするため、どうしても2回サービスをかますことになるので、処理に時間がかかり、かなりのタイムラグが出るようでした。

 結果、実用的ではないという認識で断念。

仕組みの勉強

 その後、生成AIの中身が気になり仕組みの勉強を始めました。

 まずは、Couseraのコースで「Supervised Machine Learning: Regression and Classification」というコースを修了しました。また、Deeplearning.AIにも登録してAndrewNgさんの無料コースを受講していました。

 高度な数学の内容が出てきたり、大学でしっかり勉強しておけばよかったとこの時初めて思うほど内容が難しかったのですが、「Attention is All You Need」という論文を基に、Transformerという技術が使われていることを学びました。

生成AI使い始める

 その後、2023年の5月頃にGoogleがbird(現在のgemini)を公開し、登録せずに使えるようになってきたのでちょこちょこと使い始めました。東京行った時に電車の中で宣伝されてて驚いた記憶がある。

 birdがgeminiになるまではあっという間だった記憶がえる。生成AIもまだ回答的にはいまいちと感じており、無料で使えるAIを探し回ってました。この頃主に使っていたのはGemini。

 他のAIもそんなに使ってたわけではないですが、2024年5月にChatGPT4oがリリースされ音声でのやり取りもできるようになり、音声対応がしたくなって色々探しているとCopilotが無料でできる事を知り、試してみました。まだまだ認識が甘く、日本語で話していても急に英語になったり同じ返事を何度も繰り返したりはしましたが、スムーズに会話のようなものができることがわかりました。

 これはそろそろ他のAIでも音声での利用が出てくるぞと期待をもつと同時に、人の声などはすぐに複製され、詐欺などにつかわれるようになる日も近いなと怖くなったのを覚えています。

生成AIの利用が増える

 2025年にもなると、かなり生成AIも発達し、動画の生成なども簡単に出来るようになってきました。そちらの方は全然利用はしていませんでしたが、投稿サイトを見ているといかがわしいものが多く、悪用なども増えそうであまり良くないなと思いつつ、DeepFakeなども結構簡単に作成できるようになっていて、格段と危険が迫っているような気がしていました。

 そして段々と仕事や日常の相談などにも使うようになり、ChatGPTに登録しました。続いて、Geminiにも登録しました。理由としては記憶してもらっておいた方が続きで相談する時に過去の話を入力しなくても済むからです。

 内容も細かく質問すれば結構しっかりとした回答になります。ハルシネーションもそこそこありますが、そんなものだと思って使うようにしていました。

2026年の状況

 2026年に入り、アメリカでのAIの軍事利用の関係で、ChatGPTが国防総省との契約をした関係もあり、一旦ChatGPTの利用を辞めました。その際にやり取りしていたデータは一応ダウンロードしておきました。

 また、新しくAnthropicのClaudeを登録して使い始めるようになりました。使い勝手はChatGPTが1番良かった気がしますが、システムの関係ではclaudeの方がいい気がしています。そのせいか最近はClaudeCodeが凄すぎてヤバいというFacebookの記事をやたらと目にするようになりました。ホントかウソか分かりませんがこんなに押されると逆に怪しんでしまいます。

今後のAI利用について

 去年くらいから仕事でも日常でも利用するようになり、周りもかなり利用している感じがしています。なくてはならない存在になりつつあり、検索の形態もかわり始めているのを感じています。

 今後は子どもたちの利用もますます増え、AIネイティブな子どもたちが成長した時の社会はどうなっているのか、楽しみでもありちょっと怖くもありますが、新しい革新的な技術が普及している時代を生きていることについては、前子どもたちとも一緒に考えながら使っていこうと思います。