話題の画像生成AI!Stable Diffusionの動かし方と使い方
宇宙ハム 実はこれAIに生成してもらいました
【Stable Diffusion】話題の画像生成AIを使って、ゴッホにハムスターを描いてもらった
2023.01.01 株式会社ビヨンド
このビヨンドブログ一覧のサムネイル画像なんですが、実はこれAIに生成してもらいました。
スペースハムスター、宇宙ハム。
他にもイメージを具体化するための表現として、
"in Van Gogh style" または "in the style of Van Gogh" (ゴッホ風の)
"a painting of" (~の絵)
"a photograph of" (~の写真)
"abstruct" (抽象画)
とかが使えます。
https://beyondjapan.com/blog/2023/01/stablediffusionhamster/
Part1 ChatGPTが与える衝撃
Part2 テクノロジーが変える地政学
Part3 曲がり角のテックジャイアント
Part4 メタバース&Web3、先端技術ブームの実態
Part5 日本人が知らない世界の最新常識
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
Part1 ChatGPTが与える衝撃 より
生成AIやGPTとは何か ビジネスパーソンはどう向き合う?
2022年の11月から23年2月にかけてChatGPTというサービスの話題がもちきりです。自然に見える会話形式の応答で多くのユーザーを惹きつけたことと、その普及のスピードを受けてマイクロソフトが最大約1兆円を追加出資するという報道や、検索サービスが脅かされるかもしれないと報道されたグーグルが対抗サービスである「Bard」を急遽発表したことが注目を加速させました。この動きが定着するかはまだ定かではありませんが、どういったものかを理解することは重要です。
ChatGPTの元となるGPT-3は、AI研究機関であるOpenAIが、2018年のGPT-1'2019年のGPT-2に続き、2020年に発表した大規模言語モデル(Large Language Models)の1つです。大規模言語モデルとは、膨大なデータを学習し人間が使用する言語を単語の出現確率でモデル化したもので、GPT-3は極めて自然な文章を生成したり、翻訳したりすることができます。
このGPT-3を改良して、会話に最適化したものがChatGPTです。Chatは単に会話である「チャット」を指しますが、GPTの略はGenerative Pre-Trained Transformerで、直訳すると「生成の事前学習されたトランスフォーマー」となります。トランスフォーマーとは後述の深層学習モデルを指します。
画像を生成するAIも登場 海外技術情報が重要な理由
ChatGPTに質問を入力すると、自然な会話のようにAIが作成した回答が返ってくるのです。
試しに「生きるとは何か?」という質問を入力してみると、図表のような答えが返ってきました。もしこの答えが、学生への課題の回答に使われていても、違和感は少ないのではないでしょうか。
ChatGPTは2022年11月末にインターネットで公開されてから、そのクオリティーの高さがSNSなどで話題になっています。22年のテック関連のニュースを振り返ったときに、将来的にインパクトを持つ可能性があると思われるうちの1つはGPT(Generative Pretrained Transformer)というAIの分野でしょう。
「生成AI(Generative AI)」とも呼ばれるテクノロジーは、大量のテキストデータによって事前学習済み(Pre-trained)のベースモデルをもとに文章を生成(Generative)する「Transformer」と呼ぶ自然言語処理の分野で使われる深層学習モデルを用いています。画像やキーワードを組み合わせることでコンテンツを生成するAIの手法です。
ChatGPTは100%の正解を返してくるわけではありませんし、不適切な質問は回答を拒否されることもあります。しかし友人や家族と話しているようなカジュアルな話し言葉であっても、文脈を読み取って的確に返答してくれます。AIの精度は数年前と比べて格段に進化しているのです。
22年夏には同じく生成AIの分野で、英スタートアップ企業のStability AI社が開発した「Stable diffusion」が世界中で話題になりました。「ゴッホが描いた東京タワー」のようにキーワードを入力すると。とてもそれらしくかつリアルで高品質な画像を生成するプロダクトです。
生成した画像は商用利用も可能と聞けば戦々恐々としたクリエイターも少なくないでしょう。オープンソースとして公開されたため、誰もが無料で気軽に試せる点も強みです。
こうしたプロダクトはSNSやメディアで一時的に盛り上がった後、ブームとして消費されていくように思われがちです。実体がないようなはやり言葉はバズワードとして淘汰されていきますが、こうした今後も成長していくAIのようなテクノロジーは消えずに不確実性が高い時代の中でも着実に進化していきます。この見極めがかってない価値を持ちます。
例えば、日本では多くの企業がチャットボットを活用しています。しかし、このような新しいサービスを自ら積極的に試みてみなければ、あっという間に古い技術を使い続けている状態になってしまいます。GPTのような大きな技術的な進化があると、ほかの企業がすぐには追いつけなくなる場面があるのです。
特に重要なのは、チャットボットのサービスなどを提供している会社は独自のアルゴリズムを開発しているというよりも、既存のアルゴリズムを少し改変しているだけの例もあることです。同じ「AIベンチャー」と呼ばれる企業のなかでも、独自にアルゴリズムを開発しているベンチャーと開発請負やコンサルティングだけをしているようなベンチャーは分けて扱わなければなりません。特に日本の技術力を上げていくためには、こうした区別が必要です。
生成AIとは異なるテクノロジーですが、多言語の翻訳AIではDeepL(ディープエル)というドイツの企業も目覚ましい翻訳精度の進化を見せつつありますし、米グーグルの翻訳テクノロジーもかつてより大幅に進化を遂げています。グーグルのスマートフォン「Google Pixel 7」に搭載されている翻訳や同時通訳の機能はリアルタイムかつスピーディーな性能が高く評価されています。
日本語への翻訳精度で競っているベンチャーのプロダクトには、80言語以上に対応する名刺サイズの携帯型翻訳端末「ポケトーク」があります。開発元のポケトークは既存の企業からスピンアウトして新たに資金調達をするという方法で自社サービスに新技術を取り込もうとしています。