新しいAIの画像生成がすごい!

こんにちは。横浜市旭区二俣川駅が最寄りの学習塾 Yです。

今日はGoogleがつくっているAIである「Google Gemini」に新機能である「Nano Banana」が追加されたということを聞いて、画像編集をしてみたというお話です。

当サイトのトップページのイメージ画像を最近まで学生が勉強しているフリー画像にしていたのですが、ありきたりで目立たないなと思い、「Nano Banana」を試すことになりました。まず、当塾のイメージキャラクターであるクマイさんをデフォルメしてほしいと思い、「この画像をフィギュア風に変えて後ろには本を並べて背景を塾の教室にして」と指示を出すとこうなりました。

↓元の画像

↓Nano Banana による画像

おお! いきなりレベルの高い変換を見せてくれました。クマを意識して鼻から口にかけて奥行を感じさせるものになっていますし。クマ特有の毛の質感も表現できています。フィギュアの質感も素晴らしいですね。

さらに指示を出してみます。学習塾 Yの教室内の写真の画像をアップロードして「この教室の中にさっきのキャラクターがいるように合成して」と指示を出してみると・・・

↓合成する画像

↓合成後の画像

すごい!

机や椅子は違う部分があるものの、教室の特徴を7割くらい押さえている感じがします!家具にミニチュア感が出ているのも親しみやすいですね。さらに学習塾 Yの看板を持たせてみました。(下図)

トップ画像の完成です!

さらに勉強している生徒もここに乗せちゃいましょう。

↓合成する画像

↓結果

これもいい感じですね!「Nano Bnana」のすごいところは「同一人物が認識・生成できる」ところだそうで、今までのAIでは自分の画像をアップロードして「イケメンにして!」と命令しても「お前誰やねん」レベルの別人が生成されることが多く、同一人物の識別ができていなかったのですが、それを克服したところにあります。

先ほどの男女2人の生徒のイラストは元はcnavaのAI生成機能でつくったものなのですが、それがこちらです。

↑元画像。セリフはY塾長作。9月のチラシ用に作った画像でした。

勉強で悩んでいる2人の画像を、テストで結果が出て喜んでいる画像に変えるように指示を出すと…

先ほどの画像に早変わり!

少し、タッチに変化はあるものの「Chat GPT」で指示を出したもの(下図)と比べると大きな差になりました。

↑Chat GPTで作成

どうやらNano Banana は、イラストのタッチや色使い、物質の質感などを認識する能力が強いようです。

しかも、Geminiでは画像であれば無料でいくらでも生成可能です!

ただし、使ってみて下記のような弱点もありました。

・文字の生成は相変わらず弱い

・「俯瞰から」「横からみた画像にして」などのアングルの変更指示を受け付けない

・情報量が多い複雑な画像は思うように変換されにくい。

まあ色々いう前に、この記事を見ている皆さんもまずはGeminiをつかってみてほしいと思います。

しかし、この調子でAIが進化してくると我々塾業界にもその波がくるかもしれません。最初は映像教材に利用できそうですし、さらに進歩すれば語学学習に応用できそうですね。

学習塾 YもAIやITの力を活用し、より便利で保護者の方々や生徒の皆様のニーズに対応できるよう新進気鋭の学習塾として前進していければと思います。