マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

AIツール実験室

2023.10.17

【AIツール実験室】アバタートーク動画生成AIツール「 Creative Reality Studio 」①Web編🗣

【AIツール実験室】アバタートーク動画生成AIツール「 Creative Reality Studio 」①Web編🗣

コンテンツ

はじめに

ごあいさつ

日本全国の「アバター動画生成ファン」のみなさま、
おつかれさまです。

タイムリープ系アニメTOP3

→“タイムリープ系”アニメといえば? 3位「STEINS;GATE」、2位「サマータイムレンダ」、1位は…<23年版>

■3位「STEINS;GATE」
「Dメールを送信してしまうと、大変なことになるよ!」という科学アドベンチャーで、
「複雑で緻密なプロット」「時間改変パラドックス」「科学と倫理の問題」などなどあり、
素晴らしい作品です。
SF好きなら、何周も見ておきたい作品です。

■2位「サマータイムレンダ」
とある島で発生した謎の怪奇事件にまつわるホラーミステリーです。
やや話が複雑であり、1周しか見ていないので、ぼんやりとしている部分もあります。
キャラの作画が素敵です。

■1位「???????」
この作品は、見てなかったやつでした。
見ないとダメなやつですね。

■まとめ
まあ、でも、いやしかし、
タイムリープ系ということならば、
やはり「シュタゲ」を1位に推したい、
マジセミ担当者Aでございます。

今回の作戦

今回は、
アバタートーク動画生成AIツール「Creative Reality Studio」
を、いじってみたいと思います。

「素敵な動画」を生成できたらよいなと思います。

ご注意点

※本記事は、担当者Aの主観により作成されていますので、なにとぞ、そういうことでよろしくお願いします。

※サービスについては、最新情報をご確認ください。

アバタートーク動画生成AIツール「Creative Reality Studio」まとめ

「Creative Reality Studio」とは

「Creative Reality Studio」は、
「アバターを使った動画コンテンツ」を簡単に作成できるAIツールです。

「画像」や「イラスト」をアップロードし、
喋らせたい言葉を入力するだけで、
「テキストを読み上げる動画」を作成してくれます。

サービス提供

・提供企業 = イスラエルのAI企業「D-ID社」
・リリース日 = 2022年12月13日

主な特徴

・「画像」+「テキスト」で、簡単にアバター動画を作成できる
・アバターにテキストを読み上げさせることができる
・多言語対応(100言語超)
・API経由でのサービス利用も可能
・商用利用も可能 ※有料プラン

主な機能

・アバター作成機能 :画像からアバターを作成
・音声合成機能 :アバターにテキストを読み上げさせる
・動画生成機能 :アバターを用いた動画を生成

ユースケース

・企業内コミュニケーション強化
・マーケティングコンテンツ強化 :カスタマーエンゲージメント
・オンライントレーニング動画 :教育、研修
・エンターテインメントコンテンツ作成 など

使用時の注意点

・使用する画像のプライバシー保護に十分な配慮が必要

オフィシャルサイト

→d-id.com

料金プラン

無料プランの場合
・無料トライアル期間=14日間
・商用利用NG
・最大5分間の動画を生成できる
・ウォーターマークが入る

→d-id.com →pricing →studio

【しゃべらせ動画①】「マジセミちゃん(仮)」の自己紹介動画

作戦

絶賛模索中の「マジセミちゃん(仮)」に、
自己紹介をしてもらおうと思います。

マジセミ【非公認】イメージキャラクター「マジセミちゃん(仮)」 前回までのあらすじ

→【AIツール実験室】画像生成AIツール「 Emi 」(前編)

「DALL·E 3」リリース記念

新しい画像生成機能「DALL·E 3」で画像を作成してみます。

「ChatGPT4経由」+「Bing経由」でやってみます。

アニメ調イラストは断念😢

アニメ調イラストで、動画作成してもらおうとしたものの、
「顔を特定できません」エラーとなり、
読み込んでもらえませんでした。

※証明写真のような感じが必要なようです。

画像生成プロンプト

■指示
画像を作成してください。

■作成オーダー
・フォトリアル調
・背景は白色無地
・登場人物の数=1名
・画像中央に直立している
・カメラ目線
・手には何も持っていない
・口を閉じている
・口元を隠さない
・画像サイズ=正方形

■作成キャラクターのイメージ
①女子生徒
・日本の学校に通う 女子生徒

画像できました!

Bing版で成功

微妙なAI感はあるものの、
なかなかナイスですね。

このレベルのフォトリアル画像を、
チャットAIでちょいと作ってくれてしまうというのは、
すごいご時世です。

しゃべらせ動画→作成準備

①「D-ID Creative Reality Studio」ページを開きます

→studio.d-id.com

②ログインします

左下の「Guest」をクリックして、
ログインします。

Googleで認証 などをします。

③「Create Video」をクリックします

しゃべらせ動画→画像設定

「Choose a presenter」の「+ADD」をクリックして、
作成した画像を登録します。

しゃべらせ動画→テキスト音声設定

①言語設定

「Language」で「Japanese(Japan)」を選択します。

②スクリプト入力

しゃべらせたいテキストを入力します。

(サンプル)
みなさん、こんにちは。
絶賛模索中の、
マジセミ非公認イメージキャラクター「マジセミちゃん(仮)」です。
いつの日か、公認キャラクターになれるように、がんばりたいと思います。

③声の設定

4つから選択できました。

④スタイル設定

「Nanami」の場合だけ、選択できました。
・chat
・customerservice
・cheerful

⑤読み上げ確認

「スピーカーマーク」をクリックして、
読み上げを確認します。

しゃべらせ動画→「GENERATE VIDEO」

①動画タイトル設定

左上の「Untitled video」をクリックして、
動画タイトルを設定します。

②「GENERATE VIDEO」をクリックします

③作成確認

クレジット20のうち、1つ使って、
15秒の動画ができるようです。

「GENARATE」をクリックします。

しゃべらせ動画→できました!

10秒くらいで、出来上がりました。
速いですね。

ファイルダウンロードできました。
・MP4形式
・2.9MB

シェアもいろいろできるようです。

それでは、初めてしゃべる「マジセミちゃん(仮)」をご覧ください

→初めてしゃべる「マジセミちゃん(仮)」

まとめ

思ってたより、ちゃんとしっかり、しゃべってくれました。

日本語テキストの読み上げ

やはり「AIぽさ」はあるものの、
結構自然な感じに聞こえます。

いろいろ自然に動く

・◯:口が動く
・◎:リップシンクしている
・◯:まばたきをする
・◯:顔の向きが動く
・◯:顔を動かしても、目の焦点はカメラ目線

これは、なかなかすごいですね〜。

【しゃべらせ動画②】とある紳士「T.Aniki」の解説ショート動画サンプル

作戦

実在する人類の写真データを使用して、
何かをしゃべってもらいます。

とある紳士の写真データ

とある紳士より、写真データを提供してもらいました。

まいど、ご協力ありがとうございます。

出典ページ

→majisemi.com →service

できました!

クレジットを2つ消費して、
30秒の動画ができました。

それでは、とある紳士「T.Aniki」の「Creative Reality Studio」解説ショート動画 をご覧ください

→「Creative Reality Studio」解説動画

解説してくれました

しゃべりスピードも良い感じで、
聞きやすいですね。

【反省会】なぜ、ほんのちょっとだけ不気味な感じになってしまったのか?

ベースとなった写真データが「やや斜めに写っているタイプ」であるため、
顔全体を認識できないようですね。

その状態で動かそうとすると、
やや不気味なモーションになってしまうのでは?
という推論が成り立つと思います。

もう少し賢くなってしまうと、
「斜め写真でも全然OKですよ!」になってくれそうですね。
期待しましょう。

【推奨】真正面から写っている写真データを使用しましょう

現段階では、斜め写真はやめておくのが無難です。

クレジットを無駄に消費してしまわないようにお気をつけください。

【歌わせ動画】「マジセミちゃん(仮)」が「マジセミのうた」を歌う

作戦

音声データのアップロードもできるようなので、
「マジセミちゃん(仮)」に、
お歌を歌ってもらおうと思います。

マジセミのうた

以前、
楽曲作成ツール「Suno AI」で作った、
♪「マジセミのうた」〜夢と希望と光が強め版〜♪
を、使ってみます。

作成の様子

→【AIツール実験室】楽曲作成ツール「 Suno AI 」〜AI生成ミュージックフェス〜

「マジセミのうた」〜夢と希望と光が強め版〜

楽曲データをアップロード

2MBほどのMP4ファイルを
アップロードしてみました。

楽曲を再生できるので、
読み込めたようです。

GENERATE

35秒の動画ができるようです。

3クレジットかかります。
もしかして、1クレジット=15秒 とかですかね?

できました

30秒くらいで、できました。

それでは、「マジセミちゃん(仮)」が歌う「マジセミのうた」を聴いていただきましょう

→初めて歌う「マジセミちゃん(仮)」

【アンコール曲】新生フルリメイク「いぬのおまわりさん」

→新生フルリメイク「いぬのおまわりさん」

まとめ

◯:歌ってくれました

話し言葉だけではなく、
「歌わせ」も、いける感じです。

◎:前奏の間は、口を動かさない

「伴奏パート」と「ボーカルパート」を分けて、
認識できているのですね。

△:リンプシンクが不安定 ←しょうがない

伴奏パートも一緒に混ざっているので、
リップシンクが不安定になっています。

ボーカルパートだけ抜き出して、アバター動画を作成して、
その後に、伴奏パートを重ねれば、
いい感じのリップシンクになりそうです。

最後にまとめ

今回のAIツール「Creative Reality Studio」ですが、
なかなかすごいツールでした。

◯:「写真データ+テキスト」だけで「しゃべらせ動画」ができる

(真正面からの)写真データをデフォルトで使うようにすれば、
テキストを放り込むだけで、
しゃべらせ動画を作成できてしまいます。

特に、
「いろいろ解説する動画を作る用事がある人」などは、
課金してでも使う価値はあるかもですね。

◯:アバターがほどよく動く

アバターの「口」「顔」「目」が、
結構動きます。

完全にビタッと止まっている静止画よりも、
アクティブ感が出て、
とてもよいと思います。

◯:日本語もバッチリOK

日本語テキストも、普通に読み上げてくれます。
歌わせることもできます。

日本語ユーザーには、ありがたいですね。

◯:ビジネス用途で使えそう

・サービス紹介ページでのサービス概要紹介動画
・お客様相談室ページの説明動画 など、
活用できそうです。

また、APIも使えるようなので、
生成スピードがUPすれば、
「FAQテキストを読み込ませて、リアルタイムで回答動画生成」なども、
いけるようになるかもしれませんね。

ためしに「しゃべらせ動画」を作ってみてください

お試し無料版でも、
そこそこ試せるので、
いろいろと、いじったりしてみてください👍

②API編に続きます

→【AIツール実験室】アバタートーク動画生成AIツール「 Creative Reality Studio 」②API編🗣

【お知らせ】AI関連 記事リストポータル

こちらのページでは、
【ChatGPTプラグイン探訪】および【AIツール実験室】の記事一覧を参照できます。

→AI関連 記事リストポータル

【お知らせ】「マジセミ」のご紹介

「マジセミ」では、日々、多くのIT関連セミナーを開催しています。

多くのセミナーの中から「ご自身のスキルやビジネスを強化できるセミナー」を見つけて、ぜひ1度、参加してみてください。

マジセミのイメージロゴ

マジセミ関連プラットフォーム

プラットフォーム 説明 URL
マジセミ マジセミで実施されるさまざまなセミナーの開催情報を確認できます。
「IT関連セミナー」「製造業関連セミナー」など、ご自身のビジネスを強化できるセミナーを検索できます。
→majisemi.com
マジセミサービス 「セミナーを開催したい方」向けの情報を確認できます。
トライアルからの利用が可能です。
→majisemi.com →service
マジセミドライブ 「IT関連コンテンツ」などを紹介しています。 →majisemi.com
→topics
マジセミFacebook 毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。
★フォローお願いします。
→facebook.com
→OSSNews
マジセミTwitter マジセミFacebookと同様に、
毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。
★フォローお願いします。
→twitter.com
→Majisemi_it

※「ご意見」「ご感想」「誤字がありましたよ」「こんな使い方もあるみたいですよ」などありましたら、
マジセミSNS(Facebook or Twitter)まで、お知らせください。

おすすめの記事

【デジタル寺田の3分用語解説】 「 103万の壁 」(年収の壁)とは?🧱

デジタル寺田の3分用語解説

2024.12.02

【デジタル寺田の3分用語解説】 「 103万の壁 」(年収の壁)とは?🧱

「 103万の壁 」とは、給与収入が年間103万円を超えると、所得税が課税される「年収ライン」を指します。このラインを超えると手取り収入が減少するため、多くの人が働き方を調整します。住民税や扶養控除外れも家計負担に影響します。他にも、厚生年金などの負担が発生する「壁」が存在し、制度の見直しが議論されています。

【デジタル寺田の3分用語解説】 「 OTセキュリティ 」とは?〜ITセキュリティ との違い〜🔑

デジタル寺田の3分用語解説

2024.12.02

【デジタル寺田の3分用語解説】 「 OTセキュリティ 」とは?〜ITセキュリティ との違い〜🔑

「 OTセキュリティ 」は、工場や発電所の産業用制御システムを守るためのセキュリティで、安全性が重視されます。ITシステムとの接続増加により脅威が高まり、「運用停止の難しさ」や「管理部門間の連携不足」が課題です。サイバー攻撃の増加に伴い、対策の強化が急務となっています。

【デジタル寺田の3分用語解説】 ガートナーが発表した「2025年の戦略的テクノロジの トップ トレンド 」とは?🌟

デジタル寺田の3分用語解説

2024.12.02

【デジタル寺田の3分用語解説】 ガートナーが発表した「2025年の戦略的テクノロジの トップ トレンド 」とは?🌟

ガートナーが発表した「2025年の戦略的テクノロジー トレンド 」には、自律的意思決定を行う「エージェント型AI」「AIガバナンス・プラットフォーム」「偽情報拡散防止技術」「次世代コンピューティング技術」が含まれます。これらは仕事や生活に深く影響し、企業競争力向上のカギとなると予測されています。