top of page


次は自然なポーズをどう作るかだ
今日は、背景に360°風景がを使って球体の内側にこれを貼り、背景とした。 あとは、ゆっくりしたランダムな動きで首を傾けさせることに寄り、自然な動きがさらに追加された。 頬の色を連続的に赤くしたいのだが、どうやってもわからない。 仕方がないので、作者に問い合わせ中だ。...

snackvirtual
4月8日読了時間: 1分


まるで命が吹き込まれるよう
パーツが少しずつできてきた。 前回では 呼吸、カメラワーク、キーボード入力が完成していたが、再度システムを見直した。 結論としては、BackEndとして、Python/Flaskのローカルサーバーを作り、Unityがローカルでここにアクセスする形に変えた。...

snackvirtual
4月7日読了時間: 2分


まずはせっせとパーツ作り
UnityにVRMモデルを設定し、アニメーションと瞬きとLipSyncができたので、次はその他のパーツについて作っていく。 呼吸: 停止しているモデルは生きている感じがしない。そのためにも呼吸が重要。 直接BONEを動かすスクリプトをPerplexity...

snackvirtual
4月1日読了時間: 1分


Campus Imaginary始動
正直SNACK Virtualの開発が壁に当たっていた。 口パクはなんとかクリアした。 次は風で髪が自然になびくようにしたかった。 しかし何をやってもダメ…。 気持ちが萎えてきた。 と同時に、Feeちゃんの姿が平面的に見えていた。 Live2Dなので基本は平面なのだが…。...

snackvirtual
3月30日読了時間: 2分


にじボイスをやめて、Aivis Speechに
先日の記事でにじボイスの自然さに驚き、勢いでAPIの申請/NDAの締結まで進めたのだが、その後価格がわかり、825円/1万文字という費用に一気に嫌気がさした。 1万文字は、長いチャットをやってみると、あっという間に達してしまう。...

snackvirtual
2024年12月14日読了時間: 1分


Unity WebGLのLipSyncに挑戦 vol.2
前回のまとめ UnityでのAudioは、ダイレクトのPCで動作させるときは、入力ファイル通りのサンプリング周波数だが、WebGLになるとAACで圧縮され、サンプリング周波数が変わってしまうことが判明した。 そしてこのサンプリング周波数は「audiosource.clip....

snackvirtual
2024年12月9日読了時間: 5分


Unity WebGLのLipSyncに挑戦 vol.1
最近の合成音声の進歩に驚きながら、再度Snack virtualを構築したく思い始めた。 にじボイス | AIによる感情豊かな音声生成サービス 現在の構造は、口パクは発声データを元に音声とは別ルートで制御しているため、発声データがないと口パクしない。 発声データはCeVIO...

snackvirtual
2024年11月30日読了時間: 4分


xAIML SUNABA
NTTが開発したこんなものがあるのを、いまさらながら知った SUNABAとは? | xAIML SUNABA (docomo.ne.jp) いままで定型文制御フォーマットをいろいろ考えてきたが、すでにあるんだね… これ自身が扱いやすいかどうかは疑問だが、 無料...

snackvirtual
2024年5月12日読了時間: 1分


雑談AIのキーは何か?まずは項目列挙
雑談AIはさらに進化してきている 例えば 音声会話型おしゃべりAIアプリ Cotomo(コトモ) 雑談AIかたらい (katar.ai) 少しだけ触った感じでは、どれもまだまだだと思う では何が「まだまだ」なのだろうか...

snackvirtual
2024年5月7日読了時間: 2分


定型文制御フォーマットを考える その2
いろいろ試した結果、mermaidというフォーマットでやってみることにした 文法制約を実際の処理に即して考えた 左側にIndex[Feeの反応文]、右側にそのあとのJump先Indexを書く s000([Start]) --> s001 s001[あ、いらっしゃいませ!]...

snackvirtual
2024年3月2日読了時間: 2分


Netlify
XREAの無料サーバーを借りたのだが、SSL対応のドメインは永久無料ではないらしく、 いろいろいじっているうちにわけがわからなくなってきた 外部サーバー、SSL化、それに伴うドメイン取得、証明書… ぐちゃぐちゃになってきたとき、ふと知ったのがNetlify...

snackvirtual
2024年2月29日読了時間: 1分


FlaskのSSL化
まずは証明書を作る Let’s Enctyptではドメインがないと証明書が入手できなかったので、ZeroSSLでIPアドレスで証明書を作ることにした Free SSL Certificates and SSL Tools - ZeroSSL...

snackvirtual
2024年2月28日読了時間: 1分


ブラウザの大きさに合わせて自動的に画面サイズを変える
参考にしたのは 【Unity】WebGLで画面比固定でウインドウに合わせて表示サイズを可変させる #Unity - Qiita ぶっちゃけコピペで動きました 間違ったのは 「コピーしたWebGLTemplateをAsset内に貼り付ける」 正確に言えば、...

snackvirtual
2024年2月28日読了時間: 1分


XREAの無料サーバーを借りてみた
アクセス速度や運用を考えると、どうしても外部の無料サーバーを使用したいと思っていたので、試してみた 最初はネットオウルのスターサーバーフリーがいいと思ったが、SMS認証を失敗したらいつまでたっても「認証保留中」のままになって、耐えられなくなったので、XREAに乗り換え...

snackvirtual
2024年2月25日読了時間: 1分


定型文制御フォーマットを考える
最初に挨拶をし、IDを確認して名前を呼ぶような定型文をどんな文法で表現するかを考える 以前はUMLを使ってみたが、思い付きの延長であり充分吟味されているとは言い難い よって今回は必要要素を考えながら進めてみる 要素1:何も要求せず、会話を続ける...

snackvirtual
2024年2月12日読了時間: 2分


「はい・いいえ判断」を考えてみる
これからもっとも単純な「はい・いいえ判断」を考えてみる 入力文そのものを「はい・いいえ辞書」と比較する これは一番単純なやり方だ 入力文を形態素解析したものを「はい・いいえ辞書」と比較する 形態素解析をすると基本形がわかるので、語尾が変化しても一致をとれる反面、...

snackvirtual
2024年2月10日読了時間: 4分


系統付けられた記憶と判断が必要?
Chat GPTに代表されるLLMは物凄く雑に言えば、 「膨大な情報を全部食わせて、問いかけに対してそれっぽいものを抽出する」 のだと思う そこには論理的な推論がないのではないか?と思っている 少なくとも人間はそういう形で思考してはいない...

snackvirtual
2024年2月9日読了時間: 1分


最適なLLMはどれだろう?
そもそもSnack VirtualのAIは、ある程度の会話が成り立てばいいので、難しいことは不要のはずだ 逆に客の名前や好みを記憶して、話を合わせられないといけない その意味ではいま話題の高性能LLMは充分すぎる まあそれでもいいのだが、気になっているのが費用だ Open...

snackvirtual
2024年2月6日読了時間: 2分


Version 2.0 システムまとめ
これが全体のシステム図である 動作はこのようになっている はじめに サーバーにしている自分のPCにブラウザでアクセス Unity WebGLでbuldしたFeeの画面情報を返信 ブラウザで描画 次にClientがキー入力して会話するとき キー入力をHTTP GETで通信...

snackvirtual
2024年2月5日読了時間: 2分


WebGLでの口パクが完成!
まずは完成動画を掲載 現在はClientの入力をそのままFeeがエコーバックするだけになっている 動きとしては Clientからブラウザで文字入力 http GETで文字送信 Flask-Pythonが受信して、Feeの返信を作成(今回はエコーバック)...

snackvirtual
2024年2月4日読了時間: 6分
bottom of page