試行錯誤の結果、Phase1の音声出力とリップシンクあたりがだいぶ見えてきた
キャラクターはGIFアニメーションとする
母音5通りの口を作り、会話を母音分解して、話させる
音声合成はオフラインなので、声の最初のトリガーを検出して、上記GIFをPlayさせる
呼吸は無言時に行い、無言時に息を吐いた場合、吸う速度を上げて吸い込み、会話をしたあとに吐くという感じに(とりあえず)する
まばたきは無言時に、ランダムに発生させる
感情の付加はPhase1では赤面程度にし、複雑なことはさせない
まずはこのあたりがどのくらいのPerformanceが出るのかをやってみたい
実はGIFは結構な種類が必要である
無音→あ、い、う、え、お (5種類)
あ→い、う、え、お(4種類)、い→、う→、え→、お→ で4*5=20種類
あ、い、う、え、お→無音(5種類)
の合計30種類のGIFを切り替えないといけない
まずは適当なキャラクターでこの30種類を作成し、
音声合成のデモサンプルを録音して加工し、再生させながらGIFを動かしてみよう
いろいろ調べると、意外なことに「音声をトリガーにして」というのが難しい
なのでもしかしたら音声合成ソフトをSDKで動かしてしまったほうが楽かもしれない
Comentarios