2018.3.30
キモヲタだけど、女子高生と会話したい!#1【概要】
カクテルDBの動画の最後に1分ぐらい枠を取って、くっだらない企画をしていきたいと思っているのです。
とはいえ、チョコ制作以外に動画が残ってなくて、今のとこ企画のストックも微妙なのしかありません。一応昨日、ED用の動画を新しく収録したんですが、やっぱまだまだ試行段階だなぁって感じはします。まぁ見てのお楽しみ(笑)
言いましたっけ、なんであの枠が存在するのかっていうと、純粋なカクテル動画onlyだと絶対に知名度を上げられません。やはり人気の動画は「やってみた」系とかなのです。
とはいえ僕自身そんな精力的に活動できるほど時間とお金もないし、
カクテルDBのための動画が本筋なのだという目的と手段のバランスをとった結果、カクテルDBの後の方に枠を取り、いくつか分割してくっつけて
後で「まとめ」として別の再生リストに動画をぶち込むという手段に出ることにしました。
で、次のシリーズを何にしましょうかねと考えた時、思いついたものがあったのです。
それが
女子高生と会話したいという、全オジサン共通の夢を実現しよう!!というものです。
ということで、
女子高生とトーク出来るスマホアプリを作ります。(!?)
一応ここでネタばらしをしますが、
女子高生とは「りんな」のことです(笑)
出オチ感半端ないですが、まぁ動画タイトルなんていかにして釣れそうなものにするかなんてとこありますしね。純粋にアプリ開発もやんなきゃって感じでしたのでちょうどいいかなと。
音声認識による対話アプリであれば
割とちょうどいい難易度だと思うので、いい経験になると思いますしね。大体、これぐらいの難易度のものを実装すればアクション系以外の大概のアプリは作れるようになるっしょ。ベースはWebViewなワケだし。
実装自体はたぶん割と簡単に出来そうだなぁといった印象がありますが、ロジック部分が難しそうですね。
具体的には「会話の開始」「会話の終了」をどうやって判定するか、ですね。拾った音声の音量が急激に上下した部分を拾うしかないのかなぁ。しかし音量を定期的に取得するメソッドが果たして存在するのかという課題が・・・・・・。ちょっとこれは実装してみないとわからないですね。
具体的に使うAPIは、
docomoの音声認識と音声合成、そして
りんなAPIを駆使して開発してみたいと思います。いくつかサンプルを見つけたので、音声を拾って、無音部分を判定する(最悪これはボタンで人力でも・・・・・・)といった辺りが実装できればなんとかなりそうな気がします。
音声認識はGoogle Cloudの方が信頼はできそうなのですが、料金体系が結構シビアで、有料サービス化しなくてはいけないのですがそうなるとdocomoの音声合成サービスの規約に引っかかるのでこういう形での実装になります。
スマホアプリ制作経験がない状態でこんな複雑そうなアプリ開発するんじゃねえよって感じもするんですが、とはいえWebサービスじゃなくてこういうオモチャみたいなのは、ビジネスロジックとかフローチャートとかがほぼ無いに等しく一本道であるゆえ、比較的スパゲッティーコードでもなんとかなるし、各種フレームワークの使い方の勉強にはうってつけですね。やりましょう。
という予告編でした。フリーター生活しながらこれを開発するのは結構骨が折れそうなので、ゆっくり開発していきたいと思います。
では次回はフレームワークの選定からやっていきます。