げろぐぐのぶろぐ

http://gerogugu.web.fc2.com/

 

Category: VOICEROID   Tags: ---

Response: Comment: 0  Trackback: 0  

VOICEROID音声認識

最近VOICEROIDやSoftalkの音声認識連動アプリで遊んでます

NAMAROIDのダウンロードと準備:積みゲー帝国 - ブロマガ
http://ch.nicovideo.jp/StackGamesEmpire/blomaga/ar944481/#comment_field
OKAYULU STYLE.
http://okayulu.com/



NAMAROID
namaroid01.png


NAMAROIDとはINTELが無償配布している音声認識ライブラリを利用した音声→文字変換ソフトです

特徴としてはVOICEROIDへ送る前に認識された文字を予め置き換える事が出来るので、
VOICEROIDの辞書を書き換えずにこのソフトだけ設定を変えれば済みます
更にレイヤード字幕表示、画像連動による口パク等のアニメーション、
声によるファイル呼び出し
等の機能があります

語彙が少ないのでゲームやアニメの固有名詞は殆ど認識されません

利用する時は、連続して喋ると前の読み上げが中断されてしまうので注意が必要です



ゆかりねっと
yukarinette01.png yukarinette02.png

ゆかりねっととはGoogle音声認識を利用した音声→文字変換ソフトです

特徴としてはgoogleの語彙がとても豊富な辞書を利用しているので、
簡単にゲームやアニメの単語を認識してくれます


ただ初公開の現在のバージョン(0.1.0 α版)では拡張性が低く、
VOICEROID連携以外の機能はありませんが、プラグインを自作して拡張出来るようです

こちらは連続して喋っても読み上げが終わるまで次の処理を始めないので、
読み上げが終わるまで待って喋らなくても大丈夫
なようです



両方共音声を認識→解析→ボイロへ送る→読み上げるというプロセスを踏むので、
短文でも喋り終わってから読み上げるまでに2秒くらいかかります
長文だとそれだけ認識に時間がかかるので注意

NAMAROIDにのみある字幕機能は、
両ソフト共に認識ミスで読み間違えたり、優先されて変換されてしまう単語があるので、
配信で使う場合は文字で表示出来てとても便利
ゆかりねっとでも字幕を使いたい場合はJimakuDaisuki等の字幕補助ソフトで、
VOICEROIDに読み上げさせた文を取得して表示させる必要になります

音声の出力先をゲーム内VCにしたりも出来ますが、
変換ラグの所為でリアルタイムで状況が変動するようなゲームには不向きなようです

Facerigと一緒に起動して遊ぶにも、
Facerigはリアルタイム、音声認識はラグがあってちょっと微妙

更に配信用エンコーダーとゲームを同時に起動すると画面が一瞬固まるレベルでかなり重かったけど、
ゲーム内fpsは出てたからCPU割り当てで何とかならないかな
上手いこと使って遊びたい

Category: 未分類   Tags: ---

Response: Comment: 0  Trackback: 0  

よませたかし

引数をSocket通信で棒読みちゃんへ送るだけのソフト
探したけど見つからなかったので作りました

使い方:
yomase.exeの後に引数(半角スペースに続けて読ませたい文字)を入力します

例:
yomase.exe Hello World

■Download
https://dl.dropboxusercontent.com/u/1873353/app/yomase.zip

Category: Cavetube   Tags: ---

Response: Comment: 0  Trackback: 0  

Send to Text

send2text.png

Cave to GSDの簡易版
Cavetalkから棒読みちゃんに送られたコメントのみをテキストファイルに保存して、
OBS等のテキスト読み込みで配信画面にのみ載る字幕を作れます

■Download
https://dl.dropboxusercontent.com/u/1873353/app/send2test.zip

Category: 未分類   Tags: ---

Response: Comment: 0  Trackback: 0  

Cave to GSD

Send to GSDを作りなおしてみました
レイヤード字幕もおまけで対応しましたが、
回避できない不具合があるので利用される場合は注意事項を読んで下さい
簡易版のSend2Textも作りましたが、公開はまた後日

C2G.png

従来の方式では棒読みちゃんに送られた文字列をGSD - BBS readerに渡すだけでしたが、
今回のはCavetalkが出力するNicoLiveComment.datから字幕データを取得して棒読みちゃんへ送り、
棒読みちゃんから文字列を取得し字幕ソフトへ送ります

ex1.png


■使い方
■本体の設定
C2G.png

・最長表示時間
コメントが途切れた後に字幕が消えるまでの時間です

・取得頻度
1秒間にdatファイルを取得する回数です
この時間よりも短い間隔でコメントが来ると取得に失敗するのでなるべく低いほうがいいですが、
低くすると負荷が上がります

C2G_set.png

・ベース字幕
ここにはコメントが無い間に表示しておく字幕が設定出来ます
コメント表示時は非表示になります

・レス
コメント番号の前に表示される文字列

・名無し
名前が無記名の時に表示される文字列
空欄にすると「名無しさん」になります

・敬称
コテハンの書き込みがあった時に名前の後ろに表示する文字列

・改行
棒読みちゃんへ送る改行の代わりの文字
特に問題がない場合は変更しないで下さい

・NicoLiveComment.dat
NicoLiveComment.datまでのパス
cave2gsdと同じフォルダにある場合は変更しないで下さい

・BBSreader
GSD - BBS readerのウィンドウタイトル
何かの理由でウィンドウタイトルを変更している場合は変更して下さい
ウィンドウタイトルの前半だけ一致していれば機能します(前方一致)

・AA省略
チェックを入れるとアスキーアートを読み込んでも「アスキーアート省略」と表示されます

・AA省略に使う正規表現
文字列をAAと判定させる正規表現
判定がキツい場合は最後の数字を減らし、甘い場合は最後の数字を増やして下さい

・字幕方式
「GSD」でGSD - BBS readerへ送り、
「レイヤード」で偽字○少女へ送り、
「テキスト」でcave2gsdフォルダ内のcave_comment.txtに書き込まれます

・レス着信音
「あり」だと字幕表示時にcave2gsd\soundフォルダ内のwavとmp3がランダム再生されます


■棒読みちゃんの設定
bouyomi3.png
Socket通信→01)Socket関連→01)Socket通信を使うをTrue
Socket通信→01)Socket関連→02)ポート番号を50001にします

bouyomi4.png
AA自動スキップ→01)AA自動スキップ(複数行AA)→01)AA自動スキップを有効にするをFalse
AA自動スキップ→02)AA自動スキップ(1行AA)→01)AA自動スキップを有効にするをFalse

bouyomi5.png
辞書登録→単語→正規表現に以下の3つを新規追加します

・読み上げディレイ
探索文字列<><>
正規表現^(.*?\d{1,4})
置き換え後。$1
※置き換え後の「。」を増やすと読み上げるまでのディレイが増えます

・AA省略 その1
探索文字列<><>
正規表現(.*?)<><>[厂7二\s \n!-/:-@\[-`{-~€-〲龠-힣!-/:->@{-・¢-¥\xEE\x80-\xBF\xEF\x80-\xA3\xF3\xB0-\xBF\xF4\x80-\x8F]{4,}.*
置き換え後$1<><>AA省略
※文字列内容による判定
正規表現の最後の4の数字を増やすと判定が厳しく、減らすと甘くなります

・AA省略 その2
探索文字列<><>
正規表現(.*?\d{1,4}.+?)<><>(.*?<><>){4,}.*
置き換え後$1<><>AA省略
※行数による判定
正規表現の最後の数字の4が改行の回数に値します


■Cavetalk設定
cave1.png
コメント→Flashコメントジェネレーター連携→機能の有効化にチェックを入れ、
コメント→Flashコメントジェネレーター連携→datファイルパスをcave2gsd内のNicoLiveComment.datに指定します
何かの理由で他の場所にNicoLiveComment.datを置いてしまっている場合は、
本体設定のNicoLiveComment.datをそちらに合わせて下さい

cave2.png
コメント→読み上げの読み上げソフトをなしにします


全ての設定が終わったら、棒読みちゃんと字幕表示に使うソフトを最小化せずにデスクトップ上に置いて、
本体の開始ボタンを押して下さい


※その他・注意事項
レイヤード字幕の偽字○少女へ送ると、ctrlを押しているのに強制解除される事があります
その場合はGSD字幕を使い、出力された文字列をJimakuDaisukiで取得する方法を使って下さい
ex2.png

テキスト字幕はOBSでテキストソース→ファイルからテキストを使用(UTF-8)に、
「cave_comment.txt」を指定すると配信者からは見えないがリスナーには見える字幕が表示出来ます
obs1.png

GSD - BBS readerのgsd.dllは複数出回っていますが、156KBの物がオススメです
165KBの物だと字幕が広く表示できないようです


■リンク
GSD - BBS reader
http://mosax.sakura.ne.jp/yp4g/fswiki.cgi?page=GSD+-+BBS+reader

棒読みちゃん
http://chi.usamimi.info/Program/Application/BouyomiChan/

偽字○少女
http://chechepon.tripod.com/

JimakuDaisuki
http://www.geocities.jp/karada500r/


■更新履歴
2016/01/19 v0.1.0
- 公開版完成


■Download
https://dl.dropboxusercontent.com/u/1873353/app/Cave2Gsd010.zip
01 2016 « »
SUN MON TUE WED THU FRI SAT
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31 - - - - - -
プロフィール

げろにも

Author:げろにも
pecaでTF2配信してます

検索フォーム
Twitter

Archive

RSS