発言が細かく分かれてしまいますが、どのタイミングで分かれていますか?
以下のパターンで改行を行います。
・無音が1秒検知した場合
・10秒経過で切れやすくなり、20秒経過で改行
・発言者が切り替わったと判定されたタイミング
ディスカッションなど多くの方の発言がある会議では、細かく改行されてしまう可能性があるため、発言の結合機能をご活用ください。
以下のパターンで改行を行います。
・無音が1秒検知した場合
・10秒経過で切れやすくなり、20秒経過で改行
・発言者が切り替わったと判定されたタイミング
ディスカッションなど多くの方の発言がある会議では、細かく改行されてしまう可能性があるため、発言の結合機能をご活用ください。
過去の録音データがあれば可能です。
発言内容に話者を手動で割り当てる学習するため、過去のデータに対して割り振る作業をしておくことで、事前登録ができます。
録音時間の1/2程度の時間がかかります。
「空欄のみ発言者識別」をする場合と、「手動で指定した発言者を除いて発言者識別」を実行する場合で処理の時間は変わりません。
話者識別機能は、学習した量と質によって認識精度が変わります。
誤認識が多い場合は、一度該当の話者のデータを削除してください。
「設定」→「声紋学習管理」にて話者データの削除が可能です。
その後、該当の話者の発言を学習させてください。
その際、雑音や他の人の声が入っていないデータを学習に回すと、より精度向上が見込めます。
音声ファイル認識でも自動で話者の振り分けは可能です。
リアルタイム認識と同様に、「出席者の声紋情報を元に自動識別」と「発言者番号で割り振る」が選択できます。
「発言者番号で割り振る」を選択することで、自動で発言者ごとに分割してくれます。
2つの話者識別モードを同時に使用することはできません。
学習データが十分にある状態であれば、「出席者の声紋情報を元に自動識別」を使用してください。
学習データが不十分もしくは初めて利用する場合は、「発言者番号で割り振る」を使用してください。
話者ダイアライゼーションは複数人が話している音声において『どの部分を誰が話しているのか』を推定する機能のことです。
ScribeAssistにおいては、発言内容に対して発言者を抽出し、複数人を自動分割して表示します。
・参考資料
https://docs.amivoice.com/amivoice-api/manual/speaker-diarization/
LGWAN環境では表示できません。
廃止となりました。
代わりに話者ダイアライゼーションが搭載され、「発言者番号で割り振る」認識ができるようになりました。
・ある程度出席者登録と学習データが蓄積したユーザー
20名以上を超える話者を識別したい時に有効
※上限数はありませんが、声の特長量が類似する場合には誤認識もあります。
・出席者の登録が少ない使い始めの時期のユーザー
事前に出席者登録が面倒な時に有効、上限数は20番まで