会議や打ち合わせで、会話を録音し『ReazonSpeech』を使用すれば、議事録を取らなくていい? のか検証してみました。

『ReazonSpeech』とは?
日本語に特化した高精度な音声認識モデルです。
無償で使用でき、商用利用可能です。

『ReazonSpeechクイックスタート』
を参考に作業開始です。

『VOICEPEAK』を使用し、約4分の打ち合わせ??のような音声ファイルを作成しました。
環境を構築し、コードも書きました。
 

いざ、実行!!!

Traceback (most recent call last):
File “xxx.py”, line 10, in
assert rate == 16000, f”Invalid sampling rate: {rate}”
AssertionError: Invalid sampling rate: 24000

エラー、、、はい、大丈夫です。
トライ&エラーはつきものです。こんな事では凹みません。

「無効なサンプリングレートだよ! 何をやってるんだよ!!」と、怒られています。
なるほど。音声ファイルを16000レートにしないと、エラーになるようです。
 

作成した音声ファイルのレートを変換し、再度、実行!!

can’t allocate memory: you tried to allocate 2434019328 bytes

再度、エラー、、はい、大丈夫です。
こんな事では凹みません。

「メモリ不足だよ! ちゃんと考えろよ!!」と、怒られています。
調べていくと、音声が長すぎるようです。

そこで、30秒、40秒、60秒、90秒、120秒の音声ファイルで試してみました。

30秒 ――> 動作しました。

実際の音声 実行結果
本日はご多忙の中、お時間を作ってくださり、ありがとうございます。
いえいえ、こちらこそ、ありがとうございます。

…それでは、始めましょうか。
はい。

今日の打ち合わせの目的は「ポケモンの捕まえ方について」です。

できれば、5分くらいで、ポケモンの捕まえ方をお伝えし、理解いただければ…と思っておりますので、ご協力よろしくお願いいたします。

本日はご多忙の中お時間を作ってくださりありがとうございますいえいえこちらこそありがとうございますというわけできれば5分くらいでいいかなということをお伝えしていただければと思っておりますのでご協力よろしくお願いいたします

誤認識はさておき、途中の音声が認識できていないのか、音声ファイルが長すぎるのか、音声の一部がカットされているようです。

40秒 は省略し、60秒 ――> 動作しました。

実際の音声 実行結果
本日はご多忙の中、お時間を作ってくださり、ありがとうございます。
いえいえ、こちらこそ、ありがとうございます。

…それでは、始めましょうか。
はい。

今日の打ち合わせの目的は「ポケモンの捕まえ方について」です。
できれば、5分くらいで、ポケモンの捕まえ方をお伝えし、理解いただければ…と思っておりますので、ご協力よろしくお願いいたします。

おっと。あまり時間がありませんね。
…そうですね。
あまり時間を掛けてしまうと、時間帯によっては、ポケモンがいなくなってしまう可能性がありますので…申し訳ございません。

いえいえ、おっしゃる通りです。では、さくっとはじめましょうか。
あっ、はい。ありがとうございます。

では、さっそく…弊社が考えた「ポケモンの捕まえ方」です。

資料をお渡しします。
そちらをご覧いただきながら、説明したいと思います。

よろしくお願いします。

本日はお時間を作ってくださりありがとうございますいえいえこちらこそありがとうございますそれでははじめましょうかはい今日のうちにですねできれば5分くらいでこの時間をお伝えしていただければと思っておりますのでよろしくお願いいたしますあっそうですねあんまり時間をかけてしまう時間帯によってはいなくなってしまう可能性がありますのでございましょうかありがとうございますでは早速こちらをご覧頂きたいと思います

30秒 の時と同じように一部の音声がカットされていました。
それとなぜか、先ほどはカットされていた「それでははじめましょうかはい」など、文字起こしされています。
逆に30秒 の時には認識されていた「本日はご多忙の中お時間を」が「本日はお時間を」に省略されています。
音声が長いと、ランダムで省略されてしまうのでしょうか。

90秒 を省略し、最後は120秒 ――> 動作しました。

実際の音声 実行結果
本日はご多忙の中、お時間を作ってくださり、ありがとうございます。
いえいえ、こちらこそ、ありがとうございます。

…それでは、始めましょうか。
はい。

今日の打ち合わせの目的は「ポケモンの捕まえ方について」です。
できれば、5分くらいで、ポケモンの捕まえ方をお伝えし、理解いただければ…と思っておりますので、ご協力よろしくお願いいたします。

おっと。あまり時間がありませんね。
…そうですね。
あまり時間を掛けてしまうと、時間帯によっては、ポケモンがいなくなってしまう可能性がありますので…申し訳ございません。

いえいえ、おっしゃる通りです。では、さくっとはじめましょうか。
あっ、はい。ありがとうございます。

では、さっそく…弊社が考えた「ポケモンの捕まえ方」です。

資料をお渡しします。
そちらをご覧いただきながら、説明したいと思います。

よろしくお願いします。

皆さんもご存じの通り、モンスターボールを投げる事で、ポケモンを捕まえる事はできます。
…ただ、ポケモンが強くなってきますと、1度、モンスターボールを投げるだけではポケモンは捕まえられません。

そうなんだよねー、困ったことに。

…はい。
そこで、「ポケモンを弱らせる」という方法がございます。

攻撃をして体力を減らす、または、麻痺状態などの状態異常にします。その後、モンスターボールを投げると、ポケモンは捕まえやすくなります。

今日はこのお時間を作ってくださりありがとうございますいえいえこちらこそありがとうございますそれでははじめましょうかはい今日はこちらのテーマについてですができれば5分くらいでそのまえをお伝えしていただければと思っておりますのでご協力をよろしくお願いいたしますとそうですねあまり時間をかけてしまうという時間帯によってはいけなくなってしまう可能性がありますのでございませんというおっしゃるとおりですではありましょうかはいありがとうございますでは早速なんですがこちらをご覧いただきながら説明したいと思いますお願いしますので皆さんもご存じのとおりスターボールをあげることはできましたがポケモンがなくなっていますと一度のモンスターボールを投げるだけではありませんそうなんですねということでございましてまたこの時間にしましょうかその後もスターボールを投げることはあります

60秒 の時と似たような結果です。

…というか、誤認識はさておき、省略され過ぎて、もはや日本語がおかしく何の会話か分かりません。
それと、区読点や改行がないので、読みづらいです。
区読点は難しいにしても改行はしたいです。

 
この後も検証は続けているのですが、長くなってきたので「その2」に続きます。