基本上就可以确定两人的推断了文字转WAV音频