他发现众多参考人员的反应不对文字转WAV音频