但是缺少证据支持都是白假设文字转WAV音频