我们会利用技术手段直接定位文字转WAV音频