到时候他们肯定没法交代文字转WAV音频