但由于有较为明确的分工文字转WAV音频