恐怕难以避免文字转WAV音频