因为如果表达的过于清晰文字转WAV音频