因为它涉及到很多的技术文字转WAV音频