根本就没办法定义和形容文字转WAV音频