在设计上就应该是满足部分要求的文字转WAV音频