他们只需要老老实实的文字转WAV音频