他们的想法确实是真的文字转WAV音频