这一标准模型完美的描述了强力文字转WAV音频