从表演度和观众的热情度来看文字转WAV音频