无论是戏份还是台词都明显强于后者文字转WAV音频