没有使用如LMS那样的场景开场文字转WAV音频