所以真正会参与到整个制作拍摄流程的文字转WAV音频