学术会议报告视频
一、概要
需要准备的内容:
- 幻灯片
- 演讲稿
需要用到的软件(工具):
- 演讲稿转语言 IBM text to speech
- 字幕生成 网易见外
- 视频剪辑 Final Cut Pro X
- srt字幕转fcpxml toolnb
二、 准备
2.1 准备音频
首先将准备的演讲稿转成音频,试了google和microsoft的服务,注册时都需要信用卡。所以选了IBM的服务,每个月免费10000字符转换服务,正好够用。
注册之后打开https://cloud.ibm.com/catalog/services/text-to-speech,新建一个默认的服务

完成之后引导提供了基于curl简单的用法
curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--header "Accept: audio/wav" \
--data "{\"text\":\"hello world\"}" \
--output hello_world.wav \
"{url}/v1/synthesize?voice=en-US_MichaelV3Voice"
点击 Manager,这里有服务器地址和授权密钥,直接替换上面的{apikey}和{url},然后修改--data和--output参数就得到了最后的形式

打开一个Linux终端,输入以上命令,转换完成声音文件会保存到--output参数指定的位置

2.2 准备字幕
先用音频生成字幕。 打开网易见外https://jianwai.youdao.com/,新建一个`视频转写`项目,上传视频,直接生成。为了生成的质量更好可以先用剪辑软件对音频适当断句。

生成完成点击右上角导出,得到srt格式的文件。

然后改正字幕错误。语音识别肯定会有错误,直接用文本编辑器打开srt字幕文件,对着演讲稿,将演讲稿中的文字复制到字幕文件中时间轴对应的位置。
最后将srt格式的字幕文件转换成Final Cut Pro能用的fcpxml格式。打开https://sc.toolnb.com/tools/srt2fcpxml.html,上传srt文件,点击`处理文件`即可得到fcpxml格式。
2.3 准备视频
如果是slide是ppt格式的,可以直接用PowerPoint的排练对着音频的时间轴生成视频,这样在剪辑的时候会省点事。
如果是pdf格式的,将每一页的pdf转换成图片,可以用一些转换服务(注意分辨率),我这里直接用高分辨率的显示器截图。
三、剪辑
这样所有的东西都准备好了,将视频、音频、字幕导入Final Cut Pro X,开剪。
- 新建资源库2022,新建事件icassp,新建项目v1,选1080p 60帧

右键事件导入媒体,导入slide图片和音频

将图片拖入下方时间线,即可创建主要故事情节,将音频拖入图片下方。按住b点击音频给音频适当断句,根据音频拖动图片边缘调整画面持续时间

调整完音视频成之后加入字幕。
点击文件>导入>XML,导入完成自动生成一个新的项目,双击打开该项目,复制所有字幕,粘贴到咱们的项目v1。

适当调整字幕的断句、时间,剪辑完成。
点击右上角导出,设置里选电脑,仅存储。

等待左上角导出完成。

Comments ()