这是什么?
UN Transcripts 是一个处于公开预览阶段的工具,可从联合国公开会议录像(例如 联合国网络电视 (在新标签页中打开))中自动生成转录文本。这些转录并非联合国正式记录。
面向谁?
本工具旨在帮助任何需要快速获取联合国公开会议口头内容的人,包括:
- 在多个机构间跟踪会议工作的外交官和代表团工作人员
- 研究联合国公开辩论和表决记录的研究人员和学者
- 报道联合国事务的记者
- 参与政策讨论的民间社会组织
- 审阅公开会议记录的联合国秘书处工作人员
涵盖哪些会议?
本工具涵盖在联合国公开平台上录制并发布的公开会议,包括:
- 安全理事会
- 大会
- 人权理事会
- 经济及社会理事会
- 联合国网络电视上可获取的其他政府间机构
闭门或秘密会议不会在网络电视上录制,因此不在本工具的涵盖范围内。
工作原理
1
收集会议日程
系统通过联合国网络电视保持一份始终最新的联合国会议汇总。
2
音频转录
我们转录现有的联合国音频声道 — 原始的「现场」声道和每一种可用的联合国官方口译声道。不进行机器翻译。每个声道由适合该语言的语音识别模型进行转录。
3
发言者识别
转录完成后,第二个模型会分析文字和音频,在可能的情况下为每位发言者标注姓名和所属。它使用上下文线索 — 主席介绍代表、提及国家名称、说话人分离 — 并结合可获得的正式与会者名单。无法识别时,则显示「发言者 1」之类的占位标签。
4
主题分析
系统自动分析转录文本,识别讨论的主要政策主题,并使用与相关会议事项相关的类别(例如人道主义事务、国际和平与安全、人权)。所定义的主题取决于每个视频的内容,不遵循预定义的框架,仅供参考。
准确性与局限
这些转录由自动语音识别生成,并非正式记录。
它们是更快速的非官方参考,但不应作为权威引用。如需正式记录,请参阅联合国正式文件系统 (在新标签页中打开)(逐字记录、简要记录和决议)。
自动转录比人工转录快得多,但可能产生错误。常见问题包括:
- 姓名、缩写或文件编号可能被听错或拼错
- 准确性也可能因发言者和麦克风质量而异
- 对于时间很长的会议,可能无法区分所有发言者
数据来源
- 联合国网络电视 — 会议录像和元数据,通过该平台提供(公开访问地址为 webtv.un.org)。
- 联合国正式文件系统 — 从 documents.un.org 检索的正式逐字记录(PV 文件,凡可获取者)。
状态
本工具处于公开预览阶段。功能、覆盖范围和准确性正在持续改进。欢迎反馈。