Что это?
UN Transcripts — инструмент в публичной превью-версии, автоматически создающий расшифровки из записей открытых заседаний Организации Объединённых Наций, например UN Web TV (открывается в новой вкладке). Эти расшифровки не являются официальными документами ООН.
Для кого это?
Инструмент призван помочь всем, кому нужен быстрый доступ к произнесённым на открытых заседаниях ООН выступлениям, в том числе:
- Дипломатам и сотрудникам делегаций, следящим за работой нескольких органов
- Исследователям и учёным, изучающим открытые дебаты и голосования ООН
- Журналистам, освещающим деятельность Организации Объединённых Наций
- Организациям гражданского общества, участвующим в политических обсуждениях
- Сотрудникам Секретариата ООН, изучающим материалы открытых заседаний
Какие заседания охватываются?
Инструмент охватывает открытые заседания, записанные и опубликованные на общедоступных платформах ООН, включая:
- Совет Безопасности
- Генеральная Ассамблея
- Совет по правам человека
- Экономический и Социальный Совет
- Другие межправительственные органы, доступные на UN Web TV
Закрытые или конфиденциальные заседания не записываются на Web TV и поэтому не охватываются.
Как это работает
1
Сбор расписания заседаний
Система поддерживает постоянно актуальную подборку заседаний ООН на основе UN Web TV.
2
Транскрибирование аудио
Мы транскрибируем существующие аудиоканалы ООН — оригинальный «зальный» канал и каждый из доступных официальных каналов устного перевода ООН. Машинный перевод не применяется. Каждый канал транскрибируется моделью распознавания речи, подходящей для соответствующего языка.
3
Идентификация выступающих
После транскрибирования вторая модель анализирует текст и аудио, чтобы по возможности присвоить выступающим имена и принадлежность. Она использует контекстные подсказки — председатель представляет делегатов, упоминания названий стран, диаризация говорящих — а также официальный список участников, когда он доступен. Когда это невозможно, отображаются условные обозначения вроде «Выступающий 1».
4
Анализ тем
Расшифровка автоматически анализируется для определения основных политических тем, обсуждавшихся на заседании, с использованием категорий, релевантных соответствующим заседаниям (например, гуманитарные вопросы, международный мир и безопасность, права человека). Определяемые темы зависят от содержания каждого видео и не следуют заранее заданной схеме; они приводятся исключительно в справочных целях.
5
Сопоставление с официальными документами
Точность и ограничения
Эти расшифровки создаются автоматическим распознаванием речи и не являются официальными документами.
Они представляют собой более быстрый, неофициальный источник, но на них не следует ссылаться как на авторитетные. Официальные документы см. в Системе официальной документации ООН (открывается в новой вкладке) (стенографические отчёты, краткие отчёты и резолюции).
Автоматическое транскрибирование значительно быстрее человеческого, но может допускать ошибки. Типичные проблемы:
- Имена, аббревиатуры и условные обозначения документов могут быть неверно распознаны или написаны
- Точность также может зависеть от говорящего и качества микрофона
- На очень длинных заседаниях не все выступающие могут быть различены
Источники данных
- UN Web TV — Записи и метаданные заседаний, предоставляемые через платформу (общедоступную на webtv.un.org).
- Система официальной документации ООН — Официальные стенографические отчёты (документы PV), получаемые с documents.un.org, когда они доступны.
Статус
Этот инструмент находится в публичной превью-версии. Возможности, охват и точность активно совершенствуются. Будем рады вашим отзывам.