Clear Sky Science · ru
Геолокализованные данные об участии в конференциях СИТЕС
Почему важно, кто приходит на совещания по дикой природе
Когда страны собираются, чтобы решать, сколько слоновой кости, экзотической древесины или редких рептилий можно торговать, люди в зале определяют дальнейшую судьбу находящихся под угрозой видов. Однако до сих пор не существовало ясного, детального регистра того, кто действительно посещал крупные глобальные встречи, регулирующие эту торговлю. В этой статье представлен первый всеобъемлющий, анонимизированный и готовый для карт набор данных о всех участниках почти 50 лет решений в рамках СИТЕС — Конвенции о международной торговле видами дикой флоры и фауны, находящимися под угрозой исчезновения. 
Глобальный договор в центре торговли дикой природой
CITES — главное международное соглашение, призванное не допустить, чтобы глобальная торговля толкала диких животных и растения к исчезновению. С середины 1970-х годов в него присоединилось почти каждое государство. Каждые два–три года государственные делегаты и наблюдатели от организаций, отрасли и правозащитных групп собираются на Конференциях Сторон (CoP), чтобы обсуждать правила торговли более чем 40 000 видов. Именно на этих встречах виды переводят на защищаемые списки или исключают из них, а страны оценивают выполнение условий конвенции. Несмотря на центральную роль, исследователи, журналисты и активисты не имели базовой, последовательной информации о том, кто участвует в этих переговорах, откуда прибывают участники и как эти шаблоны меняются со временем.
Преобразование разнородных списков участников в пригодную информацию
Авторы взялись заполнить этот пробел, собрав записи об участниках для всех 20 конференций СИТЕС, прошедших с 1976 по 2025 год. Они собрали 30 официальных реестров участников, опубликованных Секретариатом CITES, в основном в формате PDF с сайта конвенции и один ранний список из архивов. Эти документы значительно отличались друг от друга: некоторые были отсканированными изображениями, другие — аккуратными цифровыми таблицами; в одних был один длинный столбец имён, в других — два и более; также сильно варьировало количество сведений об аффилиации, адресах и должностях. С помощью сочетания оптического распознавания символов для отсканированных страниц и инструмента на Python, читающего точную позицию и стиль каждого слова, команда создала гибкий конвейер, способный распознавать заголовки стран или организаций, отделять отдельных людей в записи и фиксировать, представлял ли каждый участник голосующую страну (Сторону) или группу наблюдателей.
Добавление местоположений, расстояний и демографии
После извлечения блоков с данными об отдельных участниках авторы классифицировали текст на ключевые элементы: к какой делегации относился человек, наличие почётного обращения, имя человека и его организационная аффилиация. Имена затем стандартизировали и заменили криптографическими хешами, создав анонимные, но последовательные идентификаторы, которые не позволяют восстановить исходные имена. Команда использовала текст аффилиации — такие как названия городов и стран — чтобы определить приблизительные широту и долготу для многих участников, опираясь на публичные картографические сервисы. Для защиты приватности они намеренно сгладили точные координаты до центроидов города, региона или страны и зафиксировали степень точности каждого координатного присвоения. Также они вычислили, какое расстояние преодолел каждый участник, рассчитывая дистанцию между местоположением аффилиации и городом-хозяином встречи. Наконец, для большинства участников они вывели пол с помощью специализированного инструмента, основанного на именах, сопоставив результаты с случаями, где имелись гендерно-специфичные обращения вроде «Mr.» или «Ms.», чтобы обеспечить разумную точность. 
Что содержит итоговый набор данных
В результате получился открытый CSV-файл с 20 297 записями участников, охватывающими все конференции СИТЕС на текущую дату. Для каждой записи набор данных включает номер встречи, год и город-хозяин; указывает, прибыл ли участник от делегации Стороны или от наблюдательной группы (с более детальными категориями, такими как неправительственные организации или частный сектор в последние годы); стандартизованное название делегации; анонимный идентификатор человека; и текст аффилиации с удалёнными контактными данными. Также предоставлены геокоординаты и индикатор уровня их точности, пройденное расстояние до встречи, бинарные флаги статуса Стороны против наблюдателя, гендерные индикаторы, выведенные на основе обращений и алгоритмических предсказаний, и общие коды стран для представителей государств. Авторы отмечают, что около 90 процентов проверенных геоприсвоений корректны как минимум до уровня страны, а автоматические гендерные метки совпадают с метками на основе обращений более чем в 92 процентах случаев.
Новые способы изучать влияние и присутствие на переговорах по дикой природе
Этот новый набор данных не даёт оценок, успешна ли СИТЕС или нет, но он значительно упрощает изучение того, как представительство и влияние могут быть связаны с результатами в области охраны природы. Исследователи теперь могут выяснять, какие страны регулярно присутствуют, какие регионы или типы организаций недопредставлены, на какие расстояния люди приезжают для участия и как сети участия между правительствами, агентствами ООН и НПО развивались за пять десятилетий. Поскольку данные геолокализованы и анонимизированы, они также позволяют проводить пространственные и сетевые анализы, не раскрывая личных данных. По сути, статья превращает разбросанные, неупорядоченные списки участников в чистый, повторно используемый ресурс, помогающий понять, у кого есть место за столом, когда мир решает будущее торговли дикой природой.
Цитирование: Blinova, D., Emuru, G., Emuru, R. et al. Geo-located attendance data for CITES Conferences of the Parties. Sci Data 13, 493 (2026). https://doi.org/10.1038/s41597-026-06799-y
Ключевые слова: CITES, торговля дикой природой, международные переговоры, данные об участии, геопространственный анализ