Учредитель журнала

Выявление актуальных вопросов энергетической политики в публикациях из открытых реферативных
баз данных

УДК [303.6+303.7]:001.8

DOI 10.52815/0204-3653_2023_5194_
EDN: TYSTUE

Чигарев Борис
Ведущий инженер по научно-­технической информации Института проблем нефти и газа РАН, к. ф.‑ м. н.
E-mail: bchigarev@ipng.ru

Цель публикации

Показать возможность использования открытых зарубежных реферативных баз данных для анализа актуальных исследовательских задач по теме: «Энергетическая политика».

Мотивация проведения данного исследования

Прекращение доступа российских исследователей к ведущим реферативным базам данных Scopus и Web of Science затрудняет анализ выявления актуальных направлений исследований, но не исключает возможности их проведения.
Такая ситуация способствует переходу к использованию реферативных баз данных открытого доступа. Использование подобных баз данных имеет ряд преимуществ: более широкий охват индексируемых публикаций, разнообразие в работе их поисковых систем, разнообразие аналитических возможностей, наличие отраслевой специфики.
Специалистам и экспертам необходимо быть в курсе новых научных разработок и иметь доступ к получению необходимых знаний. Чтение многочисленных публикаций может оказаться непосильной задачей, библиометрические методы позволяют сузить круг подлежащих прочтению статей и предложить публикации из смежных областей знаний.
Обоснование выбора открытой базы для начала сбора данных

База данных рефератов должна охватывать широкий спектр публикаций по теме энергетической политики и экспортировать библиометрические данные. Предварительный анализ трех общедоступных баз данных – The Lens, Dimensions и SciLit – по прямому запросу «энергетическая политика» в полях названия и аннотации статей и материалов конференций за 2014–2023 гг. позволил получить 9 844, 9 259 и 8 714 результатов соответственно.
Преимуществом базы данных Lens является также возможность одновременного экспорта до 50 тыс. записей.
На момент написания данной работы, октябрь 2023 года, в The Lens проиндексировано 265 124 072 научных работ, для сравнения: в Dimensions – 140 млн публикаций, в SciLit – 160 млн.
Недостатком этой базы данных является неполное заполнение полей аннотаций и ключевых слов. Поэтому записи The Lens целесообразно дополнять открытыми данными издательств, например, ScienceDirect издательства Elsevier.

Примечания по другим открытым реферативным базам

Для выявления конкретных проблем можно использовать открытые платформы, такие как SPE OnePetro, IEEE Xplore, Semantic Scholar, CORE, BASE и материалы Министерства энергетики США. Semantic Scholar индексирует более 214 млн научных статей, используя искусственный интеллект в поисковой системе, а CORE предоставляет доступ к крупнейшей в мире коллекции научных работ открытого доступа. BASE предлагает более 340 млн документов от более чем 11 000 поставщиков контента, причем 60% проиндексированных документов доступны бесплатно. Министерство энергетики США также предоставляет платформу для поиска публикаций ведущих американских лабораторий по энергетической тематике.

Краткий обзор литературы

Публикация [1] представляет собой справочное пособие для исследователей, финансирующих организаций, разработчиков энергетической политики и специалистов отрасли о ходе исследований в области «зеленого» строительства. В работе проведен обзор 1147 научных статей и определены десять основных областей исследований по этой теме.
В исследовании [2] проанализировано 104 статьи, посвященные бизнес-­моделям электромобилей, основное внимание уделялось технологиям зарядки, услугам для водителей, управлению питанием и коммерческим контрактам. Больше всего исследований было проведено в Китае, США и Германии. Анализ выявил два направления исследований: инновационные технологии и оптимизация использования ресурсов, а также системы управления электропитанием и жизненный цикл оборудования.
В статье [3] рассматривается состояние энергетической безопасности ЕС и Румынии с акцентом на глобальные усилия по достижению климатической нейтральности. В работе используются исторический, логический и библиометрический методы для анализа политики устойчивого развития и взаимосвязи экономических процессов в энергетическом секторе. Авторы прогнозируют проблемы в достижении экологических целей и выделяют энергетическую бедность как социальный фактор, влияющий на глобальные стратегические решения.
Работа [4] представляет собой ретроспективный обзор журнала Energy Policy, издающегося 50 лет. На основе библиометрических данных из Web of Science получены результаты, свидетельствующие о том, что ежегодный объем публикаций в журнале Energy Policy составляет около 600 статей при среднем показателе 41,42. Журнал охватывает такие темы, как изменение климата, технологические инновации, экономическое развитие и социальное равенство.
Исследование, проведенное авторами работы [5], выявило дисбаланс в публикациях по энергетической политике, когда ученые из стран с высоким уровнем дохода доминируют в исследованиях, предлагающих энергетическую политику для стран с низким и средним уровнем дохода. Количество цитирований увеличивается с ростом ВВП страны первого автора.
Последняя работа указывает на актуальность библиометрических исследований и анализа тематики публикаций с использованием открытых реферативных баз данных и возможности публикаций в журналах, не обязательно индексируемых в Scopus и Wo S.
Высокая стоимость публикаций в ведущих журналах с открытым доступом, необходимость платной подписки для доступа в Scopus и WoS, доминирующая ориентация на высокую цитируемость авторов у издательств затрудняет для авторов из развивающихся стран продвигать свои исследования, раскрывающие проблемы энергетического перехода и энергетической политики, направленной на их преодоление для стран с невысоким ВВП.
Поэтому одной из задач нашей статьи в развитие темы публикации [5], является доказательство доминирования тематики, продвигаемой странами с высоким ВВП, и недостаточного отражения проблем, возникающих у развивающихся стран при реализации их энергетической политики.

Материалы и методы

В данной статье использовались17 138 библиометрических записей, экспортированных платформой The Lens [6] по запросу: Filters: Year Published = (2014 -) Field of Study = (Energy policy). Использование фильтрации по полю Field of Study позволило расширить выборку по сравнению с запросом, основанном на встречаемости термина Energy policy в полях заголовков и аннотаций (9 844 записи).
Для анализа тематики публикаций использовались данные полей Title и Abstract.
Для анализа тематики, определяемой по авторским ключевым словам, использовались библиометрические данные, экспортированные из открытой реферативной базы ScienceDirect по запросу: Journal or book title: Energy Policy; Year: 2019–2023; Research articles – 2827 записей. Данные актуальны на октябрь 2023 г.
Выборки различаются, но это позволяет оценить устойчивость интереса к актуальным задачам энергетической политики.
Кластеризация документов (17 138 записей) осуществлялась с использованием демоверсии программы Carrot2 и алгоритма Lingo3G [7], текстами служили заголовки публикаций.
Кластеризация по ключевым терминам проводилась с использованием программы VOSviewer [8]. Для записей платформы The Lens использовались тексты полей Title и Abstract, а для записей ScienceDirect – Keywords [9]. Осуществлялась предобработка текстов, включающая удаление 973 стоп слов, замена не UTF‑8 символов на ближайшие в латинице, перевод в нижний регистр и стемминг по Krovetz [10].
Для формирования примера важности часто встречаемых терминов, но не формирующих отдельный кластер, использовалось онлайн приложение Clustering App, основанное на выявлении тематики тестов с использованием факторизация неотрицательных матриц [11].

Краткие характеристики выборки платформы The Lens

«Energy policy» очевидный фаворит в списке, т. к. именно по этому термину производилась фильтрация выборки. Далее следуют экономические и бизнес исследования, тема возобновляемой энергетики и инженерные задачи, включая вопросы электрификации. Ископаемому топливу уделяется мало внимания. Тематика хорошо отражает интересы Евросоюза (European union на графике).

Рис. 1. Распределение количества публикаций по полям исследований (Field of Study)

Тематика данных журналов хорошо согласуется с полями исследований, представленных на предыдущем графике, за исключением таких журналов как Energy Research & Social Science. На первом графике отдельного поля по социальным аспектам энергетики не представлено.
Присутствия стран Африки, Латинской Америки и Азии, за исключением Китая и Индии с их полуторамиллиардным населением в данном списке не наблюдается, но присутствуют страны ЕС, Северной Америки, Австралия и Япония, активно продвигающие энергопереход от ископаемых источников к возобновляемой энергетике.

Рис. 2. Основные источники публикаций, отсортированные по числу опубликованных документов

Следует учитывать, что научные публикации – эффективное средство продвижения политэкономических тематик [12].

Рис. 3. Основные страны, с институтами которых аффилированы авторы публикаций

Результаты и обсуждения

Наиболее наглядно актуальная тематика публикаций представлена на рис. 4 в виде 6 главных кластеров и их субкластеров, полученных группированием публикаций по близости текстов их заголовков. Всего получено 29 кластеров при параметрах по умолчанию программы Carrot2.
В публикациях по энергетической политике доминирует тема энергетического перехода в возобновляемой энергетике. Следует подчеркнуть, что данный метод кластеризации публикаций относит отдельную статью к нескольким кластерам (тегирование). Тематика Climate and Energy Policy, UE Energy также хорошо представлена в данной выборке публикаций. Данный рисунок отражает практически все основные вопросы перехода к возобновляемой энергетике за исключением вопросов инвестиций и социальных аспектов. Но именно они связаны с тезисом седьмой цели ООН о доступной и чистой энергетике.

Рис. 4. 6 основных тематик исследований основанных на кластеризации текстов 17 138 заголовков публикаций платформы The Lens

В списке основных кластеров отсутствуют такие термины как «circular economy», «energy poverty», «clean energy investments» или «affordable clean energy». Например, к кластеру Energy Poverty программой отнесено только 76 публикаций, в то время как Energy Policy – 2051.
Представленная кластеризация основана на группировании схожих документов и удобна для выбора статей, представляющих интерес для дальнейшего анализа.
Для формирования новых запросов для обращения к базам данных целесообразно провести кластеризацию терминов, входящих в тексты заголовков и аннотаций.
На рис. 5 показаны результаты, полученные с помощью программы VOSviewer, алгоритм кластеризации которой основан на совместной встречаемости терминов. Анализ проводился при условии минимума 10 терминов в кластере.

Рис. 5. 6 кластеров ключевых терминов, извлеченных из текстов заголовков и аннотаций
17 138 записей платформы The Lens

Ниже представлены 20 наиболее часто встречаемых терминов для каждого кластера, в формате: термин (его встречаемость).
Красный кластер (128 терминов, общая их встречаемость – 13591): energy security (574), energy resource (417), European union (372), crisis (344), Europe (315), energy market (279), Russia (256), actor (252), reform (229), institution (225), law (220), Ukraine (210), agreement (199), governance (199), turkey (191), cooperation (190), natural gas (188), agenda (187), energy strategy (179), oil (177).
Тематика данного кластера относится к вопросам энергетической безопасности стран Евросоюза, энергетическому кризису, связанному с поставками природного газа, военным конфликтом на Украине, выработкой энергетической стратегии ЕС и даже ролью Турции в поставках газа.
Зеленый кластер (97 терминов, общая их встречаемость – 8078): cost (527), generation (285), power plant (237), plant (219), coal (199), scheme (197), renewable energy technology (187), India (186), power generation (177), grid (169), electricity market (162), electricity generation (160), renewable energy resource (157), adoption (155), operation (146), solar energy (146), renewable source (131), biomass (127), wind (126), user (125).
Тематика данного кластера связана с ценой генерации электроэнергии, включая возобновляемую энергетику. Для больших развивающихся стран, наиболее представительной из которых является Индия, такие источники энергии как уголь и биомасса продолжают быть актуальными.
Синий кластер (74 термина, общая их встречаемость – 4491): household (356), survey (203), characteristic (162), intervention (149), interview (118), income (109), evaluation (104), Nigerium (99), Africa (97), firm (94), knowledge (91), behavior (91), access (81), energy poverty (81), energy country (80), energy cost (76), perception (75), sustainable development goal (74), renewable energy project (74), poverty (71).
Термины данного кластера отражают тематику энергетической бедности и доступности энергии для домохозяйств, учитывающей их доходы и цену энергии. Наиболее актуальной данная проблема является для стран Африки. Тема согласуется целью 7 устойчивого развития – доступная и чистая энергетика.
Хаки кластер (59 терминов, общая их встречаемость – 17495): energy consumption (603), economic growth (320), variable (219), evidence (215), relationship (196), carbon emission (169), technique (163), test (159), unit (145), policy implication (130), quality (109), electricity consumption (107), energy intensity (101), purpose study (89), panel (88), province (88), hypothesis (80), renewable energy consumption (76), demand energy (74), procedure (73).
Термины данного кластера, в основном, отражают тематику энергопотребления, экономического роста, углеродных выбросов, технологий и политического подтекста.
Пурпурный кластер (53 термина, общая их встречаемость – 3959): scenario (656), reduction (208), pathway (154), policy instrument (151), climate energy policy (150), climate policy (135), Paris agreement (123), power sector (99), policy measure (96), emission reduction (95), energy model (91), assumption (85), policy decision (83), energy scenario (80), energy infrastructure (76), phase (75), GHG emission (74), energy future (74), decarbonization (72), energy alternative (72),
Термины кластера отражают тематику сценариев реализации климатических аспектов энергетической политики.
Голубой кластер (22 термина, общая их встречаемость – 1773): building (382), city (212), performance (167), parameter (124), energy saving (105), simulation (95), saving (93), stock (71), temperature (62), heat (61), energy building (55), energy performance (51), range (49), house (41), heat pump (37), energy requirement (32), guide (30), energy efficiency building (28), total energy (28), energy efficiency program (22).
Термины данного кластера связаны с тематикой энергосбережения и энергоэффективности зданий и городов. Стоит обратить внимание на продвигаемую в Европе тему тепловых насосов для зданий.

Тематика публикаций в журнале Energy Policy за 2019–2023 гг. на основе анализа ключевых слов

На рис. 6 представлена кластеризация авторских ключевых слов по результатам анализа 2827 записей при условии минимума 40 ключевых слов в кластере.

Рис. 6. 6 кластеров ключевых слов 2827 записей из журнала Energy Policy

Для сравнения с рис. 5 представим 20 наиболее часто встречаемых терминов для каждого кластера, в формате: термин (его встречаемость).
Красный кластер (106 терминов, общая их встречаемость – 1268): energy transition (129), climate change (73), energy justice (47), co2 emissions (41), sustainability (39), decarbonization (31), demand response (25), innovation (24), electricity markets (22), nuclear energy (22), choice experiment (21), fuel poverty (21), social acceptance (21), flexibility (20), community energy (16), carbon pricing (15), households (15), public opinion (15), governance (14), solar (14).
Самый большой кластер по числу уникальных терминов для библиометрических записей журнала Energy Policy посвящен энергетическому переходу, термины описывают актуальные задачи энергетического перехода, включая изменение климата, энергетическую справедливость, эмиссию CO2, вопросы устойчивого развития, инноваций и т. д.
Зеленый кластер (99 терминов, общая их встречаемость – 1285): energy efficiency (161), China (132), India (46), climate policy (41), electric vehicles (40), carbon tax (31), energy access (26), electricity consumption (22), rebound effect (21), sustainable development (21), greenhouse gas emissions (20), Brazil (17), electric vehicle (17), panel data (17), Paris agreement (17), rural electrification (16), coal (15), incentives (15), Ghana (14), clean energy (13).
Ключевые слова данного кластера отражают важность энергетической эффективности таких стран как Китай, Индия, Бразилия и Гана в контексте Парижских соглашений по климату.
Синий кластер (59 терминов, общая их встречаемость – 577): carbon emissions (39), energy (38), European union (30), natural gas (28), system dynamics (28), environmental regulation (18), feed-in tariff (17), uncertainty (16), EU ets (14), Russia (14), Africa (11), Germany (11), green finance (11), renewable portfolio standards (11), carbon leakage (10), infrastructure (9), transport (9), Vietnam (9), efficiency (8), emissions (8).
Выбросы углерода – основная тема данного кластера, она касается не только конкретных стран и регионов, но и таких вопросов как «зеленое финансирование» и стандарты на возобновляемые источники энергии.
Хаки кластер (58 терминов, общая их встречаемость – 732): energy policy (132), electricity (51), regulation (40), decarbonisation (29), solar pv (25), public acceptance (20), hydrogen (19), renewable energy policy (19), electricity market (18), renewables (16), covid‑19 (15), market design (15), renewable energy sources (15), auctions (13), discrete choice experiment (13), investment (12), wind (12), coal phase-out (11), auction (10), energy law (10).
Вопросы энергетической политики, согласно данному кластеру, охватывают широкий круг проблем, начиная от задач регулирования, технических, экономических и даже последствий пандемии вируса COVID, заканчивая законодательством в области энергетики.
Пурпурный кластер (46 терминов, общая их встречаемость – 527): energy poverty (75), energy security (47), energy consumption (45), economic growth (27), energy demand (22), developing countries (17), environmental policy (17), air pollution (16), energy intensity (14), financial development (13), carbon neutrality (11), difference-in-differences (11), Bangladesh (10), employment (10), south Africa (9), air quality (7), carbon intensity (7), climate change policy (7), cost-benefit analysis (7), health (7).
По сравнению с рис. 5, в данном случае тема энергетической бедности отражена более явно и связывается с одной стороны энергопотреблением для экономического развития развивающиеся стран, с другой – экологическими вызовами.
Голубой кластер (40 терминов, общая их встречаемость – 683): renewable energy (237), policy (39), wind energy (37), wind power (30), willingness to pay (27), energy storage (22), energy transitions (19), distributed energy resources (16), solar energy (16), battery storage (12), prosumer (11), survey (11), attitudes (10), electricity generation (10), photovoltaic (10), photovoltaics (10), renewable electricity (10), renewable energies (10), renewable portfolio standard (10), distributed generation (9).
Кластер объединяет термины, описывающие вопросы конкретных реализаций задач возобновляемой энергетики.
Ключевые слова публикаций этого журнала, также как тексты библиометрических записей платформы The Lens, хорошо отражают тему энергетического перехода. Следует подчеркнуть, что журнал имеет высокий рейтинг и, возможно, авторы могут ориентироваться на политическую актуальность тем исследований.
Cледует отметить, что и кластеризация документов и терминов хорошо описывают основные проблемы энергетической политики в контексте перехода энергетики на возобновляемые источники энергии. Однако ни в первом, ни во втором случае не представлена тема инвестиций, без которых невозможен энергетический переход.
Такую ситуацию предположительно можно объяснить тем, что вопросы инвестиций достаточно равномерно распределены в текстах публикаций, а для оценки значимости терминов при кластеризации используются метрики типа TF-IDF. Кластеризация публикаций, как и кластеризация ключевых терминов, основывается на том, что в кластер входят схожие термины или документы, но отличные от других кластеров.
Продемонстрируем данное утверждение на примере составления конкорданса для термина investment для пяти кластеров, полученных с использованием сервиса Clustering App.
Использовались те же преподготовленные тексты, что и при построении рис. 5 и параметры: Количество кластеров 5, количество слов для заголовка кластера 3, количество записей в кластере 3.

CLUSTER: 1: ENERGY POLICY EFFICIENCY
energy efficient technology implement investment project international cooperation direction
energy supplies formation competitive investment attractive energy market optimize
consumption environment require increase investment scientific field promote measure
energy audit financial analysis investment field determination source
CLUSTER: 2: ELECTRICITY POWER GENERATION
electricity deploy electricity consumption investment wind power price wind
capacity TW level broken investment solar energy increase USD
panel data regress model investment installation price wind power electricity
expect grow require extensive investment meet grow demand decade
conditions period study reduce investment cost electricity supply benefit
CLUSTER: 3: RENEWABLE ENERGY SOURCE
energy certificate renewable energy investment carbon emission
consumption study suggest increase investment renewable energy output energy
CLUSTER: 4: CHINA INDUSTRY DEVELOPMENT
dispute potential spill trade investment increase tension China Japan
role China foreign direct investment China resource quest change
produce stock global direct investment China company grown billion
China natural resource trade investment trend context discuss precedent
successful rebalance China economy investment industrial production service domestic
bank China company compete investment opportunity develop country
CLUSTER: 5: EUROPE EU GAS
energy partnership transatlantic trade investment partnership Caspian region southern gas
infrastructure anticipate financial boost investment plan Europe
Europe structural investment funds connect Europe facility
analyze revolution electricity market investment incentive upside renewable subsidy

Из приведенных данных видно, что термин investment встречается во всех кластерах, но в разном контексте. Похожая картина наблюдается, если число кластеров и отображаемых текстов увеличить до десяти.
В случае с термином «инвестиции» контекст может значительно отличаться, он встречается в различных публикациях, поэтому выделенный кластер, связанный с термином «инвестиции», может не сформироваться.
Выбор адекватных методов и критериев оценки таких терминов и их выявления требует отдельного рассмотрения.

Выводы и дальнейшие перспективы исследования

Открытые базы данных предоставляют достаточно возможностей для выявления актуальных задач исследования в определенной предметной области, в данном случае «Энергетической политики».
Платформа The Lens является рациональным начальным источником сбора и анализа материалов для выявления актуальных задач исследований.
Проанализированные материалы могут быть дополнены сведениями из других открытых источников, таких как реферативные базы издательств, а также Dimensions.ai, Core и т. д.
Тема «Энергетическая политика» в основном освещается в публикациях экономически развитых стран, таких как США, Китай, Англия, страны Европейского союза, Японии и Австралии. Развивающиеся страны в первую очередь представлены работами турецких и индийских авторов. Российских англоязычных материалов по теме «Энергетическая политика» достаточно мало – на уровне небольших европейских стран Норвегии и Швейцарии.
Среди журналов доминируют публикации в Energy Policy, журналах, связанных с энергетикой – Energies, Renewable and Sustainable Energy, а также Research Papers in Economics – сети архивов электронных документов по экономической тематике.
Выявление актуальных задач исследований, проведенное как на основе кластеризации публикаций, так и кластеризации ключевых терминов, показывает доминирование работ, посвященных вопросам энергетического перехода к возобновляемой энергетике и электрификации. Основные темы публикаций: энергетическая политика, возобновляемая энергетика, энергетический переход, энергетическая эффективность, энергетическая безопасность и энергетические системы.
Вопросам энергетической бедности и ископаемым источникам энергии уделяется меньше внимания в данных публикациях.
Проведенный анализ показал, что использование широко применяемых в настоящее время и дающих хорошие результаты методов определения тематик, основанный на кластеризации документов или кластеризации ключевых терминов может быть недостаточным.
Вопросы привлечения инвестиций часто встречаются в текстах заголовков и аннотаций, относящихся к разным кластерам, и не формируют свой, отдельный кластер.
Автор данной статьи считает целесообразным провести отдельное библиометрическое исследование тематики энергетического перехода, опираясь на данные альтернативной The Lens открытой реферативной платформы, а также применить в исследовании методы, отражающие тематику всего собранного материала, чтобы включить в анализ такие общие вопросы, как инвестиции или социальные аспекты энергетического перехода.