Вы здесь ▸ Исследования ▸
Мини-анализ трендов в исследованиях баз данных и нейронных сетей
Я провёл небольшой анализ научных исследований по тем направлениям, которые мне особенно интересны. Прежде всего, это исследования баз данных и нейросетей.
Постановка задачи
В мире существует некоторое количество крупных баз документных данных, в которых собраны значительные по объёму полнотекстовые коллекции научных статей. Естественно, количество статей по некоторой тематике показывает, насколько популярен среди исследователей та или иная предметная область (иногда, вместо “предметная область” говорят “домен”). На этом резонном предположении и был основан мой мини-анализ “Исследования баз данных и нейросетей”.
Описание поискового эксперимента и результаты
Были взяты две крупные электронные библиотеки: IEEE Explore (для англоязычных публикаций) и ELIBRARY.RU (соответственно для русскоязычных). Для начала были взяты самые общие домены (см. первый абзац) и соответственно сформулированы запросы: “база данных” и “нейронная сеть”. С помощью поисковых систем этих библиотек в каждой из них было определено количество публикаций по заданным доменам за последние 15 лет. Причём это количество определялось для каждого года отдельно. Далее вычислялась доля публикаций, относящаяся к домену, в общем количестве публикаций за год. Очевидно, что относительное число публикаций является более точным показателем, чем абсолютное. Относительные величины уменьшают влияние факторов, не относящихся к домену. Примером такого фактора является изменение критериев отбора публикаций для размещения в базе данных электронной библиотеки. Вы можете видеть результаты в таблице и на графиках ниже.
Обсуждение
Доля исследований, касающихся баз данных, практически не изменяется на протяжении всего периода анализа. Она стабильна, что говорит об устойчивой востребованности этих исследований. Особенностью русскоязычных исследований баз данных является рост их доли, начало которого синхронизируется с ростом доли публикаций и домена “нейронные сети” (см. ниже).
Доля исследований, касающихся нейронных сетей, также имела стабильный характер до 2015-2016 гг. Затем взрывной рост, который продолжается и сейчас. Скачок числа публикаций объясняется активным продвижением новых архитектур нейросетей (например, трансформеров) и и появлением генеративных моделей. Обозначенные тенденции характерны и для российских исследований.
Еще одной особенностью российских публикаций является резкое снижение их доли в 2022-2023 гг. Причиной, скорее всего, является изменение политики учета наукометрических показателей в научной и университетской среде. В условиях санкционного давления, происходит постепенный отказ от ориентации на иностранные наукометрические базы данных (WoS, Scopus), что в целом снижает публикационную мотивацию. Может быть еще более ужесточились критерии отбора публикаций в ELIBRARY.RU.
Вывод
Картина стала более чёткой. Верной дорогой идём, товарищи! Жить стало веселей ;-).