В 2021 году была разработана таблица, которая послужила основой Базы данных. Отчёт по данной работе доступен по ссылке.
В 2022 году произошли важные уточнения в рамках работы группы по эффективности
В 2023 году ведётся работа по оценке состояния трёх целевых языков: нанайского, мансийского, карельского (в пределах Тверской области).
База данных состояния языков представляет собой ресурс, включающий сведения о витальности языков России, которая оценивается по комплексной системе параметров. Данная база данных разрабатывается сотрудниками Научного центра по сохранению, возрождению и документации языков России Института языкознания РАН.
Цели проекта:
- Сбор данных по витальности каждого языка России в соответствии с разработанной системой параметров (о ней ниже);
- Анализ имеющихся данных для сравнительной оценки состояния каждого из языков России для последующей выработки стратегии их ревитализации и развития.
В настоящий момент в Базе представлены данные по языкам России с разной степенью точности. Для некоторых языков произведена оценка состояния для нескольких характерных (репрезентативных) частей ареала, в таком случае на карте показаны эти части ареала с демонстрацией параметров состояния языка в каждой такой точке. Для других языков произведена только общая оценка, имеющая погрешности и не отражающая состояние языка в разных частях ареала. Для третьих языков, за неимением данных, оценка произведена путём экстраполяции данных о других, максимально близких с точки зрения социолингвистического состояния, языков.
Неравномерность данных в настоящее время характеризуется не только широтой, но и глубиной данных: лишь для некоторых языков проводятся специальные полевые исследования с методами анкетирования, наблюдения (в том числе включённого), опроса экспертов. Необходимо расширение такой работы для ведения подробного мониторинга, что в настоящее время выходит за рамки возможностей нашей группы. Мы будем признательны за помощь в уточнении данных, готовность проводить исследование по нашей методике и открыты к сотрудничеству.
Параметры оценки состояния языков объединены в три основных блока: экстралингвистический, социолингвистический и языковая инфраструктура.
Эстралингвистический включает оценку влияния факторов, связанных с языком лишь косвенно, но важных, потому что они отражают состояние языкового сообщества (под которым мы понимаем сообщество, включающее владеющих языком и тех, кто с ними ассоциирован через близкородственные связи; также во многих случаях это этническое сообщество). Урбанизация и культурные особенности, компактность проживания, благополучие и демография.
Социолингвистический блок посвящён состоянию языка в обществе. С одной стороны, оценивается количество владеющих и качество владения, в отношении общего числа жителей населённого пункта (а также, в виде менее точных значений, по ареалу языка), а заодно, в том числе через возрастную пирамиду владеющих, делается вывод о межпоколенческой передаче. С другой стороны, оценивается повседневное использование языка в разных сферах. Наконец, даётся оценка отношения к языку, а также социальный запрос на владение и использование языка. Именно этот блок отражает реальную витальность языка и, если другие два блока связаны с действиями по повышению витальности, то данный блок, в основном, показывает эффективность языкового планирования.
Языковая инфраструктура представляет собой созданные возможности для овладения и использования языка, а также влияет на отношение к языку. При сборе данных в конкретной локации оценивается инфраструктура именно в данной локации, то есть если оценивается, например, наличие книг на целевом языке, то важнее всего будут факты наличия и чтения книг в данной локации. Состоит из следующих разделов:
Наука (лингвистика, филология). Важны наличие описаний, словарей и других изданий по изучению языка, документационных данных для возможности использования при ревитализации, а также наличие команд по развитию этого направления.
Электронные технологии. Важно наличие базовых инструментов (символы, шрифты, раскладки, системы проверки орфографии, электронные словари и разговорники), что в сумме составляет удовлетворительное состояние IT-сферы, а также продвинутых электронных инструментов (машинные переводчики, анализ и синтез речи), что соответствет следующим уровням развития инфраструктуры и, соответственно, даёт более высоких индекс параметра.
Часть параметров раздела Образование связана с уровнями образования (от дошкольного до профессионального) и оценивается по несколькими поаказателям: преподаётся ли язык как предмет, используется ли как неформальное средство общения или как язык образования (в том числе по многоязычным моделям)? При оценке в конкретной локации используются не только формальные показатели, но также производятся попытки оценить качество языкового взаимодействия в образовании. Другая часть данного раздела связана с освоением языка вне уровней образования. Также в этом разделе оценивается наличие психологической поддержки в области владения, использования языка и многоязычия, а также - кадрового потенциала для существования и развития инфраструктуры по всему этому разделу.
В следующем разеделе оцениваются различные виды контента с точки зрения формы (текст, звук, видео) и формата и пространства существования (издания, СМИ, интернет). Также оценивается наличие команд в области креативных индустрий, что связано с существованием и развитием инфраструктуры по данному разделу.
Завершающий раздел обозначен как обеспечение, и связан с направлениями, в некоторой степени разнородными. С одной стороны, здесь оценивается обеспеченность функционирования общественных сфер (включая официальную), в том числе присутствие языка в языковом ландшафте. С другой стороны, оценивается работа по популяризации языка и многоязычия, что также связано с работой “сверху”. Но многие элементы обеспечения возможности использования языка, а также, шире, всё развитие языковой инфраструктуры, зависят от наличия и работы юридического, административного, финансового обеспечения, которое может также зависеть от инициатив “снизу”, для чего существуют параметры оценки наличия таких заинтересованных лиц.
Краткое описание особенностей параметра для данного языка (также для определённой локации языка) происходит в соответствующей ячейке, а также параметру назначается индекс в соответствии со следующим описанием:
0 белый - нет данных
1 коричневый - крайне неблагоприятно, серьёзное ухудшение
2 красный - неблагоприятно, некоторое/заметное ухудшение
3 оранжевый - удовлетворительно, без заметной отрицательной или положительной динамики
4 жёлтый - приемлемо/хорошо, незначительное улучшение
5 зелёный - успешно/отлично, заметное улучшение
При описании данного индекса использовалась такая идея, что в целом ситуация описывается статично, то есть используется первая часть описания, но в случае постоянного мониторинга в отдельных случаях может быть более показательным индекс, который также учитывает некоторую динамику (релевантно для длительных сроков и заметных изменений).