Статистика в портрете корпуса
В разделе Статистика корпуса представлены таблицы, графики и диаграммы, характеризующие объем и состав корпуса на данный момент и во времени:
- Таблица и график с объемом корпуса в текстах и словах.
- Географическая карта и график распределения объема по странам и регионам (только для корпусов с региональной разметкой).
- Круговая диаграмма и график распределения значений метаатрибутов.
Получить доступ к статистике корпуса можно через портрет корпуса, нажав на кнопку (i) в шапке корпуса.
Для всех диаграмм и графиков в разделе Статистика предусмотрена стандартная всплывающая подсказка (?), в которой объясняется, как интерпретировать визуализацию, а также возможность скачать исходные данные, использованные для построения визуализации, и/или скриншот.
В настоящий момент статистика доступна в Основном, Обучающем, Газетных корпусах, некоторых исторических корпусах, а также корпусах «Русская классика» и «От 2 до 15». В дальнейшем список таких корпусов будет расширяться.
Текущее состояние
Объем корпуса
В разделе Текущее состояние данные об объеме корпуса представлены в количестве текстов и слов.
Географическая карта
На географической карте показано региональное распределение объема корпуса в выбранной единице измерения (тексты или слова). При переключении единицы измерения карта перерисовывается.
Об объеме корпуса в том или ином регионе можно судить по цветовой шкале. При наведении мыши на закрашенную область можно увидеть название региона и соответствующее ему количество текстов или слов в корпусе.
Нажав на Скачать, пользователь может выгрузить Excel/CSV с исходными данными, использованными для построения карты.
Распределение текстов
Круговая диаграмма показывает, какие виды текстов представлены в корпусе. Пользователь может выбрать метаатрибут, для которого нужно построить диаграмму, из списка наиболее показательных атрибутов корпуса, а также единицу измерения объема – тексты или слова. При переключении метаатрибута и/или единицы измерения диаграмма перерисовывается.
На диаграмме показано распределение топ-10 значений выбранного метаатрибута. Остальные значения объединены в категорию прочее. Справа от диаграммы приведен список значений и доля в процентах. При наведении мыши на сектор диаграммы можно увидеть название значения и соответствующее ему количество текстов или слов в корпусе.
Нажав на Скачать пользователь может выгрузить Excel/CSV с исходными данными, использованными для построения диаграмм, а также скачать диаграмму как картинку.
Сравнить пользовательский подкорпус с целым корпусом можно с помощью Статистики в портрете подкорпуса
Распределение по времени
В разделение Распределение по времени пользователь может выбрать уровень детализации, задать диапазон дат и сглаживание. Указанные параметры являются общими для всех графиков на странице.
Распределение объема корпуса во времени
На графике Распределение объема корпуса во времени представлены данные об объеме корпуса. По оси X указана дата создания текста, по оси Y - число текстов корпуса, созданных в эту дату.
Распределение текстов
График Распределение текстов показывает, какие виды текстов представлены в корпусе. Пользователь может выбрать метаатрибут, для которого нужно построить график, из списка наиболее показательных атрибутов корпуса, а также единицу измерения объема - тексты или слова. При переключении метаатрибута и/или единицы измерения график перерисовывается.
На графике показано распределение топ-10 значений выбранного метаатрибута, остальные значения объединены в категорию прочее. Справа от графика приведен список значений. При наведении мыши на график можно увидеть название значения и соответствующее ему количество и долю текстов или слов в корпусе.
Регионы
График показывает распределение объема текстов корпуса во времени по странам и регионам. При переключении метаатрибута и/или единицы измерения график перерисовывается.
Справа от графика приведен список значений. При наведении мыши на график можно увидеть название региона и соответствующее ему количество и долю текстов или слов в корпусе.