Мультимедийный параллельный корпус сочетает в себе свойства мультимедийного и параллельного корпусов и предназначен для сопоставительных исследований. Корпус состоит из двух независимых зон, которые отличаются как характером материала, так и способом его организации.
Русский МультиПАРК дает возможность сопоставить разные кино-, теле-, радио- и театральные постановки одной и той же пьесы на русском языке. В настоящее время русский МультиПАРК включает пьесу Н. В. Гоголя «Ревизор», представленную в 9 постановках, пьесы А. П. Чехова «Вишневый сад» в 4 постановках, «Дядя Ваня» в 5 постановках и «Три сестры» в 4 постановках. Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. В результате таких исследований могут быть установлены пределы варьирования различных аспектов звучащей речи и ее жестового сопровождения в зависимости от факторов, связанных с личностью актера, временем и стилем постановки, замыслом режиссера т. д.
Технология подготовки корпуса довольно сложна и напоминает подготовку мультиязычного параллельного корпуса письменных переводов одного и того же текста. В качестве «якорного» текста, с которым сопоставляются все варианты его исполнения, в МультиПАРКе выступает опубликованный текст пьесы. Текст пьесы разрезан на фрагменты, в соответствии с которыми фрагментируется аудио- или видеозапись постановки, а затем каждый аудио- или видеофрагмент выравнивается с его письменным транскриптом. Результаты поиска выдаются в виде кластеров: в каждый кластер входит контекст из печатного текста пьесы, содержащий запрашиваемый элемент, и выровненные с ним фрагменты из всех постановок, сопровождаемые соответствующими клипами.
Англо-русский МультиПАРК включает фрагменты сериалов и фильмов на английском языке с закадровым русским переводом или дубляжем, а также разные постановки пьес – на русском языке и в англоязычной интерпретации. Он дает возможность сравнивать и изучать речевое поведение людей, относящихся к разным культурам, говорящим на разных языках, при этом оказавшихся в сходных ситуациях.
Каждый фильм (оригинал и перевод) разрезан на небольшие фрагменты (клипы). На соответствующие фрагменты разрезаны английские и русские расшифровки этих фрагментов. После этого два клипа (английский и русский) и две расшифровки (английская и русская) выравниваются между собой. Нумерация клипов и текстовых фрагментов совпадает в английском и русском варианте.
Каждый текстовый фрагмент размечен в соответствии со стандартами МУРКО и параллельного корпуса НКРЯ и содержит метатекстовую, морфологическую аннотацию (размечены оригинал и перевод), семантическую аннотацию (русский перевод), акцентологическую аннотацию (русский перевод), социологическую аннотацию (сведения об актере — исполнителе роли и актере дубляжа). На запрос пользователя выдаются две пары клип + текст (на английском и русском языках), в которых выровнены между собой видео- и текстовый ряд. Такая подача материала позволяет вести сопоставительные исследования в области интонации и фонетики, лексики и семантики, фразеологии, синтаксиса, анализировать жестикуляцию в англоязычном дискурсе и с помощью сопоставления полученных данных с данными МУРКО проводить сопоставительные жестикуляционные исследования. Кроме того, этот корпус дает образцы особого вида речевой деятельности на русском языке — перевода аудиовизуальных текстов, который рассматривается как самостоятельный вид переводческой деятельности.