| Author | Marina Kuchina |
| Consultant | Ivan Papay |
| Advisor | Andrey Grabovoy, PhD |
В работе исследуется зависимость внутренней размерности текста от языка. Проверяется гипотеза о том, что внутренняя размерность инвариантна относительно перевода. Исследование проведено на мультиязычном корпусе текстов, состоящем из текстов одинакового содержания, переведённых на несколько языков. Для каждого текста на основе эмбеддингов токенов, полученных с помощью языковой модели, вычислена внутренняя размерность, после чего проведён сравнительный анализ полученных значений. В результате анализа гипотеза об инвариантности внутренней размерности при переводе отвергается; подтверждается, что внутренняя размерность зависит от языка. Показано, что синтетические языки с богатой морфологией дают более высокие значения, чем аналитические.
If you find our work helpful, please cite us.
@article{citekey,
title={Title},
author={Name Surname, Name Surname (consultant), Name Surname (advisor)},
year={2025}
}Our project is MIT licensed. See LICENSE for details.