Skip to content

intsystems/2026-Project-207

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Зависимость внутренней размерности текста от языка

License GitHub Contributors GitHub Issues GitHub Pull Requests

Author Marina Kuchina
Consultant Ivan Papay
Advisor Andrey Grabovoy, PhD

Assets

Abstract

В работе исследуется зависимость внутренней размерности текста от языка. Проверяется гипотеза о том, что внутренняя размерность инвариантна относительно перевода. Исследование проведено на мультиязычном корпусе текстов, состоящем из текстов одинакового содержания, переведённых на несколько языков. Для каждого текста на основе эмбеддингов токенов, полученных с помощью языковой модели, вычислена внутренняя размерность, после чего проведён сравнительный анализ полученных значений. В результате анализа гипотеза об инвариантности внутренней размерности при переводе отвергается; подтверждается, что внутренняя размерность зависит от языка. Показано, что синтетические языки с богатой морфологией дают более высокие значения, чем аналитические.

Citation

If you find our work helpful, please cite us.

@article{citekey,
    title={Title},
    author={Name Surname, Name Surname (consultant), Name Surname (advisor)},
    year={2025}
}

Licence

Our project is MIT licensed. See LICENSE for details.

About

Поиск похожих по смыслу текстов в разноязычных коллекциях на основе инвариантности внутренней размерности текста при переводе. Search for similar texts in multilingual collections based on the invariance of the internal dimension of the text in translation.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages