26.04.2024
°C
0
$ 92.13
€ 98.71
erid:2VtzqwJMV8q

Ученые СПбГУ разработали уникальный метод цифрового анализа текстов на арабском языке

Математики и востоковеды Санкт-Петербургского государственного университета разработали уникальный метод цифрового анализа текстов, написанных на арабском языке.

Исследование большого массива газетных материалов с помощью новой программы позволило ученым зафиксировать пики изменений языковой структуры, которые соответствуют важным политическим и иным событиям современного арабского мира. При этом лингвистические колебания в текстах статей отображаются уже накануне этих событий.

«Благодаря союзу математики и социолингвистики мы можем не только получить косвенное отражение модели общества и происходящих в нем процессов, но в какой-то мере даже предсказать эти процессы», — отметил профессор СПбГУ Олег Редькин.

В ходе исследования ученые-математики, не владеющие арабским языком, преобразовали тексты в гистограммы и увидели ряд колебаний с пиками, которые, как оказалось, соотносились по времени либо с изменениями в редакционной политике издания, либо с конкретными событиями в регионе. Интересно, что начало колебаний отмечалось еще до того, как они произошли. Новый метод математического анализа арабских текстов ученые протестировали на публикациях египетской газеты Al-Ahraam («Пирамиды») и ливанской Al-Akhbaar («Новости») за длительный период времени, охватывающий в том числе такие значимые социально-политические и экономические события, как «арабская весна» и др.

Представленный метод уникален еще и тем, что позволяет работать именно с арабским языком — одной из самых сложных знаковых систем в мире. В этом языке буквенные знаки соответствуют в основном согласным звукам, один знак может иметь несколько вариантов написания — в зависимости от места расположения в слове, а строчных букв нет вовсе. Ввиду этих и других особенностей языковой системы формализация лексико-синтаксического анализа арабского текста является крайне непростой задачей. «Часть этой задачи нам удалось решить уже сегодня, — добавил Олег Редькин. — Мы полагаем, что новый метод может применяться и для анализа текстов, написанных на других языках».

Как сообщает пресс-служба СПбГУ, в международном исследовании приняли участие сотрудники научной лаборатории по анализу и моделированию социальных процессов СПбГУ: доктор физико-математических наук, профессор Олег Граничин, доктор филологических наук, профессор Олег Редькин и кандидат филологических наук, доцент Ольга Берникова.


Мы в популярных социальных сетях