Доклад на конференции RCDL 2013:
Использование графов горизонтальной видимости для выявления слов,
определяющих информационную структуру текста
Завершила свою всероссийская научная конференция
RCDL-2013, которая проходила
с 14 по 17 октября в древнем русском городе Ярославле
на базе Ярославского государственного университета им. П. Г. Демидова.
Развитие технологий электронных библиотек становится все более
существенным для совершенствования стандартов науки, экономики,
образования, здравоохранения и качества жизни вообще. Научные
электронные библиотеки играют важную роль в реализации активно
поддерживаемых научным сообществом инициатив открытого доступа к
результатам исследований, в формировании открытой науки.
Электронные библиотеки образуют область исследований и разработок,
направленных на развитие теории и практики обработки, распространения,
хранения, поиска и анализа цифровых объектов различной природы. Наряду с
привычными для традиционных библиотек текстовыми и мультимедийными цифровыми
объектами, такие системы включают также структурированные данные с весьма
разнообразными цифровыми объектами различной природы и с описывающими их
метаданными. Проблемы управления настолько разнообразными информационными
ресурсами и удовлетворения растущего многообразия потребностей пользователей
в таких системах требуют применения многих перспективных технологий,
используемых в современных информационных системах. Такие технологии
развиваются в области Семантического Веба, наук с интенсивным использованием
данных, Больших данных (Big Data), для обеспечения интероперабельности
систем, параллельной обработки данных, интеграции данных в условиях быстро
растущих разнородности и объема данных. Центральное место при обсуждениях в
сообществе Электронных библиотек постепенно занимают инновационные
технологии, способствующие обмену информацией с богатой семантикой.
В работе конференций RCDL, проходивших в городах Санкт-Петербург,
Протвино, Дубна, Петрозаводск, Пущино, Ярославль, Суздаль, Переславль-
Залесский, Петрозаводск, Казань и Воронеж, приняло участие более тысячи
ученых из ведущих российских и зарубежных научных центров Австрии,
Германии, Греции, Италии, Новой Зеландии, США, Украины и других
стран.
В 2013 году на конференции с совместным докладом
на тему "Использование графов горизонтальной видимости для выявления слов,
определяющих информационную структуру текста"
выступили представители С.-Петербургского гос. университета,
НТУУ "КПИ", ИПРИ НАН Украины и ИЦ "ЭЛВИСТИ".
В рамках доклада рассматривалась предложенная авторами
методика компактифицированного графа горизонтальной видимости
для создания сети слов и выявления тех слов в тексте, которые определяют его
информационную структуру. Исследованы свойства таких сетей слов
(в том числе, на примерах, полученных с помощью технологии InfoStream).
В докладе было подчеркнуто, что
актуальной является задача определения того, какие из важных
структурных элементов оказываются также информационно-значимыми,
определяющими информационную структуру текста,
является актуальной,
позволит:
- Формировать "более осмысленные" информационные портреты текстов;
- Более качественно выполнять автоматическое реферирование текстов;
- Формировать цепочки подобных документов, объединять тематические
сюжеты, используя выявленные слова в качестве дескрипторов;
- Выявлять возможное содержательное дублирование документов, представленных
на различных языках (необходимо дальнейшее исследование инвариантности
опорных слов, для исходных текстов и их переводов);
- Составлять словари опорных слов, формировать тезаурусы и онтологии
предметных областей.
Презентация доклада
в формате PDF
ИЦ "ЭЛВИСТИ"
+38(044)239-90-91
E-mail: stream@visti.net
http://infostream.ua
|